RepE:用于增强 AI 模型透明度的表征工程 发表评论 7 views 中文标题:表征工程:一种自上而下的 AI 透明度方法 英文标题:Representation Engineering: A Top-Down Approach to AI Transparency 发布平台:预印本 发布日期:2023-01-01 引用量(非实时):494 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景介绍 2.2 线性人工断层扫描 LAT 2.3 从表征理解到控制 2.4 案例 1:真实与诚实 2.5 案例 2:伦理和权利 2.6 其他模型安全应用 相关资源 中文标题:表征工程:一种自上而下 Read more