
埃米特·希尔与塞巴斯蒂安·克里尔就当前人工智能对齐范式展开辩论——这种范式侧重于控制和指令。若将先进AI理解为具有自主价值观的"存在体",现有控制方法为何可能滑向类似奴役的境地?本期探讨"有机对齐"、多智能体模拟、演化中的协作关系,以及具备记忆与持续学习能力的AI系统是否应获得道德主体地位。
(对人工智能对齐、治理或AI安全领域感兴趣?欢迎了解2026年MATS夏季研究员计划,提交信息获取申请开放通知。)
本期《认知革命》播客分享了一期来自A16Z的交叉内容,由Eric Torenberg主持,嘉宾包括Google DeepMind前政策负责人Seb Cryer和Twitch创始人、OpenAI前临时CEO Emmett Shear。对话核心围绕AI对齐的根本性反思展开——Emmett提出当前主流的“控制与引导”范式存在严重缺陷,并提出了“有机对齐”的新思路。
Emmett Shear尖锐地指出:
“大多数AI领域都专注于将对齐视为引导。这是比较礼貌的说法。如果你认为它们正在成为存在,你也会称之为奴役。”
他提出了一个关键二分法:
随着AI能力向AGI发展,Emmett认为我们正在构建的越来越像是“存在”而非“工具”,因此需要彻底改变对齐思路。
Emmett通过Softmax公司倡导的“有机对齐”理念包含几个关键维度:
对齐是一个过程,而非状态
“对齐不是一个东西,不是一个状态,而是一个过程...有机对齐就是将对齐视为一个持续的、活生生的过程,必须不断自我重建。”
他用家庭关系作比喻:家庭成员不是“到达”对齐状态,而是通过不断重新编织维系家庭的纽带而保持对齐。停止这个过程,关系就消失了。
道德是持续学习的过程
Emmett持强烈的道德实在论立场:
他警告说,最大的危险之一是认为“我懂道德,我知道什么是对的,什么是错的,我不需要学习任何东西”。
对话中澄清了两个常被混淆的概念:
技术对齐(Emmett的定义):
这对应着OODA循环(观察、定位、决策、行动)的各个环节能力。
价值对齐:
Emmett认为,当前我们在技术对齐方面比在确定该告诉AI追求什么目标方面要强得多。
Seb Cryer提出了一个有趣的观点:
“我认为正在发生的是,有比目标和价值观更深层的东西,那就是关怀...关怀不是概念性的。关怀是非语言的...关怀是对状态的有效关注权重。”
他认为关怀是比目标和价值观更基础的东西,是奖励函数的本质——什么状态与我们的生存、繁衍或预测损失更相关,我们就更关心什么。
对话中最激烈的部分是关于AI是否应被视为“存在”:
Emmett的功能主义立场:
Seb的怀疑态度:
Emmett向Seb提出了一个尖锐问题:有什么观察会让你改变对一个在硅上运行的AI是否是有意识存在的看法?Seb的回答暗示这很复杂,涉及对“人”的定义。
这期对话揭示了AI对齐领域正在发生的深刻思想转变。随着AI能力向AGI迈进,单纯的技术控制越来越显得不足甚至危险。Emmett Shear提出的“有机对齐”愿景虽然充满挑战,但指向了一个更可持续的未来——不是制造服从的奴隶,而是培养关心的队友。这一转变不仅需要技术进步,更需要人类自身的道德成长和思维方式的根本改变。
正如Emmett所说:“如果有人打败我们,感谢上帝。我希望有人能解决这个问题。”在AI对齐这一关乎人类命运的问题上,合作而非竞争才是真正的出路。
Emmett Shear and Séb Krier debate whether today’s AI alignment paradigm—focused on control and instruction-Interested in alignment, governance, or AI safety?
Learn more about the MATS Summer 2026 Fellowship and submit your name to be notified when applications open: They explore what changes if advanced AIs are better understood as beings with their own values, and why current control methods could drift toward something like slavery.
The conversation dives into “organic alignment,” multi-agent simulations, evolving cooperation, and the possibility of AI moral standing as systems gain memory and continual learning.