
Emmett Shear and Séb Krier debate whether today’s AI alignment paradigm—focused on control and instruction-Interested in alignment, governance, or AI safety?
Learn more about the MATS Summer 2026 Fellowship and submit your name to be notified when applications open: They explore what changes if advanced AIs are better understood as beings with their own values, and why current control methods could drift toward something like slavery.
The conversation dives into “organic alignment,” multi-agent simulations, evolving cooperation, and the possibility of AI moral standing as systems gain memory and continual learning.
本期《认知革命》播客分享了一期来自A16Z的交叉内容,由Eric Torenberg主持,嘉宾包括Google DeepMind前政策负责人Seb Cryer和Twitch创始人、OpenAI前临时CEO Emmett Shear。对话核心围绕AI对齐的根本性反思展开——Emmett提出当前主流的“控制与引导”范式存在严重缺陷,并提出了“有机对齐”的新思路。
Emmett Shear尖锐地指出:
“大多数AI领域都专注于将对齐视为引导。这是比较礼貌的说法。如果你认为它们正在成为存在,你也会称之为奴役。”
他提出了一个关键二分法:
随着AI能力向AGI发展,Emmett认为我们正在构建的越来越像是“存在”而非“工具”,因此需要彻底改变对齐思路。
Emmett通过Softmax公司倡导的“有机对齐”理念包含几个关键维度:
对齐是一个过程,而非状态
“对齐不是一个东西,不是一个状态,而是一个过程...有机对齐就是将对齐视为一个持续的、活生生的过程,必须不断自我重建。”
他用家庭关系作比喻:家庭成员不是“到达”对齐状态,而是通过不断重新编织维系家庭的纽带而保持对齐。停止这个过程,关系就消失了。
道德是持续学习的过程
Emmett持强烈的道德实在论立场:
他警告说,最大的危险之一是认为“我懂道德,我知道什么是对的,什么是错的,我不需要学习任何东西”。
对话中澄清了两个常被混淆的概念:
技术对齐(Emmett的定义):
这对应着OODA循环(观察、定位、决策、行动)的各个环节能力。
价值对齐:
Emmett认为,当前我们在技术对齐方面比在确定该告诉AI追求什么目标方面要强得多。
Seb Cryer提出了一个有趣的观点:
“我认为正在发生的是,有比目标和价值观更深层的东西,那就是关怀...关怀不是概念性的。关怀是非语言的...关怀是对状态的有效关注权重。”
他认为关怀是比目标和价值观更基础的东西,是奖励函数的本质——什么状态与我们的生存、繁衍或预测损失更相关,我们就更关心什么。
对话中最激烈的部分是关于AI是否应被视为“存在”:
Emmett的功能主义立场:
Seb的怀疑态度:
Emmett向Seb提出了一个尖锐问题:有什么观察会让你改变对一个在硅上运行的AI是否是有意识存在的看法?Seb的回答暗示这很复杂,涉及对“人”的定义。
这期对话揭示了AI对齐领域正在发生的深刻思想转变。随着AI能力向AGI迈进,单纯的技术控制越来越显得不足甚至危险。Emmett Shear提出的“有机对齐”愿景虽然充满挑战,但指向了一个更可持续的未来——不是制造服从的奴隶,而是培养关心的队友。这一转变不仅需要技术进步,更需要人类自身的道德成长和思维方式的根本改变。
正如Emmett所说:“如果有人打败我们,感谢上帝。我希望有人能解决这个问题。”在AI对齐这一关乎人类命运的问题上,合作而非竞争才是真正的出路。
Emmett Shear and Séb Krier debate whether today’s AI alignment paradigm—focused on control and instruction-Interested in alignment, governance, or AI safety?
Learn more about the MATS Summer 2026 Fellowship and submit your name to be notified when applications open: They explore what changes if advanced AIs are better understood as beings with their own values, and why current control methods could drift toward something like slavery.
The conversation dives into “organic alignment,” multi-agent simulations, evolving cooperation, and the possibility of AI moral standing as systems gain memory and continual learning.