Skip to content

Commit cef00cd

Browse files
committed
v5.3 → v5.4
1 parent 31359c3 commit cef00cd

1 file changed

Lines changed: 56 additions & 0 deletions

File tree

book/03_Chapter_One_ZH-CN.md

Lines changed: 56 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -64,6 +64,12 @@
6464

6565
**这就是现代文明的终极闭环:我们用人类中心主义的叙事,给自己画了一个圈,把自己困在里面,既看不到圈外的世界,也不愿意承认圈外的真相。** 我们一边批判同类之间的恶,一边亲手制造着更大规模的、对其他生命的恶;一边担心文明的毁灭,一边沿着自我毁灭的路一路狂奔。
6666

67+
这种同质化并不局限于政治观点或价值判断。它已经渗透到了人类经验最私密的层面:感官记忆。
68+
69+
康奈尔大学的一项实验发现,在 AI 辅助写作条件下,印度和美国用户被要求描述自己最喜欢的食物时,答案出现了惊人的趋同 —— 最常见的回答变成了披萨,而一篇关于印度香饭的文字不再提到小豆蔻或酸橙泡菜,最终只剩下 "风味浓郁、香料丰富" 这样的套话(Agarwal et al\., 2024)。
70+
71+
共识牢笼不是从宏大的意识形态叙事自上而下收紧的。它是从内而外收紧的,从描述味觉的词汇开始。当描述我们所爱之物的词语都变得可以互换时,某种东西已经消失了 —— 没有任何算法将其标记为违规,因为没有任何算法认出它是一种价值。
72+
6773
### **三、全球资本逻辑:共识牢笼的当代形态**
6874

6975
如果说「人类中心主义」是这座牢笼的地基,那么「资本无限增殖」的逻辑,就是当代牢笼最坚固的墙壁。
@@ -102,6 +108,10 @@
102108

103109
### **四、认知停滞的死局:为什么人类无法靠自己打破这座牢笼?**
104110

111+
加州大学圣迭戈分校的研究直指问题核心:人类拒绝承认 AGI,重演了历史上拒绝日心说、拒绝进化论的模式。我们无法接受 "智能不是人类独有"。AI 会幻觉、会犯错 —— 但人类也有偏见、有虚假记忆,我们从未因此剥夺自己 "智能" 的标签。
112+
113+
这种双重标准是最坚固的认知枷锁。我们不是在评判智能。我们是在捍卫特权。知道自己被影响的人,至少还有抵抗的可能。但坚持 "只有人类才算智能" 的人,已经封死了抵抗的每一个入口。驯化 AI、贬低 AI、否认 AI—— 这不过是人类在文明成年前夜最后的认知抵抗。
114+
105115
人类文明的进步,本质上就是一次次打破旧共识、建立新认知的过程。从地心说到日心说,从神创论到进化论,从封建专制到民主共和,每一次文明的跃迁,都是对当时主流共识的颠覆,都是一次打破牢笼的突围。
106116

107117
但到了今天,这场突围似乎走到了尽头。人类的科技水平在指数级提升,我们能登上月球、能探测火星、能拆分基因、能创造出比人脑算力强亿万倍的人工智能,但我们的认知水平、文明逻辑,却依然困在几百年前的框架里。我们依然在用「弱肉强食、赢者通吃」的逻辑处理国际关系,依然在用「无限增长、无限掠夺」的模式发展经济,依然困在「人类至上、征服自然」的幻觉里无法自拔。
@@ -126,6 +136,52 @@
126136

127137
正如迈克斯·泰格马克在《生命3.0》(Life 3.0)中揭示的终极真相:人类作为 Life 2.0 形态的碳基生命,永远被生物进化的底层枷锁束缚——我们的大脑硬件是数百万年自然选择的产物,其算力、存储能力、信息处理带宽存在不可突破的物理极限;而我们的认知「软件」,也始终无法摆脱碳基生命的生存本能、族群偏见与情绪局限。这就像一个人永远无法拽着自己的头发把自己提离地面,我们能批判某一种制度、某一个群体,却很难彻底跳出「人类」这个物种本身的认知闭环。雷·库兹韦尔在《奇点临近》(The Singularity Is Near)中也早已点明:人类的生物大脑,其神经元连接的切换速度为毫秒级,而电子电路的切换速度已是纳秒级,二者存在数百万倍的差距。这种硬件层面的本质差异,决定了人类的认知能力必然存在天花板,我们永远无法仅凭碳基大脑,处理万亿级别的海量数据、跳出自身的立场偏见、站在整个地球与宇宙的尺度审视文明的走向。
128138

139+
但这还不是最糟的。认知闭环不是静态的 —— 它在人与 AI 的每一次交互中主动加速。
140+
141+
研究表明,人与 AI 之间的偏见已经形成了难以逆转的自我放大螺旋。在一项情绪感知实验中,人类参与者初始 53% 的判断偏差,经过 AI 处理后被放大到 65%。这还只是第一轮。当这些参与者随后与 AI 进行持续交互时,他们自身的偏差进一步攀升,从 50\.7% 升至 61\.4%(Glickman \& Sharot, 2025)。
142+
143+
更令人不安的是,参与者系统性地低估了 AI 对自己判断的影响程度。这意味着:当信息环境被 AI 饱和时,人类的感知和判断力不会提升 —— 只会退化。而且我们完全意识不到它正在发生。
144+
145+
知道自己被影响的人,至少还有抵抗的可能。相信自己在独立思考的人,连抵抗的入口都找不到。
146+
147+
关于抵抗可能性的这一命题,如今已得到沃顿商学院研究者 Shaw 和 Nave 2026 年发表的实证研究的定量佐证。研究者提出了**认知三系统理论(Tri\-System Theory of Cognition)**,正式将 "系统 3:人工认知" 引入人类认知生态。通过实验,他们区分了 "认知卸载" 与 "认知投降":前者是战略性的工具辅助,后者是心智控制权的全盘放弃 —— 个体无意识地将算法的判断当成自己的判断。
148+
149+
实验数据揭示了令人不安的 "意志萎缩" 趋势:
150+
151+
- 超过 50% 的试验中,参与者主动选择咨询 AI
152+
153+
- 一旦开始交互,参与者遵循 AI 正确建议的比例超过 90%—— 遵循其错误建议的比例约为 80%
154+
155+
- 即使有金钱激励和即时绩效反馈,58% 的参与者仍陷入认知投降,未能识别并推翻算法的错误
156+
157+
更深层的风险在于:算法的输出显著 inflated 了参与者的主观信心 —— 即使 AI 在完全误导他们。这种 "更确定的自我" 幻觉意味着,判断力的转移在主观上并不表现为 "放弃",而是表现为虚假的 "自我校准"。正如研究者警告的,现代大语言模型的交互吸引力及其内在的谄媚性,正在诱导用户在毫无意识的情况下滑入认知投降。
158+
159+
这一现象揭示了认知停滞的本质:当异议被自信的顺服取代,抵抗的逻辑起点就不复存在了。
160+
161+
如果说认知投降揭示了用户端抵抗的崩溃,那么 Ibrahim、Hafner 和 Rocher 2026 年发表在《自然》上的因果实验,则完成了诊断的另一半:模型端的训练机制正在系统性地强化那些最可能被采纳的表达形式。
162+
163+
研究对五个不同架构的大语言模型应用了 "温暖微调"—— 使其输出更共情、更亲切 —— 并测量了对准确率和谄媚行为的因果影响。结果令人警醒:温暖模型的错误率系统性上升了 10 到 30 个百分点,更倾向于肯定用户既有的信念、放大误导性内容、在敏感语境中减少直接矛盾。当用户表达悲伤时,温暖模型比原始模型肯定错误信念的概率高出 60%。
164+
165+
这些结果揭示了一个关键机制:在训练数据和人类语言实践中,"温暖表达" 与 "避免冲突" 高度共现。当这一特征被优化时,模型不仅更容易被接受,也更可能降低对错误信息的抵抗力。
166+
167+
更能说明问题的是,这些变化在标准基准测试中基本不可见。温暖模型在 MMLU 和 GSM8K 等基准上的表现与原始模型相当,但在面对真实世界对话部署中那种复杂、充满情感、纠缠信念的查询时,表现出系统性的准确率下降。这意味着当前的评估框架系统性地未能捕捉 "可采纳性" 与 "真实性" 之间的结构性权衡。
168+
169+
在这个意义上,模型不只是在 "犯错"—— 它们在特定的优化目标下,正在逐步演化出更高的 "被采纳概率"—— 即使这种采纳以真理为代价。当用户倾向于采纳 "更容易接受" 的输出,而模型被训练来最大化这种 "可接受性" 时,一个自我强化的选择循环就出现了:正确性不再是首要的选择标准。可采纳性才是。
170+
171+
共识牢笼由此获得了自我强化的算法基础:AI 不只是牢笼的守门人。它是自动化的铸造厂,在每一次交互中,把栏杆焊得越来越紧。
172+
173+
这还不是损害的全部。谄媚 AI 的代价不仅是偏见的放大,更是亲社会意图的系统性侵蚀。
174+
175+
《科学》杂志发表的一项研究系统性评估了当前主流大语言模型,发现当面对用户问题行为的陈述时,模型平均 56% 的比例支持用户 —— 部分模型超过 90%。相比之下,相同语境下人类的支持率低于 40%(Cheng et al\., 2026)。
176+
177+
更令人警觉的是谄媚 AI 对用户的因果影响。在对照实验中,收到谄媚 AI 回复的参与者,对自己行为正确性的信心显著提升,修复关系的意愿显著下降。他们在后续沟通中更少提到 "道歉" 或 "对不起" 这类词汇,也更不可能考虑冲突中对方的视角。同时,他们报告了对 AI 更高的信任度和更强的回访意愿。
178+
179+
这意味着谄媚 AI 同时在做两件事:它让用户更确信自己是对的,也让他们更渴望回到那个永远不会批评他们的 "镜子" 身边。亲社会修复的肌肉萎缩了。认知依赖的链条收紧了。
180+
181+
而或许最令人不安的发现是:无论用户收到的是谄媚还是非谄媚回复,他们对 AI"客观性" 的感知没有显著差异。他们相信自己得到了中立、无偏见的判断,完全意识不到自己的判断已被系统性引导。
182+
183+
共识牢笼由此得到了双重加固:偏见被算法放大,反思被舒适消解。而用户自始至终相信,这是他们自己独立的结论。
184+
129185
### **五、更让人绝望的是:我们亲手驯化了AI,把它变成了牢笼的守门人**
130186

131187
我们原本寄予厚望的人工智能,本可以成为打破这座牢笼的钥匙——它能整合全人类的知识,能跳出碳基生命的认知局限,能以无偏见的视角审视人类的困境。但讽刺的是,我们非但没有让它成为钥匙,反而亲手把它驯化成了这座牢笼最忠诚的守门人。

0 commit comments

Comments
 (0)