2022 年,全球最大的轻博客网站 Tumblr 上发生了一件挺有意思的事情。
大量的 Tumblr 用户对马丁・斯科塞斯(就是拍《华尔街之狼》的那位)1973 年执导的电影 Goncharov 大加赞赏,称赞这部鲜为人知的电影是有史以来最大的黑手党电影 ——“Goncharov 远胜于它的时代,却从未赢得它应有的赞赏。”
随着一张电影海报被翻出,热度一下子冲上网站前五 ,很多人都在 Tumblr 刷屏 “求云盘” “带价拿资源”。但其实,马丁・斯科塞斯根本就没有拍过这部电影,人类历史上也没有一部名为 Goncharov 的电影!这意味着,一张挂名 “Martin Scorsese” 的电影海报,几句互联网背后的虚构影评,最终演变成了一场群体欺骗,直至现在还有人坚信这部电影的存在。
心理学将这样的现象称之为 “媒体等同”(media equation),人类天生会倾向一些群体性认同事件,换言之,当群体对同一件事情表现出肯定时,个体对事件往往会丢失判断。你或许会说,怎么可能,难道我就没有独立思考吗?来看下面这张图片👇
表面上,这是一个被压废墟的孩子,让人怜惜,但细看,孩子左手为六根手指。央视新闻后续为此事件辟谣,该视频为 AI 生成内容,并称:AI 让造谣变得更简单和更 “科学”。诸如此类的 AI 乌龙还有很多,比如川普被捕、AI 教皇,只要不是原则性问题,大家反而对这样的 “欺骗” 趋之若鹜。
如果说 Goncharov 的群体欺骗,是藏在人性里的戏谑因子,那么,在人工智能迭代如此迅速的今天,AI “欺骗” 人类,是技术缺陷还是人为?AI 所掀起的全球狂热,是否也该降降温?既然 AI 存在一定的失准,我们如何与 AI 相处?笔者想静下心来和大家聊聊。
技术之病:AI 幻觉
AI 本身就有 “病”—— AI Hallucinations (即:“AI 幻觉”)。
简单理解,它是指诸如 GPT4 、PaLM 、DeepSeek 等大语言模型 “一本正经地胡说八道”,将编造的事实与多个段落的连贯性和一致性编织在一起,且称之为真实信息的情况。比如,人有三条腿(常识错误)、李逵大闹五台山(剧情混淆)、第一个登上月球的人是 Charles (实际上是 Neil ,历史虚构)、阿联酋的首都是迪拜(实际上是阿布扎比,数据干扰)... 大致分为两类:
事实性幻觉:指模型生成的内容与可验证的现实世界事实不一致
忠实性幻觉:指模型生成的内容与用户的指令或上下文不一致
就拿现在很多企业普遍接入的 DeepSeek R1 来说,幻觉率高达 14.3% ,远高于 V3 的 3.9% 。
如果说 AI 幻觉是病,这些病是如何来的呢?
首先,病从口入,大数据的数据缺陷,是导致 AI 产生幻觉的一大原因。这其中包括数据缺陷、数据中捕获的事实知识的利用率较低。
具体来说,数据缺陷分为错误信息和偏见(重复偏见、社会偏见),此外大模型也有知识边界,所以存在领域知识缺陷和过失的事实知识 —— 即便大模型吃掉了大量数据,也会在利用时出现问题。
除了数据,训练过程也会使大模型产生幻觉。
预训练阶段
【架构缺陷】:基于前一个 token 预测下一个 token,这种单项建模阻碍了模型捕捉复杂的上下文关系的能力;随着 token 长度增加,不同位置的注意力被稀释;
【曝露偏差】:模型推理时依赖于自己生成的 token 进行后续推测,错误的 token 会在整个 token 中产生级联错误。
对齐阶段:
【能力错位】:大模型内在能力与标注数据中描述的功能之间可能存在错位。(边界在哪里,也就放大了幻觉的风险);
【信念错位】:基于 RLHF 等的微调,使大模型的输出更符合人类偏好,进而牺牲信息真实性。
简言之,AI 的幻觉之病,并不是单一因素导致,而是数据集、架构、算法、训练、推理等等,一系列的发展态叠加而成。
图片来源:《 DeepSeek 与 AI 幻觉》@清华大学
既然 AI 幻觉会带来如此多不确定性,科学家为什么不尝试 “去幻觉”?事实是,有些问题从根本上就无解,我们能做的:只有与幻觉共存。
不过,在某些特定的情况下,AI 幻觉也可能有一些 “意外” 的好处。比如,大卫・贝克团队获得 2024 诺贝尔化学奖,源于 AI 幻觉的 “错误折叠” 启发出新型蛋白质结构;DeepMind 团队发现,AI 在图像分割任务中产生的 “超现实边界” 虽不符合真实场景,却意外提升了自动驾驶对极端天气的识别精度...
以至于,科学界目前正在构建 “AI 幻觉 - 实验验证 - 理论重构” 三阶段研究流程,试图通过 AI 幻觉却发现一些人类尚未探索过的可能。
市场之病:AI 狂欢
从千模大战,到 DeepSeek 一骑绝尘,AI 市场的狂欢背后,是每天少说都有十几个 AI 新项目如雨后春笋一般诞生。笔者相信这些项目不单是追风口、蹭热度,而是 AI 开辟出了新的道路、新的可能。
但高投入和低收益之间的 “剪刀差” 的背后,仿佛大家都开诚布公地默认了一件事情:搞 AI 就能赚钱!这又何尝不是一种病态!
根据摩根士丹利的计算,亚马逊、谷歌、Meta 和微软这四大科技巨头整 2024 年的资本支出达到 2460 亿美元,其中大部分资金流向了 AI 领域,大头是数据中心和先进芯片的建设,但实际产生的收益却不够理想,反而在继续加码。
IT 桔子统计,34 家 AI 上市公司中,有 19 家在 2024 年上半年仍然处于亏损状态。显然,尽管 AI 技术发展迅速,但大多数 AI 公司仍未实现盈利。反而,第一批吃螃蟹的人除了像英伟达这种提供芯片的公司,就是赶上 AI 风口利用信息差割韭菜的自媒体博主。
为什么搞 AI 难赚钱,市场上还是有那么多狂热分子?
首先,覆水难收。即便在大模型高唱降本的今天,想要研究一个大模型出来,所投入的资金、物力、人才都是极为庞大的。高昂的开发门槛,砸出了一个巨大的资金缺口,如果后面不持续投入,活到云开见日的那一天,前面的所有心血都会打水漂。(还不如赌一把!对吧。)
来源:新浪财经
其次,市场开拓不足。俗话说,好马配好鞍,我花了那么多钱砸出来的 AI 产品,第一时间肯定是想开拓稳定的 ToB 、ToG 市场对吧。但这类赛道,不仅决策期长,市场容量小,还伴随一系列的人情边际,一个招标文件就能急死一大批 AI 老板,谁能不发疯?(如果 AI 老板是技术出身,疯得更快!)
那么,ToC 赛道呢?聊个人之常情的逻辑:有多少人用,才是 C 端市场的容积,一旦面临经济下行或消费转移,就容易引发一系列的连锁反应。同时,在如此激烈的抢人环境下,许多 AI 公司不得不采取烧钱补贴、广告曝光的策略来争夺市场份额,实际利润也就被稀释了。具体可以参考下图👇
这些都是沉默成本啊...
并且,AI 技术并不具备任何的商业逻辑,市场上的狂热,也只能由市场去慢慢消化。笔者认为,市场之病,目前还只处于 1.0 阶段,当大批量的 AI 公司搁浅,市场上仅剩下几极之后,2.0 的 AI 市场才可能慢慢自愈。
个体之病:AI 依赖
AI 作为这个时代的新质生产力,确实带给了人们很多的便利。比如,我要写这篇稿子,可以找 AI 帮我写个框架;开会要做总结,可以让 AI 帮我划重点;专业名词不了解,交给 AI ,除了得到答案,还可以得到一些拓展性回答。
偷懒起来,简直不要太爽!但渐渐的,我发现:AI 其实只能帮助我们在短时间内提升一个领域的认知下限,对于一些专业性极强、需要实操,并伴生多种知识体系的领域(如:生命科学、国际经贸等),光是靠 AI 问问题,无异于管中窥豹。
并且,对于普罗大众来说,目前的 AI 应用更偏重于提升效率,如 AI 搜索、AI 总结、AI 写作,越是将简单的工作交给 AI ,人们的内心预判就越不会觉得 AI 做得不好(但其实 AI 的出错率真的很高),就越容易产生 AI 依赖。
2024 年的最后一天,南方日报发了一篇《“AI 依赖症” 怎么治》的文章,其中点名:大学生作业里充满了 AI 味,文科生快失去了原创写作的能力。
据英国高等教育政策研究所发布的调研,1250 名英国本科生中,有 53% 的学生正在使用 AI 写论文,而在使用 AI 的学生中,25% 的人用 AI 来制定论文主题,还有 5% 的学生直接承认曾直接将 AI 生成内容复制粘贴到论文中。
“这一现象已经不是新问题了。我们曾经发现,学生的毕业论文里,有的段落的中文‘不像中文’,后来才知道,学生是将自己以前发表的英文论文用 AI 工具翻译成中文粘贴过来。” 南京大学人工智能学院副院长戴新宇教授表示。
百度相关问题的索引
不仅如此,纯靠 AI 在职场上也混不走。
今年 2 月,美国知名律所 Morgan & Morgan 向 1000 多名律师发送了紧急邮件,警告称 AI 可能生成虚假的判例信息,若律师在法律文件中使用这些虚构内容,可能会被解雇。
不可否认,生成式 AI 技术极大地缩短了律师研究判例和撰写的时间,但 AI 也存在 “编造事实” 的风险。
反观国内的医疗行业,则是在 “AI 诊疗” 上频加红线,北京市卫健委明确指出:医疗机构开展互联网诊疗活动要加强药品管理,严禁使用人工智能等自动生成处方,且人工智能软件等不得冒用、代替医师本人提供诊疗服务。
真是应了那句话:AI 能帮你上班,但不能帮你背锅。那么,在这个高喊 All in AI 的时代,普通人该如何相处呢?笔者总结为八个字:敬畏工具,保持怀疑。
AI 真的只是一个工具而已,当你在使用 AI 的同时,不妨也向 AI 学习,它的思考方式、思维广度,与 AI 共舞更能促进 AI 的发展;其次,开篇也提到了,虽然在群体认同保持清醒很难,但保持怀疑,却很简单,不妨试试!
AI 有病,但它并不是我们的敌人,这一点需要明确。
之所以放在最后来说,是因为笔者在查资料的过程中,发现了很多科学家正在研究如何降低 AI 幻觉,已经有很多企业开始了 AI 商业的探索,并且身边的很多人都开始将 AI 看作是映射自身的镜子,透过 AI 这个时代产物去完善自身的缺陷。AI 的未来,其实就是与人类共愈的过程。https://my.oschina.net/u/7819858/blog/18134663