-
熊节|大模型语料的“认知投毒”,一场正在发生的数字主权攻防战
最后更新: 2025-08-05 12:23:50三、实时知识增强:从被污染的“信息井”中取水
当模型完成训练,进入实际应用阶段,它还需要通过搜索引擎等工具接入实时信息,即“知识增强”。然而,如果模型取水的这口“井”本身就是被污染的,那么无论取水工具(模型推理能力)多么先进,打上来的也只能是“污水”。
笔者最近的亲身经历便是一个绝佳的例证。
当笔者向腾讯元宝(使用DeepSeek大模型)询问“县域AI应用的挑战”时,它给出了一个看似结构清晰、数据详实的回答。其中提到“约60%县域学校设备不满足AI基础需求”,以及“某县医院AI忽略甲亢误推心脏检查概率达68%”等精准数据。面对这样“专业”的回答,我们不禁要问:其信源究竟来自何处?是严谨的社会调查,还是某些自媒体为博眼球而杜撰的“数据空壳”?
点开信源链接,答案令人啼笑皆非——这些数据大多来自今日头条、微信公众号等平台上的文章,而这些文章本身就缺乏可信的来源佐证。这暴露了当前中文互联网生态的一个致命弱点:高质量、可溯源的中文信息源极度稀缺。在搜索引擎普遍将商业利益(推广自家产品)置于信息质量之上的大环境下,大模型应用被迫在微信、头条、百家号这类“内容工厂”炮制的“信息流沙”中淘金。
更具讽刺意味的是,一种“模型近亲繁殖(Model Inbreeding)”导致的“自我增强幻觉循环”正在形成。即由AI生成的、充满事实错误的垃圾文章被发布到互联网上,随后又被其他AI应用当作“知识”抓取和引用,循环往复,导致错误信息被不断放大和固化。例如这个例子中出现的“某县医院AI忽略甲亢误推心脏检查概率达68%”的数据就源于一条看着很像是AI生成的公众号文章,笔者未能在任何其他地方找到这项数据。
7月初,“DeepSeek对王一博道歉”冲上微博热搜,引发对“内容农场”利用AI批量生产虚假信息污染网络环境的反思 图自:社交媒体
此外,一种针对大模型的新型攻击手法——对大模型应用的“搜索引擎优化”(LLM SEO)也已出现。一些商业机构正通过“蚂蚁雄兵”战术,在全网铺设大量同质化内容,污染大模型的搜索结果,以达到营销引流的目的。这种行为,无异于向整个中文互联网的“信息井”中系统性地倾倒垃圾,对信息质量造成了毁灭性的损害。原本为了减少大模型幻觉而给它加上的在线搜索功能,反而成了全网幻觉生产的一个环节,多少是有些讽刺的。
四、应用层编排:无力回天的“末端过滤器”
面对从预训练、微调到知识增强的全链路污染,有人可能会寄望于应用层的“最后防线”——通过系统提示词、内容过滤和安全护栏来净化输出。
然而,这道防线的作用极其有限。它就像是在一个已经被重金属污染的水龙头末端安装一个简易过滤器。它或许能滤掉一些肉眼可见的“杂质”(如明显的违法言论),但对于已经深植于模型认知内核的、系统性的意识形态偏见和源于劣质信源的错误事实,则完全无能为力。
依靠应用层的“打补丁”,永远无法从根本上解决“认知投毒”问题。这是一种治标不治本的“末端治理”,无法替代从源头保障语料“纯净度”的战略价值。
结论:打赢数字主权时代的“语料攻防战”
大模型语料的“认知投毒”,是一场正在发生、却又不见硝烟的战争。它发生在数字空间,攻击的却是我们的大脑,争夺的是未来的认知主导权。在这场关乎国家数字主权的攻防战中,我们必须放弃幻想,建立起全链路的防御体系。
首先,必须从战略高度,建立自主可控的“国家级清洁语料库”。令人欣慰的是,国家已经开始行动。教育部、国家语委等部门提出的“2027年初步建成国家关键语料库”的目标,正是迈向胜利的第一步。这相当于在被污染的全球信息环境中,为我们自己挖掘一口“战略储备井”,确保我们的AI拥有“干净”的成长水源。
其次,必须倒逼国内的互联网平台和搜索引擎服务商承担起信息治理的主体责任。当下的“流量为王”模式,实质上是在鼓励“劣币驱逐良币”,是对整个社会信息环境的巨大破坏。未来,信息服务的质量,而非单纯的流量,必须成为衡量平台价值的核心标准。
最后,全社会都应提升对“认知投毒”的警惕性。这不仅是一场技术之争、产业之争,更是一场围绕未来信息基础设施的“标准之争”和“认知之争”。能否在这场“看不见的战争”中占据主动,将直接决定我们在未来智能时代的国际地位和话语权。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
-
本文仅代表作者个人观点。
- 责任编辑: 郭涵 
-
美国启动337调查,一加、联想、TCL等成被告
2025-08-05 11:13 观网财经-科创 -
窃密华为被重判,中国芯没有捷径
2025-08-05 09:25 观网财经-科创 -
腾讯混元开源多个小尺寸模型;小米推出168雨伞;京东震虎价不正当竞争
2025-08-05 09:06 观网财经-互联网 -
“巨无霸”来了!中国船舶、中国重工最新公告
2025-08-04 20:15 金融观察 -
阿里 “扫地僧” 时隔三个月又跳槽,通义AI人才频频被挖
2025-08-04 20:13 观网财经-互联网 -
手机端也能流畅运行,腾讯混元宣布开源四款小尺寸模型
2025-08-04 19:12 观网财经-互联网 -
【WAIC对话美的】3-5年内,家电的“主动服务”将成为主流
2025-08-04 19:12 观网财经-科创 -
喜茶开到苹果总部,海外门店一年增6倍
2025-08-04 19:02 观网财经-消费 -
或将接盘“没落贵族”锐步?安踏回应
2025-08-04 18:13 观网财经-消费 -
宜家宣布开设京东旗舰店
2025-08-04 15:12 观网财经-消费 -
理想回应卡车碰撞测试;硅基智能疑似回应全员裁员;B站上线AI原声翻译
2025-08-04 09:00 观网财经-科创 -
中国汽研发声:随机购买了二手卡车
2025-08-04 07:30 大公司 -
鸿蒙世界,正上演“寒武纪大爆发”
2025-08-03 14:45 观网财经-科创 -
大疆、影石相互“偷家”!天空与全景的边界瓦解
2025-08-03 13:43 观网财经-消费 -
AI大潮下的具身和人形,中国在跟跑还是并跑?
2025-08-03 13:22 2025世界人工智能大会 -
华夏人寿被吊销业务许可证,原董事长、董秘被终身禁业
2025-08-02 19:42 -
李宁还能回到过去吗?
2025-08-02 10:27 观网财经-消费 -
AI+中国,能否带来东方文艺的复兴?
2025-08-02 10:06 2025世界人工智能大会 -
苹果在华营收两年来首次恢复增长,库克:感谢“国补”
2025-08-02 07:25 观网财经-科创 -
普惠AI照进现实:云知声如何让技术“越山海”
2025-08-01 23:31 观网财经-科创
相关推荐 -
普京访印:美国都在买,印度凭啥不能买? 评论 20
日本开发稀土担心中国干扰?日防相放话 评论 115
“美欧抢矿,遭殃的却是他们” 评论 13
美国又开炮欧盟:你们在“霸凌”美国军工! 评论 70
时代变了,“欧洲人迫切想要中国技术” 评论 204最新闻 Hot-
日本开发稀土担心中国干扰?日防相放话
-
“按下葫芦浮起瓢”,英伟达想重返中国市场又难了…
-
“特朗普高兴太早咯,中国把枪放进枪套,但枪还在手上”
-
又出狂言,“加墨不能成为中国出口中心…”
-
“美欧抢矿,遭殃的却是他们”
-
“今年就当广告时间,等英国接任后我们再回归”
-
美国又开炮欧盟:你们在“霸凌”美国军工!
-
“不要惊醒‘美洲豹’”
-
土耳其急了:别碰能源设施!
-
时代变了,“欧洲人迫切想要中国技术”
-
“原来特朗普对中国做这么多”,某些美国鹰派急眼了
-
17年来最低,“好感急剧恶化”
-
韩国入境系统标示“中国台湾”,民进党当局破防
-
“在美欧闻了一鼻子尾气,才反应过来:中国早没这味了”
-
中企在非遭800亿美元天价索赔,BBC老毛病又犯了
-
俄乌冲突后普京首次来访,印“外交钢丝”还能走多久?
-

观察员
上海市互联网违法与不良信息举报中心