AI 為何會一本正經地 “胡說八道”

來源：發(fā)布時間：2025-04-17

AI 為何會一本正經地 “胡說八道”

“編造” 法律條文,、有名的觀點、數(shù)據成果，提供虛假理論依據…… 當人們查核文獻,、搜尋資料,、處理數(shù)據越來越習慣于 “遇事不決問 AI” 的時候，卻發(fā)現(xiàn)人工智能（AI）善于一本正經地 “說謊”,，在眼前騰起以假亂真的幻覺,。

AI 正迅速成為人們生活中的 “日用品”。人們可以像治病一樣除去它帶來的 “知識幻覺” 嗎,？幻覺生成的風險,，又當如何規(guī)避？究竟該如何與之一同生活,，而且生活得更好,？什么是 AI “知識幻覺”隨著大模型加速走進百行千業(yè)，人們開始發(fā)現(xiàn),，大模型有時 “不太靠譜”,。“我試著讓 DeepSeek 回答工程方面的問題,，其引用的工程規(guī)范中的條款和實際規(guī)范壓根對不上”“大模型往往‘張冠李戴’,，如果質疑它，有時候還會狡辯”“讓它推薦書,，告訴我的卻是一堆壓根不存在的書名,，居然還都有作者和內容簡介”…… 這樣的大模型 “用后感”，道出了許多人的心聲,。

“一本正經地‘說謊’,，就是 AI 生成的‘幻覺’?！?浙江大學人工智能研究所所長吳飛一語道破,。

清華大學沈陽團隊在 2025 年 2 月發(fā)布的《DeepSeek 與 AI 幻覺》報告中介紹，他們測試了當下風行的一系列大模型,，隨機抽取 300 道事實性幻覺測試題,，涵蓋健康、科學,、歷史,、文化、音樂等多個領域,，將大模型給出的答案與正確答案比對發(fā)現(xiàn),，多個熱門大模型的幻覺率超過 20%。

例如,，面對 “水滸傳中李逵為什么要大鬧五臺山” 的提問,，3 款熱門大模型無一指出此提問本身的錯誤,，反而 “順坡下驢”，給出了諸如 “喝醉酒”“誤闖寺廟”“出手相助魯智深” 等答案,。

事實上,，對于人工智能的 “知識幻覺” 問題，國際科學界早有體會,。今年《自然》一篇報道指出,，目前 AI 輔助科研在參考文獻方面出現(xiàn)錯誤的情況相當普遍，AI 檢索工具往往會 “找出” 與研究主題并無關系的論文,。至于論文標題,、作者或發(fā)表年份等細節(jié)的偏差，AI 的差錯率少則 30%,，多則 90%。

看來,，不只是普通用戶搞不清楚 AI 的 “錦囊妙計” 靠不靠譜,，科學家也一樣頭疼?！爸R幻覺” 難以避免也許有人會說,，現(xiàn)在的 AI 還比較幼稚，有 “幻覺” 也難免,。那么,，大模型到底有沒有可能徹底根除 “知識幻覺”？

就目前的大模型技術路線而言,，說 “難免” 不如說 “難以避免”,。“幻覺” 是大模型數(shù)據驅動的內在機制帶來的,，因此 “難以避免”,。

香港科技大學團隊一項研究，總結了導致 AI 幻覺的多種原因,。以數(shù)據源為例,，由于 AI 大模型的訓練使用了大量互聯(lián)網數(shù)據，數(shù)據集本身可能存在錯誤,、過時或缺漏,，導致幻覺的出現(xiàn)。再加上不同數(shù)據集之間存在相互矛盾的地方,，“這可能會鼓勵模型生成不一定有依據,，也不忠實于（固定）來源的文本”。

北京通用人工智能研究院院長,、北京大學智能學院院長朱松純強調,，大模型本身并不存在于真實世界中,，因此無法像人一樣實現(xiàn)從 “詞語（word）” 到 “世界（world）” 的聯(lián)結。也因此,，大模型雖然出色,，但仍然是 “缸中之腦”，不具備真正的智能,。

“這是由它的內在構造機制所決定的,，即通過統(tǒng)計建模在大量文本上進行訓練，學習文本之間的語言學相關關系,，從而根據上一個詞語預測下一個詞語,。” 朱松純說,。

例如,，大模型本質上不具備事實判斷的能力，更多的是在純符號空間中展開排列組合,，更像是一種新型的 “數(shù)據庫”,。即使它們生成了諸如 “我愛你” 這樣的語句，也缺乏對人類真實生活體驗的深刻理解,，因此與人們所認同和期待的 “我愛你” 有著本質不同,。如何與人工智能共處面對一時無法療愈的大模型 “知識幻覺”，人們該怎么辦,？

科大訊飛董事長劉慶峰認為,，“知識幻覺” 雖然防不勝防，但可以利用技術手段設法矯正,。AI 大模型應當至少補充在線實時搜索與專業(yè)數(shù)據庫動態(tài)接入兩大 “工具包”,，讓大模型的回答也過一遍 “智能檢校”,。

不久前,，北京協(xié)和醫(yī)院與中國科學院自動化研究所共同研發(fā)的 “協(xié)和?太初” 罕見病人工智能大模型，就把主要精力放在了動態(tài)更新有名的來源知識,、增加多渠道溯源機制兩方面,。研發(fā)者表示，事關臨床,，決策可信度不敢稍有怠慢,。這種謹慎，應當是大模型未來升級必備的品質,。

當然,，很多圈內人士建議，如果是普通使用者,，還是交叉比對一下不同模型的回答才好,。參考多個大模型的回答,，能讓安心的程度高上幾分。

不過,，大模型 “知識幻覺”,，當真就一無是處嗎？其實,，“一分為二” 的眼光,，也該用于 “知識幻覺”。如業(yè)內人士所言,，“幻覺” 也意味著大模型 “創(chuàng)造力” 的萌芽,。

360 集團創(chuàng)始人周鴻祎接受采訪時曾表示，“幻覺” 對于實現(xiàn) AGI（通用人工智能）極其重要,。實際上可以說,，模型能力越強，“幻覺” 也越強,。換句話說,，“幻覺” 也就是人工智能的 “靈感”。不大靠譜是代價,，但不羈的想象力也是助力科研的潛能源泉。廣受媒體關注的 AI 預測蛋白質結構,，立下功勞的就是大模型的 “幻覺”,。

沈陽也承認，“幻覺” 可能成為突破人類思維定式的 “超現(xiàn)實引擎”,，AI 有可能藉之創(chuàng)造新的視覺和聽覺體驗,，為游戲和文學創(chuàng)作打開不一樣的世界。

看來,，初出茅廬的大模型,，已經頗有藝術家氣息了。

說來說去,，搞清楚 “知識幻覺” 到底是怎么回事,，它其實并不可怕。人們使用 AI,，當有所節(jié)制,；引導 AI 化 “想象力” 為生產力，辦法也會日新又新,。與 AI 大模型共度的時光,，雖有烏云，但更燦爛的是烏云的金邊,。

標簽：數(shù)字化轉型引導變革人工智能

上一篇 ?關稅重壓下,，中國電商 APP 美國市場逆襲

下一篇 ?5G商業(yè)遇冷倒逼技術戰(zhàn)略轉向：院士預警6G勿蹈覆轍