AI 為何會(huì)一本正經(jīng)地 “胡說(shuō)八道”
AI 為何會(huì)一本正經(jīng)地 “胡說(shuō)八道”
“編造” 法律條文,、有名的觀點(diǎn)、數(shù)據(jù)成果,,提供虛假理論依據(jù)…… 當(dāng)人們查核文獻(xiàn),、搜尋資料、處理數(shù)據(jù)越來(lái)越習(xí)慣于 “遇事不決問(wèn) AI” 的時(shí)候,,卻發(fā)現(xiàn)人工智能(AI)善于一本正經(jīng)地 “說(shuō)謊”,,在眼前騰起以假亂真的幻覺(jué),。
AI 正迅速成為人們生活中的 “日用品”。人們可以像治病一樣除去它帶來(lái)的 “知識(shí)幻覺(jué)” 嗎,?幻覺(jué)生成的風(fēng)險(xiǎn),,又當(dāng)如何規(guī)避?究竟該如何與之一同生活,,而且生活得更好,?什么是 AI “知識(shí)幻覺(jué)”隨著大模型加速走進(jìn)百行千業(yè),人們開(kāi)始發(fā)現(xiàn),,大模型有時(shí) “不太靠譜”,。“我試著讓 DeepSeek 回答工程方面的問(wèn)題,,其引用的工程規(guī)范中的條款和實(shí)際規(guī)范壓根對(duì)不上”“大模型往往‘張冠李戴’,,如果質(zhì)疑它,有時(shí)候還會(huì)狡辯”“讓它推薦書(shū),,告訴我的卻是一堆壓根不存在的書(shū)名,,居然還都有作者和內(nèi)容簡(jiǎn)介”…… 這樣的大模型 “用后感”,道出了許多人的心聲,。
“一本正經(jīng)地‘說(shuō)謊’,,就是 AI 生成的‘幻覺(jué)’?!?浙江大學(xué)人工智能研究所所長(zhǎng)吳飛一語(yǔ)道破,。
清華大學(xué)沈陽(yáng)團(tuán)隊(duì)在 2025 年 2 月發(fā)布的《DeepSeek 與 AI 幻覺(jué)》報(bào)告中介紹,他們測(cè)試了當(dāng)下風(fēng)行的一系列大模型,,隨機(jī)抽取 300 道事實(shí)性幻覺(jué)測(cè)試題,,涵蓋健康、科學(xué),、歷史,、文化、音樂(lè)等多個(gè)領(lǐng)域,,將大模型給出的答案與正確答案比對(duì)發(fā)現(xiàn),,多個(gè)熱門(mén)大模型的幻覺(jué)率超過(guò) 20%。
例如,,面對(duì) “水滸傳中李逵為什么要大鬧五臺(tái)山” 的提問(wèn),,3 款熱門(mén)大模型無(wú)一指出此提問(wèn)本身的錯(cuò)誤,反而 “順坡下驢”,,給出了諸如 “喝醉酒”“誤闖寺廟”“出手相助魯智深” 等答案,。
事實(shí)上,對(duì)于人工智能的 “知識(shí)幻覺(jué)” 問(wèn)題,,國(guó)際科學(xué)界早有體會(huì),。今年《自然》一篇報(bào)道指出,,目前 AI 輔助科研在參考文獻(xiàn)方面出現(xiàn)錯(cuò)誤的情況相當(dāng)普遍,AI 檢索工具往往會(huì) “找出” 與研究主題并無(wú)關(guān)系的論文,。至于論文標(biāo)題,、作者或發(fā)表年份等細(xì)節(jié)的偏差,AI 的差錯(cuò)率少則 30%,,多則 90%,。
看來(lái),不只是普通用戶(hù)搞不清楚 AI 的 “錦囊妙計(jì)” 靠不靠譜,,科學(xué)家也一樣頭疼,。“知識(shí)幻覺(jué)” 難以避免也許有人會(huì)說(shuō),,現(xiàn)在的 AI 還比較幼稚,,有 “幻覺(jué)” 也難免。那么,,大模型到底有沒(méi)有可能徹底根除 “知識(shí)幻覺(jué)”,?
就目前的大模型技術(shù)路線(xiàn)而言,說(shuō) “難免” 不如說(shuō) “難以避免”,?!盎糜X(jué)” 是大模型數(shù)據(jù)驅(qū)動(dòng)的內(nèi)在機(jī)制帶來(lái)的,因此 “難以避免”,。
香港科技大學(xué)團(tuán)隊(duì)一項(xiàng)研究,,總結(jié)了導(dǎo)致 AI 幻覺(jué)的多種原因,。以數(shù)據(jù)源為例,,由于 AI 大模型的訓(xùn)練使用了大量互聯(lián)網(wǎng)數(shù)據(jù),數(shù)據(jù)集本身可能存在錯(cuò)誤,、過(guò)時(shí)或缺漏,,導(dǎo)致幻覺(jué)的出現(xiàn)。再加上不同數(shù)據(jù)集之間存在相互矛盾的地方,,“這可能會(huì)鼓勵(lì)模型生成不一定有依據(jù),,也不忠實(shí)于(固定)來(lái)源的文本”。
北京通用人工智能研究院院長(zhǎng),、北京大學(xué)智能學(xué)院院長(zhǎng)朱松純強(qiáng)調(diào),,大模型本身并不存在于真實(shí)世界中,因此無(wú)法像人一樣實(shí)現(xiàn)從 “詞語(yǔ)(word)” 到 “世界(world)” 的聯(lián)結(jié),。也因此,,大模型雖然出色,但仍然是 “缸中之腦”,,不具備真正的智能,。
“這是由它的內(nèi)在構(gòu)造機(jī)制所決定的,,即通過(guò)統(tǒng)計(jì)建模在大量文本上進(jìn)行訓(xùn)練,學(xué)習(xí)文本之間的語(yǔ)言學(xué)相關(guān)關(guān)系,,從而根據(jù)上一個(gè)詞語(yǔ)預(yù)測(cè)下一個(gè)詞語(yǔ),。” 朱松純說(shuō),。
例如,,大模型本質(zhì)上不具備事實(shí)判斷的能力,更多的是在純符號(hào)空間中展開(kāi)排列組合,,更像是一種新型的 “數(shù)據(jù)庫(kù)”,。即使它們生成了諸如 “我愛(ài)你” 這樣的語(yǔ)句,也缺乏對(duì)人類(lèi)真實(shí)生活體驗(yàn)的深刻理解,,因此與人們所認(rèn)同和期待的 “我愛(ài)你” 有著本質(zhì)不同,。如何與人工智能共處面對(duì)一時(shí)無(wú)法療愈的大模型 “知識(shí)幻覺(jué)”,人們?cè)撛趺崔k,?
科大訊飛董事長(zhǎng)劉慶峰認(rèn)為,,“知識(shí)幻覺(jué)” 雖然防不勝防,但可以利用技術(shù)手段設(shè)法矯正,。AI 大模型應(yīng)當(dāng)至少補(bǔ)充在線(xiàn)實(shí)時(shí)搜索與專(zhuān)業(yè)數(shù)據(jù)庫(kù)動(dòng)態(tài)接入兩大 “工具包”,,讓大模型的回答也過(guò)一遍 “智能檢校”,。
不久前,,北京協(xié)和醫(yī)院與中國(guó)科學(xué)院自動(dòng)化研究所共同研發(fā)的 “協(xié)和?太初” 罕見(jiàn)病人工智能大模型,就把主要精力放在了動(dòng)態(tài)更新有名的來(lái)源知識(shí),、增加多渠道溯源機(jī)制兩方面,。研發(fā)者表示,事關(guān)臨床,,決策可信度不敢稍有怠慢,。這種謹(jǐn)慎,應(yīng)當(dāng)是大模型未來(lái)升級(jí)必備的品質(zhì),。
當(dāng)然,,很多圈內(nèi)人士建議,如果是普通使用者,,還是交叉比對(duì)一下不同模型的回答才好,。參考多個(gè)大模型的回答,能讓安心的程度高上幾分,。
不過(guò),,大模型 “知識(shí)幻覺(jué)”,當(dāng)真就一無(wú)是處嗎?其實(shí),,“一分為二” 的眼光,,也該用于 “知識(shí)幻覺(jué)”。如業(yè)內(nèi)人士所言,,“幻覺(jué)” 也意味著大模型 “創(chuàng)造力” 的萌芽,。
360 集團(tuán)創(chuàng)始人周鴻祎接受采訪(fǎng)時(shí)曾表示,“幻覺(jué)” 對(duì)于實(shí)現(xiàn) AGI(通用人工智能)極其重要,。實(shí)際上可以說(shuō),,模型能力越強(qiáng),“幻覺(jué)” 也越強(qiáng),。換句話(huà)說(shuō),,“幻覺(jué)” 也就是人工智能的 “靈感”。不大靠譜是代價(jià),,但不羈的想象力也是助力科研的潛能源泉,。廣受媒體關(guān)注的 AI 預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),立下功勞的就是大模型的 “幻覺(jué)”,。
沈陽(yáng)也承認(rèn),,“幻覺(jué)” 可能成為突破人類(lèi)思維定式的 “超現(xiàn)實(shí)引擎”,AI 有可能藉之創(chuàng)造新的視覺(jué)和聽(tīng)覺(jué)體驗(yàn),,為游戲和文學(xué)創(chuàng)作打開(kāi)不一樣的世界,。
看來(lái),初出茅廬的大模型,,已經(jīng)頗有藝術(shù)家氣息了,。
說(shuō)來(lái)說(shuō)去,搞清楚 “知識(shí)幻覺(jué)” 到底是怎么回事,,它其實(shí)并不可怕,。人們使用 AI,當(dāng)有所節(jié)制,;引導(dǎo) AI 化 “想象力” 為生產(chǎn)力,,辦法也會(huì)日新又新。與 AI 大模型共度的時(shí)光,,雖有烏云,但更燦爛的是烏云的金邊,。