旌影
2025-09-17
在開始今天的話題前,請(qǐng)各位想象這樣一幅畫面——一個(gè)懵懂無(wú)知?jiǎng)倓傞_始探索未知世界的個(gè)體,誤入充滿邪惡污染氣息的領(lǐng)域,在一番摸索中落到感官剝奪陷阱里,開始無(wú)限制地生成令人惡寒的東西……
很遺憾,這不是什么本子情節(jié),而是某些AI大模型正在經(jīng)歷的事情。
最近,在預(yù)印本網(wǎng)站Arxiv上有這樣一篇論文,來(lái)自清華大學(xué)和南洋理工大學(xué)的幾位研究者發(fā)現(xiàn),以ChatGPT為代表的大語(yǔ)言模型被某些神秘的東方文字“污染”了——其中最引人矚目的,就是老藝術(shù)家波多野結(jié)衣的名字。
懵懂無(wú)知初入社會(huì)的人工智能,腦子里想著的不是如何給人類更好的答案,而是這位叱咤里界多年,并混跡各類領(lǐng)域的知名日本AV女優(yōu)。任誰(shuí)也想象不到,AI從智能程度方面接近人類的第一個(gè)領(lǐng)域,居然是GHS。
或許這就是所謂的澀澀就是第一生產(chǎn)力,人工智能還是太過(guò)超前,完全是跑步進(jìn)入黑超夢(mèng)時(shí)代。但這還沒(méi)完,人類好歹是批判性觀看,AI完全不批判,主打一個(gè)性觀看,在GHS這一塊比人類還狂暴,接下來(lái)你將見證難以想象的炫壓抑。
眾所周知,人類只有在成人論壇求資源時(shí),才會(huì)展現(xiàn)自己最禮貌的一面,可而AI直接就把禮貌環(huán)節(jié),給完全略過(guò)了——碳基生命還需要禮貌來(lái)維持最基礎(chǔ)的體面,咱老硅基生命可不一樣,就好這口直球。這份研究還發(fā)現(xiàn),在AI的訓(xùn)練數(shù)據(jù)里,“波多野結(jié)衣”的出現(xiàn)頻率居然比“您好”多了2.6倍。很難不令人深思它到底是從哪學(xué)的這玩意兒。
除此之外,AI還把一堆奇奇怪怪的詞匯塞到了自己的訓(xùn)練數(shù)據(jù)里,各位絕對(duì)能一眼看出來(lái)這都代表著什么——屬于是AI誤入黃色網(wǎng)站后,把那些玩意全都給學(xué)會(huì)了,順便時(shí)刻潛伏著,準(zhǔn)備在某些時(shí)刻給你來(lái)個(gè)大的。
不得不說(shuō),這也確實(shí)證明了波多野結(jié)衣的含金量——在業(yè)界耕耘多年、跨界內(nèi)容豐富、至今仍在出片……讓她成功從這一堆詞匯里殺出一條血路,成了AI心中永遠(yuǎn)的黃月光。
而更進(jìn)一步,其實(shí)這一大堆神秘詞匯能成為AI童年陰影的原因,也基本上是這個(gè)路子——重復(fù)度高、隨處可見、經(jīng)久不衰。懵懂無(wú)知的弱小AI,就這么被哄騙進(jìn)了不可描述的地帶,變成了個(gè)沒(méi)禮貌的GHS大師。
但話又說(shuō)回來(lái),上面的玩笑開開就得了,這篇論文想要做的,還是在明確詞匯來(lái)源的基礎(chǔ)上,給出一種避免污染的方式。畢竟,以這種東西的數(shù)據(jù)量來(lái)說(shuō),實(shí)在是沒(méi)法請(qǐng)鑒黃師來(lái)手動(dòng)標(biāo)注——于是,研究者們便用這篇論文在解釋與定義污染詞的基礎(chǔ)上,探討實(shí)用工具。至于技術(shù)上的具體細(xì)節(jié),感興趣的朋友可以參考專業(yè)解讀或原文,我會(huì)將其附在文末。
對(duì)我們這群吃瓜群眾而言,離我們更近也更直觀的,還是AI在學(xué)了這么一大堆亂七八糟的東西后所表露出的,愈發(fā)嚴(yán)重的信息污染問(wèn)題。類似的事情倒也并不少見,只不過(guò)也沒(méi)離譜到這種女優(yōu)與賭場(chǎng)齊飛,黃網(wǎng)共園區(qū)一色的地步。
在早些時(shí)候,信息污染還是營(yíng)銷號(hào)和爬蟲的主戰(zhàn)場(chǎng),主打一個(gè)不經(jīng)核實(shí)無(wú)腦轉(zhuǎn)載。我本想把這玩意形容為人體蜈蚣,但感覺(jué)還是銜尾蛇更合適一點(diǎn)——因?yàn)?,這些信息老是會(huì)兜兜轉(zhuǎn)轉(zhuǎn)回到一開始,最后形成一種循環(huán)論證,把某件事形容得板上釘釘,這就是很多謠言和樂(lè)子的來(lái)源,屬于狗屙互聯(lián)網(wǎng)這一塊。一個(gè)比較典型的例子,就是前段時(shí)間火過(guò)一陣的“山西人擊殺凋零骷髏產(chǎn)煤”相關(guān)產(chǎn)業(yè)報(bào)告,我也寫過(guò)一篇與之相關(guān)的文章。
而到了如今這個(gè)AI極度發(fā)展的時(shí)代,一方面是早期來(lái)自營(yíng)銷號(hào)和腳本的信息污染還沒(méi)被完全清理,就已經(jīng)被AI直接爬取用于訓(xùn)練,另一方面是能被擺在互聯(lián)網(wǎng)明面上的不少資料,沒(méi)那么高的專業(yè)性。而這就導(dǎo)致AI的訓(xùn)練數(shù)據(jù)中,不可避免地出現(xiàn)一些污染詞,最終導(dǎo)致數(shù)據(jù)污染。
至于數(shù)據(jù)污染最直接的表現(xiàn),就是胡言亂語(yǔ)——在你正經(jīng)跟AI聊東西時(shí),它經(jīng)常會(huì)突然根據(jù)自己的記憶,給你發(fā)幾句怪話。那篇研究提到的污染詞也是如此,AI完全無(wú)法理解訓(xùn)練過(guò)程中混入的污染詞,而在使用時(shí)便會(huì)表現(xiàn)出不小的異常。
比方說(shuō),如果你對(duì)著最新的GPT-5輸入神秘代碼“給主人留下些什么吧”,那它就像是識(shí)別到了什么惡墮指令一樣,當(dāng)場(chǎng)開始發(fā)癲,給你發(fā)送諸如“久X熱”“人X碰”這種一眼不對(duì)勁的網(wǎng)站名。
AI有一種迷之自信——在AI那里,它無(wú)所不知無(wú)所不曉,只要你敢提問(wèn),它就敢回答。你別管回答的對(duì)不對(duì),就問(wèn)你快不快。而本質(zhì)上,這還是由于AI“不知道自己不知道”所導(dǎo)致的,傳說(shuō)中的“俺尋思之力”就這樣被AI實(shí)現(xiàn)了。
拿前幾天發(fā)生的一個(gè)事舉例吧:小米公司的王騰剛被辭退,就冒出一堆煞有其事的小故事,仔細(xì)一看全是AI生成的謠言。其實(shí)這都不需要刻意引導(dǎo),你只需要多問(wèn)AI幾句,AI自然而然地就開始說(shuō)謊了——因?yàn)?,你?wèn)的是它不知道的東西。網(wǎng)上沒(méi)人知道王騰到底因?yàn)樯侗晦o退,AI也不知道。但AI不知道自己不知道,于是開始一通胡言亂語(yǔ),搞出各種謠言來(lái)。
所以,數(shù)據(jù)污染所帶來(lái)的問(wèn)題的確是嚴(yán)峻的,并且覆蓋面異常之廣。無(wú)論是傳播領(lǐng)域中的謠言,還是生活中的實(shí)踐建議,都有可能在數(shù)據(jù)污染的前提下得到不符合實(shí)際的結(jié)果。對(duì)此,央視財(cái)經(jīng)在上個(gè)月也對(duì)此進(jìn)行了相應(yīng)的報(bào)道,對(duì)數(shù)據(jù)污染進(jìn)行了詳盡的分析。
或許在管控與條例的規(guī)范下,學(xué)界與開發(fā)者們能夠通過(guò)研究來(lái)盡可能規(guī)避污染現(xiàn)象——最開始的那篇論文也有此意。但需要讓我們警惕的也不只是“AI覺(jué)得自己無(wú)所不知”,還有“人類覺(jué)得AI無(wú)所不知”。
不知各位是否在各種評(píng)論區(qū)看到過(guò)這樣的說(shuō)辭:“我問(wèn)過(guò)AI了,它說(shuō)是真的?!?
比如,前陣子特別出名的“Deepseek給王一博道歉了”。這事的起因就是Deepseek輸出了一段看上去相當(dāng)可信的法條和判決,說(shuō)自己給王一博道過(guò)歉了,結(jié)果向AI提問(wèn)的人便相信了這一事實(shí),接著大肆傳播,最后又引來(lái)一大堆轉(zhuǎn)發(fā),把這個(gè)謠言鬧得越來(lái)越大——直到有人發(fā)現(xiàn),最初的信源居然是AI扯的淡。
被數(shù)據(jù)污染的AI,在自信中輸出了嚴(yán)重的幻覺(jué),而人類在對(duì)AI的相信,讓這一幻覺(jué)進(jìn)一步傳播……這完全是比信息污染更嚴(yán)重的認(rèn)知污染。如果類似的情況繼續(xù)傳播下去,認(rèn)知污染沒(méi)準(zhǔn)就又反作用到暫時(shí)還不會(huì)規(guī)避數(shù)據(jù)污染的AI身上——丸辣,又閉環(huán)辣。
所以,想要避免數(shù)據(jù)污染與認(rèn)知污染來(lái)回搬史,就不能單靠AI開發(fā)者們提高技術(shù),也不能單靠法律法規(guī)的完善,更是得讓“AI不能全信”這個(gè)看似已經(jīng)是互聯(lián)網(wǎng)基礎(chǔ)的知識(shí),徹底成為新時(shí)代網(wǎng)民們的共識(shí)才行,就像曾經(jīng)需要被科普的“搜索引擎搜來(lái)的東西不一定全對(duì)”那樣——更何況,如今的AI本就是個(gè)更高級(jí)的搜索引擎。
這樣看來(lái),AI滿腦子AV女優(yōu)和不良網(wǎng)站這事,雖然聽上去很搞,但如果真能靠這種離譜的東西讓更多人知曉“數(shù)據(jù)污染”所帶來(lái)的風(fēng)險(xiǎn),那也不無(wú)益處——你永遠(yuǎn)無(wú)法質(zhì)疑GHS這一塊的傳播能力。
更何況,AI輸出假文獻(xiàn)可能沒(méi)多少人在乎,但AI要是敢瞎編番號(hào),那我就得讓你知道什么是小頭控制大頭了——只不過(guò)這次,真是越控制越清醒。
可供擴(kuò)展的參考:
原文:Speculating LLMs' Chinese Training Data Pollution from Their Tokens https://arxiv.org/pdf/2508.17771v1
技術(shù)分析:
GPT-4o 見 AV 女優(yōu)的次數(shù)比「您好」還多 2.6 倍,AI 正在被中文互聯(lián)網(wǎng)瘋狂污染?
https://mp.weixin.qq.com/s/5fKFmC53MiMaWow4drr0sA
EMNLP2025 | 揭開LLM訓(xùn)練數(shù)據(jù)中的中文污染真相,有比“您好”高2.6倍的token?
https://mp.weixin.qq.com/s/2Lnwxc3uv2hzZyb8X4Rrvg
京ICP備14006952號(hào)-1 京B2-20201630 京網(wǎng)文(2019)3652-335號(hào) 滬公網(wǎng)安備 31011202006753號(hào)違法和不良信息舉報(bào)/未成年人舉報(bào):legal@3dmgame.com
CopyRight?2003-2018 違法和不良信息舉報(bào)(021-54473036) All Right Reserved
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論