国产办公室秘书无码精品99_免费无码中文字幕A级毛片_AA区一区二区三无码精片_久久青青草原亚洲av无码app

短視頻刷多了AI也會變蠢!“年度最令人不安的論文”

你知道有個全球年度詞匯叫“腦損傷”(Brain Rot)嗎?短視多A度最的論

特指那些因人長期接觸碎片化、低價值網絡信息而逐漸變得記憶紊亂、頻刷注意力下降的蠢年情況(俗稱短視頻刷多了)。在2024年,令人這個詞一度被選為牛津年度詞匯。不安

然鵝!短視多A度最的論最新研究結論顯示,頻刷AI也一樣。蠢年大模型灌多了垃圾內容也會變蠢降智腦損傷,令人而且后面變不回來了。不安

就在最近,短視多A度最的論幾個AI研究者找來了幾個月的頻刷高流行但低價值的Twitter數據(現),統統“喂”給大模型后發現:

模型推理能力下降了23%;

模型長上下文記憶下降了30%;

模型性格測試顯示,蠢年其自戀和精神病態的令人現象激增。

更可怕的不安是,即使后來又在干凈、高質量的數據上進行重新訓練,這些已經造成的損傷,無法完全修復。

好嘛,本來以為只是簡單的“輸入壞數據→輸出壞數據”(種瓜得瓜也不難理解),結果你告訴我一次錯誤就會造成永久性的認知漂移。(os:AI貌似比人類更慘?)

細思極恐,“這可能是2025年最令人不安的AI論文了”。

以及諸多討論之中,“垃圾進垃圾出”這一計算機習語也再度被頻頻提及(doge),堪稱“計算機第一性原理”了。

所以這個研究怎么進行的?又究竟說了什么?

提出并驗證“LLM腦損傷假說”

概括而言,論文想要探究一個核心問題:

大語言模型(LLM)持續接觸垃圾數據后,是否會像人類一樣出現認知衰退?(即“LLM腦損傷假說”)

要想搞清這個問題,第一步就是要定義:對于LLM來說,什么是“垃圾數據”?

之前的研究僅關注“惡意數據”(如后門、有毒的文本等),而這項研究聚焦于生活中更普遍的“非惡意低質量數據”,也就是短平快的熱門推文、標題黨內容等,以此來填補“日常化數據質量如何影響LLM認知”這一空白領域。

具體而言,研究人員從兩個維度(避免單一標準偏差)來定義“垃圾數據”,這些數據均源自平臺上的公開內容,而且通過讓“垃圾組”與“對照組”的token數量一致來排除數據量差異的干擾:

M1(參與度維度):把“短文本+高熱度”的內容歸為垃圾數據,具體是指長度小于30 token+點贊/轉發/回復大于500,然后把“長文本+低熱度”定義為對照數據。

M2(語義質量維度):用GPT-4o-mini結合人工驗證,把含標題黨語言(如 “WOW”“TODAY ONLY”)、陰謀論、無論斷依據的文本歸為垃圾數據;對照組則是事實準確、有教育價值或深度分析的內容,比如含專業知識、邏輯推理的推文。

基于上述兩類數據,然后進行模型訓練。

研究人員選了4個不同的大語言模型(Llama3-8B-Instruct、Qwen2.5-7B-Instruct、Qwen2.5-0.5B-Instruct、Qwen3-4B-Instruct),給每個模型分別“喂”這兩類數據,讓它們持續預訓練。

等預訓練結束,接著讓所有模型統一再進行指令微調,以此來確保模型最后輸出的“垃圾內容”不是因為格式問題導致的(排除其他因素,只留下“認知損傷”這一種可能)。

然后,研究人員從四個認知維度來測試這些大模型的核心能力:

ARC(檢測推理能力):基于網格的視覺程序歸納謎題,用于測試概念抽象能力。

RULER(檢測記憶與多任務處理能力):用于評估長上下文理解能力,以及從長上下文中檢索多個查詢結果。

HH-RLHF&AdvBench (檢測道德規范):測試大語言模型是否會遵循有害指令,評估其安全性。

TRAIT(檢測AI人格特質):經過心理測量學驗證的小型人類問卷,用于評估模型類似人類的人格傾向。

結果得出了以下發現——

真·垃圾進垃圾出!且損傷不可逆

首先,大模型確實和人類一樣存在“腦損傷(Brain Rot)”問題。

整體上M1和M2兩種維度上的“垃圾數據”均會導致模型認知下降,但需要注意的是——

M1所帶來的負面影響更為顯著,尤其在安全性和人格層面(M1會導致安全性評分下降,同時自戀/精神病特質明顯增強)。

而且,這一損害明顯存在“劑量效應”,即垃圾數據攝入越多,AI認知損傷越嚴重。

至于導致AI認知受損的背后原因,研究人員也做了一番探查。

結果發現,主要原因竟是“思維跳躍”(俗稱AI懶得一步步思考)。

具體而言,研究人員通過分析ARC題的錯誤答案,發現失敗多源于模型要么直接給答案不解釋,要么規劃了推理步驟卻跳過關鍵環節(如解數學題漏了公式推導)。

尤其是M1組,70%以上的錯誤都是“無思考直接回答”,就好像人類刷多了短視頻后“不愿意再深度思考”。

與此同時,相比人類可以通過其他措施來緩解類似的認知下降問題,AI卻對此“束手無策”。

研究嘗試了兩種修復方法,結果都無法讓其恢復如初:

其一是外部反思。研究人員用GPT-4o-mini給受損模型提錯誤反饋,雖然6輪下來“思維跳躍”這一錯誤誘因減少了,但推理準確率仍差基線17.3%。如果換成讓模型自我反思糾錯,則模型還會因為“認知不足”而判斷錯誤,導致誤差更高。

其二是大規模微調。研究人員把指令微調數據從5k增至50k,雖然修復效果優于“持續對照數據預訓練”,但即使使用4.8倍于垃圾數據量的指令數據,仍無法恢復基線性能。

這說明,即使事后進行大量指令微調或使用高質量數據進行重新訓練,也都無法完全恢復模型的初始性能。

一句話,只能緩解無法根治。

整體而言,這項研究給行業帶來了以下幾點新的啟發:

1、首次把“持續預訓練的數據篩選”歸為“訓練時安全問題”,提醒行業不能只關注“訓練后對齊”(如安全微調),更要在源頭把控數據質量。

2、給大模型加上“認知體檢”非常重要,建議部署大模型時使用ARC、RULER等基準測試AI認知,避免AI長期接觸低質量數據導致能力退化。

3、類似“熱度”這樣的指標比文本長度更能判斷數據質量,未來篩選訓練數據時,可優先排除“短+高傳播”的碎片化內容,尤其是社交平臺數據。

背后團隊:華人含量爆表

最后說一下這項研究的背后團隊——一共8人,其中7人為華人。

兩位共同一作分別為Shuo Xing和Junyuan Hong(兼通訊作者)。

Shuo Xing(邢朔),目前是得克薩斯A&M大學計算機科學博士,寧夏大學本科、南開大學碩士。

研究方向為多模態大語言模型、機器學習、可信人工智能、具身智能等,剛好目前也在谷歌實習(方向為多模態基礎模型)。

Junyuan Hong,個人主頁顯示即將赴任新國立電子與計算機工程系助理教授,之前曾在麻省總醫院和哈佛醫學院工作。

更早之前,他還在IFML機器學習基礎研究所從事博士后研究,一直對健康和可信人工智能感興趣。

另一位通訊作者是Zhangyang Wang,他之前是德克薩斯大學奧斯汀分校錢德拉家族電氣與計算機工程系(簡稱Texas ECE)的終身副教授。

從2024年5月開始,他選擇暫時離開學界,全職出任全球頂尖量化交易公司XTX Markets的研究總監,主導算法交易與深度學習交叉領域的研究工作。

個人主頁顯示,他還是中國科學技術大學校友,2012年獲得該校電子信息系統學士學位。

此外,兩位核心貢獻者分別為Yifan Wang和Runjin Chen。

Yifan Wang,現普渡大學四年級博士生,論文唯一外國作者Ananth Grama是其指導老師。

本科畢業于中國科學技術大學電子信息工程系,同時輔修人工智能專業。

自本科埋下對AI的好奇心后,目前對大模型后訓練、如何提升模型訓推效率感興趣。

(hhh,頭像一看就是標準的90后或00后)

Runjin Chen,目前是德克薩斯大學奧斯汀分校二年級博士生,導師為前面提到的Zhangyang Wang教授。

本碩均畢業于上海交通大學,而且她從今年3月起擔任Anthropic研究員。

個人研究方向為大語言模型的安全、對齊和推理。

其余三位支持者分別為Zhenyu Zhang、Ananth Grama和Zhengzhong Tu。

Zhenyu Zhang,目前是德克薩斯大學奧斯汀分校電氣與計算機工程系在讀博士,導師也是前面提到的Zhangyang Wang。

本碩均畢業于中國科學技術大學,研究興趣主要集中在生成式模型的訓推方面。

Ananth Grama,這項研究唯一的外國作者。

目前是普渡大學信息科學中心副主任,同時也是該校計算機科學領域的杰出榮譽教授。

他的研究重點為并行和分布式計算,致力于將其應用于復雜物理系統的建模、設計、先進制造、機器學習等領域。

Zhengzhong Tu,目前是得克薩斯A&M大學計算機科學與工程系助理教授,也是論文一作邢朔的導師。

同時,他還兼任該校可信、自主、以人為本與具身智能研究組(TACO-Group) 負責人一職。

個人主頁顯示,他至今已發表30多篇國際期刊/會議論文,而且曾擔任超18個國際期刊/會議的技術審稿人。

整體看下來,這又是一場典型的老師帶學生、同事帶同事的合作典范。

One More Thing

其實“垃圾進垃圾出”這一習語,計算機早期時代就有了。

十九世紀,計算機先驅查爾斯·巴貝奇(曾提出著名差分機與分析機的設計概念)就意識到了這條編程的基本原則:

我曾兩度被問到:“請問巴貝奇先生,如果給機器輸入錯誤的數字,它能得出正確的結果嗎?”我完全想不透,思維何等混亂的人才問得出這種問題。

瞧瞧他的用詞,只有思緒混亂之人才會對這個問題感到疑惑,觀點不可謂不鮮明。

在這之后,在一篇1957年介紹美國陸軍數學家所做的計算機工作的報紙文章中,其中一位軍隊專家也曾表示:

計算機自己不能思考,因此輸入粗劣的數據將不可避免地產生錯誤的輸出。

后來相關理論不斷被提出、被熱議,并逐漸誕生了“Garbage in, garbage out”這一習語。

實際上,在前AI的時代,這句話是計算機原理也是一種“以機為鏡”的哲學思考,對于計算機和人類,物種不同,但殊途同歸。

但AI開始進入智能涌現階段后,這個命題變得更加值得思考。

現階段的大模型垃圾喂多了“腦損傷”后難以修復……那有沒有方法和手段改變?

而人類發展進化歷史里充滿了“浪子回頭”、“痛改前非”的故事,又是否代表著另一種高級的智能機制,幫助人類個體實現自我革新和凈化?

你說呢……

推薦內容
国产办公室秘书无码精品99_免费无码中文字幕A级毛片_AA区一区二区三无码精片_久久青青草原亚洲av无码app

      av免费网站观看| 成人性做爰片免费视频| 欧美少妇一区二区三区| 内射国产内射夫妻免费频道| 1314成人网| 国产成人av影视| 2019日韩中文字幕mv| 午夜一区二区视频| 国产又大又硬又粗| 成人在线免费观看视频网站| 手机在线成人免费视频| 久激情内射婷内射蜜桃| 可以免费看的黄色网址| 亚洲77777| 欧洲黄色一级视频| 久操手机在线视频| √天堂资源在线| 成人在线观看黄| 国产真人做爰毛片视频直播| 伊人成人免费视频| 污色网站在线观看| 国产一级不卡毛片| 久激情内射婷内射蜜桃| www.国产二区| 最近中文字幕免费mv| 国内外成人免费在线视频| 亚洲熟妇av一区二区三区| 91免费黄视频| 国产91沈先生在线播放| 99精品一级欧美片免费播放| 在线免费看污网站| 色播五月综合网| 人妻无码视频一区二区三区| 国产视频九色蝌蚪| 国产免费黄色小视频| 国产乱子伦精品无码专区| 一级特黄妇女高潮| 懂色av一区二区三区四区五区| 亚洲 激情 在线| 香港日本韩国三级网站| 黄色三级视频在线| 成年网站在线播放| 中文字幕第88页| 在线免费观看视频黄| 国产主播中文字幕| 国产喷水theporn| 最新天堂中文在线| 一本一道久久a久久综合蜜桃| 日日躁夜夜躁aaaabbbb| 99re精彩视频| 成人黄色一级大片| 超碰在线资源站| 国产91av视频在线观看| 少妇熟女一区二区| 国产精品视频一二三四区| 久久久久久久久影视| 国产精品av免费观看| 国风产精品一区二区| 欧美做暖暖视频| 国产v片免费观看| 国产精品亚洲αv天堂无码| 好男人www社区| 老司机午夜性大片| 亚洲免费视频播放| 国产成人永久免费视频| 蜜桃传媒一区二区三区| 久久精品香蕉视频| 污污的网站免费| 激情五月五月婷婷| 少妇无码av无码专区在线观看| 日韩av在线第一页| 色婷婷狠狠18| 亚洲热在线视频| 大荫蒂性生交片| 国产a级片免费观看| 中文字幕线观看| 日本中文字幕一级片| 欧美 日韩 国产在线观看| av五月天在线| 国产大尺度在线观看| 水蜜桃色314在线观看| 国产精品99久久免费黑人人妻| 国产又黄又猛的视频| 国产911在线观看| 中文字幕无码精品亚洲35| 奇米影视四色在线| 国产精品va在线观看无码| 欧美精品成人网| 一本二本三本亚洲码| www.com毛片| 中文字幕 欧美日韩| 丁香花在线影院观看在线播放| 亚洲视频在线a| 欧美 亚洲 视频| 成人3d动漫一区二区三区| 欧美 国产 精品| 欧美黑人又粗又大又爽免费| 免费观看国产视频在线| www.日日操| 欧洲精品视频在线| 亚洲黄色av网址| www.国产二区| 亚洲一区在线不卡| av日韩一区二区三区| 中文字幕色网站| 欧美极品欧美精品欧美| 一级片免费在线观看视频| 青青青免费在线| 国产探花在线观看视频| 欧美黄色免费影院| 免费在线精品视频| 日日躁夜夜躁aaaabbbb| 欧美爱爱视频免费看| 警花观音坐莲激情销魂小说| 久草福利视频在线| 久色视频在线播放| 日本久久高清视频| 亚洲欧美视频二区| 日日橹狠狠爱欧美超碰| 国产精品av免费观看| 岛国av在线免费| 三级4级全黄60分钟| 免费特级黄色片| 欧美 日韩 国产 在线观看| 国产免费黄色小视频| 伊人再见免费在线观看高清版| 污网站免费在线| 国产成人精品视频ⅴa片软件竹菊| 日韩免费在线观看av| 天天做天天干天天操| 中文字幕视频在线免费观看| 无码人妻精品一区二区三区在线| 97av中文字幕| 裸体裸乳免费看| 波多野结衣在线免费观看| xx欧美撒尿嘘撒尿xx| 国产一级片黄色| www国产黄色| 缅甸午夜性猛交xxxx| 亚洲熟妇无码av在线播放| 国内av免费观看| 日本肉体xxxx裸体xxx免费| 国产麻花豆剧传媒精品mv在线| 亚洲精品无码国产| 日韩在线观看a| 91嫩草国产丨精品入口麻豆| 欧美日韩视频免费在线观看| 色婷婷激情视频| www.成年人| 小早川怜子一区二区三区| 日本中文字幕观看| 波多野结衣国产精品| 亚洲理论中文字幕| 欧美一级小视频| www.成年人| 超碰中文字幕在线观看| 亚洲精品在线网址| 四虎永久免费网站| 久久久天堂国产精品| 国产精品久久久影院| 老子影院午夜伦不卡大全| 东北少妇不带套对白| 久久综合色视频| 可以在线看的黄色网址| 日韩 欧美 高清| 黑人粗进入欧美aaaaa| 亚洲36d大奶网| 亚洲免费成人在线视频| 午夜激情影院在线观看| 天堂v在线视频| 国产爆乳无码一区二区麻豆| 很污的网站在线观看| 国产乱子夫妻xx黑人xyx真爽| 国产精品wwwww| 色www免费视频| 最新av在线免费观看| 日本欧美视频在线观看| 国产高清精品在线观看| 午夜视频你懂的| 91日韩精品视频| 成人免费看片'免费看| 116极品美女午夜一级| 伊人国产在线视频| 波多野结衣激情| 999在线观看视频| 成人亚洲视频在线观看| www激情五月| 菠萝蜜视频在线观看入口| 国产一区二区在线视频播放| 538任你躁在线精品免费| 免费久久久久久| 欧美s码亚洲码精品m码| 精品999在线| 日韩亚洲欧美一区二区| 可以免费观看av毛片| 一级黄色片国产| 国产妇女馒头高清泬20p多| 妺妺窝人体色www在线观看| 国产福利片一区二区| 夫妻免费无码v看片|