📝📝:ChatGPT 用生產力取代學習的努力|MIT 媒體實驗室研究思考外包的代價

本文參考自 MIT 媒體實驗室(MIT Media Lab)的研究論文《Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task》
大型語言模型(LLM)如 ChatGPT、Claude 被塑造成強大的學習輔助工具,能夠產生即時回應、個人化回饋,甚至完整的論文。
但正如 MIT Media Lab 研究所發現,AI 在便利性上的給予,可能會悄悄地在認知深度、記憶保持奪走同等的價值。而這其中的代價卻十分高昂,研究人員稱之為「認知債務」(cognitive debt)。
LLM 組、Google 組、人腦組
來自 MIT、Harvard、Wellesley 等校的五十四名大學生參與了三個主要階段,其中一部分完成了第四階段。
在每個階段中,他們被給予 SAT(Scholastic Assessment Test,由美國大學理事會 (College Board) 主辦的標準化考試)論文題目,範圍從忠誠的本質到幸福的意義。
前三個階段中,他們的輔助方法按組別固定,第四階段則對調。
階段分解:
LLM 組:只能使用 ChatGPT。
搜尋組:可以使用任何網站(Google, Bing 等),但不能用 AI 工具。
純腦力組:不能使用任何外部資源。
第四階段:工具對調,LLM 使用者無輔助撰寫,純腦力使用者嘗試 ChatGPT。
EEG 數據(腦電圖 Electroencephalogram 的縮寫)、訪談記錄、論文文本和評分(由人類和 AI 評審)經過三角驗證,以測量神經參與度、認知負荷、記憶回憶和感知擁有權。

LLM 組幾乎沒有腦部連結
研究最引人注目的發現之一在於各組間的腦部活動模式。
EEG 分析顯示,僅依賴大腦的參與者(無外部工具)展現出最高的神經連結性,特別是在 α 波和 β 波頻段,因為這主要與注意力、工作記憶和深度認知處理相關。
相較之下:
LLM 組顯示出最低的腦部連結性,顯示出參與度不足和注意力低下。
搜尋組居於中間,顯示適度參與。
這個趨勢在第四階段特別明顯:
從純腦力到 LLM 的參與者(最初無輔助,然後使用 ChatGPT)展現出增強的神經效率並保持較高的記憶回憶。
從 LLM 到純腦力的參與者則相反,顯示連結性大幅下降,表明對 LLM 的依賴已削弱了他們獨立的認知激活。
研究者指出,頻繁使用 LLM 可能會訓練大腦「蜻蜓點水」(coast),而非深度思考。

記憶與引用能力明顯衰退
當參與者被要求引用自己的論文內容(也就是在幾分鐘前寫完的)結果對 LLM 組來說是致命的:
83% 無法提供一個正確的引用。
相較之下,只有 11% 的搜尋組和純腦力組使用者有類似困難。
這暗示 LLM 輔助寫作可能繞過短期記憶加工,可能是因為使用者將想法的形成和保持都外包給了 AI。
在訪談中,許多 LLM 使用者無法回憶論文的結構或主要論點。一位參與者說這個過程讓他們感到「分析癱瘓」(analysis-paralysis),另一位則覺得產出「機械且缺乏個人色彩」。
論文品質高度相似
有趣的是,LLM 組的論文在人類和 AI 評審眼中往往得分頗佳,特別是在語法、詞彙和組織方面。但深入分析後發現:
許多 LLM 論文呈現同質化,共享驚人相似的 n-gram、命名實體和主題措辭。而且,LLM 組產出的論文更接近 ChatGPT 的預設答案,而非原創的學生思維。而純腦力論文具有更多變化、獨特觀點和更清晰的推理鏈。
這證實了一個關鍵點:
良好的結構和流暢度
並不等同於深度理解或原創思維

工具交換的後座力
在實驗的第四階段,參與者交換了組別:
從 LLM 到純腦力的參與者
被剝奪了 AI 輔助,表現明顯困難。他們的神經連結性仍然很低,論文缺乏原創性和結構。
從純腦力到 LLM 的參與者
儘管第一次使用 ChatGPT,仍保持高度記憶回憶,也能呈現出更有創意的 AI 建議整合。
這暗示在沒有 AI 的情況下進行思考的先前習慣建立了認知韌性,而頻繁的 AI 依賴削弱了獨立思考,即使工具被移除時也是如此。
MIT 這項研究並不是在妖魔化 LLM 反而強調了我們如何使用 AI 的重要性。
對於低效能學習者來說,LLM 可能成為「教育上的拐杖」,用生產力的安慰取代學習的努力。但是,對於高效能學習者,LLM 可以是延伸思維的工具,但只有在策略性使用時才如此。
教育者應該在使用 LLM 時鼓勵主動提問、反思和資料來源驗證。被動使用或複製貼上只會導致空洞的理解。