📝📝:AI 無法「想到」東西,AI 的「聯想」只是在取樣|學生的「聯想」,比任何 LLM 都更值得被認識
本文參考自美國教育工作者 Nick Potkalitsky 與 Terry Underwood 合著的文章《How Humans Free Associate Words and How Bots Do Not》
你現在試試看:想到「橋」這個字,腦海中浮現的前十個詞是什麼?
也許是「河流」、「鋼索」、「跨越」 。但也可能是 Simon & Garfunkel 的《惡水上的大橋》(Bridge over Troubled Water)、或是你第一次開車過大橋時的記憶、又或者突然跳出「牌局」這個完全不相干的聯想。
老實說,你腦子裡發生的事情,AI 辦不到。
這個實驗在做什麼
美國教育工作者 Nick Potkalitsky 與 Terry Underwood 在 2026 年發表《How Humans Free Associate Words and How Bots Do Not》研究,設計了一個極簡單的任務:
給同一個詞,要求人類與 AI 各自列出腦海中浮現的十個聯想詞
四個刺激詞,分別代表不同程度的「語義限制密度」:
hammer(鎚子):高限制,語義場窄、緊密
sky(天空):中限制,廣泛但有共同背景
bridge(橋):中限制,橫跨多個語義域
memory(記憶):低限制,極度發散、個人化
52 位人類參與者,加上 Gemini、ChatGPT、Claude、Sonar 等五個大型語言模型,全部使用相同的指令,產出相同格式的結果。表面上,結果看起來差不多,骨子裡截然不同。
人類的聯想有移動的軌跡
Potkalitsky 與 Underwood 發現,人類的聯想清單並不是一堆詞的隨機排列,而是認知移動的痕跡,具有三種可辨識的結構:
1️⃣群集(Clustering):相鄰詞屬於同一語義鄰域。
一位受訪者(R38)在 hammer 清單中寫下:
Nail, wood, force, pound, tool,
construction, head, arm, radio, dinner
前八個詞其實是一個有邏輯順序的場景展開:
作用對象(nail/wood)→ 動作(force/pound)→ 類別與情境(tool/construction)→ 身體部位(head/arm)。這是一個使用鎚子的場景,從外向內,從物件到行為者。
2️⃣序列(Sequencing):每個詞觸發下一個詞,形成鏈式推進。
低限制詞「memory」最能看出這一點。受訪者 R2 的清單是:
Sister, father, motorcycle, horse, family,
streetlights, ocean, dementia, grandma, baseball
R2 的清單就像是在走過自己的記憶本身,不只是在描述記憶而已。
姐姐引出父親,接續父親再引出摩托車,記憶中誰騎馬、誰騎車?家庭概括這一切,然後路燈、海洋、失智症(dementia)的隱患、奶奶、棒球。這是一條生命的痕跡,AI 永遠無法複製,因為 AI 沒有奶奶。
3️⃣轉折(Transitioning):列表突然從一個語義域跳到另一個。
人類會在一個語義場用盡之後,做出有意識或無意識的跳躍。
R38 在列完鎚子場景後,突然出現 radio, dinner 可能是工作時播放的電台,可能是收工後的晚餐。這個跳躍讓前八個詞突然成為「前景」,後兩個詞成為「脈絡」,整個清單獲得了一種敘事結構。
左邊那條從 1 到 10 蜿蜒的線,畫過四個不同顏色的鄰域。1、2 在親屬,3、4 跳到物件,5 又回到親屬,再下到感官(6、7)、情感(8),又跳回親屬(9),最後 10 跑到所有鄰域之外。
顏色多、軌跡彎、有跳躍。這就是人類聯想的形狀。
右邊則是另一個完全不同的故事:只有一種顏色,一個區域,沒有路徑。
十個點全部落在「靠近提示詞」的高機率區域內,其中 4 個深藍色的點(1、3、5、8)幾乎黏在一起。那就是「重複取樣」:模型沒有記得自己剛才已經抽過這個概念區,於是又抽了一次、再一次、再一次。
注意一個關鍵差異:左邊的點是有先後順序的(每一步根據前一步決定方向);右邊的點是互相獨立的(每一步都從同一個分布抽取,跟前一步沒有因果關係)。這正是 next-token prediction 的本質,LLM 不是在「想下一個詞」,只是在「對當前語境再做一次條件機率取樣」。
AI 的「聯想」其實是在取樣
同樣是 bridge 這個詞,Claude 4.6 給出:
Connection, River, Arch, Crossing, Steel,
Suspension, Gap, Transit, Span, Link
看起來很合理對嗎?
但兩位研究者指出一個驚人的問題:
Connection、Transit、Span、Link 四個詞,在語義上做的是同一件事,都在說「橋的功能是連接」。
四個近義詞散落在清單各處,中間穿插著物理結構詞,像是在反覆採樣同一個概率密度最高的語義區域。這就是研究者所稱的「重複取樣」(recurrent sampling)。
換句話說,AI 並不是在與料庫裡移動或漫遊,Claude 4.6 只是在原地掃描一個語義場的高密度區域,每次都可能不小心再次落在同一類別上。AI 根本沒有記住自己剛才說了什麼,當然也沒有「這個方向已經走過了,換一條路」的意識。
Gemini 的 hammer 清單同樣如此:
Nail, Tool, Metal, Wood, Strike, Build,
Workshop, Handle, Heavy, Construction
同樣的狀況再次發生,Workshop(工作室)排在第七位,而 Construction(建築)則在第十位。兩者都是「情境詞」,做著相同的分類工作,卻出現了兩次。任意打亂第二到第十個詞的順序,這份清單不會變得更差,也不會更好,因為 AI 的排列本身不帶資訊。
這對教育意味著什麼
研究者提出了三個對教育實踐有直接衝擊的推論:
推論一:表面相似掩蓋了結構差異
當學生把自己的聯想清單和 AI 的清單放在一起比較,他們可能會注意到詞彙重疊「啊,我們想到的差不多嘛」。
但他們不會自動注意到:一份清單是思維移動的軌跡,另一份是概率分布的採樣。這兩件事看起來像,骨子裡完全不同。
教育者的任務,是幫學生發展「看穿這層差異」的眼力
推論二:我們是否在訓練學生更像 AI?
這是整篇文章裡最值得警惕的問題。
Potkalitsky 與 Underwood 質疑:
傳統的學術寫作訓練,往往要求學生「抑制」那些這個研究認為最具人類認知特徵的行為:語音跳躍、個人記憶的闖入、離題的聯想、不相干的敘事彎路。
我們要學生「保持論點一致」、「不要離題」、「只寫相關內容」。這些確實是學術論證的基本規範。
但當這些規範被過度強調,當我們剪除所有的轉折、所有的個人化語義跳躍,我們是否正在把學生訓練成更高效、更精緻的語義場取樣機器?
推論三:轉折必須被明確教導
人類的「轉折時刻」 ,意識到自己在某個語義鄰域,決定移動到另一個,是一種元認知與元語言能力。這不需要成為語言學家才能掌握,但需要有人帶著你有意識地察覺:
我的思維剛才往哪裡走了?
為什麼在這個詞之後我突然想到那個詞?
AI 沒有這種能力,因為根本沒有「清單走過了哪裡」的感知,只有「清單是什麼」的上下文脈絡。教師的角色,正是幫學生把這種無意識的認知移動帶到意識層面。
一個實作提議
這個研究其實提供了一個非常具體可操作的教學活動:
讓學生選一個詞,寫下十個聯想
讓 AI 做同樣的事
並排比較 — — 不是比「誰寫得更好」,而是找:你的清單在哪裡轉折了?AI 的清單有沒有轉折?為什麼沒有?
請學生解釋自己的轉折:「我為什麼從這個詞跳到那個詞?」
這個小小的練習,能讓學生親身體驗「思維軌跡」與「語義取樣」的差異,比任何關於 AI 侷限的講授都更直接。
AI 列出了詞,人類走過了一段路
研究者在結論中說了一句話,值得所有教育工作者記住:
「人類列出十個詞,是在思考。AI 列出十個詞,是在取樣一個語義場。」
這兩種操作產出的清單,乍看之下相似。但差異就藏在:哪裡有轉折,哪裡有個人記憶闖入,哪裡有一個場景自然地展開又自然地結束。
這些痕跡,就是思維本身。
而我們作為教育者最重要的工作之一,是確保學生知道:他們腦子裡正在發生的這件事,叫做「想」,而它比任何語言模型都更值得被認識、被信任、被深化。
