此为历史版本和 IPFS 入口查阅区，回到作品页

IPFS 指纹这是什么

📝📝：AI 無法「想到」東西，AI 的「聯想」只是在取樣｜學生的「聯想」，比任何 LLM 都更值得被認識

鋼哥

5 月 22 日

人類列出十個詞，是在思考。AI 列出十個詞，是在取樣一個語義場。

本文參考自美國教育工作者 Nick Potkalitsky 與 Terry Underwood 合著的文章《How Humans Free Associate Words and How Bots Do Not》

你現在試試看：想到「橋」這個字，腦海中浮現的前十個詞是什麼？

也許是「河流」、「鋼索」、「跨越」。但也可能是 Simon & Garfunkel 的《惡水上的大橋》（Bridge over Troubled Water）、或是你第一次開車過大橋時的記憶、又或者突然跳出「牌局」這個完全不相干的聯想。

老實說，你腦子裡發生的事情，AI 辦不到。

這個實驗在做什麼

美國教育工作者 Nick Potkalitsky 與 Terry Underwood 在 2026 年發表《How Humans Free Associate Words and How Bots Do Not》研究，設計了一個極簡單的任務：

給同一個詞，要求人類與 AI 各自列出腦海中浮現的十個聯想詞

四個刺激詞，分別代表不同程度的「語義限制密度」：

hammer（鎚子）：高限制，語義場窄、緊密
sky（天空）：中限制，廣泛但有共同背景
bridge（橋）：中限制，橫跨多個語義域
memory（記憶）：低限制，極度發散、個人化

52 位人類參與者，加上 Gemini、ChatGPT、Claude、Sonar 等五個大型語言模型，全部使用相同的指令，產出相同格式的結果。表面上，結果看起來差不多，骨子裡截然不同。

人類的聯想有移動的軌跡

Potkalitsky 與 Underwood 發現，人類的聯想清單並不是一堆詞的隨機排列，而是認知移動的痕跡，具有三種可辨識的結構：

1️⃣群集（Clustering）：相鄰詞屬於同一語義鄰域。

一位受訪者（R38）在 hammer 清單中寫下：

Nail, wood, force, pound, tool,
construction, head, arm, radio, dinner

前八個詞其實是一個有邏輯順序的場景展開：

作用對象（nail/wood）→ 動作（force/pound）→ 類別與情境（tool/construction）→ 身體部位（head/arm）。這是一個使用鎚子的場景，從外向內，從物件到行為者。

2️⃣序列（Sequencing）：每個詞觸發下一個詞，形成鏈式推進。

低限制詞「memory」最能看出這一點。受訪者 R2 的清單是：

Sister, father, motorcycle, horse, family,
streetlights, ocean, dementia, grandma, baseball

R2 的清單就像是在走過自己的記憶本身，不只是在描述記憶而已。

姐姐引出父親，接續父親再引出摩托車，記憶中誰騎馬、誰騎車？家庭概括這一切，然後路燈、海洋、失智症（dementia）的隱患、奶奶、棒球。這是一條生命的痕跡，AI 永遠無法複製，因為 AI 沒有奶奶。

3️⃣轉折（Transitioning）：列表突然從一個語義域跳到另一個。

人類會在一個語義場用盡之後，做出有意識或無意識的跳躍。

R38 在列完鎚子場景後，突然出現 radio, dinner 可能是工作時播放的電台，可能是收工後的晚餐。這個跳躍讓前八個詞突然成為「前景」，後兩個詞成為「脈絡」，整個清單獲得了一種敘事結構。

左邊那條從 1 到 10 蜿蜒的線，畫過四個不同顏色的鄰域。1、2 在親屬，3、4 跳到物件，5 又回到親屬，再下到感官（6、7）、情感（8），又跳回親屬（9），最後 10 跑到所有鄰域之外。

顏色多、軌跡彎、有跳躍。這就是人類聯想的形狀。

右邊則是另一個完全不同的故事：只有一種顏色，一個區域，沒有路徑。

十個點全部落在「靠近提示詞」的高機率區域內，其中 4 個深藍色的點（1、3、5、8）幾乎黏在一起。那就是「重複取樣」：模型沒有記得自己剛才已經抽過這個概念區，於是又抽了一次、再一次、再一次。

注意一個關鍵差異：左邊的點是有先後順序的（每一步根據前一步決定方向）；右邊的點是互相獨立的（每一步都從同一個分布抽取，跟前一步沒有因果關係）。這正是 next-token prediction 的本質，LLM 不是在「想下一個詞」，只是在「對當前語境再做一次條件機率取樣」。

AI 的「聯想」其實是在取樣

同樣是 bridge 這個詞，Claude 4.6 給出：

Connection, River, Arch, Crossing, Steel,
Suspension, Gap, Transit, Span, Link

看起來很合理對嗎？

但兩位研究者指出一個驚人的問題：

Connection、Transit、Span、Link 四個詞，在語義上做的是同一件事，都在說「橋的功能是連接」。

四個近義詞散落在清單各處，中間穿插著物理結構詞，像是在反覆採樣同一個概率密度最高的語義區域。這就是研究者所稱的「重複取樣」（recurrent sampling）。

換句話說，AI 並不是在與料庫裡移動或漫遊，Claude 4.6 只是在原地掃描一個語義場的高密度區域，每次都可能不小心再次落在同一類別上。AI 根本沒有記住自己剛才說了什麼，當然也沒有「這個方向已經走過了，換一條路」的意識。

Gemini 的 hammer 清單同樣如此：

Nail, Tool, Metal, Wood, Strike, Build,
Workshop, Handle, Heavy, Construction

同樣的狀況再次發生，Workshop（工作室）排在第七位，而 Construction（建築）則在第十位。兩者都是「情境詞」，做著相同的分類工作，卻出現了兩次。任意打亂第二到第十個詞的順序，這份清單不會變得更差，也不會更好，因為 AI 的排列本身不帶資訊。

AI 的「聯想」其實是在取樣。Photo by Steve A Johnson on Unsplash

這對教育意味著什麼

研究者提出了三個對教育實踐有直接衝擊的推論：

推論一：表面相似掩蓋了結構差異

當學生把自己的聯想清單和 AI 的清單放在一起比較，他們可能會注意到詞彙重疊「啊，我們想到的差不多嘛」。

但他們不會自動注意到：一份清單是思維移動的軌跡，另一份是概率分布的採樣。這兩件事看起來像，骨子裡完全不同。

教育者的任務，是幫學生發展「看穿這層差異」的眼力

推論二：我們是否在訓練學生更像 AI？

這是整篇文章裡最值得警惕的問題。

Potkalitsky 與 Underwood 質疑：

傳統的學術寫作訓練，往往要求學生「抑制」那些這個研究認為最具人類認知特徵的行為：語音跳躍、個人記憶的闖入、離題的聯想、不相干的敘事彎路。

我們要學生「保持論點一致」、「不要離題」、「只寫相關內容」。這些確實是學術論證的基本規範。

但當這些規範被過度強調，當我們剪除所有的轉折、所有的個人化語義跳躍，我們是否正在把學生訓練成更高效、更精緻的語義場取樣機器？

推論三：轉折必須被明確教導

人類的「轉折時刻」，意識到自己在某個語義鄰域，決定移動到另一個，是一種元認知與元語言能力。這不需要成為語言學家才能掌握，但需要有人帶著你有意識地察覺：

我的思維剛才往哪裡走了？
為什麼在這個詞之後我突然想到那個詞？

AI 沒有這種能力，因為根本沒有「清單走過了哪裡」的感知，只有「清單是什麼」的上下文脈絡。教師的角色，正是幫學生把這種無意識的認知移動帶到意識層面。

教師的角色，正是幫學生把這種無意識的認知移動帶到意識層面。Photo by Adam Winger on Unsplash

一個實作提議

這個研究其實提供了一個非常具體可操作的教學活動：

讓學生選一個詞，寫下十個聯想
讓 AI 做同樣的事
並排比較 — — 不是比「誰寫得更好」，而是找：你的清單在哪裡轉折了？AI 的清單有沒有轉折？為什麼沒有？
請學生解釋自己的轉折：「我為什麼從這個詞跳到那個詞？」

這個小小的練習，能讓學生親身體驗「思維軌跡」與「語義取樣」的差異，比任何關於 AI 侷限的講授都更直接。

AI 列出了詞，人類走過了一段路

研究者在結論中說了一句話，值得所有教育工作者記住：

「人類列出十個詞，是在思考。AI 列出十個詞，是在取樣一個語義場。」

這兩種操作產出的清單，乍看之下相似。但差異就藏在：哪裡有轉折，哪裡有個人記憶闖入，哪裡有一個場景自然地展開又自然地結束。

這些痕跡，就是思維本身。

而我們作為教育者最重要的工作之一，是確保學生知道：他們腦子裡正在發生的這件事，叫做「想」，而它比任何語言模型都更值得被認識、被信任、被深化。

CC BY-NC-ND 4.0 授权