📝📝:AI 無法「想到」東西,AI 的「聯想」只是在取樣|學生的「聯想」,比任何 LLM 都更值得被認識

鋼哥
·
·
IPFS
·
人類列出十個詞,是在思考。AI 列出十個詞,是在取樣一個語義場。
Photo by lilartsy on Unsplash

本文參考自美國教育工作者 Nick Potkalitsky 與 Terry Underwood 合著的文章《How Humans Free Associate Words and How Bots Do Not


你現在試試看:想到「橋」這個字,腦海中浮現的前十個詞是什麼?

也許是「河流」、「鋼索」、「跨越」 。但也可能是 Simon & Garfunkel 的《惡水上的大橋》(Bridge over Troubled Water)、或是你第一次開車過大橋時的記憶、又或者突然跳出「牌局」這個完全不相干的聯想。

老實說,你腦子裡發生的事情,AI 辦不到。


這個實驗在做什麼

美國教育工作者 Nick Potkalitsky 與 Terry Underwood 在 2026 年發表《How Humans Free Associate Words and How Bots Do Not》研究,設計了一個極簡單的任務:

給同一個詞,要求人類與 AI 各自列出腦海中浮現的十個聯想詞

四個刺激詞,分別代表不同程度的「語義限制密度」:

  • hammer(鎚子):高限制,語義場窄、緊密

  • sky(天空):中限制,廣泛但有共同背景

  • bridge(橋):中限制,橫跨多個語義域

  • memory(記憶):低限制,極度發散、個人化

52 位人類參與者,加上 Gemini、ChatGPT、Claude、Sonar 等五個大型語言模型,全部使用相同的指令,產出相同格式的結果。表面上,結果看起來差不多,骨子裡截然不同。

Photo by Aaron Burden on Unsplash

人類的聯想有移動的軌跡

Potkalitsky 與 Underwood 發現,人類的聯想清單並不是一堆詞的隨機排列,而是認知移動的痕跡,具有三種可辨識的結構:

1️⃣群集(Clustering):相鄰詞屬於同一語義鄰域。

一位受訪者(R38)在 hammer 清單中寫下:

Nail, wood, force, pound, tool,
construction, head, arm, radio, dinner

前八個詞其實是一個有邏輯順序的場景展開:

作用對象(nail/wood)→ 動作(force/pound)→ 類別與情境(tool/construction)→ 身體部位(head/arm)。這是一個使用鎚子的場景,從外向內,從物件到行為者。

2️⃣序列(Sequencing):每個詞觸發下一個詞,形成鏈式推進。

低限制詞「memory」最能看出這一點。受訪者 R2 的清單是:

Sister, father, motorcycle, horse, family,
streetlights, ocean, dementia, grandma, baseball

R2 的清單就像是在走過自己的記憶本身,不只是在描述記憶而已。

姐姐引出父親,接續父親再引出摩托車,記憶中誰騎馬、誰騎車?家庭概括這一切,然後路燈、海洋、失智症(dementia)的隱患、奶奶、棒球。這是一條生命的痕跡,AI 永遠無法複製,因為 AI 沒有奶奶。

3️⃣轉折(Transitioning):列表突然從一個語義域跳到另一個。

人類會在一個語義場用盡之後,做出有意識或無意識的跳躍。

R38 在列完鎚子場景後,突然出現 radio, dinner 可能是工作時播放的電台,可能是收工後的晚餐。這個跳躍讓前八個詞突然成為「前景」,後兩個詞成為「脈絡」,整個清單獲得了一種敘事結構。

由 Claude 繪製

左邊那條從 1 到 10 蜿蜒的線,畫過四個不同顏色的鄰域。1、2 在親屬,3、4 跳到物件,5 又回到親屬,再下到感官(6、7)、情感(8),又跳回親屬(9),最後 10 跑到所有鄰域之外。

顏色多、軌跡彎、有跳躍。這就是人類聯想的形狀。

右邊則是另一個完全不同的故事:只有一種顏色,一個區域,沒有路徑

十個點全部落在「靠近提示詞」的高機率區域內,其中 4 個深藍色的點(1、3、5、8)幾乎黏在一起。那就是「重複取樣」:模型沒有記得自己剛才已經抽過這個概念區,於是又抽了一次、再一次、再一次。

注意一個關鍵差異:左邊的點是有先後順序的(每一步根據前一步決定方向);右邊的點是互相獨立的(每一步都從同一個分布抽取,跟前一步沒有因果關係)。這正是 next-token prediction 的本質,LLM 不是在「想下一個詞」,只是在「對當前語境再做一次條件機率取樣」。

AI 的「聯想」其實是在取樣

同樣是 bridge 這個詞,Claude 4.6 給出:

Connection, River, Arch, Crossing, Steel,
Suspension, Gap, Transit, Span, Link

看起來很合理對嗎?

但兩位研究者指出一個驚人的問題:

Connection、Transit、Span、Link 四個詞,在語義上做的是同一件事,都在說「橋的功能是連接」。

四個近義詞散落在清單各處,中間穿插著物理結構詞,像是在反覆採樣同一個概率密度最高的語義區域。這就是研究者所稱的「重複取樣」(recurrent sampling)。

換句話說,AI 並不是在與料庫裡移動或漫遊,Claude 4.6 只是在原地掃描一個語義場的高密度區域,每次都可能不小心再次落在同一類別上。AI 根本沒有記住自己剛才說了什麼,當然也沒有「這個方向已經走過了,換一條路」的意識。

Gemini 的 hammer 清單同樣如此:

Nail, Tool, Metal, Wood, Strike, Build,
Workshop, Handle, Heavy, Construction

同樣的狀況再次發生,Workshop(工作室)排在第七位,而 Construction(建築)則在第十位。兩者都是「情境詞」,做著相同的分類工作,卻出現了兩次。任意打亂第二到第十個詞的順序,這份清單不會變得更差,也不會更好,因為 AI 的排列本身不帶資訊

AI 的「聯想」其實是在取樣。Photo by Steve A Johnson on Unsplash

這對教育意味著什麼

研究者提出了三個對教育實踐有直接衝擊的推論:

推論一:表面相似掩蓋了結構差異

當學生把自己的聯想清單和 AI 的清單放在一起比較,他們可能會注意到詞彙重疊「啊,我們想到的差不多嘛」。

但他們不會自動注意到:一份清單是思維移動的軌跡,另一份是概率分布的採樣。這兩件事看起來像,骨子裡完全不同。

教育者的任務,是幫學生發展「看穿這層差異」的眼力

推論二:我們是否在訓練學生更像 AI?

這是整篇文章裡最值得警惕的問題。

Potkalitsky 與 Underwood 質疑:

傳統的學術寫作訓練,往往要求學生「抑制」那些這個研究認為最具人類認知特徵的行為:語音跳躍、個人記憶的闖入、離題的聯想、不相干的敘事彎路。

我們要學生「保持論點一致」、「不要離題」、「只寫相關內容」。這些確實是學術論證的基本規範。

但當這些規範被過度強調,當我們剪除所有的轉折、所有的個人化語義跳躍,我們是否正在把學生訓練成更高效、更精緻的語義場取樣機器

推論三:轉折必須被明確教導

人類的「轉折時刻」 ,意識到自己在某個語義鄰域,決定移動到另一個,是一種元認知與元語言能力。這不需要成為語言學家才能掌握,但需要有人帶著你有意識地察覺:

我的思維剛才往哪裡走了?
為什麼在這個詞之後我突然想到那個詞?

AI 沒有這種能力,因為根本沒有「清單走過了哪裡」的感知,只有「清單是什麼」的上下文脈絡。教師的角色,正是幫學生把這種無意識的認知移動帶到意識層面。

教師的角色,正是幫學生把這種無意識的認知移動帶到意識層面。Photo by Adam Winger on Unsplash

一個實作提議

這個研究其實提供了一個非常具體可操作的教學活動:

  1. 讓學生選一個詞,寫下十個聯想

  2. 讓 AI 做同樣的事

  3. 並排比較 — — 不是比「誰寫得更好」,而是找:你的清單在哪裡轉折了?AI 的清單有沒有轉折?為什麼沒有?

  4. 請學生解釋自己的轉折:「我為什麼從這個詞跳到那個詞?」

這個小小的練習,能讓學生親身體驗「思維軌跡」與「語義取樣」的差異,比任何關於 AI 侷限的講授都更直接。


AI 列出了詞,人類走過了一段路

研究者在結論中說了一句話,值得所有教育工作者記住:

「人類列出十個詞,是在思考。AI 列出十個詞,是在取樣一個語義場。」

這兩種操作產出的清單,乍看之下相似。但差異就藏在:哪裡有轉折,哪裡有個人記憶闖入,哪裡有一個場景自然地展開又自然地結束。

這些痕跡,就是思維本身。

而我們作為教育者最重要的工作之一,是確保學生知道:他們腦子裡正在發生的這件事,叫做「想」,而它比任何語言模型都更值得被認識、被信任、被深化。


CC BY-NC-ND 4.0 授权
已推荐到频道:时事・趋势

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!

鋼哥從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、行為經濟學、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
  • 来自作者
  • 相关推荐

📝📝:人類負責決策,AI 負責執行|你對問題理解多深,將會決定 AI 能為你處理得多好

🎥🎞️📝《深度安靜》|當受害者終於說了,為什麼還是沒有人聽得見?

光影筆記
35 篇作品