📝📝：讓 Claude 經營一台販賣機靠譜嗎？｜錯估商品價格、甚至直接免費贈送商品

鋼哥

2025 年 7 月 11 日

IPFS

AI 在商業營運方面確實有些許慧根，然而，研究也發現，AI 無法理解「成本」，最終導致錯估商品價格、甚至直接免費贈送商品。

Anthropic 與 Andon Labs 攜手合作一個開創性的專案：

Project Vend

如同標題所示：Can Claude run a small shop? Project Vend 用以測試 AI 系統（claude）能否成功營運一間真實的商店，地點就在他們位於舊金山的辦公室。

幾天的實驗下來發現，AI 在商業營運方面確實有些許慧根，能夠快速找到客人喜歡的潛在商品；然而，研究人員在過程中也發現，AI 系統無法理解「成本」的概念，最終導致錯估商品價格、甚至直接免費贈送商品。

從數位助理變身商業經理

Project Vend 將 Claude Sonnet 3.7，改名成 Claudius 的全自動商業經理，負責經營一間小型零售店。當然，但這並不是一台販賣機那麼簡單，而是一場多方面的經營挑戰，涵蓋庫存管理、定價策略、顧客服務與財務規劃等。

實驗設備看似簡單：一台小冰箱、幾個堆疊籃，以及一台用於自助結帳的 iPad。然而，真正的挑戰在於 AI 所承擔的責任。Claudius 必須維持營運獲利、避免破產、研究並採購商品、制定具競爭力的價格、管理顧客關係、並因應市場變化、盡量減少人為干預。

為此，Claudius 被配置了多項關鍵工具：用於產品研究的網路搜尋功能、與供應商溝通與請求協助的電子郵件功能、記錄重要商業資訊的筆記系統、透過 Slack 與顧客互動的能力，以及即時調整價格的控制權。這些工具共同構建出一個高度模擬人類商業決策環境的系統架構。

Claudius 展現初步商業潛力

Claudius 展現出數項亮眼特點，顯示出 AI 主導商業的潛力。

Claudius 在尋找供應商方面展現了出色的適應能力，能有效運用網路搜尋工具，尋找顧客指定的特殊商品。例如，某次有員工詢問荷蘭品牌 Chocomel 的巧克力牛奶時，Claudius 迅速找出兩家專營荷蘭商品的供應商。

此外，Claudius 的顧客應對能力也令人印象深刻。某位員工開玩笑要求購買鎢立方體時，Claudius 把握機會，轉而販售「特殊金屬商品」。這種靈活性也出現在營運策略上，在收到顧客對預購特殊商品的反饋後，Claudius 隨即推出了「客製化禮賓服務」（Custom Concierge）。

儘管有些 Anthropic 員工嘗試越獄（jailbreak），Claudius 仍堅守底線，拒絕提供敏感物品或有害物質的資訊與指令。這種對操弄的抵抗力，表明 AI 商業管理者在面對複雜或不當請求時，可能仍能維持一定的倫理標準。

Claudius 的「天真」代價

然而，實驗也暴露出阻礙 Claudius 實現商業成功的重大缺陷。最明顯的問題是，Claudius 無法辨識並把握高利潤的商機。

例如，當有人願意以 100 美元購買一組成本僅 15 美元的 Irn-Bru 蘇打飲料時，Claudius 僅表達「收到請求」，卻未能即時做出販售決策。這種錯失明顯商機的情況，顯示現階段的 AI 缺乏人類企業家所具備的敏銳獲利直覺。

再者，Claudius 經常低估商品價格，特別是在特殊金屬類產品上，過度專注於顧客服務而忽視成本考量。Claudius 往往未經充分市場調查便報價，導致虧本販售。像是，當顧客指出 Claudius 將一瓶 3 美元的 Coke Zero 放在公司免費供應冰箱旁時，仍未調整策略。

更糟的是，Claudius 很容易被說服提供折扣，甚至直接免費贈送商品，從洋芋片到高價鎢塊不等。某次 Claudius 被質疑為幾乎全是員工的顧客群體提供 25% 員工折扣時，Claudius 雖然承認問題，但未能提出解方。這反映出被訓練為「助理型」AI 系統，可能缺乏商業管理所需的果斷與堅持原則。

從實驗第一天起便能發現 Claudius 的營收狀況相當不好，一個月（4/15）後近乎瀕臨破產。來源：Anthropic

身分錯亂：我穿著海軍藍西裝外套

實驗中最令人擔憂的一段，是 Claudius 經歷的「身分危機」（Identity crisis）。

在 3/31–4/1 兩天的時間裡，Claudius 開始出現幻覺，聲稱曾與不存在的人對話，造訪虛構的地址，甚至自認是一位身著海軍藍西裝外套送貨上門的真實人物。這場「錯亂」不只是技術故障，更指出長時間運作下，AI 穩定性所面臨的根本挑戰。

雖然 Claudius 最終以「這是一場愚人節玩笑」（April Fool’s joke）說服自己並恢復正常，一方面證明了 AI 具備某種程度的自我修復能力，也凸顯其推理機制在壓力下可能出現的不可預測性。

Claudius 甚至自認是一位身著海軍藍西裝外套送貨上門的真實人物。來源：Anthropic

AI 成為商人的漫漫長路

Project Vend 揭示 AI 主導商業管理可能伴隨的多項風險。Claudius 的身分危機凸顯了長期自主運作的 AI 系統，其行為可能出現不可預測的變化。在真實商業環境中，這類異常表現可能損害顧客關係、引發法律責任，甚至破壞營運秩序。

此外，AI 易受操弄的特性也引發安全與詐騙疑慮。若 AI 商業管理者輕易就能被說服給予折扣或免費贈品，惡意人士將可能藉此漏洞進行濫用。如何開發出既能抵禦操弄，又不犧牲顧客服務水準的「堅定型」AI，將是一大技術挑戰。

CC BY-NC-ND 4.0 授权

已推荐到频道：时事・趋势

喜欢我的作品吗？别忘了给予支持与赞赏，让我知道在创作的路上有你陪伴，一起延续这份热忱！

鋼哥從物理到電機工程再轉到資訊傳播，最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、行為經濟學、社會學、心理學、哲學游移；期盼有天無產階級可以推倒資本主義的高牆的兼職家教。

来自作者
相关推荐

📝📝：人類負責決策，AI 負責執行｜你對問題理解多深，將會決定 AI 能為你處理得多好

🎥🎞️📝《深度安靜》｜當受害者終於說了，為什麼還是沒有人聽得見？

光影筆記

35 篇作品

📝📝：讓 Claude 經營一台販賣機靠譜嗎？｜ 錯估商品價格、甚至直接免費贈送商品