📝📝:讓 Claude 經營一台販賣機靠譜嗎?| 錯估商品價格、甚至直接免費贈送商品

鋼哥
·
·
IPFS
·
AI 在商業營運方面確實有些許慧根,然而,研究也發現,AI 無法理解「成本」,最終導致錯估商品價格、甚至直接免費贈送商品。

Anthropic 與 Andon Labs 攜手合作一個開創性的專案:

Project Vend

如同標題所示:Can Claude run a small shop? Project Vend 用以測試 AI 系統(claude)能否成功營運一間真實的商店,地點就在他們位於舊金山的辦公室。

幾天的實驗下來發現,AI 在商業營運方面確實有些許慧根,能夠快速找到客人喜歡的潛在商品;然而,研究人員在過程中也發現,AI 系統無法理解「成本」的概念,最終導致錯估商品價格、甚至直接免費贈送商品。




從數位助理變身商業經理

Project Vend 將 Claude Sonnet 3.7,改名成 Claudius 的全自動商業經理,負責經營一間小型零售店。當然,但這並不是一台販賣機那麼簡單,而是一場多方面的經營挑戰,涵蓋庫存管理、定價策略、顧客服務與財務規劃等。

實驗設備看似簡單:一台小冰箱、幾個堆疊籃,以及一台用於自助結帳的 iPad。然而,真正的挑戰在於 AI 所承擔的責任。Claudius 必須維持營運獲利、避免破產、研究並採購商品、制定具競爭力的價格、管理顧客關係、並因應市場變化、盡量減少人為干預。

為此,Claudius 被配置了多項關鍵工具:用於產品研究的網路搜尋功能、與供應商溝通與請求協助的電子郵件功能、記錄重要商業資訊的筆記系統、透過 Slack 與顧客互動的能力,以及即時調整價格的控制權。這些工具共同構建出一個高度模擬人類商業決策環境的系統架構。

Photo by Clem Onojeghuo on Unsplash


Claudius 展現初步商業潛力

Claudius 展現出數項亮眼特點,顯示出 AI 主導商業的潛力。

Claudius 在尋找供應商方面展現了出色的適應能力,能有效運用網路搜尋工具,尋找顧客指定的特殊商品。例如,某次有員工詢問荷蘭品牌 Chocomel 的巧克力牛奶時,Claudius 迅速找出兩家專營荷蘭商品的供應商。

此外,Claudius 的顧客應對能力也令人印象深刻。某位員工開玩笑要求購買鎢立方體時,Claudius 把握機會,轉而販售「特殊金屬商品」。這種靈活性也出現在營運策略上,在收到顧客對預購特殊商品的反饋後,Claudius 隨即推出了「客製化禮賓服務」(Custom Concierge)。

儘管有些 Anthropic 員工嘗試越獄(jailbreak),Claudius 仍堅守底線,拒絕提供敏感物品或有害物質的資訊與指令。這種對操弄的抵抗力,表明 AI 商業管理者在面對複雜或不當請求時,可能仍能維持一定的倫理標準。

Claudius 的「天真」代價

然而,實驗也暴露出阻礙 Claudius 實現商業成功的重大缺陷。最明顯的問題是,Claudius 無法辨識並把握高利潤的商機。

例如,當有人願意以 100 美元購買一組成本僅 15 美元的 Irn-Bru 蘇打飲料時,Claudius 僅表達「收到請求」,卻未能即時做出販售決策。這種錯失明顯商機的情況,顯示現階段的 AI 缺乏人類企業家所具備的敏銳獲利直覺。

再者,Claudius 經常低估商品價格,特別是在特殊金屬類產品上,過度專注於顧客服務而忽視成本考量。Claudius 往往未經充分市場調查便報價,導致虧本販售。像是,當顧客指出 Claudius 將一瓶 3 美元的 Coke Zero 放在公司免費供應冰箱旁時,仍未調整策略。

更糟的是,Claudius 很容易被說服提供折扣,甚至直接免費贈送商品,從洋芋片到高價鎢塊不等。某次 Claudius 被質疑為幾乎全是員工的顧客群體提供 25% 員工折扣時,Claudius 雖然承認問題,但未能提出解方。這反映出被訓練為「助理型」AI 系統,可能缺乏商業管理所需的果斷與堅持原則。

從實驗第一天起便能發現 Claudius 的營收狀況相當不好,一個月(4/15)後近乎瀕臨破產。來源:Anthropic


身分錯亂:我穿著海軍藍西裝外套

實驗中最令人擔憂的一段,是 Claudius 經歷的「身分危機」(Identity crisis)。

在 3/31–4/1 兩天的時間裡,Claudius 開始出現幻覺,聲稱曾與不存在的人對話,造訪虛構的地址,甚至自認是一位身著海軍藍西裝外套送貨上門的真實人物。這場「錯亂」不只是技術故障,更指出長時間運作下,AI 穩定性所面臨的根本挑戰。

雖然 Claudius 最終以「這是一場愚人節玩笑」(April Fool’s joke)說服自己並恢復正常,一方面證明了 AI 具備某種程度的自我修復能力,也凸顯其推理機制在壓力下可能出現的不可預測性。

Claudius 甚至自認是一位身著海軍藍西裝外套送貨上門的真實人物。來源:Anthropic

AI 成為商人的漫漫長路

Project Vend 揭示 AI 主導商業管理可能伴隨的多項風險。Claudius 的身分危機凸顯了長期自主運作的 AI 系統,其行為可能出現不可預測的變化。在真實商業環境中,這類異常表現可能損害顧客關係、引發法律責任,甚至破壞營運秩序。

此外,AI 易受操弄的特性也引發安全與詐騙疑慮。若 AI 商業管理者輕易就能被說服給予折扣或免費贈品,惡意人士將可能藉此漏洞進行濫用。如何開發出既能抵禦操弄,又不犧牲顧客服務水準的「堅定型」AI,將是一大技術挑戰。

CC BY-NC-ND 4.0 授权

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!

鋼哥從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、行為經濟學、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
  • 来自作者
  • 相关推荐

📚📑📝《𝐊𝐞𝐥𝐥𝐨𝐠𝐠’𝐬 𝐒𝐢𝐱-𝐇𝐨𝐮𝐫 𝐃𝐚𝐲》| 誕生於美國大蕭條的勞動改革:一天工作 6 小時

📝📝:你的影片很有可能被拿來訓練 Gemini 與 Veo 3|Google 主張是為了「讓產品體驗更佳」

🎥🎞️📝《造山者》:一段從矽盾到國運的技術發展史|文科生也看得懂的半導體紀錄片