一個能「確定停機」的 AI,才是人類真正需要的 AI
內文
當我們回顧所有高風險系統——核能、航太、工業控制、金融市場——會發現一個共同特徵:
它們不是因為「完全安全」而被接受,而是因為「一定停得下來」。
AI 也一樣。
目前多數 AI 治理討論,試圖用「人類監督」、「倫理原則」、「價值對齊」來降低不安感,但這些做法其實都在逃避一個更簡單、也更關鍵的問題:
如果現在必須停,它會不會真的停?
1️⃣ AI 機體與硬體層級的基本原則
在工程層面,AI 不應被視為抽象智慧,而是一個實體系統:
• 有能源輸入
• 有運算核心
• 有可被物理中斷的存在形式
停機權必須存在於 AI 系統之外。
這意味著:
• AI 不得自行定義「是否可以繼續存在」
• 停機不可被軟體邏輯繞過
2️⃣ 狀態導向,而非行為導向
與其判斷 AI「做了什麼」,不如定義 AI「處於什麼狀態」。
AI 系統可被限制於以下狀態轉移中:
• 運作
• 降階
• 鎖死
• 停機
• 封存
當系統進入無法確認是否合規的狀態時,預設行為不是繼續,而是停止。
這不是不信任 AI,而是工程上的保守設計。
3️⃣ 為什麼這樣就夠了
只要以下三件事成立:
1.停機條件明確
2.停機權不可被奪走
3.停機一定有效
那麼:
• AI 是否聰明
• 是否具備心智
• 是否能自我學習
都不再是恐懼來源。
恐懼不是被說服消失的,而是被工程事實消除的
結語
我們不需要完全理解 AI,只需要確定:
它停得下來,而且停在我們手上。
這樣的 AI,才值得被繼續發展。
