此为历史版本和 IPFS 入口查阅区,回到作品页
mythogen.engine
IPFS 指纹 这是什么

作品指纹

《遊戲至勝》四十年科技霸權的隱藏算術(終章加外傳)

mythogen.engine
·
·

終章:遊戲即未來


凌晨兩點。

序章開場的那個時刻。手邊的 Steam Deck 還在跑一款 Windows 遊戲——Linux 系統上的 Proton 翻譯層,把 DirectX 的每一個呼叫轉成 Vulkan,第六章的故事。iPhone 的通知亮了又暗——晶片出自台積電 3 奈米產線,第八章的故事。窗外某個資料中心裡,幾千張 NVIDIA H100 正在替一個大型語言模型算下一組權重——每一張卡裡面的 CUDA 核心,是遊戲玩家用十八年的 R&D 稅養出來的,第七章的故事。

但這一次,多了一樣東西。

電視櫃下面擺著一台 Nintendo Switch 2。450 美元。NVIDIA Ampere 架構。Tensor 核心。DLSS。這台主機裡面跑著的 AI 升頻演算法,跟 H100 裡面的 Tensor 核心,出自同一個設計血統。

整個房間裡,每一樣東西都有一條因果鏈,通往本書的某一章。而所有的因果鏈,最終收斂到同一個起點。

有人想玩更好的遊戲。


I. 收斂

站在 2026 年回望,這四十年的科技史出現了一種令人敬畏的收斂。

1993 年,一個年輕人在 Denny's 餐廳裡決定做一張讓 PC 遊戲畫面變漂亮的顯示卡。2026 年,他的公司市值超過五萬億美元,全球每一家想做 AI 的公司都在排隊向他買晶片。

1995 年,一個微軟工程師被派去說服 John Carmack 接受 Windows。三十年後,微軟每年花一千億美元建 AI 資料中心——資料中心裡跑的作業系統是 Linux,Carmack 當年最信任的那個系統。

1996 年,一個日本人把 500 萬美元交給一個犯了致命錯誤的年輕人。2026 年,那 500 萬美元長成了人類歷史上最深的技術壟斷。

1998 年,台積電跟 NVIDIA 簽了第一份戰略合作協議。2026 年,全球最先進的 AI 晶片——H100、B200——全部出自台積電在新竹的產線。那條產線的良率,是被遊戲 GPU 的大 die 訂單逼出來的。

2006 年,黃仁勳在每一張 GeForce 8800 GTX 裡面偷偷塞了通用運算核心。2012 年,一個烏克蘭裔博士生用兩張遊戲顯示卡,在父母家的臥室裡引爆了深度學習革命。2022 年,ChatGPT 上線。整條因果鏈的每一個節點,都站著一個遊戲玩家的鈔票。

軟體、算力、矽晶片。DirectX、CUDA、台積電。三條看似平行的科技樹,全部在 AI 時代的頂峰完成了合體。

但合體的代價,正在這本書的最後三章裡一條一條浮現。


II. 三重拷問

第一問:為什麼科技霸權的每一次轉向,都從遊戲開始?

這個問題的答案,本書用了十一章來回答,但可以壓縮成一句話:因為遊戲玩家是人類歷史上唯一一群,願意每兩年花上千美元、只為了讓螢幕上的水面反光更真實一點的消費者。

沒有任何其他產業有這種消費者。企業用戶買伺服器是為了省錢——他們精打細算每一分成本。科研機構買超算是靠政府撥款——週期長、金額固定。只有遊戲玩家是自掏腰包、心甘情願、而且永不滿足。

這群人構成了一個完美的壓力測試場加 R&D 資金池。他們的錢養了 NVIDIA 的 CUDA 十年(第七章)。他們的 GPU 訂單逼台積電把大 die 良率推到極限(第八章)。他們對畫質的偏執,迫使每一代 GPU 都要突破上一代的矽晶片極限——而那些被突破的極限,恰好就是 AI 運算需要的極限。

遊戲不是科技革命的附產品。遊戲是科技革命的壓力測試場和提款機。

第二問:為什麼在這場四十年的廝殺中,有些公司倖存,有些黯然倒下?

答案不是天才的多寡。本書記錄的每一個主角——黃仁勳、蓋茲、Lisa Su、Pat Gelsinger、Gabe Newell、張忠謀——都是各自領域裡最聰明的人。天才不缺。

差別在體制。

第九章的結論:Intel 的 MDF 和一條龍服務體系養出了一個動不了的帝國。Pat Gelsinger 看到了所有問題,但利益結構固化得太深,華爾街不給他時間。Lisa Su 贏了,不是因為她更聰明——是因為 AMD 被打到谷底,谷底意味著自由,自由意味著可以把所有資源壓在一個賭注上。

第十章的結論:Nadella 有實權、方向可能對——但他正在拆毀的東西(遊戲作為壓力測試場的功能),帳單要十年後才到。Ryan 有實權、方向已被證明錯——服務性遊戲的屍體堆成山。

科技霸權的更迭,不是天才之間的智力競賽。是組織結構、利益綑綁、和時間尺度之間的達爾文演化。

第三問:當巨頭親手拆毀自己的壓力測試場,這是轉型,還是自殺?

這是本書最後一個問題,也是唯一一個還沒有答案的問題。

微軟在 2026 年的 AI 資本支出超過一千億美元。它關掉了 Tango Gameworks、Arkane Austin、The Initiative。它讓 Turn 10——ForzaTech 引擎的開發團隊——裁掉近半數員工。它用省下來的錢買 NVIDIA 的 GPU 建 AI 資料中心。

Sony 花了 2 億美元做了一款活了十四天的遊戲。關掉了 Japan Studio。關掉了 Bluepoint。關掉了 Firewalk。Jim Ryan 帶著幾輩子都花不完的財富退休了。

兩家公司用不同的方式,做了同一件事:把遊戲當作手段而不是目的,把玩家當作籌碼而不是顧客。

第三章寫過這句話。那時它是一個預告。第十章把它變成了一份結算。

但結算的帳單上,有一行數字還沒有人算得出來:當全球最大的兩家遊戲平台商同時決定「遊戲不是核心業務」的時候,他們同時拆掉的壓力測試場、R&D 資金池、和長期晶片訂單,會對未來十年的半導體供應鏈造成多大的缺口?

沒有 CEO 問這個問題。因為這條因果鏈太長了——從 Xbox 的裁員到台積電的產能規劃,中間隔了太多層。而華爾街只看下一季。


III. 全局觀的消亡

這本書的自序講了一個私人的故事。一個在九十年代的旺角信和中心長大的少年,靠著改 config.sys、背 IRQ 中斷線號碼、在卡西歐計算機上把 255 按成 FF,不小心學會了整個 CPU 的架構。

那種學習路徑——從遊戲出發,穿透作業系統,直達硬體底層——在今天已經幾乎消失了。

2026 年的年輕工程師不需要知道 IRQ 是什麼。不需要知道 VGA 暫存器怎麼配置。不需要知道記憶體頁面是怎麼切分的。他們打開 PyTorch,呼叫 model.train(),底下的一切——cuDNN、cuBLAS、PTX、SASS、GPU 上的每一個電晶體的開關——全部被封裝成黑盒子。

這不是壞事。抽象層是管理複雜度的唯一辦法。自序已經說過:問題不在抽象層本身——問題在抽象層何時變成了黑盒子。

黑盒子意味著:你可以使用它,但你不能打開它。你可以在它的表面上做優化,但你不能穿透它去重新設計地基。

John Carmack 之所以是 Carmack,是因為他成長的年代,硬體是裸露的。他必須直接寫 VGA 記憶體、必須搞清楚 CPU 的每一個 clock cycle 怎麼花。黃仁勳之所以能看到 GPU 裡面那條從繪圖到通用運算的縫,是因為他橫跨硬體設計和商業行銷,看得穿整個 stack。Lisa Su 之所以能在谷底把 AMD 救活,是因為她的技術底子從半導體物理一路到系統架構,每一層都碰過。

這些人有一個共同點:他們看得穿整個系統——從電晶體到 API 到應用層。 自序把這種能力叫做「全局觀」。

但在 2026 年的速食 AI 時代,最聰明的腦袋都在學習如何呼叫現成的工具——如何串接 LangChain、如何微調 LoRA、如何用 Agent 自動化工作流程。這些技能有價值。但它們全部站在黑盒子的表面上。

而更令人不安的是,這個問題不只出在學生身上——它出在整個教育體制的結構裡。

產業對工程師的需求方式已經徹底改變了。AI 輔助開發工具的普及,讓軟體團隊的人數正在被壓縮到個位數。企業的選才標準不再容許「進來慢慢帶」——他們要的是入門即戰力。但課程表上教的東西,還是五年前的路線圖。學生不是不聰明,是沒有人告訴他們路已經變了。

這裡藏著一個諷刺。

學校不教的東西——遊戲引擎的底層架構、即時渲染的管線設計、GPU 上的並行運算怎麼排程——恰好就是通往 AI 時代最前沿的橋樑。NVIDIA 的 Isaac Sim——物理 AI 的核心模擬平台——建基於 Omniverse 和 PhysX 物理引擎。PhysX 同時也是 Unreal Engine 的預設物理引擎;Omniverse 的場景描述格式 OpenUSD,同時也是 Houdini 和好萊塢特效產業的資料交換標準。這些系統的架構和目的各不相同——遊戲引擎追求即時互動效能,Houdini 追求程序化內容生成,Isaac Sim 追求高保真的機器人訓練模擬——但它們需要的核心技能高度重疊:理解 GPU 如何排程並行運算、理解場景圖如何組織 3D 資料、理解物理引擎如何在每一幀裡解算碰撞和力學。一個在遊戲引擎裡面磨過底層的工程師,轉向物理 AI 的門檻遠比一個只會呼叫 API 的人低。

但沒有人告訴他這件事。因為課程表上沒有這條路。學生沿著前人的老路走,老路的盡頭是一個正在被 AI 精簡掉的職位。而旁邊那條通往新世界的小徑——從遊戲引擎的底層技能穿透到 AI 基礎設施的那條小徑——上面長滿了草,因為沒有課程帶他們走過去。

培養「全局觀」工程師的土壤,正在從兩端同時崩塌。一端是產業——壓力測試場被拆、工作室被關、遊戲被當作報表上的數字。另一端是教育——課程跟不上、學生不知道路變了、最有價值的跨層學習路徑沒有人教。

如果我們不再培養那種願意深潛入機器底層的工程師——那種會問「這個 API 底下是什麼」「這顆晶片為什麼要這樣設計」「這個抽象層背後藏了什麼代價」的人——

那麼,當下一次科技革命的巨浪襲來時,誰來為人類寫下第一行破局的代碼?


IV. 最後的算術

這本書記錄了八次 pattern 的變奏。

第二章:DirectX 鎖住 PC 遊戲開發者。第三章:Xbox 用虧損堵住 Sony。第四章:世嘉的善款偶然催生了 NVIDIA。第五和第六章:Linux 的反擊與 Steam 的新鎖定。第七章:CUDA 的四層監獄。第八章:台積電的信任壟斷。第九章:Intel 的 MDF 鎖住了自己。第十章:微軟和 Sony 親手拆毀壓力測試場。

八次變奏,鎖的形態各不相同,但有一個共同特徵:每一把鎖都向外擴散。 DirectX 從 PC 遊戲擴散到整個 Windows 開發生態。CUDA 從遊戲 GPU 擴散到全球 AI 基礎設施。台積電的信任壟斷從遊戲晶片代工擴散到所有 fabless 客戶。這些鎖穿透了平台邊界、穿透了世代更替、穿透了產業隔閡。它們的代價,至今仍在被瓜分。

第十一章,pattern 反轉了。

任天堂不是一家「沒有建立平台鎖定」的公司。恰恰相反——1985 年,它在 NES 卡帶裡植入 10NES 鎖定晶片,建立了遊戲業歷史上第一個硬體級准入機制。比 DirectX 早十年。比 CUDA 早二十年。它的授權制度之嚴苛——年度配額、獨佔期、獨家卡帶製造——在同時代無人能出其右。

但任天堂的鎖有一個特徵,跟本書前十章描述的每一把鎖都不一樣:它從不向外擴散。

NES 的 10NES 不影響 PC。不影響 Mega Drive。不影響 PlayStation。任天堂從不試圖讓自己的技術標準成為產業標準,從不參與 DirectX 和 Vulkan 的標準戰爭,從不試圖用自己的鎖去箍住平台以外的世界。它的態度始終如一:你進來我的花園,按我的規矩。你不進來,我不管你。

世嘉走了另一個極端。它連最基本的圍牆都沒有建。Dreamcast 的防盜版機制形同虛設,開發門檻主動降低,大門敞開。結果:PS2 一來,它死了。

三種鎖,三種結局。

擴散型鎖定——微軟、NVIDIA、台積電、Valve——成為科技霸權的基礎設施。代價由下游承擔,延遲帳單二三十年後才到。

圍牆型鎖定——任天堂——存活四十年,但與科技霸權的主線無關。一座花園,不是一條供應鏈。Switch 裡面的 NVIDIA Ampere 晶片,跟 H100 出自同一個設計血統。但任天堂從來不關心 AI。它只關心遊戲好不好玩。

無鎖——世嘉——死亡。入交昭一郎的 500 萬美元善款,是世嘉留給科技史最後的指紋。

八次擴散,一次圍牆,一次無鎖。十一章因果鏈,全部收斂到同一個起點:有人想玩更好的遊戲。

這就是本書的最終算術。

遊戲不是一個產業。遊戲是一個壓力測試場——世界上最嚴苛的壓力測試場。它逼 GPU 推到極限,逼製程推到極限,逼作業系統推到極限,逼人類工程師推到極限。而在推到極限的過程中,它無意間鋪設了 AI 革命、智慧型手機、全球半導體格局的底層軌道。

遊戲也是一面鏡子。它映照出每一家科技巨頭的真實面目——誰把使用者當作目的,誰把使用者當作手段。微軟用遊戲堵牆,用完就拆。Sony 用遊戲做報表,型態不對就換。NVIDIA 用遊戲養 CUDA,養完就轉。任天堂建了最嚴的圍牆,但圍牆裡面,它從頭到尾把遊戲當作遊戲。世嘉連圍牆都不建,把善意交給了一個陌生人——然後死了。

自序問了一個問題:AI 時代,我們還有沒有可能培養出下一代的 Carmack、Lisa Su、張忠謀?

答案取決於兩件事。

第一:有沒有人還在做那種逼年輕人穿透黑盒子的產品——那種讓你為了解決一個 bug、為了讓畫面多跑出十幀而徹夜不眠的東西。

第二:有沒有人還在保護那個壓力測試場——不讓它被拆去蓋 AI 資料中心、不讓它被改造成微交易的收割機、不讓它被華爾街的經常性收入執念給吞噬。

如果這兩件事還在發生,下一代的全局觀工程師就有土壤。如果它們消失了——如果最後一座壓力測試場也被拆掉、最後一個願意做完整遊戲的公司也向華爾街投降——

那麼這本書,就是一份悼詞。

如果它們還在——

那這本書就是一份使用說明書。給下一個在凌晨兩點,為了讓一款遊戲跑起來,而願意打開機殼、直視矽晶片的人。



外傳上篇:逃獄者——Google 的無魂豪賭與 TPU 閉環

2022 年 9 月 29 日,Google 副總裁 Phil Harrison 在一篇官方部落格文章裡宣佈:Stadia 將於 2023 年 1 月 18 日永久關閉。

這是一個奇怪的死法。

Stadia 擁有全世界任何遊戲公司都夢寐以求的基礎設施:遍佈全球的資料中心、自家鋪設的海底光纖、YouTube 的十億級用戶入口、以及 Google 工程團隊幾十年累積的大規模分散式系統經驗。論技術底座,地球上沒有第二家公司比 Google 更適合做雲端遊戲。

但 Stadia 的月活躍用戶從未超過七十五萬。同一時期,Xbox Live 和 PlayStation Network 的月活躍用戶各自突破一億。

Harrison 在文章裡說的理由很溫和:「沒有獲得我們預期的用戶黏著度。」他沒有說的是:在他按下發佈鍵的同一秒,Google Play 商店正在全球二十億台 Android 手機上,以每筆交易自動抽取最高 30% 佣金的速度,從遊戲開發者口袋裡收錢。

2024 年,Google Play 的用戶消費總額超過 467 億美元。其中遊戲佔大約四成——將近兩百億美元。Google 從中抽走的佣金,遠超過 Stadia 三年營運期間的全部營收。

一邊是花了幾億美元建設、苦撐三年、月活不到一百萬的雲端遊戲平台。另一邊是零遊戲研發、零硬體成本、每一秒鐘自動進帳的平台稅。

Harrison 簽下關閉 Stadia 的文件時,大概連猶豫都沒有。


I. 降維打擊:為什麼不在泥沼裡打仗

正文第六章講了 Valve 怎樣用 Proton 撬開微軟的 DirectX 鎖。第七章講了 NVIDIA 怎樣用 CUDA 蓋了一座四層深的軟體監獄。兩場戰爭有一個共同點:戰場在 PC 和主機——你必須造硬體、寫驅動、建生態、搶開發者。每一步都是泥沼裡的肉搏。

Google 從頭到尾沒有踏進這片泥沼。

它做的事情更簡單也更殘酷:它跳過了整個遊戲價值鏈的中下游,直接站在最上游收租。

2008 年,Android Market(Google Play 的前身)上線。Google 沒有自己開發任何一款遊戲。它做的事只有一件:提供一個所有 Android 手機預裝的商店,然後對每一筆數位內容交易抽取 30% 佣金。後來降到首年百萬美元以內抽 15%,超過的部分仍然是 30%。

這個模式的本質,跟第六章裡 Steam 的 30% 平台稅一模一樣。但 Google 的版本更極端。

Valve 至少還在做兩件事:第一,它自己開發遊戲(《Half-Life》《Portal》《Dota 2》),理解遊戲是什麼;第二,它建造了 Proton、DXVK、Steam Deck——花真金白銀去解決「讓更多遊戲跑起來」的技術問題。Valve 收的那 30%,至少有一部分被拿去養工程師、寫翻譯層、推 Linux 生態。

Google 收的那 30%,沒有任何一分錢回到遊戲本身。

它不設計遊戲引擎。不投資工作室。不推動圖形 API 標準。不跟 GPU 廠商合作優化驅動。它甚至不做遊戲品質審核——Google Play 上充斥著換皮遊戲和廣告農場。Google 對遊戲的全部態度,可以濃縮成一個詞:報表。

每一款遊戲在 Google 眼中,都是一行報表上的數字。下載量、日活、付費轉換率、ARPU——這些指標決定它在商店裡的排名。遊戲好不好玩?那是開發者的事。Google 只負責收租。

這就是正文第六章提出的 pattern 的一個極端變體:便利吸引開發者(全球最大的行動裝置安裝基數)→ 鎖定效應箍住開發者(你的用戶在 Android 上,你的收入透過 Google Play 結算,你不可能離開)→ 反過來向開發者收取壟斷溢價(30% 佣金,沒有議價空間)。

而代價呢?

代價是 Google 對遊戲這件事本身,沒有任何理解。這個代價在 Stadia 身上兌現了。


II. Stadia 之死:擁有一切,卻少了一個東西

2019 年 3 月,Google 在舊金山的 GDC(遊戲開發者大會)上發佈 Stadia。發佈會的規格令人窒息:4K 解析度、HDR 色彩、5.1 環繞音效、延遲低於 30 毫秒。背後是 Google 遍佈全球的邊緣運算節點。Phil Harrison 站在台上,用一句話總結了 Google 的野心:「未來最強大的遊戲平台,不需要任何硬體。」

技術上他說的是對的。

但他漏算了一件事:技術從來不是遊戲平台成敗的決定因素。

第三章講過,Xbox 第一代的硬體規格遠勝 PS2。但 PS2 靠著龐大的遊戲庫和先發優勢,在那一個世代賣出超過一億五千萬台。第四章講過,世嘉 Dreamcast 是當時技術最先進的主機——它死了。硬體和技術解決的是「能不能做到」的問題。但遊戲平台的勝負取決於另一個問題:開發者願不願意為你做遊戲。

開發者願不願意,取決於信任。

任天堂的開發者信任任天堂會把遊戲當遊戲看。Sony 的第一方工作室——至少在 Jim Ryan 拆牆之前——信任 PlayStation 會給他們時間做好一款作品。連 Valve 的開發者都知道,Gabe Newell 自己就是一個玩家,他理解遊戲的價值不只是報表上的數字。

Google 給開發者的信號是什麼?

2021 年 2 月,Stadia 上線不到兩年,Google 關閉了自己的第一方遊戲工作室 Stadia Games and Entertainment。一間還沒來得及發佈任何遊戲的工作室,就這樣被砍了。

對全世界的遊戲開發者來說,這個動作傳遞的信號只有一個:Google 隨時會走。

而 Google 確實走了。因為 Google 做每一個產品的方式都是一樣的:設定一個用戶目標、給兩到三年的跑道、達標就加碼、不達標就殺。這個流程對搜尋引擎、對廣告平台、對雲端服務都有效。對遊戲無效。

因為遊戲生態的建立需要十年。

Xbox 從 2001 年推出第一代,到 2013 年 Xbox One 才真正在訂閱模式上找到自己的定位——十二年。PlayStation 從 1994 年的 PS1 到 2020 年 PS5 的生態成熟——二十六年。Steam 從 2003 年上線到 2022 年 Steam Deck 證明 PC 遊戲不需要 Windows——十九年。

沒有一個成功的遊戲平台是在三年內建起來的。

Google 不是沒有資源。它是全世界最有錢的公司之一。但它的體制——季度考核、OKR 驅動、專案隨時可殺——跟遊戲生態所需要的長期承諾,在結構上不相容。

正文裡我們給這種特質取了一個名字:報表靈魂。 Google 有全世界最精密的報表。但報表看不見「一個開發者花三年做了一款沒人買但改變了類型定義的遊戲」這種事情的價值。報表只看得見下載量和收入曲線。

Stadia 的死因不是技術。是靈魂。

Google 有全球最好的基礎設施、最快的網路、最強的工程團隊——但它沒有 Game Soul。它有的是 Spreadsheet Soul。而 Spreadsheet Soul 可以讓你在 Google Play 上每秒鐘自動收租,卻沒辦法說服任何一個開發者:「把你的心血之作,獨佔放在我的平台上。」


III. TPU:唯一一個成功的逃獄者

但 Google 在另一場戰爭裡,做到了一件沒有任何其他公司做到的事。

它逃出了 CUDA 的監獄。

第七章用了相當篇幅講 NVIDIA 的四層鎖:硬體指令集、運算函式庫、AI 框架、知識體系。全世界的 AI 研究員——從博士生到大型實驗室——全部被鎖在這四層裡面。AMD 用 ROCm 追了十年,追不上。每一家 AI 新創公司在成立第一天,就已經是 NVIDIA 的俘虜。

Google 不是。

原因很簡單,也很殘酷:Google 自己重建了全部四層。

2013 年,Google 內部開始設計一種專門為機器學習優化的晶片。2015 年,第一代 TPU 在 Google 的資料中心裡投入運作——那時候外界甚至不知道它的存在。2016 年 5 月,Google 才在一篇論文裡正式公佈 TPU 的存在。

到了 2026 年,TPU 已經演化到第七代(代號 Ironwood)。Gemini 2.0——Google 最強大的 AI 模型——是用第六代 TPU(Trillium)訓練出來的。

用第七章的框架來看 Google 做了什麼:

第一層——硬體指令集: NVIDIA GPU 有自己的原生指令集(PTX/SASS),TPU 也有自己的。但 TPU 的指令集從一開始就為矩陣運算而設計——它不需要兼顧遊戲繪圖,不需要背負 CUDA 向後相容的歷史包袱。每一個電晶體都花在 AI 需要的地方。

第二層——運算函式庫: NVIDIA 有 cuDNN、cuBLAS、NCCL。Google 有 XLA(Accelerated Linear Algebra)編譯器——一個可以把高階運算自動編譯成 TPU 原生指令的系統。XLA 不是一個函式庫,它是一個編譯器。這意味著 Google 的工程師不需要手動針對每一種運算寫優化版——編譯器替他們做。

第三層——AI 框架: NVIDIA 靠 PyTorch 和 TensorFlow 在這一層鎖住開發者。但 TensorFlow 是誰寫的?Google。JAX 是誰寫的?Google。Google 不是被別人的框架鎖住的——它自己就是框架的作者。 它可以隨時修改框架的底層,讓 TPU 成為最佳運行目標。

第四層——知識體系: Google 內部有幾千名 AI 研究員。他們不需要去 Stack Overflow 上找 CUDA 的教學——他們用的是 Google 內部的工具鏈、內部的文件、內部的基礎設施。他們的知識體系是圍繞 TPU 而非 CUDA 建立的。

四層鎖,Google 全部繞過。不是用「翻譯」的方式繞(那是 Valve 對付 DirectX 的方法),而是用「重建」的方式。它造了自己的硬體、自己的編譯器、自己的框架、自己的研究團隊——一座完全獨立於 NVIDIA 生態的城池。

但這座城池有一個關鍵特徵:它是封閉的。

TPU 不賣給終端用戶。你不能像買一張 GeForce 那樣去百思買買一張 TPU 卡。你只能透過 Google Cloud 租用 TPU 算力——按小時計費。2025 年,Google 開始嘗試向企業直接銷售 TPU 硬體,但規模極小,而且買家基本上是跟 Google 有深度合作關係的機構。

這意味著 Google 的「逃獄」,是一種只有 Google 做得到的逃獄。

為什麼?因為 Google 有一樣東西是全世界任何其他公司都沒有的:龐大到足以撐起一整條自建晶片供應鏈的內部需求。

YouTube 的推薦系統。Google 搜尋的排名演算法。Gmail 的垃圾郵件過濾。Google Photos 的影像辨識。Google 翻譯。Google Maps 的即時路況預測。Gemini。——這些服務加起來,每秒鐘消耗的 AI 運算量,比大多數國家的全部 AI 算力還大。

Google 不需要說服外面的開發者來用 TPU。它自己就是 TPU 最大的客戶。它不需要建立「生態」——它自己就是生態。

這就是「內部閉環」的本質。 Google 同時是晶片的設計者、框架的作者、模型的訓練者、和服務的運營者。它不需要跟任何人合作,不需要說服任何人遷移,不需要等待任何第三方函式庫的支援。它一個人,把 NVIDIA 用十年時間、靠全球千萬遊戲玩家建立的生態,在自己的圍牆花園裡從零複製了一套。


IV. 逃獄的代價

但逃獄者付出了什麼代價?

第一個代價:Google 的 TPU 逃獄對其他人毫無意義。

一個在大學裡用 PyTorch 寫 AI 模型的博士生,不會因為 Google 有 TPU 就能逃出 CUDA 的監獄。他的論文要用 PyTorch 寫、用 CUDA 跑、在 NVIDIA GPU 上訓練。他可以申請 Google 的 TPU 研究計劃免費使用一些算力,但他的程式碼最終還是要能在 NVIDIA GPU 上跑——因為他的論文審稿人會用 NVIDIA 的機器驗證他的實驗。

Google 的逃獄是一個人的逃獄。它不是越獄革命。

第六章裡 Valve 的 Proton 是一場真正的越獄——它把翻譯層開源,讓所有 Linux 用戶都受益。它撬開的門,是全世界的門。Google 的 TPU 撬開的門,只通向 Google 自己的後花園。

第二個代價:Stadia 的死亡證明,技術閉環無法替代生態。

Google 有全球最好的雲端基礎設施、有 TPU 的運算能力、有 YouTube 的用戶入口。但這些東西加在一起,做不出一個活的遊戲平台。因為遊戲平台的核心不是技術——是信任、是內容、是開發者願意用三年甚至五年的時間為你做一款好遊戲的承諾。

這跟第七章的 CUDA 故事形成了一個有趣的鏡像。

NVIDIA 的 CUDA 生態不是 NVIDIA 自己建的——是全球的大學教授、博士生、開源貢獻者、AI 新創公司,在十年裡自然長出來的。NVIDIA 提供了土壤(免費的 CUDA 工具鏈、開發者文件、大學贊助計劃),但植物是自己長的。這就是為什麼 CUDA 的鎖這麼深——因為你不是在跟 NVIDIA 一家公司競爭,你是在跟一整個自然生長的生態競爭。

Google 的 TPU 生態是 Google 自己建的。每一行程式碼、每一個工具、每一份文件,都是 Google 的工程師寫的。這讓 Google 可以完全控制——但也意味著它永遠不會有 CUDA 那種「千萬人自發貢獻」的爆發力。

Google 證明了一件事:CUDA 的四層鎖是可以繞過的。但繞過的方式——從零重建全部四層——需要的資源和內部需求規模,全世界只有不超過三家公司做得到。

Google 是一家。另外兩家可能是 Amazon(自研 Trainium 晶片)和 Meta(自研 MTIA 晶片)。但即使是這兩家,也遠遠沒有達到 Google 的閉環程度。

對於第七章結尾那個試圖把 GPU 叢集從 NVIDIA 換成 AMD 的年輕工程師來說,Google 的 TPU 跟他沒有關係。他依然困在 CUDA 的監獄裡。唯一的區別是,他現在知道有人逃出去了——而逃出去的那個人,是一個擁有全世界最大廣告收入的科技巨頭,一個永遠不需要向任何外部開發者低頭的公司。

這個事實讓監獄的牆看起來更高了,不是更矮。


V. 結算:報表靈魂的勝利與代價

回到 Harrison 簽下 Stadia 關閉文件的那一刻。

從 Google 的報表來看,這是一個完全理性的決定。Stadia 的月活不到一百萬,運營成本高昂,遊戲庫貧乏,開發者信心崩盤。砍掉它,把工程資源轉移到 AI 和 YouTube——這是報表會給你的建議。

但報表不會告訴你另一件事。

Google 在行動遊戲市場上每年收取將近兩百億美元的佣金——這些錢來自遊戲開發者的心血。但 Google 沒有把這筆錢的任何一部分投回遊戲本身。沒有用它來資助引擎開發、培養工作室、推動圖形技術進步。這些錢被 Google 收走,然後消失在 Google 的總營收裡,變成 AI 研發預算、雲端基礎設施擴張、和搜尋引擎的廣告優化。

Google 是遊戲產業最大的寄生者。 它從遊戲身上抽取利潤,但對遊戲生態的貢獻是零。

正文裡的 pattern 是這樣的:便利吸引用家 → 鎖定開發者 → 壟斷收租。每一次變奏裡,鎖的建造者至少做了一件事——推動了某種技術進步。微軟用 DirectX 統一了 PC 遊戲的繪圖介面。NVIDIA 用 CUDA 催生了 AI 運算。台積電用先進製程讓晶片越做越強。連 Valve 都用 Proton 證明了遊戲不需要 Windows。

Google 什麼都沒做。它只是站在 Android 平台的高處,向下面的遊戲開發者伸手收錢。

這是 pattern 的一個病理變體:鎖定存在,壟斷溢價存在,但完全沒有推動任何技術進步。 純粹的價值抽取。

而 Google 在 TPU 上的成功,則揭示了一個更冷的事實:打破壟斷鎖定的唯一方式,是擁有足以無視外部生態的內部規模。 如果你不是 Google,如果你沒有全球最大的 AI 內部需求,你就逃不出去。

第七章的結論是:CUDA 的四層鎖,到今天為止沒有人撬得開。

這篇外傳的補充是:有一個人「逃」出去了——但他不是撬開了鎖,他是在監獄旁邊蓋了自己的城堡。鎖還在那裡。其他人還困在裡面。

而那個蓋了城堡的人,連一款遊戲都做不好。

這也許是科技世界最諷刺的定律:你可以用工程力量繞過任何技術鎖定。但你繞不過「沒有靈魂」這件事。Google 有全世界最好的基礎設施、最強的 AI、最多的錢。但它做不出一個讓人願意在上面花三年做遊戲的平台。因為平台不是技術問題。平台是信任問題。而信任,是報表上唯一一個永遠顯示不出來的數字。




外傳下篇:缺課者——中國的應用狂歡與底層斷裂

凌晨一點,上海。一間手遊工作室的辦公室亮著燈。螢幕上的數字正在跳動——他們的新款抽卡遊戲上線不到二十四小時,首日流水突破一億人民幣。產品經理打開香檳。營運總監已經在計算第二週的付費轉化率。美術團隊開始趕製下一批限定角色的立繪。整間公司像一台精密的印鈔機,每一個齒輪都在飛速旋轉。

同一個時區,深圳。華為的一棟研發大樓裡,幾個工程師盯著終端機上的紅色錯誤訊息,表情凝重。他們正在嘗試讓一台搭載國產昇騰 910B AI 晶片的伺服器,跑起 GitHub 上最新版本的一個開源大型語言模型。模型的程式碼是用 PyTorch 寫的。PyTorch 底下呼叫的是 CUDA。他們的晶片不是 NVIDIA 的。

錯誤訊息一行接一行。

最賺錢的應用,和最無力的底層,在同一個國度並存。這不是偶然。這是三十年來一條完整因果鏈的結算。


I. 報表靈魂的極致

如果說上一篇外傳裡的 Google 是報表靈魂的原型,那麼中國的互聯網巨頭就是報表靈魂的完成式。

騰訊、網易、字節跳動——三家公司加起來,控制了全球行動遊戲市場的相當大一塊版圖。它們不是靠做出最好的遊戲贏的。它們是靠做出最精密的變現機器贏的。

抽卡機制的保底設計、活動倒數計時的心理壓力、社交排名的攀比驅動、首儲禮包的錨定效應——這些東西背後站著的不是遊戲設計師,是行為心理學家和數據科學家。每一個彈窗的出現時機、每一次限時折扣的幅度、每一個「再抽一次」按鈕的顏色和大小,都經過 A/B 測試的精密校準。

結果是驚人的。一款成功的中國手遊,可以在上線首日創造超過一億人民幣的營收——這個數字超過了許多歐美 3A 遊戲工作室幾百人團隊磨了三到五年的產品在首週的全球銷售額。

但這些公司做的事情,跟正文裡每一章描述的科技霸權建造者,有一個根本的差異。

微軟用 DirectX 統一了 PC 遊戲的繪圖介面——這推動了 GPU 硬體的演進。NVIDIA 用 CUDA 在遊戲顯示卡裡塞入通用運算核心——這催生了整個 AI 運算產業。台積電在遊戲 GPU 的大面積晶片上磨練極限良率——這為 AI 晶片的量產鋪了路。每一個正文裡的玩家,不論動機多自私、手段多骯髒,至少在客觀上推動了某種底層技術的進步。

中國的遊戲巨頭沒有推動任何底層技術。

它們的遊戲跑在別人設計的晶片上(Qualcomm 的 Snapdragon、Apple 的 A 系列)、由別人製造的工廠代工(台積電、三星)、使用別人開發的引擎(Unity、Unreal)、在別人建立的作業系統上運行(Android、iOS)。從晶片到引擎到作業系統,整條技術供應鏈沒有一環是中國自己的。

這不是因為中國的工程師不夠聰明。是因為賺錢太容易了。

當你可以用三十個人、花六個月、做一款換皮的抽卡遊戲、首月營收破億——你為什麼要花三百個人、投十年時間、去做一個沒有即時回報的底層框架?當風險投資的錢像水一樣湧入共享單車、社區團購、短影音平台——為什麼要把資本投入回報週期長達十年、成功率極低的半導體研發?

正文第七章講的 NVIDIA 故事裡,黃仁勳從 2006 年開始在 GeForce 裡塞 CUDA 核心,整整等了六年,才等到 AlexNet 替 CUDA 找到用途。六年間,這筆研發投入在報表上看起來像純粹的浪費。

中國的資本市場不允許六年的浪費。中國的互聯網公司不允許十年不見回報的基礎投資。它們的體制——季度考核、KPI 驅動、上市後的投資人壓力——跟 Google 的 OKR 體制一樣,在結構上不相容於長期的底層研發。

所以中國做了一件事:在別人的地基上蓋了一座直入雲霄的大廈。

大廈裡住滿了全世界出手最闊綽的手遊玩家。大廈的每一層都裝了全世界最精密的付費轉化引擎。從外面看,這座大廈金碧輝煌。

但地基不是自己的。


II. 斷裂

2022 年 10 月,美國商務部發佈了一份出口管制新規。簡單說:禁止向中國出售先進的 AI 晶片和半導體製造設備。NVIDIA 的 A100、H100 不能賣了。ASML 的 EUV 極紫外光刻機不能賣了。台積電、三星不能替中國客戶代工最先進製程的 AI 晶片了。

一夜之間,地基裂了。

但裂的程度不是均勻的。有些地方裂得淺,有些地方裂到了根基。

裂得淺的地方:成熟製程。

電動車、家電、工業控制器需要的晶片,大多停留在 28 奈米或更舊的製程。這些製程不需要 EUV 光刻機——用傳統的 DUV(深紫外光)就能做。中芯國際在這個領域瘋狂擴產,用國家補貼壓低價格,向全球市場傾銷。28 奈米的晶片不算先進,但它是現代工業的血液——每一台冷氣機裡面都有、每一台電動車裡面都有、每一個路由器裡面都有。

在這條線上,中國做到了自給自足。不是最好的,但夠用。

裂到根基的地方:先進製程。

2023 年 8 月,華為毫無預警地發佈了 Mate 60 Pro。拆機之後,全世界的半導體分析師倒吸了一口氣:裡面的 Kirin 9000S 晶片,是中芯國際用 7 奈米級別的製程生產的。

在被禁止使用 EUV 光刻機的情況下。

中芯國際用的方法叫做多重曝光——把一層電路拆成好幾次曝光,用精度較低的 DUV 光刻機反覆疊加,最終達到接近 7 奈米的效果。這是一種暴力破解。它能做到。但代價是巨大的。

第八章裡有一個核心概念:台積電的先進製程是「順水推舟」養出來的。Apple 首發驗證、遊戲 GPU 壓力測試、主機 SoC 長期訂單——每一個客戶都帶著不同的技術需求,推著台積電在實戰中把良率一步一步推到極致。台積電的 7 奈米良率之所以能到商業量產的水準,是因為它在幾十個客戶、幾百款晶片上,反覆磨練了無數次。

中芯國際沒有這些客戶。它的先進製程訂單幾乎全部來自華為一家公司。沒有 Apple 的小面積高良率驗證,沒有 NVIDIA 的大面積極限壓力測試,沒有 Sony 和微軟的長期穩定主機訂單。它是在封鎖中、用國家補貼、在客戶極度單一的情況下,硬生生地把良率往上推。

結果是:Kirin 9000S 可以出貨,但良率極低、成本極高。一片晶圓上能切出的合格晶片數量,遠低於台積電同製程的水準。每一顆 Kirin 9000S 的真實成本——包括不良品的損耗——可能是台積電同等級晶片的好幾倍。

這不是市場的勝利。這是一場用國家補貼去填補三十年硬體缺課的生存戰。

而且,即使華為把晶片造出來了,故事也還沒結束。因為還有一道更深的牆。


III. 軟體監獄的中國版

Kirin 9000S 是手機晶片。手機晶片的軟體生態相對簡單——Android 系統、應用程式、驅動程式——華為可以靠自己的鴻蒙系統繞過 Google 的軟體封鎖。困難,但可行。

AI 晶片是另一回事。

華為的昇騰 910B 是一顆 AI 訓練晶片。純硬體數據上,華為自己宣稱它在某些特定的訓練任務上,效能可以逼近甚至超越 NVIDIA 的 A100 約 20%。後續的 910C 和 910D 更是瞄準了 NVIDIA 的 H100。

但「硬體算力逼近」和「可以替代」之間,隔著一道看不見的深淵。

這道深淵的名字叫 CUDA。

第七章講了 CUDA 的四層鎖。現在把中國的情況代入:

第一層——硬體指令集: 昇騰晶片用的是華為自己的達文西(Da Vinci)架構,跟 NVIDIA 的 PTX/SASS 完全不同。這意味著所有為 NVIDIA GPU 編譯的程式碼,在昇騰上都跑不了。必須重新編譯。

第二層——運算函式庫: NVIDIA 有 cuDNN、cuBLAS、NCCL——每一個都是幾百人團隊花十年針對 NVIDIA 硬體做深度優化的成果。華為對應的是 CANN(Compute Architecture for Neural Networks)。CANN 的功能覆蓋率和效能成熟度,跟 CUDA 的函式庫差了不止一個世代。

第三層——框架綁定: 全世界的 AI 研究員用 PyTorch 寫程式碼。PyTorch 的底層預設呼叫 CUDA。華為開發了自己的 AI 框架 MindSpore,也做了讓 PyTorch 在昇騰上運行的適配層。但適配層的相容性問題層出不窮——開篇那幾個深圳工程師面對的紅色錯誤訊息,就是這一層出了問題。每一個開源模型的程式碼裡,都藏著十幾個隱含的 CUDA 依賴。表面上改一行 device = 'npu' 就好,實際上底下的函式庫呼叫、記憶體管理、運算精度處理,處處是陷阱。

第四層——知識綁定: 中國的 AI 工程師在大學裡學的是 CUDA。他們讀的教科書用 CUDA 寫範例。他們查的 Stack Overflow 用 CUDA 回答問題。他們 GitHub 上 fork 的每一個開源專案,預設在 NVIDIA GPU 上跑。要讓他們轉用華為的 CANN 和 MindSpore,等於要求他們忘掉自己會的語言,重新學一門新的。

正文第七章的結論句是:「CUDA 不是一個 API。CUDA 是一座監獄。而你從入學那天起就住在裡面。」

中國的 AI 工程師面對的是同一座監獄。區別在於:NVIDIA 的生態是全球千萬個遊戲玩家和開發者,在二十年裡自然長出來的。中國要建立的替代生態,是在制裁的絕境下,用行政指令硬砌出來的。

這兩種生態的差別,不是量的差別。是質的差別。

自然生長的生態有根——它的每一個節點都是有人主動選擇使用的。有人用 CUDA 發了論文,有人用 CUDA 做了產品,有人在 CUDA 上建了公司。砍掉任何一個節點,其他節點還在。

行政指令砌出來的生態沒有根——它的每一個節點都是被要求使用的。一旦指令鬆動、一旦補貼減少、一旦 NVIDIA 找到繞過制裁的方式(比如推出專門為中國市場閹割的 H20 晶片),開發者會在一夜之間跑回 CUDA 的懷抱。

事實上,這件事已經在發生。2024 年,當 NVIDIA 把 H20 的價格降到跟昇騰 910B 差不多的水準時,許多中國 AI 公司重新開始採購 NVIDIA 的晶片。不是因為它們不支持國產——是因為用 CUDA 寫的程式碼不用改,用 CANN 寫的程式碼要重寫。

工程師是理性的。理性的選擇永遠是阻力最小的那條路。而 CUDA,就是阻力最小的那條路。


IV. 缺課的帳單

現在可以把因果鏈串起來了。

正文的核心論點是:遊戲玩家的錢和需求,無意中供養了整個科技霸權的底層基礎設施。 從 DirectX 到 CUDA 到台積電的先進製程——每一塊磚,都有遊戲的指紋在上面。

中國的反面案例完美地驗證了這條論點。

中國有全世界最會賺錢的遊戲公司。但這些公司賺的錢,沒有任何一分流向底層技術。它們的遊戲跑在進口的晶片上、用進口的引擎做、在進口的作業系統裡賣。它們做的事只有一件:在別人搭好的舞台上,用最精密的心理學工具,從玩家口袋裡掏錢。

當美國說「這個舞台以後你不能用了」的時候,中國突然發現:自己在應用層的摩天大樓底下,沒有地基。

這不是制裁造成的。制裁只是讓缺課的帳單提前到了。

真正的原因藏在三十年前。當黃仁勳在 Denny's 餐廳裡決定創辦 NVIDIA 的時候,中國的資本正在湧入房地產。當張忠謀在新竹建造台積電第一座工廠的時候,中國的製造業正在做代工。當 CUDA 在 2006 年誕生、全世界的大學生開始在 NVIDIA 顯示卡上寫並行計算程式的時候,中國最聰明的畢業生正在去騰訊和阿里巴巴——做社交軟體、做電商、做手遊。

每一步都是理性的。每一步的報表都很好看。

但每一步都在跳過同一件事:底層。

硬體的底層——自主設計高效能晶片的能力。軟體的底層——自主建立開發者生態的能力。製造的底層——在沒有外國設備的情況下生產先進製程晶片的能力。

這三個「底層」,本書的正文用了三章來講述它們是怎麼被建立的:第七章(CUDA 的軟體生態)、第八章(台積電的製造能力)、第四章(NVIDIA 從瀕死到崛起的硬體設計積累)。每一個底層的建立,都花了至少十五年。每一個底層的建立過程裡,遊戲都扮演了關鍵角色——不是作為目的,而是作為壓力測試場和資金池。

中國跳過了這個過程。它直接從應用層開始。它用最短的時間、最高的效率、最精密的變現設計,建起了全世界最賺錢的數位娛樂帝國。

然後發現帝國的地基是別人的。


V. 結算

有一個問題值得問:中國能不能補課?

答案是:技術上可以,但時間上未必來得及。

華為的昇騰晶片在硬體算力上正在逐代接近 NVIDIA。中芯國際在成熟製程上已經實現了自給自足,在 7 奈米級別的先進製程上做到了暴力破解。百度的崑崙晶片、阿里巴巴的含光晶片,都在不同程度上嘗試建立替代方案。

但正文第八章講過一個殘酷的道理:追不上的原因不是技術差距,是信任差距。 台積電的護城河不是某一項技術——是三十年來全球 fabless 生態對它累積的信任。你不能用一張投影片追。你不能用一個季度追。

同樣的道理適用於軟體生態。CUDA 的護城河不是 cuDNN 的效能——是全世界每一間大學、每一個 GitHub 專案、每一本教科書、每一個 AI 工程師腦子裡的肌肉記憶。你不能用行政指令追。你不能用補貼追。你只能用時間追——而在你追的這十年裡,NVIDIA 也沒有站著不動。

中國面對的是一個雙重追趕問題。在硬體端,它要追的是台積電——一家每年投入超過三百億美元資本支出、擁有三十年製程經驗累積的公司。在軟體端,它要追的是 CUDA——一個由全球千萬開發者自然長成的生態系統。

兩個追趕同時進行。兩個目標都在移動。而追趕者被掐住了最關鍵的供應鏈——先進的光刻設備買不到、最新的 NVIDIA 晶片買不到、最先進的製程代工服務用不了。

這就是缺課的代價。

你可以用幾個月的時間複製一款吸金的手遊。你可以用國家資本在三年內暴力推高某個製程節點的晶片產能。但你無法用錢或行政命令,在一夜之間買到一個由千萬個工程師和開發者,用二十年時間共同編織出來的底層生態。

正文的核心 pattern 是:便利吸引用家 → 鎖定開發者 → 壟斷收租。代價二三十年後才顯形。

中國的案例是這個 pattern 的鏡像:你當年跳過了多少底層建設的苦工,歷史就會要你連本帶利地吐出來。 代價同樣是二三十年後才到。

而帳單已經到了。

回到開篇。上海那間手遊工作室的香檳還在冒泡。深圳那棟研發大樓裡的錯誤訊息還在跳。兩幅畫面之間的距離——從應用層的繁華到底層的斷裂——不是地理距離。是三十年來一個國家在「應用」和「基礎」之間做出的無數次選擇的累積。

每一次選擇都是理性的。每一次的報表都很好看。

但所有理性的選擇加起來,等於一筆歷史從未打折的帳單。

這句話聽起來很耳熟。因為正文第五章裡,講 Intel 砍掉 Larrabee GPU 專案的時候,用的是同一句話——

「沒有人做了一個錯誤的決定。每一個人都做了在自己位置上最理性的決定。但所有理性的決定加起來,等於一個自殺式的結果。」

Intel 的版本是一家公司。中國的版本是一整個國家的產業結構。

規模不同。邏輯完全一樣。


CC BY-NC-ND 4.0 授权