遊戲至勝:四十年科技霸權的隱藏算術(終章加外傳)
第十一章:給遊戲玩家的情書——世嘉的成全與任天堂的救贖
2001 年 1 月 31 日,世嘉在東京召開了一場記者會。
社長入交昭一郎站在講台上,宣佈 Dreamcast 停產。世嘉退出主機硬體市場。一家從 1983 年的 SG-1000 起就在做遊戲主機的公司——經歷過 Mega Drive 的輝煌、Saturn 的苦戰、Dreamcast 的最後一搏——永遠離開了硬體戰場。
記者會很短。入交的措辭很克制。但那天晚上,秋葉原的遊戲店裡,店員把 Dreamcast 的展示櫃移到了角落。一些死忠玩家在 2ch 論壇上寫下悼文。有人引用了《莎木》裡的一句台詞:「いつか必ず、この道を。」(終有一天,會走完這條路。)
這家公司死了。但它死之前做的事——第四章講過的那筆 500 萬美元善款,讓 NVIDIA 活過 1996 年、最終長成五萬億美元的 AI 壟斷帝國——在二十五年後回看,重量大得驚人。
而世嘉倒下之後,主機市場只剩下三個玩家:Sony、微軟、任天堂。前兩家走上了本書前十章描述的那條路——算力軍備競賽、平台鎖定、華爾街報表遊戲。第三家,走了一條完全不同的路。
但在講任天堂的故事之前,要先把世嘉的驗屍報告寫清楚。因為世嘉的死因,遠比「技術太好」複雜得多。
I. 驗屍報告
要理解世嘉為什麼死,先要理解世嘉是什麼。
世嘉不是任天堂。任天堂是玩具公司出身——花札、遊戲卡、然後才是電子遊戲。任天堂的基因是「好玩」,它的畫面從來不需要是最好的,只需要服務玩法。
世嘉是街機公司出身。它的根在遊戲中心裡那些一台幾十萬日圓的大型筐體——液壓座椅、全包圍螢幕、六十幀不掉格的即時 3D。世嘉的內部開發團隊 AM2,由鈴木裕領軍,從八十年代起就在做一件任天堂從未做過的事:用極限硬體打造極限體驗。
1986 年,《OutRun》。Super Scaler 技術用高速精靈縮放模擬 3D 縱深——那個年代家用主機連影子都做不到的效果。液壓筐體跟著畫面傾斜,讓你的身體感受到過彎的離心力。世嘉把這種設計哲學叫做「體感」(taikan)。
1993 年,《Virtua Fighter》。世界上第一款全 3D 格鬥遊戲。Model 1 基板,每秒六十幀的多邊形即時渲染。在《Street Fighter II》定義了 2D 格鬥的年代,AM2 直接跳到了 3D——不是為了炫技,是因為鈴木裕相信 3D 空間能讓格鬥的深度和真實感達到 2D 做不到的層次。
1994 年,《Daytona USA》。Model 2 基板——GE Aerospace 合作開發的客製硬體,比當時任何家用主機快一個世代。八台筐體連線對戰,高速材質貼圖,引擎聲浪和輪胎摩擦的物理音效。這不是一款賽車遊戲,這是一個讓人坐在裡面就忘記自己在遊戲中心的沉浸裝置。
世嘉追求的從來不是單純的「畫面最好」或單純的「玩法最好」。它追求的是兩者同時推到極限——用最頂尖的硬體,做出讓身體和感官都無法拒絕的遊戲體驗。 這種追求,在任天堂的基因裡不存在,在後來 Sony 和微軟的報表邏輯裡也不存在。世嘉是遊戲史上最接近「工匠」的平台商。
但工匠死了。死因有三。
第一刀:自己砍的。 Dreamcast 之前,世嘉在五年內推出了 Mega CD、32X、Saturn 三款硬體——每一款都需要獨立的遊戲開發生態、獨立的供應鏈、獨立的行銷預算。Saturn 的雙 CPU 架構讓第三方開發者抓狂——只有 AM2 那種從裸機寫起的團隊才能榨乾它的性能。到 Dreamcast 上市的時候,世嘉的財務已經在失血,開發者的信任也在流失。
第二刀:Sony 的出口術。 1995 年的首屆 E3,世嘉宣佈 Saturn 以 399 美元在北美即日開賣——一個試圖搶先搶跑的冒險。Sony 的回應是遊戲史上最著名的一刀:SCEA 總裁 Steve Race 走上台,丟開講稿,只說了一個詞——「$299」——然後轉身下台。一百美元的價差,在那一秒內殺死了 Saturn 在北美的氣勢。但 Sony 的殺招不只是價格。久多良木健的團隊在 1994 年就開始了全球開發者巡迴——帶著 PlayStation 的 3D demo 逐間工作室拜訪,承諾低廉的 CD 量產費(比卡帶便宜一個數量級)和快速的審核流程。結果:Square 把《Final Fantasy VII》從任天堂陣營帶走,投向 PlayStation。Capcom、Konami 紛紛跟進。Sony 搶走的不是市佔率——它搶走的是第三方獨佔。 在一個遊戲主機的生死取決於軟體陣容的產業裡,失去第三方就是失去一切。
第三刀:PS2。 2000 年 3 月。第三章提過的那場發佈會——久多良木健拿著 Emotion Engine 的浮點運算數據上台,把 PS2 定位成「二十一世紀的家庭電腦」。PS2 第一年就賣了超過一千萬台。Dreamcast 的銷量從斷崖式下跌到停產,前後不到兩年。
三刀加在一起:自己的硬體分裂消耗了財務和開發者信任、Sony 的行銷戰術搶走了第三方陣容、PS2 的壓倒性裝機量封死了最後的出路。
世嘉的高層做了一個計算。繼續做硬體,每年虧損幾億美元。退出硬體,轉型純軟體公司,至少能活下去。
鈴木裕在 Dreamcast 上做了《莎木》——開發成本的報導從未被官方確認,業界估計在 4,700 萬到 7,000 萬美元之間。《莎木》有日夜交替的天氣系統、有獨立作息的 NPC、有可以走進去的便利店和可以玩的街機。在那個 3D 遊戲剛學會走路的年代,鈴木裕做了一個完整的虛擬城鎮。這款遊戲是世嘉「體感」哲學的終極表達——也是它最後的輓歌。
世嘉退出主機市場,在全球遊戲業發出了一個信號——如果連世嘉這種同時擁有頂級街機技術、頂級遊戲開發能力、而且願意不計成本追求極致的公司都撐不住,那麼做主機硬體這條路,留給後來者的教訓只有一個:你要麼大到不能倒,要麼就不要入場。
II. 岩田聰的算術
2002 年 5 月 31 日,岩田聰就任任天堂第四代社長。四十二歲。前任山內溥退休,指定了這個從 HAL 研究所走出來的程式設計師——不是商人、不是行銷人——接掌這家百年老店。
岩田聰接手的時候,任天堂正在被 GameCube 的失敗教訓。GameCube 搭載了一顆 IBM 的 PowerPC 客製 CPU「Gekko」和 ATI 的 GPU「Flipper」——效能在當時跟 PS2 和 Xbox 同級。任天堂認認真真地跟 Sony 和微軟打了一場正面的機能大戰。
結果:GameCube 全球銷量 2,174 萬台。PS2 賣了 1.55 億台。Xbox 賣了 2,400 萬台。GameCube 在三家裡墊底——而且是大幅墊底。
岩田聰不是那種會被失敗嚇住的人。他是一個會拿出計算機的人。
他算了一筆帳。
PS2 的 Emotion Engine 研發成本數以億計,Sony 每賣一台 PS2 在早期都虧錢,靠的是軟體授權費和 DVD 播放器的附加價值來回本。Xbox 每台虧超過 100 美元,微軟認了 40 億美元的虧損——因為它的目的不是賺錢,是堵住 Sony(第三章的故事)。
兩家對手都在用虧損換市佔率。這場仗的代價,隨著每一個世代的到來只會更高。GPU 效能每兩年翻一倍,研發成本每兩年翻一倍,但遊戲售價不能漲——消費者對一款遊戲的心理價位在 50 到 60 美元之間,十年沒變過。
岩田聰不需要別人的屍骨來教他算術。GameCube 自己的失敗已經夠清楚了——任天堂認認真真地跟對手比機能,結果賣得最差。而整個產業的成本結構擺在那裡:如果繼續跟 Sony 和微軟比算力,任天堂要麼被成本壓垮,要麼就得像微軟一樣靠一個更大的帝國來補貼虧損——但任天堂沒有 Windows 帝國,也沒有華爾街的耐心。 世嘉的退出是一個佐證,不是原因。真正的原因是計算機上的數字。
他做了一個在當時被幾乎所有遊戲媒體嘲笑的決定。
退出機能競賽。
III. 不參戰的代價
2006 年 11 月 19 日——比 PS3 晚兩天——Wii 在北美上市。249 美元。
Wii 的硬體規格,在當時的遊戲社群裡被當作笑話。它的 CPU 是 IBM 的 Broadway——基本上就是 GameCube 的 Gekko 超頻版。GPU 是 ATI 的 Hollywood——GameCube 的 Flipper 的升級版。整台機器的效能,大約是 PS3 和 Xbox 360 的三分之一到四分之一。
Sony 的 PS3 用的是 Cell Broadband Engine——IBM、Sony、東芝三家聯合研發的怪獸晶片,研發成本超過 30 億美元。微軟的 Xbox 360 用的是 IBM 的 Xenon 三核 CPU 配 ATI 的 Xenos GPU,在 2005 年是最先進的消費級圖形硬體之一。
Wii 用的,是兩代前的東西。
但 Wii 做了一件 PS3 和 Xbox 360 做不到的事:它開機兩秒就能玩。它的體感控制器讓七十歲的老太太也能打網球。它的價格讓家長不需要猶豫。
Wii 最終銷量:1.0163 億台。PS3:8,740 萬台。Xbox 360:8,580 萬台。
岩田聰贏了。
但這裡要停下來,問一個本書的讀者應該已經習慣問的問題:代價是什麼?
代價是:任天堂完美地錯過了通往 AI 霸權的所有底層技術積累。
Wii 沒有推動任何先進製程的壓力測試。它的晶片用的是 90 奈米——2006 年的 90 奈米,Intel 在那一年已經開始量產 65 奈米。Wii 的 GPU 沒有可編程的 shader 管線——第七章講的那種讓 NVIDIA 得以把遊戲 GPU 變成通用運算平台的架構創新,Wii 完全缺席。
Wii 沒有為台積電貢獻大 die 的良率數據。它沒有為 CUDA 的生態分攤一分錢的 R&D 稅。它的存在,在第七章和第八章描述的那條「從遊戲到 AI」的隱形供應鏈上,是一個零。
任天堂沒有參與鍛造 AI 霸權的底層基礎設施。 它退出了軍備競賽,保全了自己的財務,但也從此與推動人類科技極限的那條主戰線脫節。
這不是道德判斷。這是結構性觀察。任天堂的選擇讓它活了下來——而活下來,讓它能做一件在本書的語境裡更有意思的事。
IV. 孤島
當全世界的遊戲巨頭在做同一件事的時候,任天堂在做相反的事。
第十章詳細解剖了那件事:微軟把 Xbox 的工作室拆骨,把資源搬去 AI 基礎設施。Sony 在 Jim Ryan 的主導下,逼第一方工作室轉做服務性遊戲,關掉 Japan Studio,砸了 2 億美元做一款活了十四天的《Concord》。兩家公司的邏輯是同一個——把一次性交易變成經常性收入,向華爾街交保護費。
任天堂沒有交這筆保護費。
原因很簡單——任天堂不是美國上市公司。它在東京證券交易所上市,大股東結構以日本機構投資者和長期持股者為主。華爾街的季度營收壓力、美式上市公司的「經常性收入執念」——這些在任天堂的董事會裡,份量遠比在微軟和 Sony 小。
2017 年 3 月 3 日,Nintendo Switch 上市。299 美元。
Switch 的心臟是 NVIDIA 的 Tegra X1——一顆 2015 年發佈的行動裝置晶片。20 奈米製程。256 個 CUDA 核心。在 2017 年的遊戲硬體光譜上,它的效能大約是 PS4 的四分之一到三分之一。
再一次,遊戲媒體的第一反應是嘲笑。
再一次,任天堂贏了。
Switch 累計銷量超過 1.46 億台——超過 Wii,成為任天堂史上最暢銷的主機。《塞爾達傳說:曠野之息》《動物森友會》《瑪利歐卡丁車 8》——這些遊戲不需要光線追蹤,不需要 4K 材質,不需要每秒 120 幀。它們需要的是好玩。
而在 Switch 的整個生命週期裡——2017 年到 2024 年——任天堂堅持做了幾件微軟和 Sony 沒有做的事:
它的第一方遊戲是買斷制。沒有賽季通行證。沒有戰鬥通行證。沒有「充值 1,000 日圓解鎖限定外觀」。你花 60 美元買一款《曠野之息》,你得到的是一款完整的遊戲。
它沒有關閉任何第一方工作室。沒有裁員幾千人。沒有砍掉進行中的項目來「執靚盤數」。
它沒有逼自己的工作室做服務性遊戲。沒有 Jim Ryan 式的全面轉向指令。
在微軟和 Sony 把玩家當作分攤 R&D 成本的提款機、把工作室當作可以隨時拆毀重組的資產的時候,任天堂做了一件看起來很蠢的事——它把玩家當作顧客。
但這裡需要糾正一個容易產生的錯覺:任天堂不是一家「開放」的公司。恰恰相反。
1985 年——比 DirectX 早十年、比 CUDA 早二十年——任天堂在 NES 的每一張正版卡帶裡植入了一顆叫 10NES 的認證晶片。主機開機時與卡帶握手驗證。未經授權的卡帶,黑屏。這是遊戲業歷史上第一把硬體級的鎖。配套的授權制度嚴苛到近乎霸道:第三方開發商的年度發行數量有限額、必須接受獨佔期、卡帶由任天堂獨家製造。從 NES 到 Switch 2,每一代主機都有自己的專屬卡帶或卡片格式、自己的認證機制、自己的封閉開發者計劃。NES 到 3DS 還有硬體級的區域鎖定。
任天堂建了遊戲業歷史上最嚴的鎖。但這把鎖有一個特徵,跟本書前十章描述的每一把鎖都不一樣:它從不向外擴散。
10NES 不影響 PC。Switch 的封閉生態不影響 Steam。任天堂從不試圖讓自己的技術標準成為產業標準,從不參與 DirectX 和 Vulkan 的標準戰爭。它的態度始終如一:你進來我的花園,按我的規矩。你不進來,我不管你。
2026 年 4 月,有人在一台破解過的初代 Switch 上跑通了 Steam——Valve 的 Proton 剛加入 ARM64 支援,Switch 碰巧用了 ARM 晶片。任天堂的回應不是開放,是加固圍牆:Switch 2 的用戶協議明確寫著,安裝未授權軟體可能導致整台主機永久停用。
四十年前的 10NES 讓未授權卡帶黑屏。四十年後的反制手段升級成帳號封禁和遠端變磚。工具變了,邏輯一個字都沒有變。
微軟的 DirectX 是武器——用來征服外部世界的武器。任天堂的鎖是城牆——用來保護裡面的花園。兩者都是鎖。但一個向外擴散,另一個向內收縮。
V. NS2:孤島的裂縫
但故事到這裡並沒有結束。因為 2025 年 6 月 5 日發生了一件事,讓「任天堂不參與軍備競賽」的敘事出現了一道裂縫。
Nintendo Switch 2 上市。449.99 美元。
任天堂史上最貴的主機。比初代 Switch 貴了 50%。比 2006 年 Wii 的 249 美元貴了近一倍。
更值得注意的是裡面那顆晶片。
Switch 2 的心臟是 NVIDIA 客製的 Tegra T239——代號 Drake。這不是一顆「枯萎技術」的晶片。它基於 NVIDIA 的 Ampere 架構——跟 RTX 3080 同一個架構世代。1,536 個 CUDA 核心。配備 RT 核心——即時光線追蹤。配備 Tensor 核心——NVIDIA 為 AI 運算設計的專用單元。晶片面積 207 平方毫米——初代 Switch 的 Tegra X1 的近兩倍。12GB LPDDR5X 記憶體。
這顆晶片最關鍵的功能是 DLSS——Deep Learning Super Sampling。NVIDIA 的 AI 升頻技術。它讓 Switch 2 可以用較低的原生解析度渲染遊戲,然後用 Tensor 核心的 AI 運算把畫面「升級」到 1080p 甚至 4K。
任天堂的新主機裡面,跑著 NVIDIA 的 AI 晶片。
BOM(物料清單)估計在 330 到 400 美元之間。如果屬實,這意味著任天堂——一家以「硬體必須盈利」為鐵律的公司——在 Switch 2 上可能只有極薄的利潤,甚至虧損。
這顆 T239 晶片由 Samsung Foundry 代工,使用 Samsung 8nm 製程(技術上是 10nm 的衍生版本)——跟 NVIDIA 的 RTX 3090 用的是同一個製程節點。不是台積電。
這裡出現了一個微妙但重要的事實:任天堂的主機晶片訂單,沒有進入台積電的產能池。 第八章和第十章強調過,PS5 和 Xbox Series X 的長期 SoC 訂單是台積電產能規劃的壓艙石之一。Switch 2 的訂單去了 Samsung——這意味著任天堂的硬體存在,在第八章描述的那條「主機→台積電→AI 晶片」的供應鏈上,同樣是一個零。即使它終於加入了算力競賽,它依然沒有踏上那條軌道。
但 Switch 2 做了另一件事。
首四天,全球賣出 350 萬台。任天堂史上最快的首發銷售紀錄。在微軟的 Xbox 正在被拆、Sony 的第一方工作室正在被服務性遊戲的殘局壓垮的 2025 年——在全球遊戲硬體市場據說正在萎縮的 2025 年——一台 450 美元的主機,靠的不是算力、不是 AI 故事、不是經常性收入的華爾街敘事,而是「這台機器上有《瑪利歐》和《塞爾達》」,四天賣了 350 萬台。
在所有人都在拆遊戲的時候,只有任天堂還在做遊戲。而消費者的鈔票,投給了做遊戲的那一家。
VI. 結案陳詞
在前十章裡,那個 pattern 出現了八次。每一次的形態不同——進攻、防禦、偶然、雙向鎖定——但核心邏輯一樣:用便利吸引使用者,用依賴鎖住使用者,把使用者變成平台的附屬品。 而且每一把鎖都有同一個特徵:它向外擴散,穿透平台邊界,影響了平台以外的世界。
這一章,pattern 反轉了。
世嘉沒有建鎖——它沒有活到鎖定生態的那一天。Dreamcast 的線上服務 SegaNet 有鎖定的雛形,但 PS2 在它成型之前就殺死了它。世嘉的退出,不是選擇,是被判刑。
任天堂建了鎖——遊戲業歷史上最早、最嚴厲的鎖。10NES 比 DirectX 早十年。但它的鎖是圍牆型的:邊界止於自家平台,從不向外擴散,每一代主機結束就歸零重置。沒有人在 2025 年因為 1985 年的 10NES 而被鎖在任何地方。
三種鎖,三種結局。
擴散型鎖定——微軟、NVIDIA、台積電、Valve——成為科技霸權的基礎設施。代價由下游承擔,延遲帳單二三十年後才到。
圍牆型鎖定——任天堂——活了四十年,但與科技霸權的主線無關。一座花園,不是一條供應鏈。
無鎖——世嘉——死亡。
任天堂是選擇。它選擇不參與算力軍備競賽,從 Wii 到 Switch,十八年。它選擇把鎖的邊界畫在自己的圍牆上,從不試圖鎖住外面的世界。這個選擇有兩面。
一面是代價:任天堂不在第七章的 CUDA 供應鏈上,不在第八章的台積電良率壓力測試場上,不在第九章的 x86 vs. ARM 的架構之爭上。它對 AI 革命的底層基礎設施貢獻為零。從科技史的角度看,任天堂的十八年,是一段精彩的旁觀。
另一面是收穫:任天堂是本書所有角色裡,唯一一個在 2025 年還把遊戲當作目的而非手段的公司。 微軟把遊戲當作 Windows 的防禦武器,用完就拆。Sony 把遊戲當作營收管線,型態不對就換。NVIDIA 把遊戲玩家當作 R&D 稅的繳納者,養完 CUDA 就轉向 AI。台積電把遊戲晶片當作先進製程的壓力測試場。每一家公司都在利用遊戲——只有任天堂還在做遊戲。
但 Switch 2 打破了一些東西。449 美元。NVIDIA Ampere。DLSS。Tensor 核心。任天堂第一次把 AI 技術放進了自己的主機——雖然目的不是做 AI,是為了讓一台掌機能跑出接近 4K 的畫面。它開始付更高的硬體成本。它離「枯萎技術」越來越遠。
任天堂的孤島,正在被潮水侵蝕。不是因為任天堂變了——是因為「做一台好玩的遊戲機」在 2025 年需要的硬體成本,已經不允許任何人便宜地獨善其身了。
世嘉死於走在時代的前面。任天堂活於走在時代的後面。但時代正在追上來。
VII. 贓物仍在被瓜分
2001 年,世嘉在退出主機市場之前,賣掉了手中持有的 NVIDIA 股份。500 萬美元買入,1,500 萬美元賣出。三倍回報。
2025 年,NVIDIA 市值超過五萬億美元。那 500 萬美元的原始投資,如果持有至今,價值數百億美元。
世嘉沒有等到那一天。它等不起。
而入交昭一郎——那個在 1996 年做了一個違反所有商業教科書的決定,把最後的救生圈丟給 NVIDIA 的人——在 2000 年辭去世嘉社長職位後,從公眾視野中消失了。
入交昭一郎從來不知道自己做了什麼。他不知道那 500 萬美元會變成 RIVA 128、變成 GeForce、變成 CUDA、變成 H100、變成掐住全球 AI 產業咽喉的壟斷。他只是覺得一個年輕人值得再給一次機會。
世嘉是這本書裡最純粹的角色。它沒有陰謀,沒有鎖定,沒有華爾街的報表遊戲。它為了做好遊戲而超前、為了道義而慷慨、為了活下去而退出。它的每一個決定,都是一個做遊戲的人會做的決定——不是一個做平台的人會做的決定。
而任天堂——在世嘉倒下後的同一個市場裡活下來的那家公司——正在面對一個世嘉從未面對過的問題:當孤島的成本越來越高,你還能獨善其身多久?
Switch 2 的 449 美元,已經是任天堂向現實妥協的第一步。下一步是什麼?下一代主機用台積電的製程?加入 PS6 和下一代 Xbox 的算力競賽?用 DLSS 4.0 的 AI 升頻,卻同時堅持做買斷制的純粹遊戲?
沒有人知道。
但有一件事是確定的。在本書記錄的這四十年裡,有兩家公司證明了——你可以不參與向外擴散的平台鎖定,你可以不參與壟斷競賽,你甚至可以不參與推動 AI 霸權的底層基礎設施建設。
代價是,你不會成為五萬億美元的巨人。
收穫是,你做的東西,還是遊戲。
那是終章的問題:在這場四十年的狂奔之後,「還是遊戲」這四個字,到底值多少?
終章:遊戲即未來
凌晨兩點。
序章開場的那個時刻。手邊的 Steam Deck 還在跑一款 Windows 遊戲——Linux 系統上的 Proton 翻譯層,把 DirectX 的每一個呼叫轉成 Vulkan,第六章的故事。iPhone 的通知亮了又暗——晶片出自台積電 3 奈米產線,第八章的故事。窗外某個資料中心裡,幾千張 NVIDIA H100 正在替一個大型語言模型算下一組權重——每一張卡裡面的 CUDA 核心,是遊戲玩家用十八年的 R&D 稅養出來的,第七章的故事。
但這一次,多了一樣東西。
電視櫃下面擺著一台 Nintendo Switch 2。450 美元。NVIDIA Ampere 架構。Tensor 核心。DLSS。這台主機裡面跑著的 AI 升頻演算法,跟 H100 裡面的 Tensor 核心,出自同一個設計血統。
整個房間裡,每一樣東西都有一條因果鏈,通往本書的某一章。而所有的因果鏈,最終收斂到同一個起點。
有人想玩更好的遊戲。
I. 收斂
站在 2026 年回望,這四十年的科技史出現了一種令人敬畏的收斂。
1993 年,一個年輕人在 Denny's 餐廳裡決定做一張讓 PC 遊戲畫面變漂亮的顯示卡。2026 年,他的公司市值超過五萬億美元,全球每一家想做 AI 的公司都在排隊向他買晶片。
1995 年,一個微軟工程師被派去說服 John Carmack 接受 Windows。三十年後,微軟每年花一千億美元建 AI 資料中心——資料中心裡跑的作業系統是 Linux,Carmack 當年最信任的那個系統。
1996 年,一個日本人把 500 萬美元交給一個犯了致命錯誤的年輕人。2026 年,那 500 萬美元長成了人類歷史上最深的技術壟斷。
1998 年,台積電跟 NVIDIA 簽了第一份戰略合作協議。2026 年,全球最先進的 AI 晶片——H100、B200——全部出自台積電在新竹的產線。那條產線的良率,是被遊戲 GPU 的大 die 訂單逼出來的。
2006 年,黃仁勳在每一張 GeForce 8800 GTX 裡面偷偷塞了通用運算核心。2012 年,一個烏克蘭裔博士生用兩張遊戲顯示卡,在父母家的臥室裡引爆了深度學習革命。2022 年,ChatGPT 上線。整條因果鏈的每一個節點,都站著一個遊戲玩家的鈔票。
軟體、算力、矽晶片。DirectX、CUDA、台積電。三條看似平行的科技樹,全部在 AI 時代的頂峰完成了合體。
但合體的代價,正在這本書的最後三章裡一條一條浮現。
II. 三重拷問
第一問:為什麼科技霸權的每一次轉向,都從遊戲開始?
這個問題的答案,本書用了十一章來回答,但可以壓縮成一句話:因為遊戲玩家是人類歷史上唯一一群,願意每兩年花上千美元、只為了讓螢幕上的水面反光更真實一點的消費者。
沒有任何其他產業有這種消費者。企業用戶買伺服器是為了省錢——他們精打細算每一分成本。科研機構買超算是靠政府撥款——週期長、金額固定。只有遊戲玩家是自掏腰包、心甘情願、而且永不滿足。
這群人構成了一個完美的壓力測試場加 R&D 資金池。他們的錢養了 NVIDIA 的 CUDA 十年(第七章)。他們的 GPU 訂單逼台積電把大 die 良率推到極限(第八章)。他們對畫質的偏執,迫使每一代 GPU 都要突破上一代的矽晶片極限——而那些被突破的極限,恰好就是 AI 運算需要的極限。
遊戲不是科技革命的附產品。遊戲是科技革命的壓力測試場和提款機。
第二問:為什麼在這場四十年的廝殺中,有些公司倖存,有些黯然倒下?
答案不是天才的多寡。本書記錄的每一個主角——黃仁勳、蓋茲、Lisa Su、Pat Gelsinger、Gabe Newell、張忠謀——都是各自領域裡最聰明的人。天才不缺。
差別在體制。
第九章的結論:Intel 的 MDF 和一條龍服務體系養出了一個動不了的帝國。Pat Gelsinger 看到了所有問題,但利益結構固化得太深,華爾街不給他時間。Lisa Su 贏了,不是因為她更聰明——是因為 AMD 被打到谷底,谷底意味著自由,自由意味著可以把所有資源壓在一個賭注上。
第十章的結論:Nadella 有實權、方向可能對——但他正在拆毀的東西(遊戲作為壓力測試場的功能),帳單要十年後才到。Ryan 有實權、方向已被證明錯——服務性遊戲的屍體堆成山。
科技霸權的更迭,不是天才之間的智力競賽。是組織結構、利益綑綁、和時間尺度之間的達爾文演化。
第三問:當巨頭親手拆毀自己的壓力測試場,這是轉型,還是自殺?
這是本書最後一個問題,也是唯一一個還沒有答案的問題。
微軟在 2026 年的 AI 資本支出超過一千億美元。它關掉了 Tango Gameworks、Arkane Austin、The Initiative。它讓 Turn 10——ForzaTech 引擎的開發團隊——裁掉近半數員工。它用省下來的錢買 NVIDIA 的 GPU 建 AI 資料中心。
Sony 花了 2 億美元做了一款活了十四天的遊戲。關掉了 Japan Studio。關掉了 Bluepoint。關掉了 Firewalk。Jim Ryan 帶著幾輩子都花不完的財富退休了。
兩家公司用不同的方式,做了同一件事:把遊戲當作手段而不是目的,把玩家當作籌碼而不是顧客。
第三章寫過這句話。那時它是一個預告。第十章把它變成了一份結算。
但結算的帳單上,有一行數字還沒有人算得出來:當全球最大的兩家遊戲平台商同時決定「遊戲不是核心業務」的時候,他們同時拆掉的壓力測試場、R&D 資金池、和長期晶片訂單,會對未來十年的半導體供應鏈造成多大的缺口?
沒有 CEO 問這個問題。因為這條因果鏈太長了——從 Xbox 的裁員到台積電的產能規劃,中間隔了太多層。而華爾街只看下一季。
III. 全局觀的消亡
這本書的自序講了一個私人的故事。一個在九十年代的旺角信和中心長大的少年,靠著改 config.sys、背 IRQ 中斷線號碼、在卡西歐計算機上把 255 按成 FF,不小心學會了整個 CPU 的架構。
那種學習路徑——從遊戲出發,穿透作業系統,直達硬體底層——在今天已經幾乎消失了。
2026 年的年輕工程師不需要知道 IRQ 是什麼。不需要知道 VGA 暫存器怎麼配置。不需要知道記憶體頁面是怎麼切分的。他們打開 PyTorch,呼叫 model.train(),底下的一切——cuDNN、cuBLAS、PTX、SASS、GPU 上的每一個電晶體的開關——全部被封裝成黑盒子。
這不是壞事。抽象層是管理複雜度的唯一辦法。自序已經說過:問題不在抽象層本身——問題在抽象層何時變成了黑盒子。
黑盒子意味著:你可以使用它,但你不能打開它。你可以在它的表面上做優化,但你不能穿透它去重新設計地基。
John Carmack 之所以是 Carmack,是因為他成長的年代,硬體是裸露的。他必須直接寫 VGA 記憶體、必須搞清楚 CPU 的每一個 clock cycle 怎麼花。黃仁勳之所以能看到 GPU 裡面那條從繪圖到通用運算的縫,是因為他橫跨硬體設計和商業行銷,看得穿整個 stack。Lisa Su 之所以能在谷底把 AMD 救活,是因為她的技術底子從半導體物理一路到系統架構,每一層都碰過。
這些人有一個共同點:他們看得穿整個系統——從電晶體到 API 到應用層。 自序把這種能力叫做「全局觀」。
但在 2026 年的速食 AI 時代,最聰明的腦袋都在學習如何呼叫現成的工具——如何串接 LangChain、如何微調 LoRA、如何用 Agent 自動化工作流程。這些技能有價值。但它們全部站在黑盒子的表面上。
而更令人不安的是,這個問題不只出在學生身上——它出在整個教育體制的結構裡。
產業對工程師的需求方式已經徹底改變了。AI 輔助開發工具的普及,讓軟體團隊的人數正在被壓縮到個位數。企業的選才標準不再容許「進來慢慢帶」——他們要的是入門即戰力。但課程表上教的東西,還是五年前的路線圖。學生不是不聰明,是沒有人告訴他們路已經變了。
這裡藏著一個諷刺。
學校不教的東西——遊戲引擎的底層架構、即時渲染的管線設計、GPU 上的並行運算怎麼排程——恰好就是通往 AI 時代最前沿的橋樑。NVIDIA 的 Isaac Sim——物理 AI 的核心模擬平台——建基於 Omniverse 和 PhysX 物理引擎。PhysX 同時也是 Unreal Engine 的預設物理引擎;Omniverse 的場景描述格式 OpenUSD,同時也是 Houdini 和好萊塢特效產業的資料交換標準。這些系統的架構和目的各不相同——遊戲引擎追求即時互動效能,Houdini 追求程序化內容生成,Isaac Sim 追求高保真的機器人訓練模擬——但它們需要的核心技能高度重疊:理解 GPU 如何排程並行運算、理解場景圖如何組織 3D 資料、理解物理引擎如何在每一幀裡解算碰撞和力學。一個在遊戲引擎裡面磨過底層的工程師,轉向物理 AI 的門檻遠比一個只會呼叫 API 的人低。
但沒有人告訴他這件事。因為課程表上沒有這條路。學生沿著前人的老路走,老路的盡頭是一個正在被 AI 精簡掉的職位。而旁邊那條通往新世界的小徑——從遊戲引擎的底層技能穿透到 AI 基礎設施的那條小徑——上面長滿了草,因為沒有課程帶他們走過去。
培養「全局觀」工程師的土壤,正在從兩端同時崩塌。一端是產業——壓力測試場被拆、工作室被關、遊戲被當作報表上的數字。另一端是教育——課程跟不上、學生不知道路變了、最有價值的跨層學習路徑沒有人教。
如果我們不再培養那種願意深潛入機器底層的工程師——那種會問「這個 API 底下是什麼」「這顆晶片為什麼要這樣設計」「這個抽象層背後藏了什麼代價」的人——
那麼,當下一次科技革命的巨浪襲來時,誰來為人類寫下第一行破局的代碼?
IV. 最後的算術
這本書記錄了八次 pattern 的變奏。
第二章:DirectX 鎖住 PC 遊戲開發者。第三章:Xbox 用虧損堵住 Sony。第四章:世嘉的善款偶然催生了 NVIDIA。第五和第六章:Linux 的反擊與 Steam 的新鎖定。第七章:CUDA 的四層監獄。第八章:台積電的信任壟斷。第九章:Intel 的 MDF 鎖住了自己。第十章:微軟和 Sony 親手拆毀壓力測試場。
八次變奏,鎖的形態各不相同,但有一個共同特徵:每一把鎖都向外擴散。 DirectX 從 PC 遊戲擴散到整個 Windows 開發生態。CUDA 從遊戲 GPU 擴散到全球 AI 基礎設施。台積電的信任壟斷從遊戲晶片代工擴散到所有 fabless 客戶。這些鎖穿透了平台邊界、穿透了世代更替、穿透了產業隔閡。它們的代價,至今仍在被瓜分。
第十一章,pattern 反轉了。
任天堂不是一家「沒有建立平台鎖定」的公司。恰恰相反——1985 年,它在 NES 卡帶裡植入 10NES 鎖定晶片,建立了遊戲業歷史上第一個硬體級准入機制。比 DirectX 早十年。比 CUDA 早二十年。它的授權制度之嚴苛——年度配額、獨佔期、獨家卡帶製造——在同時代無人能出其右。
但任天堂的鎖有一個特徵,跟本書前十章描述的每一把鎖都不一樣:它從不向外擴散。
NES 的 10NES 不影響 PC。不影響 Mega Drive。不影響 PlayStation。任天堂從不試圖讓自己的技術標準成為產業標準,從不參與 DirectX 和 Vulkan 的標準戰爭,從不試圖用自己的鎖去箍住平台以外的世界。它的態度始終如一:你進來我的花園,按我的規矩。你不進來,我不管你。
世嘉走了另一個極端。它連最基本的圍牆都沒有建。Dreamcast 的防盜版機制形同虛設,開發門檻主動降低,大門敞開。結果:PS2 一來,它死了。
三種鎖,三種結局。
擴散型鎖定——微軟、NVIDIA、台積電、Valve——成為科技霸權的基礎設施。代價由下游承擔,延遲帳單二三十年後才到。
圍牆型鎖定——任天堂——存活四十年,但與科技霸權的主線無關。一座花園,不是一條供應鏈。Switch 裡面的 NVIDIA Ampere 晶片,跟 H100 出自同一個設計血統。但任天堂從來不關心 AI。它只關心遊戲好不好玩。
無鎖——世嘉——死亡。入交昭一郎的 500 萬美元善款,是世嘉留給科技史最後的指紋。
八次擴散,一次圍牆,一次無鎖。十一章因果鏈,全部收斂到同一個起點:有人想玩更好的遊戲。
這就是本書的最終算術。
遊戲不是一個產業。遊戲是一個壓力測試場——世界上最嚴苛的壓力測試場。它逼 GPU 推到極限,逼製程推到極限,逼作業系統推到極限,逼人類工程師推到極限。而在推到極限的過程中,它無意間鋪設了 AI 革命、智慧型手機、全球半導體格局的底層軌道。
遊戲也是一面鏡子。它映照出每一家科技巨頭的真實面目——誰把使用者當作目的,誰把使用者當作手段。微軟用遊戲堵牆,用完就拆。Sony 用遊戲做報表,型態不對就換。NVIDIA 用遊戲養 CUDA,養完就轉。任天堂建了最嚴的圍牆,但圍牆裡面,它從頭到尾把遊戲當作遊戲。世嘉連圍牆都不建,把善意交給了一個陌生人——然後死了。
自序問了一個問題:AI 時代,我們還有沒有可能培養出下一代的 Carmack、Lisa Su、張忠謀?
答案取決於兩件事。
第一:有沒有人還在做那種逼年輕人穿透黑盒子的產品——那種讓你為了解決一個 bug、為了讓畫面多跑出十幀而徹夜不眠的東西。
第二:有沒有人還在保護那個壓力測試場——不讓它被拆去蓋 AI 資料中心、不讓它被改造成微交易的收割機、不讓它被華爾街的經常性收入執念給吞噬。
如果這兩件事還在發生,下一代的全局觀工程師就有土壤。如果它們消失了——如果最後一座壓力測試場也被拆掉、最後一個願意做完整遊戲的公司也向華爾街投降——
那麼這本書,就是一份悼詞。
如果它們還在——
那這本書就是一份使用說明書。給下一個在凌晨兩點,為了讓一款遊戲跑起來,而願意打開機殼、直視矽晶片的人。
外傳上篇:逃獄者——Google 的無魂豪賭與 TPU 閉環
2022 年 9 月 29 日,Google 副總裁 Phil Harrison 在一篇官方部落格文章裡宣佈:Stadia 將於 2023 年 1 月 18 日永久關閉。
這是一個奇怪的死法。
Stadia 擁有全世界任何遊戲公司都夢寐以求的基礎設施:遍佈全球的資料中心、自家鋪設的海底光纖、YouTube 的十億級用戶入口、以及 Google 工程團隊幾十年累積的大規模分散式系統經驗。論技術底座,地球上沒有第二家公司比 Google 更適合做雲端遊戲。
但 Stadia 的月活躍用戶從未超過七十五萬。同一時期,Xbox Live 和 PlayStation Network 的月活躍用戶各自突破一億。
Harrison 在文章裡說的理由很溫和:「沒有獲得我們預期的用戶黏著度。」他沒有說的是:在他按下發佈鍵的同一秒,Google Play 商店正在全球二十億台 Android 手機上,以每筆交易自動抽取最高 30% 佣金的速度,從遊戲開發者口袋裡收錢。
2024 年,Google Play 的用戶消費總額超過 467 億美元。其中遊戲佔大約四成——將近兩百億美元。Google 從中抽走的佣金,遠超過 Stadia 三年營運期間的全部營收。
一邊是花了幾億美元建設、苦撐三年、月活不到一百萬的雲端遊戲平台。另一邊是零遊戲研發、零硬體成本、每一秒鐘自動進帳的平台稅。
Harrison 簽下關閉 Stadia 的文件時,大概連猶豫都沒有。
I. 降維打擊:為什麼不在泥沼裡打仗
正文第六章講了 Valve 怎樣用 Proton 撬開微軟的 DirectX 鎖。第七章講了 NVIDIA 怎樣用 CUDA 蓋了一座四層深的軟體監獄。兩場戰爭有一個共同點:戰場在 PC 和主機——你必須造硬體、寫驅動、建生態、搶開發者。每一步都是泥沼裡的肉搏。
Google 從頭到尾沒有踏進這片泥沼。
它做的事情更簡單也更殘酷:它跳過了整個遊戲價值鏈的中下游,直接站在最上游收租。
2008 年,Android Market(Google Play 的前身)上線。Google 沒有自己開發任何一款遊戲。它做的事只有一件:提供一個所有 Android 手機預裝的商店,然後對每一筆數位內容交易抽取 30% 佣金。後來降到首年百萬美元以內抽 15%,超過的部分仍然是 30%。
這個模式的本質,跟第六章裡 Steam 的 30% 平台稅一模一樣。但 Google 的版本更極端。
Valve 至少還在做兩件事:第一,它自己開發遊戲(《Half-Life》《Portal》《Dota 2》),理解遊戲是什麼;第二,它建造了 Proton、DXVK、Steam Deck——花真金白銀去解決「讓更多遊戲跑起來」的技術問題。Valve 收的那 30%,至少有一部分被拿去養工程師、寫翻譯層、推 Linux 生態。
Google 收的那 30%,沒有任何一分錢回到遊戲本身。
它不設計遊戲引擎。不投資工作室。不推動圖形 API 標準。不跟 GPU 廠商合作優化驅動。它甚至不做遊戲品質審核——Google Play 上充斥著換皮遊戲和廣告農場。Google 對遊戲的全部態度,可以濃縮成一個詞:報表。
每一款遊戲在 Google 眼中,都是一行報表上的數字。下載量、日活、付費轉換率、ARPU——這些指標決定它在商店裡的排名。遊戲好不好玩?那是開發者的事。Google 只負責收租。
這就是正文第六章提出的 pattern 的一個極端變體:便利吸引開發者(全球最大的行動裝置安裝基數)→ 鎖定效應箍住開發者(你的用戶在 Android 上,你的收入透過 Google Play 結算,你不可能離開)→ 反過來向開發者收取壟斷溢價(30% 佣金,沒有議價空間)。
而代價呢?
代價是 Google 對遊戲這件事本身,沒有任何理解。這個代價在 Stadia 身上兌現了。
II. Stadia 之死:擁有一切,卻少了一個東西
2019 年 3 月,Google 在舊金山的 GDC(遊戲開發者大會)上發佈 Stadia。發佈會的規格令人窒息:4K 解析度、HDR 色彩、5.1 環繞音效、延遲低於 30 毫秒。背後是 Google 遍佈全球的邊緣運算節點。Phil Harrison 站在台上,用一句話總結了 Google 的野心:「未來最強大的遊戲平台,不需要任何硬體。」
技術上他說的是對的。
但他漏算了一件事:技術從來不是遊戲平台成敗的決定因素。
第三章講過,Xbox 第一代的硬體規格遠勝 PS2。但 PS2 靠著龐大的遊戲庫和先發優勢,在那一個世代賣出超過一億五千萬台。第四章講過,世嘉 Dreamcast 是當時技術最先進的主機——它死了。硬體和技術解決的是「能不能做到」的問題。但遊戲平台的勝負取決於另一個問題:開發者願不願意為你做遊戲。
開發者願不願意,取決於信任。
任天堂的開發者信任任天堂會把遊戲當遊戲看。Sony 的第一方工作室——至少在 Jim Ryan 拆牆之前——信任 PlayStation 會給他們時間做好一款作品。連 Valve 的開發者都知道,Gabe Newell 自己就是一個玩家,他理解遊戲的價值不只是報表上的數字。
Google 給開發者的信號是什麼?
2021 年 2 月,Stadia 上線不到兩年,Google 關閉了自己的第一方遊戲工作室 Stadia Games and Entertainment。一間還沒來得及發佈任何遊戲的工作室,就這樣被砍了。
對全世界的遊戲開發者來說,這個動作傳遞的信號只有一個:Google 隨時會走。
而 Google 確實走了。因為 Google 做每一個產品的方式都是一樣的:設定一個用戶目標、給兩到三年的跑道、達標就加碼、不達標就殺。這個流程對搜尋引擎、對廣告平台、對雲端服務都有效。對遊戲無效。
因為遊戲生態的建立需要十年。
Xbox 從 2001 年推出第一代,到 2013 年 Xbox One 才真正在訂閱模式上找到自己的定位——十二年。PlayStation 從 1994 年的 PS1 到 2020 年 PS5 的生態成熟——二十六年。Steam 從 2003 年上線到 2022 年 Steam Deck 證明 PC 遊戲不需要 Windows——十九年。
沒有一個成功的遊戲平台是在三年內建起來的。
Google 不是沒有資源。它是全世界最有錢的公司之一。但它的體制——季度考核、OKR 驅動、專案隨時可殺——跟遊戲生態所需要的長期承諾,在結構上不相容。
正文裡我們給這種特質取了一個名字:報表靈魂。 Google 有全世界最精密的報表。但報表看不見「一個開發者花三年做了一款沒人買但改變了類型定義的遊戲」這種事情的價值。報表只看得見下載量和收入曲線。
Stadia 的死因不是技術。是靈魂。
Google 有全球最好的基礎設施、最快的網路、最強的工程團隊——但它沒有 Game Soul。它有的是 Spreadsheet Soul。而 Spreadsheet Soul 可以讓你在 Google Play 上每秒鐘自動收租,卻沒辦法說服任何一個開發者:「把你的心血之作,獨佔放在我的平台上。」
III. TPU:唯一一個成功的逃獄者
但 Google 在另一場戰爭裡,做到了一件沒有任何其他公司做到的事。
它逃出了 CUDA 的監獄。
第七章用了相當篇幅講 NVIDIA 的四層鎖:硬體指令集、運算函式庫、AI 框架、知識體系。全世界的 AI 研究員——從博士生到大型實驗室——全部被鎖在這四層裡面。AMD 用 ROCm 追了十年,追不上。每一家 AI 新創公司在成立第一天,就已經是 NVIDIA 的俘虜。
Google 不是。
原因很簡單,也很殘酷:Google 自己重建了全部四層。
2013 年,Google 內部開始設計一種專門為機器學習優化的晶片。2015 年,第一代 TPU 在 Google 的資料中心裡投入運作——那時候外界甚至不知道它的存在。2016 年 5 月,Google 才在一篇論文裡正式公佈 TPU 的存在。
到了 2026 年,TPU 已經演化到第七代(代號 Ironwood)。Gemini 2.0——Google 最強大的 AI 模型——是用第六代 TPU(Trillium)訓練出來的。
用第七章的框架來看 Google 做了什麼:
第一層——硬體指令集: NVIDIA GPU 有自己的原生指令集(PTX/SASS),TPU 也有自己的。但 TPU 的指令集從一開始就為矩陣運算而設計——它不需要兼顧遊戲繪圖,不需要背負 CUDA 向後相容的歷史包袱。每一個電晶體都花在 AI 需要的地方。
第二層——運算函式庫: NVIDIA 有 cuDNN、cuBLAS、NCCL。Google 有 XLA(Accelerated Linear Algebra)編譯器——一個可以把高階運算自動編譯成 TPU 原生指令的系統。XLA 不是一個函式庫,它是一個編譯器。這意味著 Google 的工程師不需要手動針對每一種運算寫優化版——編譯器替他們做。
第三層——AI 框架: NVIDIA 靠 PyTorch 和 TensorFlow 在這一層鎖住開發者。但 TensorFlow 是誰寫的?Google。JAX 是誰寫的?Google。Google 不是被別人的框架鎖住的——它自己就是框架的作者。 它可以隨時修改框架的底層,讓 TPU 成為最佳運行目標。
第四層——知識體系: Google 內部有幾千名 AI 研究員。他們不需要去 Stack Overflow 上找 CUDA 的教學——他們用的是 Google 內部的工具鏈、內部的文件、內部的基礎設施。他們的知識體系是圍繞 TPU 而非 CUDA 建立的。
四層鎖,Google 全部繞過。不是用「翻譯」的方式繞(那是 Valve 對付 DirectX 的方法),而是用「重建」的方式。它造了自己的硬體、自己的編譯器、自己的框架、自己的研究團隊——一座完全獨立於 NVIDIA 生態的城池。
但這座城池有一個關鍵特徵:它是封閉的。
TPU 不賣給終端用戶。你不能像買一張 GeForce 那樣去百思買買一張 TPU 卡。你只能透過 Google Cloud 租用 TPU 算力——按小時計費。2025 年,Google 開始嘗試向企業直接銷售 TPU 硬體,但規模極小,而且買家基本上是跟 Google 有深度合作關係的機構。
這意味著 Google 的「逃獄」,是一種只有 Google 做得到的逃獄。
為什麼?因為 Google 有一樣東西是全世界任何其他公司都沒有的:龐大到足以撐起一整條自建晶片供應鏈的內部需求。
YouTube 的推薦系統。Google 搜尋的排名演算法。Gmail 的垃圾郵件過濾。Google Photos 的影像辨識。Google 翻譯。Google Maps 的即時路況預測。Gemini。——這些服務加起來,每秒鐘消耗的 AI 運算量,比大多數國家的全部 AI 算力還大。
Google 不需要說服外面的開發者來用 TPU。它自己就是 TPU 最大的客戶。它不需要建立「生態」——它自己就是生態。
這就是「內部閉環」的本質。 Google 同時是晶片的設計者、框架的作者、模型的訓練者、和服務的運營者。它不需要跟任何人合作,不需要說服任何人遷移,不需要等待任何第三方函式庫的支援。它一個人,把 NVIDIA 用十年時間、靠全球千萬遊戲玩家建立的生態,在自己的圍牆花園裡從零複製了一套。
IV. 逃獄的代價
但逃獄者付出了什麼代價?
第一個代價:Google 的 TPU 逃獄對其他人毫無意義。
一個在大學裡用 PyTorch 寫 AI 模型的博士生,不會因為 Google 有 TPU 就能逃出 CUDA 的監獄。他的論文要用 PyTorch 寫、用 CUDA 跑、在 NVIDIA GPU 上訓練。他可以申請 Google 的 TPU 研究計劃免費使用一些算力,但他的程式碼最終還是要能在 NVIDIA GPU 上跑——因為他的論文審稿人會用 NVIDIA 的機器驗證他的實驗。
Google 的逃獄是一個人的逃獄。它不是越獄革命。
第六章裡 Valve 的 Proton 是一場真正的越獄——它把翻譯層開源,讓所有 Linux 用戶都受益。它撬開的門,是全世界的門。Google 的 TPU 撬開的門,只通向 Google 自己的後花園。
第二個代價:Stadia 的死亡證明,技術閉環無法替代生態。
Google 有全球最好的雲端基礎設施、有 TPU 的運算能力、有 YouTube 的用戶入口。但這些東西加在一起,做不出一個活的遊戲平台。因為遊戲平台的核心不是技術——是信任、是內容、是開發者願意用三年甚至五年的時間為你做一款好遊戲的承諾。
這跟第七章的 CUDA 故事形成了一個有趣的鏡像。
NVIDIA 的 CUDA 生態不是 NVIDIA 自己建的——是全球的大學教授、博士生、開源貢獻者、AI 新創公司,在十年裡自然長出來的。NVIDIA 提供了土壤(免費的 CUDA 工具鏈、開發者文件、大學贊助計劃),但植物是自己長的。這就是為什麼 CUDA 的鎖這麼深——因為你不是在跟 NVIDIA 一家公司競爭,你是在跟一整個自然生長的生態競爭。
Google 的 TPU 生態是 Google 自己建的。每一行程式碼、每一個工具、每一份文件,都是 Google 的工程師寫的。這讓 Google 可以完全控制——但也意味著它永遠不會有 CUDA 那種「千萬人自發貢獻」的爆發力。
Google 證明了一件事:CUDA 的四層鎖是可以繞過的。但繞過的方式——從零重建全部四層——需要的資源和內部需求規模,全世界只有不超過三家公司做得到。
Google 是一家。另外兩家可能是 Amazon(自研 Trainium 晶片)和 Meta(自研 MTIA 晶片)。但即使是這兩家,也遠遠沒有達到 Google 的閉環程度。
對於第七章結尾那個試圖把 GPU 叢集從 NVIDIA 換成 AMD 的年輕工程師來說,Google 的 TPU 跟他沒有關係。他依然困在 CUDA 的監獄裡。唯一的區別是,他現在知道有人逃出去了——而逃出去的那個人,是一個擁有全世界最大廣告收入的科技巨頭,一個永遠不需要向任何外部開發者低頭的公司。
這個事實讓監獄的牆看起來更高了,不是更矮。
V. 結算:報表靈魂的勝利與代價
回到 Harrison 簽下 Stadia 關閉文件的那一刻。
從 Google 的報表來看,這是一個完全理性的決定。Stadia 的月活不到一百萬,運營成本高昂,遊戲庫貧乏,開發者信心崩盤。砍掉它,把工程資源轉移到 AI 和 YouTube——這是報表會給你的建議。
但報表不會告訴你另一件事。
Google 在行動遊戲市場上每年收取將近兩百億美元的佣金——這些錢來自遊戲開發者的心血。但 Google 沒有把這筆錢的任何一部分投回遊戲本身。沒有用它來資助引擎開發、培養工作室、推動圖形技術進步。這些錢被 Google 收走,然後消失在 Google 的總營收裡,變成 AI 研發預算、雲端基礎設施擴張、和搜尋引擎的廣告優化。
Google 是遊戲產業最大的寄生者。 它從遊戲身上抽取利潤,但對遊戲生態的貢獻是零。
正文裡的 pattern 是這樣的:便利吸引用家 → 鎖定開發者 → 壟斷收租。每一次變奏裡,鎖的建造者至少做了一件事——推動了某種技術進步。微軟用 DirectX 統一了 PC 遊戲的繪圖介面。NVIDIA 用 CUDA 催生了 AI 運算。台積電用先進製程讓晶片越做越強。連 Valve 都用 Proton 證明了遊戲不需要 Windows。
Google 什麼都沒做。它只是站在 Android 平台的高處,向下面的遊戲開發者伸手收錢。
這是 pattern 的一個病理變體:鎖定存在,壟斷溢價存在,但完全沒有推動任何技術進步。 純粹的價值抽取。
而 Google 在 TPU 上的成功,則揭示了一個更冷的事實:打破壟斷鎖定的唯一方式,是擁有足以無視外部生態的內部規模。 如果你不是 Google,如果你沒有全球最大的 AI 內部需求,你就逃不出去。
第七章的結論是:CUDA 的四層鎖,到今天為止沒有人撬得開。
這篇外傳的補充是:有一個人「逃」出去了——但他不是撬開了鎖,他是在監獄旁邊蓋了自己的城堡。鎖還在那裡。其他人還困在裡面。
而那個蓋了城堡的人,連一款遊戲都做不好。
這也許是科技世界最諷刺的定律:你可以用工程力量繞過任何技術鎖定。但你繞不過「沒有靈魂」這件事。Google 有全世界最好的基礎設施、最強的 AI、最多的錢。但它做不出一個讓人願意在上面花三年做遊戲的平台。因為平台不是技術問題。平台是信任問題。而信任,是報表上唯一一個永遠顯示不出來的數字。
外傳下篇:缺課者——中國的應用狂歡與底層斷裂
凌晨一點,上海。一間手遊工作室的辦公室亮著燈。螢幕上的數字正在跳動——他們的新款抽卡遊戲上線不到二十四小時,首日流水突破一億人民幣。產品經理打開香檳。營運總監已經在計算第二週的付費轉化率。美術團隊開始趕製下一批限定角色的立繪。整間公司像一台精密的印鈔機,每一個齒輪都在飛速旋轉。
同一個時區,深圳。華為的一棟研發大樓裡,幾個工程師盯著終端機上的紅色錯誤訊息,表情凝重。他們正在嘗試讓一台搭載國產昇騰 910B AI 晶片的伺服器,跑起 GitHub 上最新版本的一個開源大型語言模型。模型的程式碼是用 PyTorch 寫的。PyTorch 底下呼叫的是 CUDA。他們的晶片不是 NVIDIA 的。
錯誤訊息一行接一行。
最賺錢的應用,和最無力的底層,在同一個國度並存。這不是偶然。這是三十年來一條完整因果鏈的結算。
I. 報表靈魂的極致
如果說上一篇外傳裡的 Google 是報表靈魂的原型,那麼中國的互聯網巨頭就是報表靈魂的完成式。
騰訊、網易、字節跳動——三家公司加起來,控制了全球行動遊戲市場的相當大一塊版圖。它們不是靠做出最好的遊戲贏的。它們是靠做出最精密的變現機器贏的。
抽卡機制的保底設計、活動倒數計時的心理壓力、社交排名的攀比驅動、首儲禮包的錨定效應——這些東西背後站著的不是遊戲設計師,是行為心理學家和數據科學家。每一個彈窗的出現時機、每一次限時折扣的幅度、每一個「再抽一次」按鈕的顏色和大小,都經過 A/B 測試的精密校準。
結果是驚人的。一款成功的中國手遊,可以在上線首日創造超過一億人民幣的營收——這個數字超過了許多歐美 3A 遊戲工作室幾百人團隊磨了三到五年的產品在首週的全球銷售額。
但這些公司做的事情,跟正文裡每一章描述的科技霸權建造者,有一個根本的差異。
微軟用 DirectX 統一了 PC 遊戲的繪圖介面——這推動了 GPU 硬體的演進。NVIDIA 用 CUDA 在遊戲顯示卡裡塞入通用運算核心——這催生了整個 AI 運算產業。台積電在遊戲 GPU 的大面積晶片上磨練極限良率——這為 AI 晶片的量產鋪了路。每一個正文裡的玩家,不論動機多自私、手段多骯髒,至少在客觀上推動了某種底層技術的進步。
中國的遊戲巨頭沒有推動任何底層技術。
它們的遊戲跑在別人設計的晶片上(Qualcomm 的 Snapdragon、Apple 的 A 系列)、由別人製造的工廠代工(台積電、三星)、使用別人開發的引擎(Unity、Unreal)、在別人建立的作業系統上運行(Android、iOS)。從晶片到引擎到作業系統,整條技術供應鏈沒有一環是中國自己的。
這不是因為中國的工程師不夠聰明。是因為賺錢太容易了。
當你可以用三十個人、花六個月、做一款換皮的抽卡遊戲、首月營收破億——你為什麼要花三百個人、投十年時間、去做一個沒有即時回報的底層框架?當風險投資的錢像水一樣湧入共享單車、社區團購、短影音平台——為什麼要把資本投入回報週期長達十年、成功率極低的半導體研發?
正文第七章講的 NVIDIA 故事裡,黃仁勳從 2006 年開始在 GeForce 裡塞 CUDA 核心,整整等了六年,才等到 AlexNet 替 CUDA 找到用途。六年間,這筆研發投入在報表上看起來像純粹的浪費。
中國的資本市場不允許六年的浪費。中國的互聯網公司不允許十年不見回報的基礎投資。它們的體制——季度考核、KPI 驅動、上市後的投資人壓力——跟 Google 的 OKR 體制一樣,在結構上不相容於長期的底層研發。
所以中國做了一件事:在別人的地基上蓋了一座直入雲霄的大廈。
大廈裡住滿了全世界出手最闊綽的手遊玩家。大廈的每一層都裝了全世界最精密的付費轉化引擎。從外面看,這座大廈金碧輝煌。
但地基不是自己的。
II. 斷裂
2022 年 10 月,美國商務部發佈了一份出口管制新規。簡單說:禁止向中國出售先進的 AI 晶片和半導體製造設備。NVIDIA 的 A100、H100 不能賣了。ASML 的 EUV 極紫外光刻機不能賣了。台積電、三星不能替中國客戶代工最先進製程的 AI 晶片了。
一夜之間,地基裂了。
但裂的程度不是均勻的。有些地方裂得淺,有些地方裂到了根基。
裂得淺的地方:成熟製程。
電動車、家電、工業控制器需要的晶片,大多停留在 28 奈米或更舊的製程。這些製程不需要 EUV 光刻機——用傳統的 DUV(深紫外光)就能做。中芯國際在這個領域瘋狂擴產,用國家補貼壓低價格,向全球市場傾銷。28 奈米的晶片不算先進,但它是現代工業的血液——每一台冷氣機裡面都有、每一台電動車裡面都有、每一個路由器裡面都有。
在這條線上,中國做到了自給自足。不是最好的,但夠用。
裂到根基的地方:先進製程。
2023 年 8 月,華為毫無預警地發佈了 Mate 60 Pro。拆機之後,全世界的半導體分析師倒吸了一口氣:裡面的 Kirin 9000S 晶片,是中芯國際用 7 奈米級別的製程生產的。
在被禁止使用 EUV 光刻機的情況下。
中芯國際用的方法叫做多重曝光——把一層電路拆成好幾次曝光,用精度較低的 DUV 光刻機反覆疊加,最終達到接近 7 奈米的效果。這是一種暴力破解。它能做到。但代價是巨大的。
第八章裡有一個核心概念:台積電的先進製程是「順水推舟」養出來的。Apple 首發驗證、遊戲 GPU 壓力測試、主機 SoC 長期訂單——每一個客戶都帶著不同的技術需求,推著台積電在實戰中把良率一步一步推到極致。台積電的 7 奈米良率之所以能到商業量產的水準,是因為它在幾十個客戶、幾百款晶片上,反覆磨練了無數次。
中芯國際沒有這些客戶。它的先進製程訂單幾乎全部來自華為一家公司。沒有 Apple 的小面積高良率驗證,沒有 NVIDIA 的大面積極限壓力測試,沒有 Sony 和微軟的長期穩定主機訂單。它是在封鎖中、用國家補貼、在客戶極度單一的情況下,硬生生地把良率往上推。
結果是:Kirin 9000S 可以出貨,但良率極低、成本極高。一片晶圓上能切出的合格晶片數量,遠低於台積電同製程的水準。每一顆 Kirin 9000S 的真實成本——包括不良品的損耗——可能是台積電同等級晶片的好幾倍。
這不是市場的勝利。這是一場用國家補貼去填補三十年硬體缺課的生存戰。
而且,即使華為把晶片造出來了,故事也還沒結束。因為還有一道更深的牆。
III. 軟體監獄的中國版
Kirin 9000S 是手機晶片。手機晶片的軟體生態相對簡單——Android 系統、應用程式、驅動程式——華為可以靠自己的鴻蒙系統繞過 Google 的軟體封鎖。困難,但可行。
AI 晶片是另一回事。
華為的昇騰 910B 是一顆 AI 訓練晶片。純硬體數據上,華為自己宣稱它在某些特定的訓練任務上,效能可以逼近甚至超越 NVIDIA 的 A100 約 20%。後續的 910C 和 910D 更是瞄準了 NVIDIA 的 H100。
但「硬體算力逼近」和「可以替代」之間,隔著一道看不見的深淵。
這道深淵的名字叫 CUDA。
第七章講了 CUDA 的四層鎖。現在把中國的情況代入:
第一層——硬體指令集: 昇騰晶片用的是華為自己的達文西(Da Vinci)架構,跟 NVIDIA 的 PTX/SASS 完全不同。這意味著所有為 NVIDIA GPU 編譯的程式碼,在昇騰上都跑不了。必須重新編譯。
第二層——運算函式庫: NVIDIA 有 cuDNN、cuBLAS、NCCL——每一個都是幾百人團隊花十年針對 NVIDIA 硬體做深度優化的成果。華為對應的是 CANN(Compute Architecture for Neural Networks)。CANN 的功能覆蓋率和效能成熟度,跟 CUDA 的函式庫差了不止一個世代。
第三層——框架綁定: 全世界的 AI 研究員用 PyTorch 寫程式碼。PyTorch 的底層預設呼叫 CUDA。華為開發了自己的 AI 框架 MindSpore,也做了讓 PyTorch 在昇騰上運行的適配層。但適配層的相容性問題層出不窮——開篇那幾個深圳工程師面對的紅色錯誤訊息,就是這一層出了問題。每一個開源模型的程式碼裡,都藏著十幾個隱含的 CUDA 依賴。表面上改一行 device = 'npu' 就好,實際上底下的函式庫呼叫、記憶體管理、運算精度處理,處處是陷阱。
第四層——知識綁定: 中國的 AI 工程師在大學裡學的是 CUDA。他們讀的教科書用 CUDA 寫範例。他們查的 Stack Overflow 用 CUDA 回答問題。他們 GitHub 上 fork 的每一個開源專案,預設在 NVIDIA GPU 上跑。要讓他們轉用華為的 CANN 和 MindSpore,等於要求他們忘掉自己會的語言,重新學一門新的。
正文第七章的結論句是:「CUDA 不是一個 API。CUDA 是一座監獄。而你從入學那天起就住在裡面。」
中國的 AI 工程師面對的是同一座監獄。區別在於:NVIDIA 的生態是全球千萬個遊戲玩家和開發者,在二十年裡自然長出來的。中國要建立的替代生態,是在制裁的絕境下,用行政指令硬砌出來的。
這兩種生態的差別,不是量的差別。是質的差別。
自然生長的生態有根——它的每一個節點都是有人主動選擇使用的。有人用 CUDA 發了論文,有人用 CUDA 做了產品,有人在 CUDA 上建了公司。砍掉任何一個節點,其他節點還在。
行政指令砌出來的生態沒有根——它的每一個節點都是被要求使用的。一旦指令鬆動、一旦補貼減少、一旦 NVIDIA 找到繞過制裁的方式(比如推出專門為中國市場閹割的 H20 晶片),開發者會在一夜之間跑回 CUDA 的懷抱。
事實上,這件事已經在發生。2024 年,當 NVIDIA 把 H20 的價格降到跟昇騰 910B 差不多的水準時,許多中國 AI 公司重新開始採購 NVIDIA 的晶片。不是因為它們不支持國產——是因為用 CUDA 寫的程式碼不用改,用 CANN 寫的程式碼要重寫。
工程師是理性的。理性的選擇永遠是阻力最小的那條路。而 CUDA,就是阻力最小的那條路。
IV. 缺課的帳單
現在可以把因果鏈串起來了。
正文的核心論點是:遊戲玩家的錢和需求,無意中供養了整個科技霸權的底層基礎設施。 從 DirectX 到 CUDA 到台積電的先進製程——每一塊磚,都有遊戲的指紋在上面。
中國的反面案例完美地驗證了這條論點。
中國有全世界最會賺錢的遊戲公司。但這些公司賺的錢,沒有任何一分流向底層技術。它們的遊戲跑在進口的晶片上、用進口的引擎做、在進口的作業系統裡賣。它們做的事只有一件:在別人搭好的舞台上,用最精密的心理學工具,從玩家口袋裡掏錢。
當美國說「這個舞台以後你不能用了」的時候,中國突然發現:自己在應用層的摩天大樓底下,沒有地基。
這不是制裁造成的。制裁只是讓缺課的帳單提前到了。
真正的原因藏在三十年前。當黃仁勳在 Denny's 餐廳裡決定創辦 NVIDIA 的時候,中國的資本正在湧入房地產。當張忠謀在新竹建造台積電第一座工廠的時候,中國的製造業正在做代工。當 CUDA 在 2006 年誕生、全世界的大學生開始在 NVIDIA 顯示卡上寫並行計算程式的時候,中國最聰明的畢業生正在去騰訊和阿里巴巴——做社交軟體、做電商、做手遊。
每一步都是理性的。每一步的報表都很好看。
但每一步都在跳過同一件事:底層。
硬體的底層——自主設計高效能晶片的能力。軟體的底層——自主建立開發者生態的能力。製造的底層——在沒有外國設備的情況下生產先進製程晶片的能力。
這三個「底層」,本書的正文用了三章來講述它們是怎麼被建立的:第七章(CUDA 的軟體生態)、第八章(台積電的製造能力)、第四章(NVIDIA 從瀕死到崛起的硬體設計積累)。每一個底層的建立,都花了至少十五年。每一個底層的建立過程裡,遊戲都扮演了關鍵角色——不是作為目的,而是作為壓力測試場和資金池。
中國跳過了這個過程。它直接從應用層開始。它用最短的時間、最高的效率、最精密的變現設計,建起了全世界最賺錢的數位娛樂帝國。
然後發現帝國的地基是別人的。
V. 結算
有一個問題值得問:中國能不能補課?
答案是:技術上可以,但時間上未必來得及。
華為的昇騰晶片在硬體算力上正在逐代接近 NVIDIA。中芯國際在成熟製程上已經實現了自給自足,在 7 奈米級別的先進製程上做到了暴力破解。百度的崑崙晶片、阿里巴巴的含光晶片,都在不同程度上嘗試建立替代方案。
但正文第八章講過一個殘酷的道理:追不上的原因不是技術差距,是信任差距。 台積電的護城河不是某一項技術——是三十年來全球 fabless 生態對它累積的信任。你不能用一張投影片追。你不能用一個季度追。
同樣的道理適用於軟體生態。CUDA 的護城河不是 cuDNN 的效能——是全世界每一間大學、每一個 GitHub 專案、每一本教科書、每一個 AI 工程師腦子裡的肌肉記憶。你不能用行政指令追。你不能用補貼追。你只能用時間追——而在你追的這十年裡,NVIDIA 也沒有站著不動。
中國面對的是一個雙重追趕問題。在硬體端,它要追的是台積電——一家每年投入超過三百億美元資本支出、擁有三十年製程經驗累積的公司。在軟體端,它要追的是 CUDA——一個由全球千萬開發者自然長成的生態系統。
兩個追趕同時進行。兩個目標都在移動。而追趕者被掐住了最關鍵的供應鏈——先進的光刻設備買不到、最新的 NVIDIA 晶片買不到、最先進的製程代工服務用不了。
這就是缺課的代價。
你可以用幾個月的時間複製一款吸金的手遊。你可以用國家資本在三年內暴力推高某個製程節點的晶片產能。但你無法用錢或行政命令,在一夜之間買到一個由千萬個工程師和開發者,用二十年時間共同編織出來的底層生態。
正文的核心 pattern 是:便利吸引用家 → 鎖定開發者 → 壟斷收租。代價二三十年後才顯形。
中國的案例是這個 pattern 的鏡像:你當年跳過了多少底層建設的苦工,歷史就會要你連本帶利地吐出來。 代價同樣是二三十年後才到。
而帳單已經到了。
回到開篇。上海那間手遊工作室的香檳還在冒泡。深圳那棟研發大樓裡的錯誤訊息還在跳。兩幅畫面之間的距離——從應用層的繁華到底層的斷裂——不是地理距離。是三十年來一個國家在「應用」和「基礎」之間做出的無數次選擇的累積。
每一次選擇都是理性的。每一次的報表都很好看。
但所有理性的選擇加起來,等於一筆歷史從未打折的帳單。
這句話聽起來很耳熟。因為正文第五章裡,講 Intel 砍掉 Larrabee GPU 專案的時候,用的是同一句話——
「沒有人做了一個錯誤的決定。每一個人都做了在自己位置上最理性的決定。但所有理性的決定加起來,等於一個自殺式的結果。」
Intel 的版本是一家公司。中國的版本是一整個國家的產業結構。
規模不同。邏輯完全一樣。
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!

- 选集
- 来自作者
- 相关推荐