AI 熱潮最危險的地方是需求本身會變聰明

Tony_Chan
·
·
IPFS
·


AI 記憶體晶片的熱潮是一個典型的半導體景氣循環問題。需求上升,價格上升,企業擴產,資本市場追捧,然後某一日供給超過需求,價格下跌,股價回落。這套敘事在記憶體行業發生過很多次,所以市場很自然會把今天的 AI 記憶體熱潮理解成另一輪「供給過剩前夕」。但這次要注意到需求端本身可能會改變。

記憶體晶片之所以突然變得重要是因為 AI 計算並不只是需要 GPU 的算力,也需要大量資料在不同記憶層之間高速流動。高頻寬記憶體,即 HBM,正是為了解決這個瓶頸而變得昂貴。根據 WSJ 相關報道,AI 需求令 Micron、SK Hynix、Samsung 等記憶體廠商受惠,而 Micron 亦計劃大規模投資新產能。但文章同時指出,記憶體行業一向有強烈周期性,當高利潤吸引擴產,未來便可能出現價格下跌風險。更關鍵是風險不只來自新產能,也來自 AI 技術本身變得更省記憶體。

這個判斷很重要,因為它改變我們理解 AI 泡沫的方式。一般人講 AI 泡沫會先想到市場過度估值,企業過度投資,投資者過度相信未來增長。但如果需求本身會因技術進步而被壓縮,問題就是「市場用靜態需求去估算一個會自我優化的技術系統」。

傳統基建需求比較容易理解。城市需要更多電力,便興建電廠;人口增加,興建住宅;貨運增加,興建港口、鐵路和倉庫。這些需求會有波動,但需求單位相對穩定。一個家庭需要的居住面積不會突然因演算法優化而減少九成,一個貨櫃佔用的物理空間也不會因軟件更新而消失。

但 AI 不同之處在於其需求單位不是固定的。模型訓練、推理、上下文長度、資料調度、快取策略、量化技術、稀疏化設計、專用晶片架構都會影響同一件事需要多少記憶體與計算資源。FlashAttention 這類研究已經顯示,Transformer 的注意力機制可以透過更重視記憶體讀寫方式而提升效率,減少 GPU HBM 與片上 SRAM 之間的資料搬運成本。這類進展不代表記憶體需求會立即消失,但它說明 AI 系統會不斷尋找方法減少硬件瓶頸。

所以,AI 熱潮的危險點是資本市場可能把今天的低效率視為明天的穩定需求。這是一個更深層的錯配。硬件投資需要長周期,晶圓廠、封裝產能、供應鏈、設備訂單、材料配置都不是幾個月可以完成。可是 AI 軟件效率的變化速度可能比硬件投資周期快得多。當企業按照今日模型的記憶體飢餓程度去投資未來產能時,它是在押注未來的 AI 仍然會以相似方式消耗記憶體。

這個押注不是錯誤。AI 模型可能繼續變大,代理系統可能大量普及,企業內部 AI 工作流可能真正落地,影片生成、機器人、科學計算、個人化助理都可能創造新需求。Fortune 近期報道亦提到,AI 伺服器需要的 DRAM 遠高於傳統伺服器,單一 AI 伺服器可需要約八至十倍於傳統伺服器的 DRAM。這說明現階段的記憶體需求有實際基礎,不只是市場幻想。

但問題正是現階段有實際基礎不等於未來會線性延續。AI 產業的前瞻性風險是需求並非單純取決於使用量,也取決於使用量與效率之間的拉扯。

如果 AI 應用普及速度快過效率提升,記憶體需求會繼續上升。如果效率提升快過應用普及,部分硬件需求會被壓縮。如果兩者同時發生,市場就會進入更難判斷的狀態:總使用量增加,但每次任務所需資源下降,最後受惠的便是那些位於新瓶頸位置的公司。

這才是 AI 基建投資最難分析的地方。它是一個瓶頸輪換系統。早期瓶頸可能是 GPU,之後是 HBM,再之後可能是電力、散熱、網絡、推理延遲、資料品質、企業整合成本,甚至是人類組織能否真正使用 AI。資本市場喜歡把瓶頸視為長期護城河,但技術系統的特徵是它會集中火力攻擊瓶頸。一旦某個瓶頸太貴,所有研究、工程與商業壓力都會指向同一個方向:降低對它的依賴。

記憶體晶片今天的高利潤正是因為它成為瓶頸。但正因為它成為瓶頸,它也會成為被優化的對象。這裡可以看出 AI 熱潮與過去科技周期的一個差異。過去很多科技需求建立在「更多」之上,更多電腦、更多手機、更多伺服器、更多用戶。AI 當然也需要更多,但它同時建立在「更少」之上,例如更少參數完成相似能力,更少記憶體支撐更長上下文,更少推理成本服務更多用戶,更少資料搬運達到更高吞吐。AI 產業的增長不一定等於每一個上游環節都會長期同步增長。

這會帶來一個前瞻性判斷:AI 基建的投資邏輯將會從「誰提供稀缺資源」轉向「誰能控制效率重分配」。今日最賺錢的環節,未必是明日最有定價權的環節。因為當某個環節利潤太高,它會同時吸引兩種力量。第一種是供給端擴產,令未來價格受壓。第二種是需求端優化,令客戶減少依賴。記憶體行業過去最怕的是第一種力量,但 AI 時代可能更需要重視第二種力量。

這不代表 HBM 或記憶體公司沒有前景。相反,在短中期內,AI 計算仍然需要大量高性能記憶體,特別當模型走向多模態、長上下文、即時推理和代理式工作流,記憶體瓶頸仍然會存在。問題只是不能把今天的短缺直接翻譯成長期穩定需求。短缺可以是真的,泡沫也可以同時存在。兩者並不矛盾。

更準確地說,AI 記憶體熱潮是一種「真需求上的錯價」。真需求令價格上升,錯價來自市場低估需求結構會被技術改寫。這件事對整個 AI 產業有更大的啟示。很多人以為 AI 革命會帶來一場單向擴張,所有算力、能源、資料中心、晶片和雲服務都會持續上升。但真正成熟的 AI 系統不只是消耗資源,也會反過來壓縮資源浪費。當 AI 變得更有效率,它會削弱某些原本因低效率而產生的市場需求。

這就是「需求本身會變聰明」的意思。需求將是由模型架構、工程優化、成本壓力和商業落地共同形成的動態結果。今天看似不可替代的硬件需求,明天可能被軟件、架構或系統設計重新分配。資本市場最容易犯的錯就是把一個動態需求當成靜態需求,也把一個過渡期瓶頸當成永久秩序。

如果 AI 熱潮最後出現調整,原因未必是 AI 沒有用或者是市場完全看錯方向。更可能是 AI 確實有用,但它變得太快,快到昨日用來估值的瓶頸,今日已經開始被系統本身消化。

這種風險比普通泡沫更難察覺。因為它是由成功引起。AI 越進步,越可能降低某些硬件環節的邊際需求。模型越成熟,越會尋找更便宜、更高效、更可控的運行方式。當效率提升成為產業共識,最先受壓的可能正是那些因早期低效率而獲得超額利潤的環節。

所以 AI 熱潮最危險的地方是市場可能相信一個曾經真實、但正在被技術本身改寫的故事。

危險藏在需求端!WSJ專欄作家:AI記憶體晶片榮景正埋下崩盤的種子

CC BY-NC-ND 4.0 授权
已推荐到频道:时事・趋势

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!