DeepSeek-V4真的表現如何?

林定恩
·
(修改过)
·
IPFS
·

中時新聞網,DeepSeek-V4的技術報告也坦承,在標準推理基準測試中的性能表現「略遜於Gemini-Pro-3.1等模型」,研發進度落後全球最頂尖的前沿模型約3到6個月。是否如此?

4月26日占<山水蒙>。

〈雜卦〉說:「蒙,雜而著」種類繁多生長茂盛普遍顯明之意,群雄並起情勢朦朧不清。所以DeepSeek-V4跟Gemini-Pro-3.1之間各有領先。

京房易。午年辰月午日。

世戌子孫受月辰沖但日午以及年午生扶,身不弱,代表DeepSeek-V4的能力不差。

應寅父母木在月辰有餘氣但在日午衰,所以身偏弱,代表Gemini-Pro-3.1。

世戌子孫乃是生財源,子孫能生妻財,代表產品、技術、客源、創意能帶來利潤。所以DeepSeek-V4的收益性應該會比較高。應寅雖然會剋世戌但是沒有發動而且偏弱無法發揮克制的效果,所以Gemini-Pro-3.1 要全力壓制力有不逮。 

報載,在標準推理基準測試中,DeepSeek-V4-Pro-Max 的表現略遜於 Gemini-Pro-3.1 等模型。技術差距落後全球最頂尖的前沿模型約 3 到 6 個月。

 DeepSeek-V4 的核心競爭力在於長上下文架構,透過 CSA(壓縮稀疏注意力)與 HCA 混合機制,推理計算量僅為前一代的 27%,且顯存佔用僅約 10%。晶片轉向與華為合作,利用華為的昇騰(Ascend)系列晶片進行訓練,而非此前主要依賴的輝達晶片。大陸AI模型全面轉向本土晶片,對美國科技優勢會構成嚴重衝擊。

DeepSeek V4真正的價值不在模型本身,而在於其背後的供應鏈邏輯,它並非用模型能力讓世界驚艷,而是讓中國的AI用戶能低成本調用Token(詞元)。顯然DeepSeek-V4正在發揮後發優勢全力追趕,現階段技術水準應該在伯仲之間,但是產品、技術、客源、創意能帶來利潤卻領先一步。


CC BY-NC-ND 4.0 授权
已推荐到频道:时事・趋势

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!