VibeTensor：由 AI 代理全自主生成的深度學習系統

2 月 13 日

VibeTensor 是一個開源的深度學習平台，特別之處在於它幾乎是由 AI 自己寫出來的。人在過程中只提供方向與原則，實際的程式設計、修改與測試，大多由 AI 自動完成。它內部用高效能的 C++ 核心與自動學習計算引擎，已成功在高階顯示卡上訓練 ViT 和 miniGPT 模型。這代表 AI 正從「寫程式助手」走向「系統設計者」。不過，它仍可能出現整體效率不佳或長時間運行不穩定等問題。

Source: VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents

1. VibeTensor 簡介

VibeTensor 是一套開源的研究型深度學習系統工具。它最特別的地方在於：這整套系統的程式碼，幾乎都是由大型語言模型（LLM）的「寫程式 AI 代理」(coding agent) —— 簡稱「AI 代理」—— 在人的高層指示下自動產生的。

所謂「全自主生成」，意思是說，VibeTensor 的程式碼都是由 AI 自己寫出來並修改。而且，後續的驗證流程，例如編譯程式、執行測試、檢查修改前後的差異，也都是由 AI 的工作流程自動完成，人類不需要一行一行地去檢查程式碼。

這個系統可以想像成一個專門為 AI 設計的全方位工具箱。它採用了和主流框架（例如 PyTorch）類似的「即時執行模式」。簡單來說，就是工程師每輸入一個指令，系統就立刻執行並顯示結果，不用等所有步驟都寫完才執行。這樣一來，開發和排除錯誤都變得更方便。

為了讓這個工具箱既強大又容易使用，AI 代理做了幾個重要設計：

① 強大的核心引擎，加上好用的操作介面

內部核心是用高效能的 C++20 建造，確保運算速度非常快。
外部則提供兩種常見的操作介面：Python 和 Node.js，讓工程師可以用自己熟悉的語言來控制它。

你可以把它想成：裡面是高速引擎，外面是順手的軚盤。

② 從最底層到最上層都AI 代理設計的

它不是只在別人的系統外面加一層包裝，而是連底層關鍵零件都自己設計，包括：

專屬的數據儲存系統（張量儲存）：
專門用來整齊又有效率地存放 AI 計算需要的大量數字資料。
自動求導引擎（AI 的學習核心）：
這是 AI 能夠「學習」的關鍵機制。它會自動計算數學公式，幫助 AI 從錯誤中調整自己、持續進步。
GPU 管理系統（CUDA 運行管理）：
負責調校 NVIDIA 顯示卡（GPU）的運算資源，讓資料在硬件中運行得又快又順。

2. AI 代理如何設計 VibeTensor？

VibeTensor 的開發方式屬於「代理式 AI（Agentic AI）」流程。簡單來說，就是把 AI 代理當為「自動工程師」。它可以自己運用工具、搜尋資料、修改程式、編譯程式、做測試，人類只需要給方向，不用一步步手動操作。

整個開發流程大致分成四個循環階段：

① 設定目標與規則

人類先告訴 AI 代理，這一階段要完成什麼功能，同時訂下幾個不能違反的重要原則（例如系統必須保持穩定、安全等）。這些原則就像「不能破壞的規矩」。

② 作修改並直接套用

AI 會自己想出要怎麼改程式，修改內容，然後直接把修改套用到整個程式系統裡。

③ 自動驗證

修改完成後，AI 會自己編譯程式，並執行相關測試，看看功能是否正常、有否出錯。

④更全面的檢查與審核

當不同部分的系統整合起來之後，會進行更大範圍的測試。此外，研究團隊還使用了「多代理程式碼審查」機制 —— 也就是讓不同的 AI 互相檢查彼此的工作，避免單一 AI 遺漏安全問題或寫出多餘、重複的設計。

3. 人類在整個過程中做了什麼？

雖然實際寫程式的是 AI，但人類仍然非常重要，只是角色比較像「導師」或「總設計師」，而不是親自下場寫程式的人。

人類主要參與幾個方面：

① 提供大方向

人類負責說明系統要做什麼、哪些功能比較重要，以及整體架構應該做成什麼樣子。
簡單說，人類決定「要往哪裡走」，AI 負責「怎麼走」。

② 設定規則與標準（護欄）

人類會事先訂好測試規範，例如使用 CTest 或 pytest 這類測試工具，作為 AI 必須達成的標準。這些規範就像道路兩旁的護欄，確保 AI 不會偏離正確方向。

③ 協助處理複雜問題

如果系統在多次修改後出現比較隱藏的問題，例如數值計算錯誤、記憶體使用不當等，人類會提醒 AI 增加更多測試，或加入更嚴格的檢查機制，幫助找出問題。

但有一點很重要：人類並不直接寫程式、不手動執行測試，也不逐行檢查或修改程式碼。這些具體技術工作都是由 AI 自己完成的。

4. 產品功能與可以怎樣使用？

VibeTensor 是一套完整的深度學習運行平台，也就是說，你可以用它來訓練和運行 AI 模型。它的主要功能可以用比較簡單的方式理解如下：

① 支援多種常用語言

它提供兩種常見的操作方式：Python 介面和 Node.js 介面。
這代表程式設計師可以用自己熟悉的語言來操作這個系統。

② 底層運算很快、很強

它的核心是用 C++20 寫成，並且同時支援：

CPU 運算
CUDA（GPU 加速）運算

裡面還包含：

自動求導引擎（幫助 AI 自動計算學習所需的數學公式）
具備診斷能力的 GPU 記憶體管理系統（可以更有效率地分配與追蹤 GPU 記憶體使用狀況）

簡單說，它的引擎是為了「快又穩」而設計的。

③ 容易擴充與整合

它支援 DLPack 標準，這表示可以和其他深度學習工具交換資料，而且幾乎不用多做資料複製（更省時間與資源）。

此外，它還提供穩定的 C 語言接口，讓外部開發者可以加入自己寫的運算模組，讓整個系統功能繼續擴充。

簡單說，它不是封閉系統，而是可以外加模組而升級。

④ 已經實際測試過

研究人員已經用 VibeTensor 在 NVIDIA H100 和 Blackwell GPU 上成功做過幾個訓練測試，包括：

CIFAR-10 圖像分類任務（使用 ViT 模型）
miniGPT 小型語言模型訓練

這表示它不只是理論設計，而是真的能在高階顯示卡上實際運作。

5. 「AI 設計 AI」的意義與未來

VibeTensor 的出現，可以說是 AI 參與軟件開發的一個重要突破。

① 證明 AI 能跨越不同層次來設計系統

過去大家以為，AI 只能幫忙寫一些零碎的程式碼。但 VibeTensor 顯示，AI 不只會寫表面的程式（例如 Python 介面），甚至連最底層的系統核心（例如 CUDA 記憶體管理）都能一起設計，並且讓整個系統前後一致、彼此配合。

簡單說，它證明了 AI 有能力從「外層操作介面」一路做到「最底層運算引擎」，而不是只做局部幫手。

② 從寫程式助手，變成系統設計者

以前的 AI 多半只是「程式助理」，幫工程師補程式、改錯誤、寫函式。

但未來的 AI，可能不只是補 code，而是能根據目標（例如：要更快、更省資源）主動設計整個系統架構。也就是說，AI 不只是施工者，還可能成為「建築師」。

③ 走向「自我強化」的發展

這也和「自我加速進化」的概念有關——
如果 AI 能設計和優化支撐自己運行的軟件平台，那它就等於在改進自己的工具。當工具變強，它又能設計出更強的工具，如此循環下去，進步的速度可能會越來越快。

6. 可能的危險與挑戰

雖然這項技術很先進，但由 AI 自己產生的系統軟體，還是有一些特別的風險需要注意。

① 「科學怪人效應」

這個說法的意思是：
每一個小部分看起來都沒問題，但拼在一起卻出現整體效率變差的情況。

例如，AI 可能為了安全考量，把很多步驟設計成必須一個一個依序執行，結果反而讓高性能的硬件（例如 GPU）閒著沒事做，整體速度變慢。

簡單說：局部正確，不代表整體最佳。

② 隱藏的穩定性問題

有些程式在短時間測試時看起來正常，但如果長時間運行（例如訓練 AI 模型幾天幾夜），或在比較複雜的情況下互動，就可能出現問題。

③ 安全與維護困難

機器自動產生的程式碼，有時會：

結構不夠一致
設計上出現多餘或重複
潛藏不容易察覺的安全漏洞

因此，目前這類由 AI 全面生成的系統，還不太適合直接用在正式的商業或關鍵生產環境中。

結論

VibeTensor 清楚地展示了一件重要的事情：
在有人類提供大方向與原則的前提下，AI 代理已經能夠建構出不簡單、而且可以使用 GPU 加速的完整深度學習系統。

這個開源成果的意義不只是做出一個新工具，而是提供了一個範例，讓學術界可以進一步研究「AI 如何參與、甚至主導軟件工程」的方法。

更重要的是，它讓我們看到一種新的可能性——未來的 AI 不只是使用既有的基礎設施，而是能夠自己設計、優化，甚至重建支撐自己運作的底層系統。

簡單說，這可能是 AI 從「工具使用者」，走向「基礎建設建造者」的一個開端。

PowerPoint

Youtube

CC BY-NC-ND 4.0 授权

喜欢我的作品吗？别忘了给予支持与赞赏，让我知道在创作的路上有你陪伴，一起延续这份热忱！

人工智能中心

选集
来自作者
相关推荐