VibeTensor:由 AI 代理全自主生成的深度學習系統
Source: VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents
1. VibeTensor 簡介
VibeTensor 是一套開源的研究型深度學習系統工具。它最特別的地方在於:這整套系統的程式碼,幾乎都是由大型語言模型(LLM)的「寫程式 AI 代理」(coding agent) —— 簡稱「AI 代理」—— 在人的高層指示下自動產生的。
所謂「全自主生成」,意思是說,VibeTensor 的程式碼都是由 AI 自己寫出來並修改。而且,後續的驗證流程,例如編譯程式、執行測試、檢查修改前後的差異,也都是由 AI 的工作流程自動完成,人類不需要一行一行地去檢查程式碼。
這個系統可以想像成一個專門為 AI 設計的全方位工具箱。它採用了和主流框架(例如 PyTorch)類似的「即時執行模式」。簡單來說,就是工程師每輸入一個指令,系統就立刻執行並顯示結果,不用等所有步驟都寫完才執行。這樣一來,開發和排除錯誤都變得更方便。
為了讓這個工具箱既強大又容易使用,AI 代理做了幾個重要設計:
① 強大的核心引擎,加上好用的操作介面
內部核心是用高效能的 C++20 建造,確保運算速度非常快。
外部則提供兩種常見的操作介面:Python 和 Node.js,讓工程師可以用自己熟悉的語言來控制它。
你可以把它想成:裡面是高速引擎,外面是順手的軚盤。
② 從最底層到最上層都AI 代理設計的
它不是只在別人的系統外面加一層包裝,而是連底層關鍵零件都自己設計,包括:
專屬的數據儲存系統(張量儲存):
專門用來整齊又有效率地存放 AI 計算需要的大量數字資料。自動求導引擎(AI 的學習核心):
這是 AI 能夠「學習」的關鍵機制。它會自動計算數學公式,幫助 AI 從錯誤中調整自己、持續進步。GPU 管理系統(CUDA 運行管理):
負責調校 NVIDIA 顯示卡(GPU)的運算資源,讓資料在硬件中運行得又快又順。
2. AI 代理如何設計 VibeTensor?
VibeTensor 的開發方式屬於「代理式 AI(Agentic AI)」流程。簡單來說,就是把 AI 代理當為「自動工程師」。它可以自己運用工具、搜尋資料、修改程式、編譯程式、做測試,人類只需要給方向,不用一步步手動操作。
整個開發流程大致分成四個循環階段:
① 設定目標與規則
人類先告訴 AI 代理,這一階段要完成什麼功能,同時訂下幾個不能違反的重要原則(例如系統必須保持穩定、安全等)。這些原則就像「不能破壞的規矩」。
② 作修改並直接套用
AI 會自己想出要怎麼改程式,修改內容,然後直接把修改套用到整個程式系統裡。
③ 自動驗證
修改完成後,AI 會自己編譯程式,並執行相關測試,看看功能是否正常、有否出錯。
④更全面的檢查與審核
當不同部分的系統整合起來之後,會進行更大範圍的測試。此外,研究團隊還使用了「多代理程式碼審查」機制 —— 也就是讓不同的 AI 互相檢查彼此的工作,避免單一 AI 遺漏安全問題或寫出多餘、重複的設計。
3. 人類在整個過程中做了什麼?
雖然實際寫程式的是 AI,但人類仍然非常重要,只是角色比較像「導師」或「總設計師」,而不是親自下場寫程式的人。
人類主要參與幾個方面:
① 提供大方向
人類負責說明系統要做什麼、哪些功能比較重要,以及整體架構應該做成什麼樣子。
簡單說,人類決定「要往哪裡走」,AI 負責「怎麼走」。
② 設定規則與標準(護欄)
人類會事先訂好測試規範,例如使用 CTest 或 pytest 這類測試工具,作為 AI 必須達成的標準。這些規範就像道路兩旁的護欄,確保 AI 不會偏離正確方向。
③ 協助處理複雜問題
如果系統在多次修改後出現比較隱藏的問題,例如數值計算錯誤、記憶體使用不當等,人類會提醒 AI 增加更多測試,或加入更嚴格的檢查機制,幫助找出問題。
但有一點很重要:人類並不直接寫程式、不手動執行測試,也不逐行檢查或修改程式碼。這些具體技術工作都是由 AI 自己完成的。
4. 產品功能與可以怎樣使用?
VibeTensor 是一套完整的深度學習運行平台,也就是說,你可以用它來訓練和運行 AI 模型。它的主要功能可以用比較簡單的方式理解如下:
① 支援多種常用語言
它提供兩種常見的操作方式:Python 介面 和 Node.js 介面。
這代表程式設計師可以用自己熟悉的語言來操作這個系統。
② 底層運算很快、很強
它的核心是用 C++20 寫成,並且同時支援:
CPU 運算
CUDA(GPU 加速)運算
裡面還包含:
自動求導引擎(幫助 AI 自動計算學習所需的數學公式)
具備診斷能力的 GPU 記憶體管理系統(可以更有效率地分配與追蹤 GPU 記憶體使用狀況)
簡單說,它的引擎是為了「快又穩」而設計的。
③ 容易擴充與整合
它支援 DLPack 標準,這表示可以和其他深度學習工具交換資料,而且幾乎不用多做資料複製(更省時間與資源)。
此外,它還提供穩定的 C 語言接口,讓外部開發者可以加入自己寫的運算模組,讓整個系統功能繼續擴充。
簡單說,它不是封閉系統,而是可以外加模組而升級。
④ 已經實際測試過
研究人員已經用 VibeTensor 在 NVIDIA H100 和 Blackwell GPU 上成功做過幾個訓練測試,包括:
CIFAR-10 圖像分類任務(使用 ViT 模型)
miniGPT 小型語言模型訓練
這表示它不只是理論設計,而是真的能在高階顯示卡上實際運作。
5. 「AI 設計 AI」的意義與未來
VibeTensor 的出現,可以說是 AI 參與軟件開發的一個重要突破。
① 證明 AI 能跨越不同層次來設計系統
過去大家以為,AI 只能幫忙寫一些零碎的程式碼。但 VibeTensor 顯示,AI 不只會寫表面的程式(例如 Python 介面),甚至連最底層的系統核心(例如 CUDA 記憶體管理)都能一起設計,並且讓整個系統前後一致、彼此配合。
簡單說,它證明了 AI 有能力從「外層操作介面」一路做到「最底層運算引擎」,而不是只做局部幫手。
② 從寫程式助手,變成系統設計者
以前的 AI 多半只是「程式助理」,幫工程師補程式、改錯誤、寫函式。
但未來的 AI,可能不只是補 code,而是能根據目標(例如:要更快、更省資源)主動設計整個系統架構。也就是說,AI 不只是施工者,還可能成為「建築師」。
③ 走向「自我強化」的發展
這也和「自我加速進化」的概念有關——
如果 AI 能設計和優化支撐自己運行的軟件平台,那它就等於在改進自己的工具。當工具變強,它又能設計出更強的工具,如此循環下去,進步的速度可能會越來越快。
6. 可能的危險與挑戰
雖然這項技術很先進,但由 AI 自己產生的系統軟體,還是有一些特別的風險需要注意。
① 「科學怪人效應」
這個說法的意思是:
每一個小部分看起來都沒問題,但拼在一起卻出現整體效率變差的情況。
例如,AI 可能為了安全考量,把很多步驟設計成必須一個一個依序執行,結果反而讓高性能的硬件(例如 GPU)閒著沒事做,整體速度變慢。
簡單說:局部正確,不代表整體最佳。
② 隱藏的穩定性問題
有些程式在短時間測試時看起來正常,但如果長時間運行(例如訓練 AI 模型幾天幾夜),或在比較複雜的情況下互動,就可能出現問題。
③ 安全與維護困難
機器自動產生的程式碼,有時會:
結構不夠一致
設計上出現多餘或重複
潛藏不容易察覺的安全漏洞
因此,目前這類由 AI 全面生成的系統,還不太適合直接用在正式的商業或關鍵生產環境中。
結論
VibeTensor 清楚地展示了一件重要的事情:
在有人類提供大方向與原則的前提下,AI 代理已經能夠建構出不簡單、而且可以使用 GPU 加速的完整深度學習系統。
這個開源成果的意義不只是做出一個新工具,而是提供了一個範例,讓學術界可以進一步研究「AI 如何參與、甚至主導軟件工程」的方法。
更重要的是,它讓我們看到一種新的可能性——未來的 AI 不只是使用既有的基礎設施,而是能夠自己設計、優化,甚至重建支撐自己運作的底層系統。
簡單說,這可能是 AI 從「工具使用者」,走向「基礎建設建造者」的一個開端。
PowerPoint
Youtube
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!
