VibeTensor:由 AI 代理全自主生成的深度學習系統

人工智能中心
·
·
IPFS
·
VibeTensor 是一個開源的深度學習平台,特別之處在於它幾乎是由 AI 自己寫出來的。人在過程中只提供方向與原則,實際的程式設計、修改與測試,大多由 AI 自動完成。它內部用高效能的 C++ 核心與自動學習計算引擎,已成功在高階顯示卡上訓練 ViT 和 miniGPT 模型。這代表 AI 正從「寫程式助手」走向「系統設計者」。不過,它仍可能出現整體效率不佳或長時間運行不穩定等問題。

Source: VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents

1. VibeTensor 簡介

 VibeTensor 是一套開源的研究型深度學習系統工具。它最特別的地方在於:這整套系統的程式碼,幾乎都是由大型語言模型(LLM)的「寫程式 AI 代理」(coding agent) —— 簡稱「AI 代理」—— 在人的高層指示下自動產生的。

所謂「全自主生成」,意思是說,VibeTensor 的程式碼都是由 AI 自己寫出來並修改。而且,後續的驗證流程,例如編譯程式、執行測試、檢查修改前後的差異,也都是由 AI 的工作流程自動完成,人類不需要一行一行地去檢查程式碼。

這個系統可以想像成一個專門為 AI 設計的全方位工具箱。它採用了和主流框架(例如 PyTorch)類似的「即時執行模式」。簡單來說,就是工程師每輸入一個指令,系統就立刻執行並顯示結果,不用等所有步驟都寫完才執行。這樣一來,開發和排除錯誤都變得更方便。

為了讓這個工具箱既強大又容易使用,AI 代理做了幾個重要設計:

強大的核心引擎,加上好用的操作介面

  • 內部核心是用高效能的 C++20 建造,確保運算速度非常快。

  • 外部則提供兩種常見的操作介面:Python 和 Node.js,讓工程師可以用自己熟悉的語言來控制它。

你可以把它想成:裡面是高速引擎,外面是順手的軚盤。

 ② 從最底層到最上層都AI 代理設計的

它不是只在別人的系統外面加一層包裝,而是連底層關鍵零件都自己設計,包括:

  • 專屬的數據儲存系統(張量儲存)
    專門用來整齊又有效率地存放 AI 計算需要的大量數字資料。

  • 自動求導引擎(AI 的學習核心)
    這是 AI 能夠「學習」的關鍵機制。它會自動計算數學公式,幫助 AI 從錯誤中調整自己、持續進步。

  • GPU 管理系統(CUDA 運行管理)
    負責調校 NVIDIA 顯示卡(GPU)的運算資源,讓資料在硬件中運行得又快又順。

2. AI 代理如何設計 VibeTensor?

VibeTensor 的開發方式屬於「代理式 AI(Agentic AI)」流程。簡單來說,就是把 AI 代理當為「自動工程師」。它可以自己運用工具、搜尋資料、修改程式、編譯程式、做測試,人類只需要給方向,不用一步步手動操作。

整個開發流程大致分成四個循環階段:

① 設定目標與規則

人類先告訴 AI 代理,這一階段要完成什麼功能,同時訂下幾個不能違反的重要原則(例如系統必須保持穩定、安全等)。這些原則就像「不能破壞的規矩」。

② 作修改並直接套用

AI 會自己想出要怎麼改程式,修改內容,然後直接把修改套用到整個程式系統裡。

③ 自動驗證

修改完成後,AI 會自己編譯程式,並執行相關測試,看看功能是否正常、有否出錯。

④更全面的檢查與審核

當不同部分的系統整合起來之後,會進行更大範圍的測試。此外,研究團隊還使用了「多代理程式碼審查」機制 —— 也就是讓不同的 AI 互相檢查彼此的工作,避免單一 AI 遺漏安全問題或寫出多餘、重複的設計。

3. 人類在整個過程中做了什麼?

雖然實際寫程式的是 AI,但人類仍然非常重要,只是角色比較像「導師」或「總設計師」,而不是親自下場寫程式的人。

人類主要參與幾個方面:

① 提供大方向

人類負責說明系統要做什麼、哪些功能比較重要,以及整體架構應該做成什麼樣子。
簡單說,人類決定「要往哪裡走」,AI 負責「怎麼走」。

② 設定規則與標準(護欄)

人類會事先訂好測試規範,例如使用 CTest 或 pytest 這類測試工具,作為 AI 必須達成的標準。這些規範就像道路兩旁的護欄,確保 AI 不會偏離正確方向。

③ 協助處理複雜問題

如果系統在多次修改後出現比較隱藏的問題,例如數值計算錯誤、記憶體使用不當等,人類會提醒 AI 增加更多測試,或加入更嚴格的檢查機制,幫助找出問題。

但有一點很重要:人類並不直接寫程式、不手動執行測試,也不逐行檢查或修改程式碼。這些具體技術工作都是由 AI 自己完成的。

4. 產品功能與可以怎樣使用?

VibeTensor 是一套完整的深度學習運行平台,也就是說,你可以用它來訓練和運行 AI 模型。它的主要功能可以用比較簡單的方式理解如下:

① 支援多種常用語言

  • 它提供兩種常見的操作方式:Python 介面 和 Node.js 介面。

  • 這代表程式設計師可以用自己熟悉的語言來操作這個系統。

② 底層運算很快、很強

它的核心是用 C++20 寫成,並且同時支援:

  • CPU 運算

  • CUDA(GPU 加速)運算

裡面還包含:

  • 自動求導引擎(幫助 AI 自動計算學習所需的數學公式)

  • 具備診斷能力的 GPU 記憶體管理系統(可以更有效率地分配與追蹤 GPU 記憶體使用狀況)

簡單說,它的引擎是為了「快又穩」而設計的。

③ 容易擴充與整合

它支援 DLPack 標準,這表示可以和其他深度學習工具交換資料,而且幾乎不用多做資料複製(更省時間與資源)。

此外,它還提供穩定的 C 語言接口,讓外部開發者可以加入自己寫的運算模組,讓整個系統功能繼續擴充。

簡單說,它不是封閉系統,而是可以外加模組而升級。

④ 已經實際測試過

研究人員已經用 VibeTensor 在 NVIDIA H100Blackwell GPU 上成功做過幾個訓練測試,包括:

  • CIFAR-10 圖像分類任務(使用 ViT 模型)

  • miniGPT 小型語言模型訓練

這表示它不只是理論設計,而是真的能在高階顯示卡上實際運作。

5. 「AI 設計 AI」的意義與未來

VibeTensor 的出現,可以說是 AI 參與軟件開發的一個重要突破。

① 證明 AI 能跨越不同層次來設計系統

過去大家以為,AI 只能幫忙寫一些零碎的程式碼。但 VibeTensor 顯示,AI 不只會寫表面的程式(例如 Python 介面),甚至連最底層的系統核心(例如 CUDA 記憶體管理)都能一起設計,並且讓整個系統前後一致、彼此配合。

簡單說,它證明了 AI 有能力從「外層操作介面」一路做到「最底層運算引擎」,而不是只做局部幫手。

② 從寫程式助手,變成系統設計者

以前的 AI 多半只是「程式助理」,幫工程師補程式、改錯誤、寫函式。

但未來的 AI,可能不只是補 code,而是能根據目標(例如:要更快、更省資源)主動設計整個系統架構。也就是說,AI 不只是施工者,還可能成為「建築師」

③ 走向「自我強化」的發展

這也和「自我加速進化」的概念有關——
如果 AI 能設計和優化支撐自己運行的軟件平台,那它就等於在改進自己的工具。當工具變強,它又能設計出更強的工具,如此循環下去,進步的速度可能會越來越快

6. 可能的危險與挑戰

雖然這項技術很先進,但由 AI 自己產生的系統軟體,還是有一些特別的風險需要注意。

① 「科學怪人效應」

這個說法的意思是:
每一個小部分看起來都沒問題,但拼在一起卻出現整體效率變差的情況。

例如,AI 可能為了安全考量,把很多步驟設計成必須一個一個依序執行,結果反而讓高性能的硬件(例如 GPU)閒著沒事做,整體速度變慢。

簡單說:局部正確,不代表整體最佳。

② 隱藏的穩定性問題

有些程式在短時間測試時看起來正常,但如果長時間運行(例如訓練 AI 模型幾天幾夜),或在比較複雜的情況下互動,就可能出現問題。

③ 安全與維護困難

機器自動產生的程式碼,有時會:

  • 結構不夠一致

  • 設計上出現多餘或重複

  • 潛藏不容易察覺的安全漏洞

因此,目前這類由 AI 全面生成的系統,還不太適合直接用在正式的商業或關鍵生產環境中。

結論

VibeTensor 清楚地展示了一件重要的事情:
在有人類提供大方向與原則的前提下,AI 代理已經能夠建構出不簡單、而且可以使用 GPU 加速的完整深度學習系統。

這個開源成果的意義不只是做出一個新工具,而是提供了一個範例,讓學術界可以進一步研究「AI 如何參與、甚至主導軟件工程」的方法。

更重要的是,它讓我們看到一種新的可能性——未來的 AI 不只是使用既有的基礎設施,而是能夠自己設計、優化,甚至重建支撐自己運作的底層系統。

簡單說,這可能是 AI 從「工具使用者」,走向「基礎建設建造者」的一個開端。

PowerPoint

Youtube


CC BY-NC-ND 4.0 授权

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!

人工智能中心
  • 选集
  • 来自作者
  • 相关推荐