AI News

自主軟體工程的黎明

在人工智慧與軟體工程的一個分水嶺時刻,Cursor,這家著名的 AI 原生程式碼編輯器(AI-native code editor)的公司,成功展示了自主式 AI 代理(autonomous AI agents)從零開始構建複雜軟體的能力。此實驗在開發者社群引起震撼——一群由 OpenAI 提供動力的 AI 代理「群群協作」,在不到一週的時間內協同建構並執行了一個可運作的網頁瀏覽器。

該專案在內部被稱為「FastRender」,代表著從 AI 作為程式碼助理(Copilot)到 AI 作為完全自主軟體工程師的重大飛躍。實驗結果產生了超過 300 萬行程式碼,分佈在數千個檔案中,且在程式撰寫過程中沒有直接的人類介入。此成就挑戰了技術領域中對於人工通用智慧(Artificial General Intelligence,AGI)時間線的長期假設,並為適當協調時自主系統(autonomous systems)能達成的成就建立了新基準。

Cursor 的執行長 Michael Truell 公佈了這次大規模實驗的結果,透露系統在峰值時使用了約 2,000 個同時運行的階層式代理。這些代理並非僅僅 fork 現有專案如 Chromium;相反地,他們以 Rust(Rust)架構了一個自訂的渲染引擎,包含自有的 HTML 解析器、CSS 層疊邏輯,以及自訂的 JavaScript 虛擬機。

打破預測:「FastRender」專案

理解 FastRender 專案的重要性,最好的方式是放在專家預測的脈絡中。就在宣布前幾週,軟體社群中的重要人物、Django 共同創建者 Simon Willison 曾公開預測,由 AI 建構的網頁瀏覽器至少要到 2029 年才有可能實現。在 Cursor 展示之後,Willison 承認他「誤差三年」,突顯了 AI 能力加速的步伐。

該瀏覽器本身並非要成為可與 Chrome 或 Firefox 競爭的生產等級產品,也不是為此目的而製作。它是一個用來測試代理工作流程極限的概念驗證(proof-of-concept)。然而,它是可運作的。它能以可辨識的準確度呈現網頁,處理需要渲染引擎與 JavaScript 執行環境深度整合的複雜版面與互動。

指標 FastRender 統計 比較/脈絡
開發時間 < 1 週 人類團隊通常需數年
程式碼量 約 300 萬行 可與早期瀏覽器核心相當
代理規模 約 2,000 同時運行 大規模平行化
語言 Rust 高效能、記憶體安全的系統程式語言

選擇構建瀏覽器——一般被視為最複雜的軟體工程挑戰之一,因為它需要網路、圖形、語言解析與安全性的匯聚——是一項刻意的壓力測試。當能在此規模上成功時,Cursor 已展示出 AI 編碼的瓶頸不再僅僅是模型的智慧,而是管理代理的協調層。

引擎內部:協調代理群

FastRender 的成功不僅僅是把大量運算丟給問題的結果。它需要重新構想 AI 代理(AI agents)如何互動。實驗的早期迭代失敗,是因為採用了「扁平」階層,所有代理地位相等。在這些初期測試中,代理會鎖定檔案以避免衝突,導致僵局——20 個代理的效能會降到兩個代理的實際吞吐量,常常無限期等待資源釋放。

為了克服這點,Cursor 團隊實施了嚴格的階層結構,模仿成功的人類工程組織:

  • 首席架構代理(Principal Architect Agents): 負責高階系統設計,並將龐大的「建造瀏覽器」目標拆解為子系統(例如「建置 CSS 解析器」、「實作網路堆疊」)。
  • 管理者代理(Manager Agents): 監督特定模組,將任務指派給工作代理並根據規格審查其輸出。
  • 工作者代理(Worker Agents): 執行特定編碼任務、撰寫單元測試並處理實作細節。

此結構允許代理群有效地平行化工作。當一群代理在實作 DOM 時,另一群可以同時構建網路層,管理者代理則確保這些系統之間的介面保持一致。

基礎設施與運算

支援這個代理群所需的實體基礎設施相當龐大。報告指出使用了大型伺服器,每台大約同時承載 300 個代理。這些代理每小時產生數千次 commit,這樣的開發速率對任何規模的人類團隊來說,若不遭受溝通開銷吞噬,是物理上難以協調的。

向規格驅動開發(SDD)的轉移

從 FastRender 實驗中浮現出的最重要洞見之一,是驗證了規格驅動開發(Specification-Driven Development,SDD)作為自主編碼的主要介面。在傳統開發中,程式碼是事實的來源;在 AI 代理群的時代,規格成為事實的來源。

代理們並未依賴模糊的提示。相反地,工作流程依賴嚴謹的規格,以結構化且可測試的語言定義意圖。這種方法與 Cursor 及其他 AI 領導者目前倡導的一系列方法論呈現一致性:

  1. SDD(Specification-Driven Development,規格驅動開發): 在產生任何一行程式碼之前,先定義「做什麼」與「為什麼」。
  2. BDD(Behavior-Driven Development,行為驅動開發): 使用情境來對齊期望。
  3. TDD(Test-Driven Development,測試驅動開發): 先撰寫失敗的測試以「鎖定」正確性。

透過把規格當作主要產物,首席代理能為工作者代理產生精確的需求。如果工作者代理未能產出通過由規格衍生測試的程式碼,它會被重置並被要求再試一次,或該任務會被重新分配。這個自我修正迴圈使系統能在一週內無需人工扶持而持續運行。

數量 vs 品質:產出分析

雖然程式碼量(300 萬行)驚人,但數量不等於品質。Cursor 團隊對輸出的限制保持透明。FastRender 瀏覽器存在渲染故障與效能問題,而這些問題在開發流程中,人類團隊可能會更早優化。

此外,「自主性」並非沒有問題。對專案的 GitHub(GitHub)歷史分析顯示,在該週的大部分時間內,CI/CD(CI/CD)管線都在失敗。直到實驗的最後幾天,代理群才成功解決整合衝突並達成通過的建置狀態。

這種「在失敗中前進(failing forward)」的方法是當前 AI 模型的特徵。他們不是完美的程式設計師,但很有韌性。代理群閱讀錯誤日誌、診斷建置失敗,並反覆修補程式直到管線轉為綠燈,這一點可能比初始程式碼產生更能顯示智慧。

關鍵技術觀察:

  • Git Submodules: 代理們智慧地使用 Git submodules 將官方網頁規範(WhatWG、CSS-WG)直接納入倉庫,確保他們能取得基準真實資料。
  • 風險規避: 在沒有明確階層時,代理傾向於風險規避,採取小而安全的變更。階層化的指揮結構迫使它們對複雜的端到端功能承擔責任。

對開發者生態系的影響

FastRender 實驗對軟體產業提出了強烈的警示。它顯示人類軟體工程師的角色正在快速轉變,從「程式碼的撰寫者」轉為「規格的架構師」與「代理的協調者」。

對企業軟體開發(software development)而言,這指向一個未來,像「舊系統程式碼現代化」或「平台遷移」——目前需人類團隊數月或數年的工作——可能會被分配給代理群,在一個週末內完成。Cursor 已暗示類似的內部成功案例,例如使用代理在其自身程式碼庫中,將大量程式碼從 Solid 迁移到 React,觸及超過 20 萬行程式碼且準確度高。

然而,這並不意味著開發者會立即過時。FastRender 瀏覽器雖然可運作,但缺乏人類工程師提供的微妙性、審美潤飾與以使用者為中心的設計選擇。相反地,它突顯了一個未來,開發者將在更高層次的抽象上運作,管理大量初級等級的 AI 代理來執行實作的繁重工作。

結論:能力的新基準

Cursor 透過 FastRender 的展示,確立了大規模自主軟體工程的存在性證明。結合 OpenAI 的強大模型與穩健的階層化代理框架,他們在一週內完成了過去被認為需數年才能達成的事。

隨著這些工具從實驗室走向生產環境,產業的焦點將從「AI 能寫程式嗎?」轉向「我們如何治理、規格化,並驗證 AI 代理群所產出的程式碼?」孤傲天才程式設計師的時代可能正在結束,但 AI 擴充的軟體架構師時代才剛剛開始。

精選
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
ThumbnailCreator.com
利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
InstantChapters
即時生成吸引人的書籍章節。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
AirMusic
AirMusic.ai 可從文字提示生成高品質的 AI 音樂曲目,支援風格與情緒自訂,並能匯出分軌(stems)。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
Telegram Group Bot
TGDesk 是一款多合一的 Telegram 群組機器人,用於擷取潛在客戶、提升互動並擴展社群。

Cursor 展示自主 AI 代理構建網頁瀏覽器

這款以 AI 為原生的程式碼編輯器 Cursor 成功使用由 OpenAI 支援的自主管理 AI 代理群,在無需人工干預的情況下建立並運行了一個功能性網頁瀏覽器長達一週,展示了 AI 在軟體開發中的潛力。