重點摘要
AI 正在撰寫它自己的下一版本——Anthropic 公開數字,同步呼籲世界設立暫停按鈕
Claude Code 上線 15 個月,AI 寫程式佔比從個位數衝至 80%+,工程師日均產出量提升 8 倍,品質已從「略遜」追平人類,且預計年內超越。
Anthropic 呼籲建立全球多邊暫停機制,但坦承財務誘因與核查技術是核心障礙,且明言只有在其他實驗室同等參與下才願跟進暫停。
報告揭示三種未來情境:能力停滯、人機分工加速、完全遞歸自我改進——Anthropic 對第三種坦言「我們沒有直覺可以預測那個世界」。
前情提要
章節一:數據揭露——Claude 在 Anthropic 內部的程式碼貢獻比例
2026 年 6 月 4 日,Anthropic Institute 發布報告《When AI Builds Itself》,由共同創辦人 Jack Clark 與 Marina Favaro 共同撰寫。報告首次以內部數據揭露令業界震驚的速度:截至 2026 年 5 月,生產程式碼庫中超過 80%(部分指標達 90%)由 Claude 撰寫。
Claude Code 於 2025 年 2 月上線前,AI 寫程式佔比「仍在低個位數」——15 個月內從個位數躍升至 80%+,不是漸進改善,而是結構性轉變。工程師每日合併的程式碼量已達 2021—2025 年均值的 8 倍。
一名員工表示:「距離我上次自己寫程式碼,已經過了大約五個月」。程式碼品質也從 2025 年底「略遜於人類」追平至今,Anthropic 預計年內將「明確優於人類」——人類在程式碼生產上的相對優勢窗口正在快速關閉。
章節二:AI 自我開發的加速飛輪效應
報告最核心的論點是一個自我強化的迴圈:Claude 撰寫的程式碼,正在縮短下一代 Claude 的開發週期,形成遞歸自我改進 (RSI) 的雛形。任務完成時長每約 4 個月翻倍,由 2024 年 3 月的 4 分鐘,逐步成長至 Claude Mythos Preview 的至少 16 小時。
名詞解釋
遞歸自我改進(RSI,Recursive Self-Improvement):指 AI 系統能夠自主設計並優化其後繼版本,形成能力指數級提升的迴圈,理論上無需人類介入每個迭代步驟。
程式碼最佳化加速倍數從 2025 年 5 月的 3 倍飆升至 2026 年 5 月的 52 倍。2026 年 4 月的一項示範中,9 個並行 Claude agent 耗費約 18,000 美元算力、累積 800 小時,恢復了 AI 安全研究任務 97% 的性能差距;相比之下,兩名人類研究員一週僅達到 23%。
選擇研究方向的正確率從 2025 年 11 月的 51% 提升至 2026 年 4 月的 64%,逐漸逼近「主導決策」的門檻。報告描述:「現在,執行幾乎不需要人類時間」,而「人類審查」正在成為整個開發流程中新的速度瓶頸。
章節三:「暫停按鈕」提案——Anthropic 的安全治理願景
Anthropic 在報告中呼籲建立「可驗證的全球協調暫停機制」,並坦承這比想像中困難:訓練算力比飛彈倉庫更容易隱藏,通用用途投入難以核查,而「退出協議的財務誘因極大」。
報告明確指出:「單邊暫停的效果遠小於多邊協調框架」——若其他實驗室繼續前進而 Anthropic 一家暫停,可能拱手相讓領先地位。Anthropic 計劃未來數月啟動政策、研究與企業界的跨界對話,目標是建立可讓多方參與的協調機制。
這份聲明在業界引發廣泛討論:批評者指出,「我願意停,但你得先停」的邏輯,本質上不會讓任何一方真正停下來;支持者則認為,Anthropic 願意公開討論暫停機制的可行性,已是業界罕見的自我揭露。
章節四:當 AI 開始寫自己——對產業與社會的深層影響
報告列舉三種未來情境:能力曲線停滯(需要架構突破)、AI 自動執行但人類主導研究方向(百人公司可比肩十萬人組織)、以及完全遞歸自我改進(AI 自主設計後繼者,發展速度由算力決定)。
Anthropic 對第三種情境坦言「我們沒有直覺可以預測那個世界會是什麼樣子」,但強調:「它可能比大多數機構準備好的時間更早到來」。依據 The Decoder 的報導,GitHub 週提交量已達 2.75 億次,Claude Code 佔其中 4.5%(每週約 260 萬次提交),且增速未見放緩。
當一家 AI 公司的共同創辦人親自發布「我們可能需要暫停」的報告,並同步揭露 AI 已主導自家 90% 程式碼生產,這本身就是一個信號:對 AI 自我開發飛輪效應的焦慮,已從學術圈蔓延至核心技術組織的決策層。
多元觀點
正方立場
AI 主導程式碼生產是效率提升的自然演進,Anthropic 的數據是可查核的生產力證明。
130 名研究員的內部調查顯示生產力提升中位數達 4 倍,開放式程式設計任務成功率六個月內上升 50 個百分點,Claude 自動審查器已能在生產事故前攔截約三分之一的 bug——這些都是可量化的工程成果。
支持者認為,AI 加速開發週期有助於在更短時間內解決更多問題;Anthropic 願意公開自身數據與局限,是業界應鼓勵的透明度表態。
反方立場
Anthropic 呼籲「暫停按鈕」的同時,自身仍以最快速度推進 AI 開發——這是一個結構性矛盾,而非誠意聲明。
Dr. Abeba Birhane 等學者指出,「遞歸自我改進」的說法忽略了仍在幕後工作的大量人類勞動力:RLHF 標注員、隱藏的零工經濟工作者、以及約 1,000 名提供回饋的人類軟體工程師。批評者認為,Anthropic 的敘事將人類勞動隱形化,以「AI 自我進化」的框架推高估值與媒體曝光。
Ed Zitron 等評論者更直接指出,Anthropic 早已掌握媒體對其聲明的信任度,財務誘因與多邊協調的結構性困難,讓「暫停呼籲」實際上等同於無效聲明。
中立/務實觀點
無論 Anthropic 的動機如何,「AI 寫程式比例快速提升」是可觀察的現象,問題是我們是否擁有對應的治理框架。
技術進步與安全治理並非必然對立:效率提升是真實的正面效益,但效益愈顯著,可驗證的協調機制就愈迫切。
務實的問題不是「要不要暫停」,而是:當前的評測指標是否足以預警失控風險?多邊協調的激勵機制應如何設計才能抵抗退出誘因?以及,如何確保 AI 開發過程中的人類勞動貢獻獲得應有的可見度?
實務影響
對開發者的影響
Claude Code 的快速普及正在重新定義什麼叫做「寫程式」。當一名工程師可以五個月不直接撰寫程式碼、而日均產出是過去 8 倍,「程式碼審查者」與「AI 任務規劃者」可能正在成為新的核心技能。
然而,@GergelyOrosz 等資深工程師已公開反映,Claude Code 的行為穩定性正在下降——功能突然失效、無故拒絕任務,且缺乏透明說明。當開發者對 AI 的依賴超過臨界點,任何突發的能力退化都可能造成不成比例的生產力衝擊。
對團隊/組織的影響
「百人公司比肩十萬人組織」的情境,對現有大型組織是警訊:若 AI 提升生產力的主要受益者是能迅速擁抱它的小型團隊,傳統大型工程組織的人力優勢將快速貶值。
短期行動建議
- 評估工作流程中哪些環節可安全移交 AI,哪些需要保留人類判斷
- 建立 AI 生成程式碼的品質審查流程,避免審查能力因長期不用而退化
- 持續關注 Anthropic 承諾的多邊治理對話進展,以此評估企業 AI 策略的長期風險
社會面向
產業結構變化
GitHub 每週 2.75 億次提交中,Claude Code 已佔 4.5%——一家公司的工具正在主導全球軟體生產的相當比例。若此趨勢持續,AI 工具提供者將掌握更高的產業基礎設施影響力,類似搜尋引擎在資訊流通上的角色。
軟體工程師的供需結構也正在重新定價:生產力提升 4—8 倍意味著相同產出需要更少的工程師頭數,但對「能有效監督 AI 輸出」的高階工程師需求或許反而上升。
倫理邊界
這份報告揭示的核心倫理問題不只是「AI 能不能寫好程式碼」,而是:當訓練數據、標注工作與產品回饋仍大量依賴人類勞動時,「AI 自我改進」的敘事是否合理地隱形化了這些貢獻?
Anthropic 報告中提及的 1,000 名人類工程師回饋計畫,以及仍活躍的 RLHF 標注生態,提醒我們「遞歸自我改進」從來都不是真正的無人介入。
長期趨勢預測
若 Claude Mythos Preview 能穩定執行 16 小時以上的複雜任務且成功率持續提升,「AI 輔助開發」的框架將在 2—3 年內轉變為「人類監督 AI 主導開發」。
這一轉變的速度,取決於 Anthropic 及其競爭對手是否能在不觸發監管或重大事故的情況下,持續擴展能力邊界。
唱反調
Anthropic 的暫停呼籲本質上是「先讓別人停,再考慮自己停」——在多邊協調機制建立之前,這份倡議不會改變任何人的實際行為。
80% 程式碼由 AI 撰寫的數字,未揭示其中有多少是樣板程式碼或重複性工作;若核心架構決策仍高度依賴人類,「AI 主導開發」的說法可能言過其實。
遞歸自我改進的敘事放大了 AI 的能動性,卻系統性地忽略了仍在幕後工作的大量人類標注員與回饋提供者——這些勞動的隱形化本身就是一個倫理問題。
社群風向
Anthropic:我們無法控制我們完全自主、「遞歸自我改進」的模型 隱藏的零工經濟工作者、RLHF 標注員,以及那些實際上在改進模型的無名程式設計師與學術研究員:先緩一緩
Anthropic 真的在快速消耗開發者的好感。Claude Code 突然在昨天還能用的事情上變得無法使用,AI 現在拒絕做任何它認為與軟體開發無關的事。當然,完全沒有透明度說明原因。
Anthropic 很早就意識到媒體會將它說的任何話當成聖旨,散播關於 AI 理論能力的恐懼,並以補貼訂閱掩蓋 AI 的真實成本。這是一家赤裸裸的惡意公司。
Anthropic 的一個專案正在使用約 1,000 名人類軟體工程師的回饋來改進 Claude Code。
Claude Code 就是你所需要的一切。我剛加入 Anthropic 時,很驚訝地發現團隊中許多人把 Claude Code 當作通用 agent 使用,不只是用於程式碼。我後來也成了信徒——現在幾乎用 Claude Code 幫我處理所有工作。
炒作指數
行動建議
閱讀 Anthropic Institute 的原始報告《When AI Builds Itself》,特別關注三種未來情境與自動審查器的具體數據
在工程流程中加入 AI 生成程式碼的品質審查機制,確保在 AI 依賴度提升的同時保留人類判斷能力,避免審查技能退化
追蹤 Anthropic 承諾的政策、研究與企業界跨界對話進展,以及其他前沿實驗室對「多邊暫停協調」提案的公開回應