重點摘要
「永遠不融資」的 DeepSeek,終於打開了大門
首次對外募資至少 3 億美元,估值逾 100 億美元,結束母公司量化基金獨力支撐的模式,梁文鋒的長期信仰宣告轉向。
V4 已針對華為昇騰完成 CANN 架構遷移,SWE-bench 內部評分超過 80%,若成功將是首個擺脫 NVIDIA 依賴的頂尖模型。
融資對象幾乎鎖定中資機構,美國創投因監管受阻,地緣政治在資本層面加速中美 AI 生態分裂,格局持續重塑。
前情提要
獨立路線的終結:DeepSeek 為何不再自給自足
DeepSeek 長期以來以拒絕外部資本著稱,母公司浙江幻方量化 (High-Flyer Capital Management) 憑藉 2025 年平均 56.6% 的驚人投資回報,為 DeepSeek 提供穩定的內部資金流。
然而,隨著旗艦模型 V4 的規格急遽膨脹——1 兆參數、100 萬 token 上下文視窗、多模態原生支援——單一股東的資本承擔上限已悄然逼近。兩位知情人士向《The Information》透露,DeepSeek 正首次對外尋求至少 3 億美元融資,估值目標逾 100 億美元。
此前,DeepSeek 曾多次婉拒中國頂級創投與科技巨頭的投資邀約,創辦人梁文鋒也始終以「保持公司遠離商業壓力」自我定位。此次轉向被市場視為重大戰略重新校準,標誌著「量化基金孵化 AI 實驗室」這一獨特模式走到了臨界點。
100 億美元估值的技術底氣與商業邏輯
100 億美元的估值並非憑空而來,背後是 DeepSeek R1 創下的驚人技術先例:訓練成本僅 560-600 萬美元,卻在發布後引發全球 AI 公司市值蒸發約 1 兆美元,徹底顛覆了「高算力必然論」的敘事。
V4 的內部基準測試進一步強化了估值底氣:SWE-bench 評分超過 80%、HumanEval 達 90%,更關鍵的是,V4 全量版(1 兆參數)已針對華為昇騰 (Ascend) 晶片完成核心程式碼的 CUDA → CANN 架構遷移。
若成功,這將成為首個不依賴 NVIDIA 硬體的頂尖 AI 模型,直接呼應北京的半導體自主戰略——這種政策契合度本身,就是估值的重要溢價來源。
名詞解釋
SWE-bench Verified 是一項標準化軟體工程基準測試,衡量 AI 模型自主解決真實 GitHub issue 的能力,業界將其視為衡量程式碼理解與修復能力的黃金標準之一。
中國 AI 融資格局的連鎖效應
DeepSeek 此次融資的投資方構成,幾乎已被地緣政治預先篩選:美國創投因監管壓力與國家安全顧慮,參與空間嚴重受限,最可能的資金來源為國內中資機構。
這一格局將對中國 AI 生態產生深遠影響。DeepSeek 入場外部資本市場,等同於為同類型的「量化基金孵化 AI 實驗室」模式發出退場訊號,後進者可能更早選擇接受外部資金。
V4 計劃以 Apache 2.0 授權開源,意味著商業化路徑仍以生態影響力為主,而非直接的模型授權收入——這種策略選擇也將反映在投資方對「回報週期」的預期上。
人才流失的壓力同樣不容忽視:V3 核心開發者 Luo Fuli 已離職赴小米、Guo Daya 跳槽字節跳動,外部資金的注入或有助於穩定薪酬競爭力,緩解頂尖工程師的流失壓力。
對全球 AI 軍備競賽的戰略影響
NVIDIA CEO 黃仁勳 (Jensen Huang) 直言,DeepSeek 在華為昇騰平台上的模型「將是美國的壞結果」——這句話精準點出了此次融資的深層戰略意涵。
美中頂尖模型的性能差距已縮小至 2.7 個百分點,但邊際改善的算力成本正急劇攀升。DeepSeek 以遠低於西方競爭對手的算力預算實現頂尖性能,此次融資不只是財務補血,更是在向市場宣示:在出口管制步步收緊的硬體環境下,中國 AI 的技術路線依然具備前進動能。
對西方 AI 產業而言,這意味著「算力壁壘」作為競爭護城河的有效性正在加速消退,全球 AI 軍備競賽的遊戲規則正被悄然改寫。
團隊與技術實力
核心團隊
梁文鋒 (Liang Wenfeng) 同時擔任 DeepSeek 創辦人兼 CEO,以及母公司浙江幻方量化的創辦人,其量化金融背景賦予 DeepSeek 獨特的資源調度能力與長期主義文化。
然而,V3 核心開發者 Luo Fuli 已離職赴小米、Guo Daya 跳槽字節跳動,人才流失訊號值得高度關注。目前 V4 開發主力仍由 DeepSeek 內部工程師承擔,外部融資或有助於提升薪酬競爭力、緩解核心人才的流失壓力。
技術壁壘
DeepSeek 的核心技術壁壘在於以極低算力成本實現頂尖性能:R1 訓練成本僅 560-600 萬美元,透過 KV cache 壓縮與 MoE 選擇性激活大幅降低推理開銷。
V4 進一步引入「Engram」條件記憶架構,將 100 萬 token 上下文的資訊召回率提升至 97%;更關鍵的是,核心程式碼已從 NVIDIA CUDA 遷移至華為 CANN 架構,技術上實現對 NVIDIA 硬體的脫鉤。
名詞解釋
MoE(Mixture of Experts,專家混合架構)是一種稀疏模型設計:每次推理只激活部分「專家」子網路,而非整個模型,可大幅降低每 token 的計算量,同時保持模型總參數量帶來的能力上限。
技術成熟度
DeepSeek R1 已是 GA(正式發布)產品,並在全球範圍內獲得廣泛部署與第三方基準驗證。
V4 目前處於內部測試階段,原訂 2026 年 2 月發布後多次延期,目前預估 2026 年 4 月底上線,計劃以 Apache 2.0 授權開源。技術成熟度已達 beta 末段,但正式發布時程仍存在不確定性,多輪延期本身即是執行風險的警示訊號。
融資結構分析
融資結構
本輪為 DeepSeek 成立以來首次外部融資,目標募集金額至少 3 億美元,估值逾 100 億美元(依據《The Information》兩位知情人士透露)。輪次類型尚未公開確認,領投方與跟投方均未揭露,截至報導發出時 DeepSeek 官方尚未確認融資討論,Reuters 亦未能即時核實。
估值邏輯
100 億美元估值對應的核心資產包括:
- R1 在全球的技術聲譽與開源生態影響力
- V4 的技術規格優勢(SWE-bench 80%+、HumanEval 90%、100 萬 token 上下文)
- 華為昇騰晶片適配能力,直接契合北京半導體自主政策溢價
- 母公司 High-Flyer 2025 年 56.6% 回報率所示範的資本實力背書
與同期美國 AI 公司相比(Anthropic 估值約 610 億美元、xAI 約 500 億美元),DeepSeek 100 億美元估值顯得相對保守,但仍反映市場對其「效率優先」技術路線的高度認可。
資金用途
- V4 訓練與推理基礎設施擴張(含華為昇騰叢集採購)
- 核心工程師薪酬競爭力提升(對抗小米、字節跳動等大廠挖角)
- 多模態能力研發加速與後續模型研究投入
競爭版圖
競爭版圖
- 直接競品:Anthropic Claude 4 系列(估值約 610 億美元)、OpenAI GPT-5(估值約 3000 億美元)、xAI Grok(估值約 500 億美元)——三者均高度依賴 NVIDIA H100/H200 算力
- 間接競品:Google Gemini(Alphabet 內部產品)、Meta Llama 4(開源,商業模式不同);國內競品包括百度文心、阿里通義、月之暗面 Kimi
市場規模
全球 AI 基礎模型市場預估 2026 年 TAM 超過 400 億美元,中國市場佔其中約 15-20%。DeepSeek 的差異化在於以極低成本提供頂尖性能,理論上可服務對 API 成本高度敏感的中小企業與研究機構市場(SAM 估計約 50-80 億美元)。
差異化定位
DeepSeek 的核心差異化是「效率優先」技術路線:以遠低於競爭對手的訓練成本實現同等甚至更優的基準性能,並以 Apache 2.0 開源策略快速建立生態影響力。
V4 的華為昇騰適配更賦予其在出口管制環境下的獨特護城河——西方競爭對手無法在同等硬體限制條件下實現相同性能,這一壁壘在中美科技脫鉤加劇的背景下只會愈發顯著。
風險與挑戰
技術風險
V4 已多次延期,核心開發者相繼出走,顯示內部工程執行存在壓力。CUDA → CANN 架構遷移的穩定性與性能表現尚未經過外部獨立驗證,若 V4 正式發布後基準達不到預期,100 億美元估值將面臨嚴峻考驗。
市場風險
美國創投因監管壓力幾乎無法參與,融資對象局限於中資機構,資金來源集中度偏高。同時,中國 AI 生態競爭日趨激烈——百度、阿里、字節跳動均在加速部署,DeepSeek 的技術領先優勢有被追平的風險。
執行風險
梁文鋒此前以「遠離商業壓力」為核心理念,外部資本的引入不可避免帶來股東回報預期,可能影響 DeepSeek 一貫的長期主義研發文化。Apache 2.0 開源策略雖有生態優勢,但商業變現路徑至今仍不清晰,投資回報週期高度不確定。
唱反調
V4 已多次延期,核心開發者相繼出走,顯示工程執行風險遠超預期;「首個不依賴 NVIDIA 的頂尖模型」可能只是行銷敘事,CANN 架構遷移的實際性能落差需待第三方獨立驗證。
梁文鋒過去多次拒絕外部資本,此次轉向可能源於技術瓶頸而非戰略選擇——若 V4 最終未能達到內部基準,3 億美元融資或成燙手山芋,反而加速商業壓力對研發文化的侵蝕。
社群風向
DeepSeek 創辦人梁文鋒旗下對沖基金 2025 年業績亮眼,這可能間接為更多 AI 工作提供資金。浙江幻方量化旗下基金 2025 年平均回報率達 56.6%,這一表現強化了梁文鋒支付 DeepSeek 員工薪資、GPU 及其他開銷的能力。
有趣的是,DeepSeek 是由一家中國量化基金開發的,而非新創公司、大型科技公司或學術機構——所有模型都是開源的。
DeepSeek 首次以 100 億美元估值尋求外部融資:這家中國 AI 新創正洽談募集至少 3 億美元,此前曾多次拒絕投資方的邀約。
DeepSeek 據報啟動首輪融資,估值超過 100 億美元。DeepSeek 曾多次拒絕創投,如今計劃募集不少於 3 億美元的外部資金。
我不確定如何解讀這件事,我對 OpenAI/Anthropic 有關蒸餾的說法持懷疑態度,但我確實注意到 DeepSeek 最近聽起來愈來愈像 Claude 了。
炒作指數
行動建議
關注 DeepSeek V4 的 Apache 2.0 開源版本發布,在昇騰或通用 GPU 環境下進行 benchmark 對比,評估是否值得替換現有推理模型。
若有中國雲端客戶需求,提前評估華為 CANN 開發者工具鏈的遷移成本,及早建立昇騰適配的工程能力儲備。
同步追蹤三條訊號線:DeepSeek 融資公告正式確認、V4 發布時程,以及美國對華 AI 晶片出口管制的後續政策動向——三者將共同決定全球 AI 算力格局走向。