Key Takeaways:
- DeepSeek 以超過 500 億美元估值募資 74 億美元,梁文鋒個人出資 30 億美元
- 公司計劃立即將 300 人團隊規模擴大一倍,涵蓋所有部門
- 此次募資源於梁文鋒在四月份看到 Anthropic 的 Claude Mythos 預覽後的反應
Key Takeaways:

DeepSeek 的 74 億美元募資——這是中國 AI 初創公司最大的一輪單筆融資——其背後原因是梁文鋒在四月份看到 Anthropic 的 Claude Mythos 預覽後,意識到若沒有龐大資本儲備,公司無法參與競爭。
據知情人士透露,DeepSeek 的 74 億美元募資——這是中國 AI 初創公司最大的一輪單筆融資——其觸發點是創辦人梁文鋒在審閱 Anthropic 的 Claude Mythos 預覽後得出的結論:若沒有龐大資本儲備,公司無法支撐其研究抱負。這家總部位於杭州的公司在此輪融資中估值超過 500 億美元,計劃將目前約 300 人的團隊規模在所有部門擴大一倍。
「人類目前正處於 AGI 的黎明時期,」DeepSeek 在微信上發表的聲明中表示。「隨著技術進步,我們正努力將所有部門的規模至少擴大至兩倍。」
梁文鋒個人出資約 30 億美元——相當於 200 億元人民幣——佔總募資額約 40%,同時維持其控股股東地位。互聯網巨頭騰訊及電池製造商寧德時代作為機構投資者參與,此外還有國家人工智能產業投資基金,顯示出強大的政府支持背景。公司立即開放 27 類技術及企業職位的申請,包括開發工程師、數據工程師、AI 產品經理及運營人員,所有職位均向實習生開放。
此次募資標誌著 DeepSeek 的戰略轉向。該公司在梁文鋒 2023 年與潛在投資者的會面告吹後——當時他告訴對方公司沒有商業化或產品路線圖——以自籌資金的研究實驗室模式營運了三年。策略轉變源於競爭壓力:Anthropic 的 Claude Mythos 於四月展示的功能基於龐大算力與數據,梁文鋒認為 DeepSeek 若沒有顯著更大的資本基礎,無法與之匹敵。
華為晶片的取捨
DeepSeek 致力於將其模型適配至國產華為晶片,這一選擇付出了巨大代價。該公司的訓練與部署系統原本建基於 Nvidia 的 CUDA 軟體,工程師需重新編寫底層軟體,才能在華為硬體上高效運行。這一努力導致公司長達 15 個月未發布任何新一代模型——在頂尖實驗室每兩到三個月便推出新模型的時代,這是一段異常漫長的停滯期。
這段空白期使得 DeepSeek 錯過了去年下半年 Anthropic 推出 Claude Code 後掀起的程式碼工具熱潮。梁文鋒在募資路演中對投資者表示,程式碼工具與 AI 聊天機器人都是通往通用人工智能路上的臨時中途站,過度押注短期產品會分散對終極目標的注意力。
梁文鋒相信,華為晶片將在數年內追上 Nvidia 的效能,而 DeepSeek 應在此之前完成適配工作。華為直到去年才得知 DeepSeek 一直在私下測試其晶片,此後兩家公司開始直接合作。
在美國市佔率提升
儘管模型發布出現空窗期,DeepSeek 的現有模型在美國開發者市場的接受度正在提升。該公司的旗艦產品 V4 模型於四月發布,五月在 Vercel 的 AI Gateway 平台上佔據了 17% 的 Token 使用量,而前一個月這一比例還不到 1%。這使得 DeepSeek 成為該平台上第三大模型供應商,僅次於 Anthropic 和 Google。
輕量版的 V4 Flash 變體定價比同級別的 Anthropic 模型便宜 20 到 50 倍,梁文鋒表示將維持這一定價策略。平台數據顯示,增長勢頭持續至六月。
DeepSeek 仍是唯一將所有模型底層程式碼完全開源的主要 AI 實驗室,梁文鋒將此理念描述為防止 AI 被少數公司控制的關鍵。該公司已建立員工持股計劃,按此次募資估值分配股份。
對投資者而言,其影響顯而易見。DeepSeek 的激進擴張與超低定價策略,對包括 OpenAI 和 Anthropic 在內的美國 AI 龍頭企業的利潤率構成壓力;同時,其轉向國產晶片的舉措,強化了中國半導體自給自足的敘事。Nvidia 的 H100 和 Blackwell GPU 目前驅動著大多數大型 AI 訓練任務,若中國實驗室成功脫離其生態系統,Nvidia 將面臨長期風險——儘管 DeepSeek 長達 15 個月的模型空窗期也顯示出這一轉型的難度。
本文僅供資訊參考,不構成投資建議。