DeepSeek募資74億美元，計劃在Claude啟發後將員工人數翻倍

DeepSeek 的 74 億美元募資——這是中國 AI 初創公司最大的一輪單筆融資——其背後原因是梁文鋒在四月份看到 Anthropic 的 Claude Mythos 預覽後，意識到若沒有龐大資本儲備，公司無法參與競爭。

據知情人士透露，DeepSeek 的 74 億美元募資——這是中國 AI 初創公司最大的一輪單筆融資——其觸發點是創辦人梁文鋒在審閱 Anthropic 的 Claude Mythos 預覽後得出的結論：若沒有龐大資本儲備，公司無法支撐其研究抱負。這家總部位於杭州的公司在此輪融資中估值超過 500 億美元，計劃將目前約 300 人的團隊規模在所有部門擴大一倍。

「人類目前正處於 AGI 的黎明時期，」DeepSeek 在微信上發表的聲明中表示。「隨著技術進步，我們正努力將所有部門的規模至少擴大至兩倍。」

梁文鋒個人出資約 30 億美元——相當於 200 億元人民幣——佔總募資額約 40%，同時維持其控股股東地位。互聯網巨頭騰訊及電池製造商寧德時代作為機構投資者參與，此外還有國家人工智能產業投資基金，顯示出強大的政府支持背景。公司立即開放 27 類技術及企業職位的申請，包括開發工程師、數據工程師、AI 產品經理及運營人員，所有職位均向實習生開放。

此次募資標誌著 DeepSeek 的戰略轉向。該公司在梁文鋒 2023 年與潛在投資者的會面告吹後——當時他告訴對方公司沒有商業化或產品路線圖——以自籌資金的研究實驗室模式營運了三年。策略轉變源於競爭壓力：Anthropic 的 Claude Mythos 於四月展示的功能基於龐大算力與數據，梁文鋒認為 DeepSeek 若沒有顯著更大的資本基礎，無法與之匹敵。

華為晶片的取捨

DeepSeek 致力於將其模型適配至國產華為晶片，這一選擇付出了巨大代價。該公司的訓練與部署系統原本建基於 Nvidia 的 CUDA 軟體，工程師需重新編寫底層軟體，才能在華為硬體上高效運行。這一努力導致公司長達 15 個月未發布任何新一代模型——在頂尖實驗室每兩到三個月便推出新模型的時代，這是一段異常漫長的停滯期。

這段空白期使得 DeepSeek 錯過了去年下半年 Anthropic 推出 Claude Code 後掀起的程式碼工具熱潮。梁文鋒在募資路演中對投資者表示，程式碼工具與 AI 聊天機器人都是通往通用人工智能路上的臨時中途站，過度押注短期產品會分散對終極目標的注意力。

梁文鋒相信，華為晶片將在數年內追上 Nvidia 的效能，而 DeepSeek 應在此之前完成適配工作。華為直到去年才得知 DeepSeek 一直在私下測試其晶片，此後兩家公司開始直接合作。

在美國市佔率提升

儘管模型發布出現空窗期，DeepSeek 的現有模型在美國開發者市場的接受度正在提升。該公司的旗艦產品 V4 模型於四月發布，五月在 Vercel 的 AI Gateway 平台上佔據了 17% 的 Token 使用量，而前一個月這一比例還不到 1%。這使得 DeepSeek 成為該平台上第三大模型供應商，僅次於 Anthropic 和 Google。

輕量版的 V4 Flash 變體定價比同級別的 Anthropic 模型便宜 20 到 50 倍，梁文鋒表示將維持這一定價策略。平台數據顯示，增長勢頭持續至六月。

DeepSeek 仍是唯一將所有模型底層程式碼完全開源的主要 AI 實驗室，梁文鋒將此理念描述為防止 AI 被少數公司控制的關鍵。該公司已建立員工持股計劃，按此次募資估值分配股份。

對投資者而言，其影響顯而易見。DeepSeek 的激進擴張與超低定價策略，對包括 OpenAI 和 Anthropic 在內的美國 AI 龍頭企業的利潤率構成壓力；同時，其轉向國產晶片的舉措，強化了中國半導體自給自足的敘事。Nvidia 的 H100 和 Blackwell GPU 目前驅動著大多數大型 AI 訓練任務，若中國實驗室成功脫離其生態系統，Nvidia 將面臨長期風險——儘管 DeepSeek 長達 15 個月的模型空窗期也顯示出這一轉型的難度。

本文僅供資訊參考，不構成投資建議。