核心要点:
- DeepSeek以超过500亿美元估值融资74亿美元,梁文锋个人出资30亿美元
- 公司计划立即将300人规模翻倍,覆盖所有部门
- 本轮融资源于梁文锋在4月看到Anthropic的Claude Mythos预览后的反应
核心要点:

DeepSeek 74亿美元融资——中国AI初创公司最大单轮融资——源于梁文锋在4月看到Anthropic的Claude Mythos预览后意识到,没有巨额资本储备,公司无法参与竞争。
据知情人士透露,DeepSeek 74亿美元融资——中国AI初创公司最大单轮融资——由创始人梁文锋在4月审阅Anthropic的Claude Mythos预览后得出结论:没有巨额资本储备,公司无法维持其研究雄心。这家总部位于杭州的公司在本次融资中估值超过500亿美元,计划将现有约300人的员工规模在所有部门翻倍。
"人类目前正处于AGI的黎明期,"DeepSeek在微信声明中表示。"随着技术的进步,我们正力争将所有部门的规模至少扩大一倍。"
梁文锋个人出资约30亿美元(200亿元人民币),约占融资总额的40%,同时保留其控股股权。互联网巨头腾讯和电池制造商宁德时代作为机构投资者参与,此外还有国家人工智能产业投资基金,显示出强大的政府支持。公司即日起开放27类技术和企业岗位的申请,包括开发工程师、数据工程师、AI产品经理和运营人员,所有职位均向学生实习生开放。
此次融资标志着DeepSeek的战略转折。此前三年,该公司一直作为自筹资金的研究实验室运营——2023年梁文锋与潜在投资者的会面因他坦言公司没有商业化或产品路线图而告吹。如今战略转变源于竞争压力:4月预览的Anthropic Claude Mythos展示了基于海量算力和数据构建的能力,梁文锋由此断定,没有显著更大的资本基础,DeepSeek无法与之匹敌。
华为芯片的取舍
DeepSeek坚持让模型适配国产华为芯片,为此付出了巨大代价。该公司的训练和部署系统基于英伟达的CUDA软件构建,工程师需重写底层软件才能让其在华为硬件上高效运行。这一努力导致公司长达15个月未发布任何新一代模型——在顶级实验室每两到三个月就推出新模型的时代,这是一次异常漫长的停更。
这段空白期导致DeepSeek错过去年下半年Anthropic推出Claude Code后掀起的编程工具热潮。梁文锋在融资路演中对投资者表示,编程工具和AI聊天机器人都是通往通用人工智能道路上的临时站点,过度押注短期产品会分散对终极目标的关注。
梁文锋认为华为芯片将在几年内赶上英伟达的性能,DeepSeek应在此之前完成适配工作。华为直到去年才知道DeepSeek一直在私下测试其芯片,此后两家公司才开始直接合作。
美国市场份额增长
尽管模型发布出现空白期,DeepSeek现有模型在美国开发者市场正获得增长。该公司4月发布的旗舰模型V4,5月在Vercel的AI Gateway平台上占据17%的Token使用量,而此前一个月还不到1%。这使得DeepSeek成为该平台第三大模型提供商,仅次于Anthropic和谷歌。
轻量版V4 Flash的定价比同类Anthropic模型便宜20到50倍,梁文锋表示将维持这一定价策略。平台数据显示,增长势头持续至6月。
DeepSeek仍是唯一将所有模型底层代码完全开源的主流AI实验室,梁文锋将这一理念描述为防止AI被少数公司控制的关键。公司已建立员工持股计划,按融资估值分配股份。
对投资者而言,影响显而易见。DeepSeek的激进扩张和超低定价策略对OpenAI和Anthropic等美国AI领导者的利润率构成压力,而其转向国产芯片强化了中国半导体自给自足的叙事。英伟达——其H100和Blackwell GPU驱动着大部分大型AI训练——面临长期风险:如果中国实验室成功从其生态系统中脱钩,不过DeepSeek长达15个月的模型空白期也显示出这一转型的难度。
本文仅供参考,不构成投资建议。