DeepSeek huy động 7,4 tỷ USD, có kế hoạch tăng gấp đôi nhân sự sau sự kiện Claude

Đợt huy động 7,4 tỷ USD của DeepSeek — vòng gọi vốn lớn nhất từ trước đến nay của một startup AI Trung Quốc — được kích hoạt sau khi Lương Văn Phong nhận ra rằng công ty không thể cạnh tranh nếu thiếu nguồn lực vốn khổng lồ, sau khi xem bản xem trước Claude Mythos của Anthropic vào tháng 4.

Đợt huy động 7,4 tỷ USD của DeepSeek — vòng gọi vốn đơn lẻ lớn nhất từ trước đến nay của một startup AI Trung Quốc — được kích hoạt sau khi nhà sáng lập Lương Văn Phong đi đến kết luận rằng công ty không thể duy trì tham vọng nghiên cứu nếu thiếu nguồn lực vốn khổng lồ, sau khi xem xét bản xem trước Claude Mythos của Anthropic vào tháng 4, theo những người am hiểu sự việc. Công ty có trụ sở tại Hàng Châu, được định giá hơn 50 tỷ USD trong vòng gọi vốn này, có kế hoạch tăng gấp đôi đội ngũ nhân sự khoảng 300 người trên tất cả các bộ phận.

"Nhân loại hiện đang ở buổi bình minh của AGI," DeepSeek cho biết trong một tuyên bố trên WeChat. "Khi công nghệ tiến bộ, chúng tôi đang nỗ lực ít nhất để tăng gấp đôi quy mô của tất cả các bộ phận."

Lương đã đóng góp cá nhân khoảng 3 tỷ USD — 200 tỷ nhân dân tệ — chiếm khoảng 40% tổng số tiền huy động, đồng thời vẫn duy trì quyền kiểm soát cổ phần. Gã khổng lồ Internet Tencent và nhà sản xuất pin Contemporary Amperex Technology tham gia với tư cách nhà đầu tư tổ chức, cùng với Quỹ Đầu tư Công nghiệp Trí tuệ Nhân tạo Quốc gia Trung Quốc, cho thấy sự hậu thuẫn mạnh mẽ từ chính phủ. Công ty đang ngay lập tức mở đơn tuyển dụng cho 27 loại vị trí kỹ thuật và quản trị, bao gồm kỹ sư phát triển, kỹ sư dữ liệu, quản lý sản phẩm AI và nhân viên vận hành, với tất cả các vị trí đều mở cho thực tập sinh.

Đợt gọi vốn này đánh dấu một bước ngoặt chiến lược đối với DeepSeek, vốn hoạt động như một phòng thí nghiệm nghiên cứu tự cấp vốn trong ba năm sau khi các cuộc gặp của Lương với các nhà đầu tư tiềm năng vào năm 2023 không thành công khi ông nói với họ rằng công ty không có lộ trình thương mại hóa hoặc sản phẩm. Sự thay đổi trong cách tiếp cận được thúc đẩy bởi áp lực cạnh tranh: Claude Mythos của Anthropic, được xem trước vào tháng 4, đã thể hiện những khả năng được xây dựng trên nền tảng sức mạnh tính toán và dữ liệu khổng lồ mà Lương kết luận DeepSeek không thể sánh kịp nếu thiếu một nền tảng vốn lớn hơn đáng kể.

Sự đánh đổi với Chip Huawei

Cam kết của DeepSeek trong việc điều chỉnh các mô hình của mình cho phù hợp với chip nội địa Huawei đã phải trả một cái giá đáng kể. Các hệ thống huấn luyện và triển khai của công ty được xây dựng xung quanh phần mềm CUDA của Nvidia, buộc các kỹ sư phải viết lại phần mềm nền tảng để chạy hiệu quả trên phần cứng Huawei. Nỗ lực này đã dẫn đến khoảng trống 15 tháng mà không phát hành bất kỳ mô hình thế hệ mới nào — một sự gián đoạn bất thường trong kỷ nguyên mà các phòng thí nghiệm hàng đầu tung ra các mô hình mới mỗi hai đến ba tháng.

Khoảng trống này khiến DeepSeek bỏ lỡ cuộc bùng nổ công cụ lập trình sau khi Anthropic ra mắt Claude Code vào nửa cuối năm ngoái. Lương đã nói với các nhà đầu tư trong chuyến roadshow gọi vốn rằng các công cụ lập trình và chatbot AI đều là những điểm dừng chân tạm thời trên con đường dẫn đến trí tuệ nhân tạo tổng quát, và việc đặt cược lớn vào các sản phẩm ngắn hạn sẽ làm xao nhãng mục tiêu cuối cùng.

Lương tin rằng chip của Huawei sẽ sánh kịp hiệu suất của Nvidia trong vòng vài năm tới, và DeepSeek nên hoàn thành công việc thích ứng trước mốc thời gian đó. Huawei chỉ biết rằng DeepSeek đã thử nghiệm chip của mình một cách riêng tư vào năm ngoái, sau đó hai công ty bắt đầu hợp tác trực tiếp với nhau.

Gia tăng thị phần tại Mỹ

Bất chấp khoảng trống phát hành mô hình, các mô hình hiện có của DeepSeek đang thu hút được sự chú ý tại thị trường nhà phát triển Mỹ. Mô hình chủ lực V4, phát hành vào tháng 4, đã chiếm 17% lượng token sử dụng trên nền tảng AI Gateway của Vercel trong tháng 5, tăng từ mức dưới 1% của tháng trước đó. Điều này đưa DeepSeek trở thành nhà cung cấp mô hình lớn thứ ba trên nền tảng này, chỉ sau Anthropic và Google.

Biến thể Flash nhẹ V4 có giá rẻ hơn từ 20 đến 50 lần so với các mô hình tương đương của Anthropic — một chiến lược định giá mà Lương cho biết sẽ duy trì. Sự tăng trưởng tiếp tục kéo dài sang tháng 6, theo dữ liệu nền tảng.

DeepSeek vẫn là phòng thí nghiệm AI lớn duy nhất công khai mã nguồn mở hoàn toàn của tất cả các mô hình — một triết lý mà Lương mô tả là điều cần thiết để ngăn chặn AI bị kiểm soát bởi một số ít công ty. Công ty đã thiết lập kế hoạch sở hữu cổ phiếu cho nhân viên, phân bổ cổ phần theo mức định giá của vòng gọi vốn.

Đối với các nhà đầu tư, những tác động rất rõ ràng. Việc mở rộng mạnh mẽ và chiến lược định giá cực thấp của DeepSeek gây áp lực lên biên lợi nhuận của các nhà lãnh đạo AI Mỹ bao gồm OpenAI và Anthropic, trong khi việc chuyển hướng sang chip nội địa củng cố câu chuyện tự cung tự cấp chất bán dẫn của Trung Quốc. Nvidia, với các GPU H100 và Blackwell cung cấp năng lượng cho hầu hết các đợt huấn luyện AI quy mô lớn, đối mặt với rủi ro dài hạn nếu các phòng thí nghiệm Trung Quốc thành công trong việc tách khỏi hệ sinh thái của hãng — mặc dù khoảng trống mô hình 15 tháng tại DeepSeek cho thấy sự khó khăn của quá trình chuyển đổi đó.

Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.