LongCat-2.0 của Meituan là mô hình nghìn tỷ tham số đầu tiên được huấn luyện hoàn toàn trên cụm GPU nội địa Trung Quốc, một cột mốc thách thức các giả định về sự phụ thuộc của Trung Quốc vào phần cứng Nvidia và gây áp lực lên các phòng thí nghiệm AI phương Tây về định giá.
Meituan đã phát hành và công bố mã nguồn mở LongCat-2.0, một mô hình 1.600 tỷ tham số với trung bình 48 tỷ tham số được kích hoạt và ngữ cảnh gốc 1 triệu token, được huấn luyện từ đầu trên cụm GPU nội địa gồm 50.000 thẻ, công ty cho biết vào cuối tháng Sáu.
"Điều này chứng tỏ rằng các phòng thí nghiệm AI Trung Quốc giờ đây có thể huấn luyện các mô hình quy mô tiên phong mà không cần dựa vào phần cứng Nvidia," một người quen thuộc với dự án cho biết với điều kiện giấu tên vì các chi tiết chưa được công bố.
LongCat-2.0 sử dụng kiến trúc Mixture-of-Experts, kích hoạt từ 33 tỷ đến 56 tỷ tham số cho mỗi token — một thiết kế giúp chi phí suy luận ở mức gần với một mô hình dense 48 tỷ tham số trong khi vẫn duy trì năng lực của một hệ thống 1.600 tỷ tham số. Cửa sổ ngữ cảnh 1 triệu token ngang bằng với mức dài nhất hiện có từ các phòng thí nghiệm tiên phong phương Tây. Meituan chưa công bố điểm benchmark, chi phí huấn luyện hay giá suy luận.
Việc phát hành mã nguồn mở đặt Meituan vào vị trí cạnh tranh trực tiếp với các phòng thí nghiệm AI Trung Quốc là Zhipu AI và Moonshot AI, khi các mô hình GLM 5.2 và Kimi K2.7 Code của họ đã được doanh nghiệp áp dụng rộng rãi trong những tuần gần đây. Điều này cũng gây áp lực lên các phòng thí nghiệm phương Tây như Anthropic và OpenAI, vốn có sức mạnh định giá phụ thuộc vào việc duy trì khoảng cách hiệu suất so với các giải pháp thay thế trọng số mở.
Bước đột phá về GPU nội địa
Việc huấn luyện một mô hình nghìn tỷ tham số đòi hỏi hàng chục nghìn GPU chạy song song trong nhiều tuần — một nhiệm vụ thường yêu cầu các cụm H100 hoặc B200 của Nvidia với kết nối NVLink độc quyền. Cụm 50.000 thẻ của Meituan đã sử dụng bộ tăng tốc nội địa, mặc dù công ty không chỉ rõ nhà cung cấp chip hoặc kiến trúc. Huawei Ascend 910B và 910C là những ứng cử viên khả dĩ nhất, vì đây là những chip AI sản xuất tại Trung Quốc duy nhất có sẵn ở quy mô lớn.
Cột mốc này có ý nghĩa quan trọng vì các biện pháp kiểm soát xuất khẩu của Mỹ, được thắt chặt gần đây nhất vào tháng 1 năm 2025, hạn chế việc bán H100 và B200 của Nvidia cho Trung Quốc. Nếu Meituan huấn luyện thành công một mô hình nghìn tỷ tham số cạnh tranh trên chip nội địa, điều đó cho thấy các phòng thí nghiệm Trung Quốc đã tìm ra giải pháp thay thế — một giải pháp có thể đẩy nhanh tiến độ phát triển AI của nước này độc lập với chuỗi cung ứng phương Tây.
Áp lực định giá lên các phòng thí nghiệm phương Tây
LongCat-2.0 gia nhập thị trường nơi các mô hình trọng số mở của Trung Quốc đang ngày càng chiếm ưu thế. GLM 5.2 của Zhipu AI, được phát hành ngày 13 tháng 6 theo giấy phép MIT, có giá 1,40 USD cho mỗi triệu token đầu vào và 4,40 USD cho mỗi triệu token đầu ra — bằng khoảng một phần ba đến một phần sáu giá của Opus 4.8 từ Anthropic. Kimi K2.7 Code của Moonshot AI, phát hành ngày 12 tháng 6, cũng theo chiến lược định giá tương tự. Coinbase tiết lộ ngày 27 tháng 6 rằng hiện công ty này đang mặc định sử dụng hai mô hình này cho các kỹ sư của mình, cắt giảm 50% chi tiêu cho AI.
Meituan chưa công bố giá hoặc hiệu suất benchmark của LongCat-2.0, khiến việc so sánh trực tiếp là không thể. Quyết định công bố mã nguồn mở của công ty theo một giấy phép chưa được xác định cho thấy họ sẽ cạnh tranh bằng khả năng tiếp cận thay vì lợi thế độc quyền. Đối với bản thân Meituan, mô hình này đại diện cho một tài sản chiến lược: gã khổng lồ giao đồ ăn và dịch vụ địa phương có thể triển khai LongCat-2.0 nội bộ cho các hệ thống đề xuất, tối ưu hóa hậu cần và tự động hóa dịch vụ khách hàng, qua đó có thể giảm sự phụ thuộc vào các nhà cung cấp AI bên thứ ba.
Hàm ý cho nhà đầu tư
Thị trường AI trọng số mở đang phân mảnh theo các ranh giới địa chính trị. Các doanh nghiệp phương Tây hiện phải đối mặt với sự lựa chọn giữa các mô hình tiên phong chi phí cao từ các phòng thí nghiệm Mỹ và các giải pháp thay thế chi phí thấp hơn từ Trung Quốc nhưng tiềm ẩn rủi ro về quy định và xuất xứ. Sự gia nhập của Meituan bổ sung thêm một lựa chọn khác — một mô hình được huấn luyện trên phần cứng nội địa bởi một công ty đại chúng không chịu tác động trực tiếp từ các biện pháp kiểm soát xuất khẩu của Mỹ.
Cổ phiếu Meituan giao dịch trên Sở Giao dịch Chứng khoán Hồng Kông. Công ty không công bố riêng chi tiêu cho AI trong các báo cáo tài chính, nhưng chi phí R&D hàng năm của họ vào khoảng 21,1 tỷ nhân dân tệ (2,9 tỷ USD) trong năm 2025, theo báo cáo thường niên gần đây nhất. Quá trình huấn luyện LongCat-2.0 có khả năng đã tiêu tốn một phần đáng kể ngân sách đó, mặc dù công ty chưa công bố chi phí.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.