SpaceX không thể tự vận hành trung tâm dữ liệu Colossus 1 của mình để huấn luyện Grok, vì vậy họ đã cho Anthropic thuê toàn bộ cơ sở này với giá 1,25 tỷ USD mỗi tháng.
Trung tâm dữ liệu Colossus 1 của SpaceX tại Memphis được thiết kế để huấn luyện các mô hình Grok tiên tiến nhất của công ty. Thay vào đó, nó trở thành một nguồn doanh thu 1,25 tỷ USD mỗi tháng cho Anthropic sau khi các kỹ sư của SpaceX không thể khắc phục các vấn đề về độ trễ và sự không tương thích phần cứng, theo những người quen thuộc với vấn đề này cho biết.
"SpaceX xác định rằng cơ sở này sẽ có giá trị hơn khi tạo ra doanh thu thay vì bị sử dụng dưới công suất," Bret Johnsen, giám đốc tài chính của SpaceX, cho biết trong một tuyên bố. Ông nói thêm rằng công ty chưa từ bỏ công việc AI nội bộ và vẫn giữ quyền thu hồi công suất với thông báo trước 90 ngày.
Cơ sở hơn 300 megawatt này chứa hơn 220.000 GPU Nvidia thuộc nhiều thế hệ chip khác nhau — các hệ thống Hopper và Blackwell cùng với các bộ tăng tốc cũ hơn. Sự không đồng nhất về phần cứng đó đã tạo ra các điểm nghẽn trong quá trình huấn luyện phân tán, nơi các chip chậm hơn buộc các chip nhanh hơn phải chờ đợi. Colossus 2 và 3, được xây dựng đồng nhất hơn xung quanh chip Blackwell, đã tránh được vấn đề này. Các kết nối mạng giữa Colossus 1 và hai khuôn viên còn lại, cách nhau hơn 10 dặm, đã gây ra độ trễ khiến việc huấn luyện liên khu vực trở nên bất khả thi.
Thỏa thuận cho thuê này đã biến SpaceX từ một nhà xây dựng AI thành một chủ cho thuê AI. Kết hợp với thỏa thuận 920 triệu USD hàng tháng với Google bắt đầu từ tháng 10, SpaceX đang thu về khoảng 2,17 tỷ USD mỗi tháng — tương đương 26 tỷ USD hàng năm — từ cơ sở hạ tầng tính toán mà ban đầu công ty xây dựng cho chính mình. Các hợp đồng, với tổng giá trị hơn 700 tỷ USD, đã trở thành tâm điểm trong chương trình roadshow IPO của SpaceX, nhắm đến mức định giá khoảng 750 tỷ USD.
Tại sao Colossus 1 không thể huấn luyện Grok
SpaceX đã xây dựng Colossus 1 trong 122 ngày — một tốc độ mà công ty tự hào trong suốt roadshow IPO vượt xa mức trung bình của ngành. Nhưng tốc độ đi kèm với cái giá phải trả. Hàng tồn kho phần cứng hỗn hợp của cơ sở, kết hợp các bộ tăng tốc Nvidia cũ với các chip Hopper và Blackwell mới hơn, đã tạo ra sự không tương thích về hiệu suất làm giảm hiệu quả huấn luyện. Trong các cụm AI phân tán, toàn bộ hệ thống chạy ở tốc độ của thành phần chậm nhất.
Cơ sở hạ tầng mạng kết nối Colossus 1 với hai khuôn viên còn lại càng làm trầm trọng thêm vấn đề. Huấn luyện các mô hình tiên tiến đòi hỏi các kết nối cực nhanh, độ trễ thấp giữa các nút. Với Colossus 1 cách các địa điểm khác hơn 10 dặm, các thiết bị mạng cũ không thể duy trì tốc độ đồng bộ hóa cần thiết cho các đợt huấn luyện quy mô lớn.
Kết quả: Cụm huấn luyện AI tham vọng nhất của SpaceX đã bị mắc kẹt một cách hiệu quả. Thay vì đầu tư vào các nâng cấp mạng tốn kém và tiêu chuẩn hóa phần cứng, công ty đã chọn kiếm tiền từ công suất này ra bên ngoài.
Mảng kinh doanh tình cờ trị giá 26 tỷ USD
Anthropic đang trả 1,25 tỷ USD mỗi tháng cho đến tháng 5 năm 2029 để truy cập vào các cơ sở Colossus 1 và Colossus II — khoảng 45 tỷ USD trong ba năm. Thỏa thuận này mang lại cho Anthropic một giải pháp tạm thời khi công ty đang vật lộn với nhu cầu khó dự đoán đối với Claude, Claude Code và dòng mô hình Opus. Người dùng đã báo cáo về các giới hạn tốc độ và hiệu suất suy giảm trong giờ cao điểm khi công ty bị hạn chế về công suất trong nhiều tháng.
Thỏa thuận này chỉ là tạm thời: hợp đồng thuê 180 ngày với điều khoản hủy bỏ 90 ngày từ hai phía. Musk từng nói rằng SpaceX có thể thu hồi công suất "nếu tính toán trở nên cực kỳ khan hiếm." Nhưng sự suy giảm của Grok — lượt tải xuống giảm từ 20 triệu vào tháng 1 xuống còn 8,3 triệu vào tháng 4, với tỷ lệ chuyển đổi trả phí chỉ bằng 1/5 so với ChatGPT — khiến việc thu hồi đó trở nên kém cấp bách hơn.
Đối với các nhà đầu tư, sự chuyển hướng này đặt ra câu hỏi về câu chuyện cơ sở hạ tầng AI của SpaceX. Công ty đã trình bày việc xây dựng trung tâm dữ liệu như một lợi thế chiến lược trong các buổi roadshow IPO, nhấn mạnh tốc độ và quy mô xây dựng. Việc tiết lộ rằng những hạn chế kỹ thuật của Colossus 1 đã buộc phải cho thuê ngoài — cho một đối thủ cạnh tranh, không hơn không kém — đã làm phức tạp câu chuyện đó. Các nhà phê bình cũng đặt câu hỏi liệu giá cho thuê có vượt quá giá thị trường hay không và liệu cấu trúc thỏa thuận có liên quan đến tài chính vòng tròn giữa các thực thể liên kết với Musk hay không.
Cổ phiếu SpaceX mở cửa ở mức khoảng 150 USD trên Nasdaq, cao hơn 11% so với giá IPO, và tăng vọt tới 30% trong phiên giao dịch đầu ngày trước khi đóng cửa tăng 19%. Cổ phiếu này đã đẩy vốn hóa thị trường của SpaceX lên trên 2,2 nghìn tỷ USD.
Bài học rộng hơn cho ngành AI: Sở hữu phần cứng không đồng nghĩa với việc có thể sử dụng nó. Địa lý, mạng lưới và sự phức tạp của tích hợp có thể biến một trung tâm dữ liệu thành công suất bị mắc kẹt. Khi các phòng thí nghiệm tiên tiến cạnh tranh cho các cụm 100.000 GPU trở lên, những ràng buộc vật lý của tính toán — không chỉ kiến trúc mô hình — đang trở thành điểm nghẽn mang tính quyết định.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.