Các mô hình AI Trung Quốc đang chiếm thị phần ngày càng lớn trong lưu lượng định tuyến suy luận khi chi phí API của họ chỉ bằng một phần nhỏ so với các đối thủ Mỹ, định hình lại nền kinh tế của thị trường AI.
Các mô hình AI Trung Quốc đang chiếm thị phần ngày càng lớn trong lưu lượng định tuyến suy luận khi chi phí API của họ chỉ bằng một phần nhỏ so với các đối thủ Mỹ, định hình lại nền kinh tế của thị trường AI.

Các mô hình AI Trung Quốc đang chiếm thị phần ngày càng lớn trong lưu lượng định tuyến suy luận khi chi phí API của họ chỉ bằng một phần nhỏ so với các đối thủ Mỹ, định hình lại nền kinh tế của thị trường AI.
Các mô hình AI Trung Quốc từ DeepSeek, Qwen của Alibaba và ByteDance đang giành được thị phần ngày càng lớn trong các truy vấn định tuyến mô hình khi các nhà phát triển chuyển hướng khối lượng công việc không nhạy cảm sang nhà cung cấp suy luận rẻ nhất, đe dọa sức mạnh định giá của OpenAI, Anthropic và Google.
Xu hướng này được nêu bật trong một báo cáo ngày 8 tháng 6 của CNBC do Deirdre Bosa thực hiện, phân tích cách các nền tảng định tuyến mô hình ngày càng chuyển hướng lưu lượng sang các nhà cung cấp Trung Quốc khi khoảng cách chi phí ngày càng mở rộng trong toàn ngành.
Định giá API của DeepSeek cho mô hình V3 của họ ở mức khoảng 0,14 USD trên một triệu token đầu vào, so với GPT-4o của OpenAI ở mức 2,50 USD — mức chiết khấu 94%. Qwen 2.5 của Alibaba và các mô hình Doubao của ByteDance mang lại lợi thế định giá tương tự, khiến chúng trở thành lựa chọn mặc định cho các nền tảng định tuyến ưu tiên tối ưu chi phí hơn năng lực thô.
Sự dịch chuyển này đe dọa mô hình doanh thu của các nhà lãnh đạo AI Mỹ, những công ty đã xây dựng hoạt động kinh doanh dựa trên định giá API cao cấp. Riêng OpenAI dự kiến sẽ tạo ra hơn 10 tỷ USD doanh thu trong năm nay, phần lớn đến từ truy cập API. Nếu các nền tảng định tuyến tiếp tục chuyển hướng lưu lượng sang các nhà cung cấp Trung Quốc, các công ty Mỹ có thể buộc phải giảm giá, làm thu hẹp biên lợi nhuận trên toàn ngành.
Cách Định Tuyến Mô Hình Định Hình Lại Thị Trường Suy Luận
Các nền tảng định tuyến mô hình như OpenRouter và Together AI tự động đánh giá các truy vấn đến và chuyển hướng chúng đến mô hình cung cấp sự cân bằng tốt nhất giữa năng lực và chi phí. Đối với các tác vụ như tóm tắt, dịch thuật và tạo mã cơ bản — chiếm phần lớn khối lượng suy luận — các mô hình Trung Quốc thường mang lại chất lượng tương đương với chi phí chỉ bằng một phần nhỏ. Điều này tạo ra lợi thế cấu trúc cho các nhà cung cấp Trung Quốc mà các phòng thí nghiệm Mỹ khó có thể đối phó nếu không cắt giảm giá của chính họ.
Ai Được Lợi, Ai Mất Lợi
Những người hưởng lợi lớn nhất là các nhà cung cấp hạ tầng đám mây hỗ trợ định tuyến đa mô hình, bao gồm AWS, Google Cloud và Alibaba Cloud, những công ty kiếm doanh thu tính toán bất kể mô hình nào thắng trong quyết định định tuyến. Nvidia cũng được hưởng lợi từ nhu cầu tính toán tổng thể gia tăng — mọi truy vấn suy luận vẫn yêu cầu chu kỳ GPU và các nền tảng định tuyến thúc đẩy mức sử dụng tổng thể cao hơn.
Những người mất nhiều nhất là các phòng thí nghiệm AI Mỹ đã đầu tư hàng tỷ đô la vào đào tạo các mô hình tiên tiến nhưng nay phải đối mặt với một cuộc chiến giá cả mà họ có thể khó giành chiến thắng. OpenAI đã huy động hơn 20 tỷ USD tài trợ, phần lớn được chi cho chi phí tính toán đào tạo và nhân tài. Nếu các nền tảng định tuyến làm cho suy luận trở thành hàng hóa, nền kinh tế từng biện minh cho những khoản đầu tư đó bắt đầu suy yếu.
Đối với các nhà đầu tư, câu hỏi chính là liệu các công ty AI Mỹ có thể duy trì sức mạnh định giá của họ hay không. OpenAI, Anthropic và DeepMind của Google đã dựa vào định giá API cao cấp để tài trợ cho các đợt đào tạo quy mô lớn. Mô hình V3 của DeepSeek được đào tạo với chi phí tính toán khoảng 6 triệu USD, so với hàng trăm triệu USD chi cho các mô hình Mỹ tương đương — một cấu trúc chi phí cho phép các nhà cung cấp Trung Quốc phá giá định giá Mỹ một cách bền vững. Các nhà phân tích của Morgan Stanley đã coi định giá suy luận là rủi ro chính đối với định giá hạ tầng AI, lưu ý rằng một cuộc chiến giá cả kéo dài có thể làm giảm lợi nhuận dự kiến từ 200 tỷ USD chi tiêu vốn cho trung tâm dữ liệu AI được lên kế hoạch đến năm 2027.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.