Khoảng cách giữa các mô hình AI tiên tiến của Trung Quốc và Mỹ đã thu hẹp xuống còn vài tháng, thay vì nhiều năm, khi các hệ thống mã nguồn mở từ Zhipu và DeepSeek đạt điểm chuẩn chỉ kém các mô hình đóng tốt nhất một sải tay.
Khoảng cách giữa các mô hình AI tiên tiến của Trung Quốc và Mỹ đã thu hẹp xuống còn vài tháng, thay vì nhiều năm, khi các hệ thống mã nguồn mở từ Zhipu và DeepSeek đạt điểm chuẩn chỉ kém các mô hình đóng tốt nhất một sải tay.

Khoảng cách giữa các mô hình AI tiên tiến của Trung Quốc và Mỹ đã thu hẹp xuống còn vài tháng, thay vì nhiều năm, khi các hệ thống mã nguồn mở từ Zhipu và DeepSeek đạt điểm chuẩn chỉ kém các mô hình đóng tốt nhất một sải tay.
Elon Musk dự đoán các mô hình ngôn ngữ lớn của Trung Quốc có thể đạt ngang bằng với Fable của Anthropic vào quý 1 năm 2027, để đáp lại một bài đăng trên mạng xã hội về việc GLM-5.2 của Zhipu AI đang thu hẹp khoảng cách. Giám đốc điều hành Google DeepMind, Demis Hassabis, cũng từng nhận định rằng các mô hình AI của Trung Quốc có thể "chỉ chậm hơn vài tháng" so với các đối thủ nước ngoài, theo những phát biểu trước đây được truyền thông nhà nước Trung Quốc trích dẫn.
"Tốc độ cải thiện mới là điều đáng chú ý," Rachel Kim, một nhà phân tích tại Edgen, người theo dõi hạ tầng AI, cho biết. "Các phòng thí nghiệm Trung Quốc đang nén những gì từng mất nhiều năm thành vài quý, và họ làm điều đó trên chip bán dẫn nội địa."
Zhipu AI đã phát hành GLM-5.2 vào ngày 16 tháng 6 theo giấy phép MIT, giúp mô hình này được sử dụng miễn phí cho mục đích thương mại. Mô hình đạt 81,0 điểm trên Terminal-Bench 2.1, tăng từ 62,0 của GLM-5.1 — một bước nhảy 31% chỉ sau một bản phát hành nhỏ. Trên SWE-bench Pro, mô hình đạt 62,1 điểm, vượt nhẹ qua GPT-5.5, và chỉ kém Opus 4.8 của Anthropic một điểm trên FrontierSWE. Mô hình này có cửa sổ ngữ cảnh 1 triệu token và chi phí chỉ bằng khoảng một phần sáu so với các mô hình đóng hàng đầu của Mỹ tính trên mỗi token.
V4-Pro của DeepSeek, một mô hình hỗn hợp chuyên gia (mixture-of-experts) với 1,6 nghìn tỷ tham số, kích hoạt 49 tỷ tham số cho mỗi token, đạt 80,6% trên SWE-bench Verified. Với mức giá khoảng 87 cent cho mỗi triệu token đầu ra, chi phí chỉ bằng khoảng một phần ba mươi so với mức giá của các mô hình tiên tiến. Các trọng số (weights) được công khai. Gia đình mô hình Qwen của Alibaba đã vượt mốc 1 tỷ lượt tải xuống trên Hugging Face vào tháng 1, vượt qua Llama của Meta để trở thành dòng mô hình mã nguồn mở được tải nhiều nhất toàn cầu.
Ba Bản Phát Hành, Bốn Tháng
Nhịp độ phát hành mô hình của Trung Quốc cho thấy tốc độ này. GLM-5 ra mắt vào tháng 2. GLM-5.1 tiếp nối vào tháng 3, nâng điểm số lập trình nội bộ từ 35,4 lên 45,3 — một cải thiện 28%. GLM-5.2 ra mắt vào tháng 6, gần như tăng gấp đôi kết quả Terminal-Bench một lần nữa. Mỗi bước đều được huấn luyện trên chip bán dẫn Trung Quốc, với một số bằng chứng cho thấy toàn bộ hệ thống hiện không sử dụng Nvidia.
Năm 2023, các mô hình mã nguồn mở tụt hậu so với các mô hình đóng tiên tiến hai năm. Năm 2024, khoảng cách đó thu hẹp còn một năm. Năm 2025, còn sáu tháng. Ngày nay, trên các điểm chuẩn quan trọng cho công việc kỹ thuật, khoảng cách được tính bằng tuần.
Giá Trị Sẽ Dồn Về Đâu Tiếp Theo
Khi các trọng số mô hình tiến gần đến mức giá hàng hóa (commodity pricing), kinh tế học chuyển dịch sang suy luận (inference) và hạ tầng. Suy luận hiện tiêu thụ khoảng hai phần ba tổng sức mạnh tính toán AI, tăng từ một phần ba vào năm 2023, theo ước tính của ngành. Tập đoàn Nebius Group báo cáo một khách hàng đã cắt giảm chi phí suy luận tới 26 lần khi sử dụng các mô hình mã nguồn mở trên nền tảng của họ. Cloudflare hiện phục vụ hơn 70 mô hình từ mạng biên (edge network) của mình.
Giám đốc điều hành Microsoft, Satya Nadella, đã định hình sự chuyển dịch này trong một bài luận ngày 14 tháng 6, lập luận rằng các công ty phải xây dựng cả "vốn nhân lực" lẫn "vốn token" — năng lực AI mà họ sở hữu thay vì đi thuê. Lời cảnh báo của ông dành cho nhân viên: tránh chạy mọi tác vụ qua một mô hình tiên tiến đắt đỏ khi một mô hình chuyên biệt rẻ hơn có thể làm được.
Đối với các nhà đầu tư, khoảng cách thu hẹp đặt ra câu hỏi về 176 tỷ đô la Mỹ khấu hao tiềm ẩn chưa được ghi nhận trong ngành công nghiệp trung tâm dữ liệu mà Michael Burry đã cảnh báo. Nếu các mô hình AI tiên tiến có thể chạy trên một máy tính để bàn DGX Spark trị giá 4.700 đô la Mỹ — máy Grace Blackwell của Nvidia với 128 gigabyte bộ nhớ hợp nhất — thì đường cầu suy luận tập trung vốn là cơ sở cho lịch trình khấu hao 5 năm có thể tăng trưởng chậm hơn so với các bảng tính dự kiến. Khoảng một nửa số trung tâm dữ liệu của Mỹ dự kiến xây dựng vào năm 2026 đã phải đối mặt với việc trì hoãn hoặc hủy bỏ, và các thị trường dự đoán (prediction markets) đặt tỷ lệ cược về một lệnh cấm vận liên bang đối với các ưu đãi cho trung tâm dữ liệu lớn trước năm 2027 ở mức khoảng 1/3.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.