Trong cuộc đua trí tuệ nhân tạo, một phong trào ngược lại đang trỗi dậy, ưu tiên không phải mô hình lớn nhất mà là mô hình hiệu quả nhất.
Trong cuộc đua trí tuệ nhân tạo, một phong trào ngược lại đang trỗi dậy, ưu tiên không phải mô hình lớn nhất mà là mô hình hiệu quả nhất.

Mô hình “SenseNova 6.7 Flash-Lite” thế hệ mới của SenseTime đang cắt giảm 60% lượng tiêu thụ token, báo hiệu một bước chuyển mình rộng lớn hơn của ngành công nghiệp: rời xa việc xây dựng các mô hình AI lớn hơn và hướng tới các hệ thống có thể hoạt động trong các ràng buộc thực tế của doanh nghiệp về chi phí và chủ quyền dữ liệu.
“Tại Châu Á, khi tôi nhìn vào sự bùng nổ AI, chủ quyền đang được đo lường nhiều hơn cả các mô hình,” Hans Dekkers, Tổng Giám đốc IBM Châu Á Thái Bình Dương, cho biết trong một cuộc phỏng vấn gần đây, lưu ý rằng 99% dữ liệu doanh nghiệp vẫn chưa được AI chạm tới do lo ngại về lộ lọt dữ liệu.
Mô hình SenseNova đạt được hiệu quả thông qua kiến trúc đa phương thức gốc giúp loại bỏ lớp chuyển đổi hình ảnh sang văn bản trung gian, trực tiếp diễn giải các tài liệu và biểu đồ phức tạp. Điều này trái ngược với việc mở rộng quy mô bằng vũ lực thấy ở các mô hình từ các đối thủ cạnh tranh như Tencent và DeepSeek, thay vào đó nhắm mục tiêu vào các luồng công việc doanh nghiệp cụ thể, có giá trị cao.
Động thái này phản ánh một chiến lược doanh nghiệp đang phát triển là triển khai hàng chục mô hình nhỏ hơn, chuyên dụng thay vì một mô hình duy nhất, toàn năng. Sự thay đổi này tạo ra một mặt trận cạnh tranh mới trong AI: các nền tảng điều phối có thể quản lý sự kết hợp của các mô hình, một thị trường mà IBM đang nhắm tới và là nơi các mô hình hiệu quả, chi phí thấp như của SenseTime có thể thấy nhu cầu đáng kể.
Trong khi phần lớn thị trường tập trung vào hiệu suất điểm chuẩn, các doanh nghiệp đối mặt với sự không phù hợp về cấu trúc khi cố gắng triển khai AI đa năng, quy mô lớn. Sự phân mảnh về quy định, đặc biệt là trên khắp Châu Á Thái Bình Dương, làm cho chủ quyền dữ liệu trở thành một ràng buộc hoạt động chính. Các công ty thường miễn cưỡng để lộ dữ liệu độc quyền cho các mô hình nguyên khối, bên ngoài, tạo ra rào cản cho việc áp dụng AI. “Sự lựa chọn không phải là giữa tuân thủ và đổi mới… mà là về việc duy trì quyền kiểm soát trên toàn bộ kiến trúc kỹ thuật số của bạn,” Dekkers nói. Sự do dự này đã khiến phần lớn dữ liệu doanh nghiệp có giá trị bị cô lập và không được các hệ thống AI sử dụng, đại diện cho một thị trường khổng lồ, chưa được khai thác cho các công cụ có thể hoạt động trong các ranh giới này.
Nhu cầu về AI hiệu quả, năng lượng thấp đang tạo ra những cơ hội mới trong cái mà Didier Lasserre của GSI Technology gọi là “thị trường hàng tỷ đô la”. Đơn vị xử lý liên kết (APU) Gemini II của GSI cung cấp một nghiên cứu điển hình rõ ràng. Trong một bằng chứng khái niệm về quốc phòng gần đây, con chip đã đạt được thời gian tạo token đầu tiên khoảng ba giây chỉ với 30 watt điện năng hệ thống, một chỉ số quan trọng cho giám sát bằng máy bay không người lái. Hiệu suất này trong một môi trường hạn chế về năng lượng đã dẫn trực tiếp đến một hợp đồng thắng lợi và đang được tận dụng cho một dự án thành phố thông minh mới. Sự thành công của phần cứng chuyên dụng như của GSI, được tài trợ bởi sự tăng trưởng 22% trong mảng kinh doanh SRAM truyền thống, chứng minh tính khả thi của việc xây dựng các giải pháp AI có mục tiêu ưu tiên độ trễ và hiệu quả hơn là quy mô thô, chính là phân khúc mà SenseTime đang nhắm tới với mô hình hạng nhẹ của mình.
Cách tiếp cận của SenseTime với SenseNova 6.7 Flash-Lite phù hợp trực tiếp vào mô hình mới đang nổi lên này. Bằng cách xây dựng một mô hình vốn dĩ rẻ hơn để vận hành—cắt giảm 60% lượng sử dụng token trong các nhiệm vụ tìm kiếm thông tin—công ty đang đặt cược rằng các doanh nghiệp sẽ ủng hộ việc tiết kiệm chi phí và kiểm soát hơn là uy tín của việc sử dụng mô hình lớn nhất hiện có. Đây là một phần của xu hướng lớn hơn hướng tới môi trường "tự mang mô hình của riêng bạn", nơi các công ty sử dụng nền tảng điều phối để triển khai công cụ tốt nhất cho từng công việc cụ thể, cho dù đó là một gã khổng lồ toàn cầu như GPT-4, một đối thủ khu vực từ Alibaba hay một hệ thống nội bộ chuyên dụng. Trong bối cảnh này, người chơi giá trị nhất có thể không phải là người có mô hình lớn nhất, mà là người cung cấp giải pháp hiệu quả và tuân thủ nhất cho một vấn đề kinh doanh cụ thể.
Bài viết này chỉ nhằm mục đích thông tin và không cấu thành lời khuyên đầu tư.