SenseTime (00020.HK) đang nhắm mục tiêu vào chi phí vận hành trí tuệ nhân tạo cao với một mô hình mới giúp giảm 60% lượng tiêu thụ token, một động thái nhằm cải thiện hiệu quả trong một thị trường đầy tính cạnh tranh.
Công ty đã công bố việc triển khai chính thức mô hình tác nhân đa phương thức nhẹ thế hệ mới, 'SenseNova 6.7 Flash-Lite'. Theo thông báo, kiến trúc của mô hình đạt được bước nhảy vọt về khả năng tác nhân với kích thước tham số nhỏ hơn, giảm đáng kể mức tiêu thụ token trong quá trình suy luận, đặc biệt là trong các kịch bản tìm kiếm thông tin.
Được xây dựng trên kiến trúc đa phương thức gốc, mô hình có thể trực tiếp diễn giải các bố cục trang web phức tạp, cấu trúc tài liệu và biểu đồ tài chính, đây là điểm khác biệt chính so với các mô hình yêu cầu lớp chuyển đổi hình ảnh sang văn bản trung gian. Điều này cho phép nó xử lý tốt hơn các tác vụ phức tạp chuỗi dài như phân tích dữ liệu, nghiên cứu chuyên sâu và tạo bài thuyết trình. Việc giảm 60% mức sử dụng token được đối chuẩn so với các mô hình tác nhân chỉ có văn bản thực hiện các nhiệm vụ tương tự.
Việc thúc đẩy hiệu quả cao hơn giải quyết một vấn đề quan trọng trong ngành AI: chi phí triển khai các mô hình quy mô lớn đắt đỏ. Bằng cách giảm mức tiêu thụ token, SenseTime có thể làm cho các giải pháp doanh nghiệp của mình trở nên hấp dẫn hơn đối với khách hàng, định vị vị thế tốt hơn để cạnh tranh với các đối thủ lớn như OpenAI, Google và Anthropic. Tiến bộ công nghệ này có thể củng cố lợi thế cạnh tranh của SenseTime và có khả năng được các nhà đầu tư nhìn nhận tích cực như một động lực tiềm năng cho tăng trưởng doanh thu.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.