Chi tiêu AI của các tập đoàn Mỹ đang vượt khỏi tầm kiểm soát, và một công ty khởi nghiệp mới 8 tháng tuổi với cách tiếp cận lấy cảm hứng từ khoa học thần kinh về trí nhớ vừa huy động được 98 triệu USD để giải quyết vấn đề này.
Chi tiêu AI của các tập đoàn Mỹ đang vượt khỏi tầm kiểm soát, và một công ty khởi nghiệp mới 8 tháng tuổi với cách tiếp cận lấy cảm hứng từ khoa học thần kinh về trí nhớ vừa huy động được 98 triệu USD để giải quyết vấn đề này.

Chi tiêu AI của các tập đoàn Mỹ đang vượt khỏi tầm kiểm soát, và một công ty khởi nghiệp mới 8 tháng tuổi với cách tiếp cận lấy cảm hứng từ khoa học thần kinh về trí nhớ vừa huy động được 98 triệu USD để giải quyết vấn đề này.
Engram, một công ty khởi nghiệp AI có các mô hình có thể sánh ngang với các phòng thí nghiệm hàng đầu trong khi sử dụng ít hơn tới 100 lần số token, đã huy động được 98 triệu USD từ General Catalyst, Kleiner Perkins và Sequoia trong bối cảnh các doanh nghiệp đang đối mặt với chi phí AI leo thang. Vòng gọi vốn này còn có sự tham gia của Andrej Karpathy, đồng sáng lập OpenAI.
"Bạn có sự bùng nổ dữ liệu, sự bùng nổ chi phí," Leigh Marie Braswell, đối tác tại Kleiner Perkins, cho biết. "Engram xuất hiện và về cơ bản lập bản đồ tổ chức của bạn, mang lại đầu ra rẻ hơn theo cấp số nhân."
Công ty với 13 nhân viên, được thành lập chưa đầy một năm trước, đã ký hợp đồng với Microsoft, Notion và công ty khởi nghiệp AI pháp lý Harvey. Engram cho biết các mô hình của họ ghi nhớ các quy trình làm việc và bối cảnh cụ thể của tổ chức để dự đoán câu hỏi và đưa ra phản hồi với chi phí thấp hơn. Cách tiếp cận này dựa trên khái niệm khoa học thần kinh về engram — dấu vết ký ức trong não.
Khoản tài trợ này diễn ra khi các công ty từ Uber đến các ngân hàng lớn báo cáo đã vượt ngân sách AI với ít lợi nhuận thu về. CTO của Uber tiết lộ vào tháng 4 rằng công ty đã vượt quá ngân sách AI cho năm 2026. Hai ngân hàng lớn đã chi ước tính 1 tỷ USD cho các thử nghiệm AI mà không mang lại lợi nhuận đáng kể, theo The Times. Meta đã áp đặt các giới hạn nghiêm ngặt đối với việc sử dụng token nội bộ sau khi phát hiện công ty đang trên đà chi hàng tỷ USD chỉ riêng cho AI vào năm 2026.
Đồng sáng lập kiêm CEO của Engram, Dan Biderman, người có bằng Tiến sĩ khoa học thần kinh tính toán từ Đại học Columbia và sau đó làm việc tại phòng thí nghiệm AI của Stanford, cho biết công ty đang xây dựng một lớp "bộ nhớ học được" cho các hệ thống AI. Ý tưởng này xuất phát từ quan sát của ông rằng mặc dù các mô hình AI có vẻ rất mạnh mẽ, nhưng bộ nhớ của chúng thực sự hạn chế hơn nhiều so với vẻ ngoài — và việc thêm nhiều ngữ cảnh thường làm chúng quá tải, đẩy chi phí lên cao.
"Chúng tôi đang cố gắng vượt ra khỏi khả năng ghi chép hiện có và xây dựng lớp trực giác mà con người có, còn các mô hình hiện tại thì không," Biderman nói.
Nỗ lực nâng cao hiệu quả này diễn ra khi toàn ngành AI đang đối mặt với một cuộc khủng hoảng chi phí. OpenAI và Anthropic đang xem xét cắt giảm giá mạnh chỉ sau chưa đầy ba tháng tính phí thực tế cho các dịch vụ mô hình ngôn ngữ lớn của họ, theo một giám đốc điều hành của Cisco, người cho biết chi phí token vượt xa giá trị mà chúng tạo ra ở quy mô lớn. Gartner dự báo rằng tình trạng thiếu bộ nhớ do nhu cầu máy chủ AI sẽ đẩy giá PC tăng 17% và giá điện thoại thông minh tăng 13% vào năm 2026.
Cách tiếp cận của Engram phản ánh xu hướng chuyển dịch rộng lớn hơn hướng tới hiệu quả. Apple đang xây dựng các mô hình AI trên thiết bị thông qua quan hệ đối tác với Google Gemini, chưng cất các mô hình lớn thành các phiên bản nhỏ hơn chạy cục bộ. Công ty khởi nghiệp Trung Quốc Zhipu AI gần đây đã phát hành GLM-5.2, một mô hình trọng số mở có giá thấp hơn tới 82% mỗi token so với các mô hình hàng đầu phương Tây, với giá đầu ra là 4,40 USD cho mỗi triệu token.
Biderman thừa nhận rằng các mô hình của Engram không "tốt hơn tuyệt đối" so với các mô hình từ OpenAI hay Anthropic trong mọi tác vụ, nhưng cho biết chúng vượt trội trong việc chuyên môn hóa — đôi khi phải đánh đổi các khả năng khác. Công ty có kế hoạch sử dụng khoản tài trợ để hỗ trợ chi phí tính toán và nhân tài.
Đối với các nhà đầu tư, khả năng thu hút khách hàng nhanh chóng của Engram — giành được hợp đồng với Microsoft và Notion chỉ trong vài tháng sau khi thành lập — cho thấy nhu cầu của doanh nghiệp đối với cơ sở hạ tầng AI hiệu quả về chi phí là thực tế và cấp bách. Công ty khởi nghiệp này gia nhập một lĩnh vực đông đúc các giải pháp tối ưu hiệu quả, nhưng trọng tâm vào bộ nhớ tổ chức giúp họ khác biệt so với các giải pháp tối ưu hóa mô hình thông thường. Nếu tuyên bố giảm 100 lần số token của Engram được chứng minh trong môi trường sản xuất ở quy mô lớn, điều này có thể gây áp lực lên giá suy luận (inference) trên toàn ngành, siết chặt biên lợi nhuận tại các nhà cung cấp đám mây trong khi mang lại lợi ích cho người mua AI doanh nghiệp.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.