OpenAI và Broadcom ra mắt chip Jalapeño, cắt giảm 50% chi phí suy luận AI

Chip tùy chỉnh đầu tiên của OpenAI, được đồng phát triển với Broadcom trong chín tháng, hứa hẹn cắt giảm một nửa chi phí suy luận và giảm sự phụ thuộc vào GPU Nvidia.

OpenAI và Broadcom đã ra mắt Jalapeño, một chip suy luận tùy chỉnh mà CEO của Broadcom cho biết có thể cắt giảm chi phí khoảng 50%, đe dọa vị thế thống trị của Nvidia trong lĩnh vực chip AI.

"Bằng cách tự thiết kế nhiều hơn trong hệ thống của mình, chúng tôi có thể cung cấp nhiều năng lực trí tuệ hơn với hiệu quả cao hơn," Greg Brockman, chủ tịch kiêm đồng sáng lập OpenAI, cho biết trong một tuyên bố. "Jalapeño là một phần trong chiến lược cơ sở hạ tầng toàn diện dài hạn của chúng tôi nhằm làm cho sức mạnh tính toán trở nên dồi dào hơn."

Con chip này, được phát triển từ thiết kế ban đầu đến khi hoàn thiện (tape-out) trong chín tháng, là một kiến trúc hoàn toàn mới dành cho suy luận mô hình ngôn ngữ lớn (LLM), chứ không phải sự điều chỉnh từ các bộ tăng tốc AI trước đó. Các mẫu kỹ thuật đã đang chạy GPT-5.3-Codex-Spark ở tần số và công suất mục tiêu sản xuất, với các thử nghiệm ban đầu cho thấy hiệu suất trên mỗi watt "vượt trội đáng kể" so với các chip tiên tiến nhất hiện nay, theo OpenAI. Cổ phiếu Broadcom đã tăng khoảng 2% sau thông báo, mặc dù sau đó giảm khoảng 3% khi toàn bộ ngành bán dẫn đi xuống.

Quan hệ đối tác này đánh dấu một bước chuyển chiến lược đối với OpenAI, một trong những khách hàng mua GPU lớn nhất của Nvidia kể từ khi cơn sốt AI tổng quát bùng nổ vào năm 2022. Bằng cách tự thiết kế chip silicon, OpenAI đặt mục tiêu giảm chi phí mua sắm trong bối cảnh nhu cầu tính toán suy luận đang bùng nổ. Việc triển khai ban đầu các hệ thống dựa trên Jalapeño dự kiến vào cuối năm 2026, với kế hoạch mở rộng lên các trung tâm dữ liệu quy mô gigawatt cùng với Microsoft và các đối tác khác.

Jalapeño là một mạch tích hợp chuyên dụng (ASIC), được thiết kế đặc biệt cho suy luận LLM. Không giống như các bộ xử lý đồ họa đa năng của Nvidia, vốn xử lý cả đào tạo và suy luận trên nhiều khối lượng công việc khác nhau, ASIC đánh đổi sự linh hoạt để lấy hiệu suất cao hơn trên các tác vụ mục tiêu. OpenAI cho biết kiến trúc này giảm thiểu việc di chuyển dữ liệu và cân bằng tài nguyên tính toán, bộ nhớ và mạng để đạt được mức sử dụng "gần hơn nhiều so với hiệu suất lý thuyết tối đa." Broadcom đóng góp chip mạng Tomahawk và chuyên môn triển khai chip, trong khi Celestica đảm nhận việc tích hợp bo mạch, giá đỡ và hệ thống.

Đây là chip đầu tiên trong một nền tảng tính toán đa thế hệ đã được lên kế hoạch. OpenAI cũng đã ký kết các thỏa thuận với Amazon Web Services cho chip Trainium, cũng như với Advanced Micro Devices và Cerebras, như một phần trong chiến lược có chủ đích nhằm đa dạng hóa khỏi Nvidia. Công ty cho biết chu kỳ phát triển chín tháng có thể là quá trình phát triển ASIC nhanh nhất từng đạt được trong lĩnh vực bán dẫn hiệu suất cao, được đẩy nhanh một phần nhờ chính các mô hình AI của OpenAI giúp thiết kế và tối ưu hóa chip.

Đối với các nhà đầu tư, những tác động mang tính hai mặt. Broadcom, với cổ phiếu đã tăng gần bảy lần kể từ cuối năm 2022, có được một khách hàng chip tùy chỉnh khối lượng lớn là OpenAI, qua đó đa dạng hóa doanh thu AI ngoài mảng mạng. Nvidia, công ty đã thống trị thị trường chip AI nhờ GPU, đang phải đối mặt với một khách hàng lớn nhất tự xây dựng giải pháp thay thế cho suy luận — phân khúc tăng trưởng nhanh nhất của tính toán AI. OpenAI không tiết lộ tổng chi phí của chương trình hay giá mỗi chip, nhưng CEO của Broadcom, Hock Tan, mô tả sự hợp tác này chỉ là "khởi đầu của một lộ trình đa thế hệ" cho phép triển khai các trung tâm dữ liệu quy mô gigawatt bắt đầu từ năm 2026.

Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.