Chính sức mạnh định giá HBM đã đưa lợi nhuận Micron lên mức kỷ lục giờ đây đang tạo động lực mạnh mẽ để các khách hàng lớn nhất của họ sử dụng ít hơn.
Chính sức mạnh định giá HBM đã đưa lợi nhuận Micron lên mức kỷ lục giờ đây đang tạo động lực mạnh mẽ để các khách hàng lớn nhất của họ sử dụng ít hơn.

Qualcomm, Nvidia, Apple, Cerebras và Google đang phát triển các kiến trúc chip và thuật toán nhằm giảm sự phụ thuộc vào bộ nhớ băng thông cao (HBM), khi tình trạng thắt chặt nguồn cung kéo dài đẩy chi phí tăng cao trên toàn bộ chuỗi cung ứng AI.
"Nguồn cung HBM đang thắt chặt, đắt đỏ, và chúng tôi không sử dụng nó," Giám đốc điều hành Cerebras Andrew Feldman phát biểu trong cuộc họp báo cáo thu nhập đầu tiên của công ty sau khi niêm yết, định vị thiết kế không HBM của nhà sản xuất chip wafer-scale này như một lợi thế cạnh tranh.
Micron Technology tuần trước báo cáo rằng nguồn cung đã thắt chặt hơn so với ba tháng trước, ký 15 thỏa thuận dài hạn mới — hầu hết kéo dài 5 năm với mức giá sàn — và kéo dài triển vọng thiếu hụt đến sau năm 2027. Doanh số bộ nhớ toàn cầu tăng vọt 79% trong năm 2024 lên 165 tỷ USD và được dự báo sẽ vượt 223 tỷ USD vào năm 2025, theo dữ liệu ngành. SK Hynix, nhà sản xuất HBM hàng đầu, đã bán hết toàn bộ sản lượng năm 2026 và không còn nhận đơn đặt hàng mới cho các sản phẩm bộ nhớ chủ lực.
Động thái này tạo ra một nghịch lý cho các nhà sản xuất bộ nhớ: chính sức mạnh định giá tạo ra lợi nhuận chưa từng có đang tài trợ cho làn sóng đổi mới do khách hàng dẫn dắt nhằm giảm sự phụ thuộc vào HBM. Nếu thành công, những nỗ lực này có thể chặn đứng quỹ đạo tăng trưởng dài hạn của một thị trống đã trở nên trung tâm đối với cơ sở hạ tầng AI.
Qualcomm Đặt Cược Vào Kiến Trúc Bộ Nhớ Khác Biệt
Qualcomm tại Ngày Nhà đầu tư tháng 6/2026 đã công bố nền tảng trung tâm dữ liệu mang tên Dragonfly được xây dựng xung quanh công nghệ mà họ gọi là điện toán băng thông cao (HBC). Thay vì kết hợp bộ xử lý với các chồng HBM kết nối qua một bộ ghép nối silicon đắt đỏ — cách tiếp cận tiêu chuẩn được Nvidia H100 và B200 sử dụng — Qualcomm đặt các lõi xử lý trực tiếp bên dưới một chồng DRAM, rút ngắn khoảng cách dữ liệu phải di chuyển. Công ty tuyên bố điều này mang lại hiệu suất token trên mỗi watt cao gấp tám lần so với các cấu hình GPU truyền thống và băng thông bộ nhớ trên mỗi watt gấp sáu lần so với các đối thủ dựa trên HBM, đồng thời loại bỏ hoàn toàn bộ ghép nối.
Kiến trúc này ra đời trong bối cảnh HBM đã trở thành một trong những linh kiện bị hạn chế nhất trong chuỗi cung ứng AI. Các cơ sở sản xuất bộ nhớ mới cần đầu tư từ 15 tỷ đến 20 tỷ USD và mất vài năm để đi vào hoạt động, đồng nghĩa với việc tình trạng thiếu hụt có thể kéo dài ít nhất đến năm 2027, theo dự báo của ngành. Qualcomm cho biết đã đảm bảo đủ wafer và bộ nhớ cần thiết để đạt mục tiêu doanh thu trung tâm dữ liệu 5 tỷ USD trong năm tài chính 2027.
Nvidia và Google Đi Theo Hướng Phần Mềm
Nvidia, nhà tiêu thụ HBM lớn nhất cho các bộ tăng tốc AI, cũng đang tìm cách giảm nhu cầu bộ nhớ. Công ty đang điều chỉnh các thành phần trong nền tảng Vera Rubin thế hệ tiếp theo để giảm yêu cầu bộ nhớ tổng thể, theo các báo cáo. CPU Grace và kiến trúc Vera của Nvidia đại diện cho nỗ lực tối ưu hóa sự cân bằng giữa tính toán và bộ nhớ trong các hệ thống nơi HBM hiện chiếm tỷ trọng ngày càng lớn trong tổng chi phí vật liệu.
Google vào tháng 3 đã công bố nghiên cứu về TurboQuant, một phương pháp nén mô hình giúp giảm đáng kể dung lượng bộ nhớ của mô hình AI với tác động tối thiểu đến hiệu suất. Thông báo này đã gây ra một đợt bán tháo mạnh cổ phiếu Micron, giảm gần một phần ba trong một phiên giao dịch trước khi phục hồi gấp đôi khi thị trường đánh giá lại thời gian để các kỹ thuật như vậy tác động đáng kể đến nhu cầu HBM. Tình huống này cho thấy định giá cổ phiếu bộ nhớ nhạy cảm đến mức nào trước bất kỳ công nghệ nào đe dọa vai trò của HBM trong suy luận AI.
Bài Toán Đầu Tư
Đối với các nhà sản xuất bộ nhớ, triển vọng ngắn hạn vẫn cực kỳ tích cực. Các thỏa thuận dài hạn mới của Micron khóa mức giá cao hơn đỉnh chu kỳ lịch sử ngay cả ở mức tối thiểu theo hợp đồng, theo nhà phân tích Rolf Bulk của Futurum. Hướng dẫn của công ty ngụ ý lợi nhuận hoạt động hàng quý vượt quá doanh thu cả năm tốt nhất từ các chu kỳ trước.
Nhưng rủi ro cấu trúc đang gia tăng. Apple tuần này đã tăng giá trên nhiều mẫu Mac và iPad giữa các chu kỳ sản phẩm, với lý do trực tiếp là chi phí chip bộ nhớ tăng — một động thái báo hiệu rằng khả năng chịu đựng giá cao của người dùng cuối có giới hạn. Khi các công ty công nghệ lớn nhất thế giới ký các thỏa thuận cung ứng 5 năm với mức giá sàn, họ đồng thời cam kết vốn cho các đội kỹ thuật có nhiệm vụ làm cho các thỏa thuận đó trở nên kém phù hợp hơn theo thời gian.
Cổ phiếu Qualcomm đang giao dịch ở mức gấp khoảng 18 lần thu nhập dự phóng, chiết khấu so với mức 35 lần của Nvidia, phản ánh sự hoài nghi của thị trường về khả năng thâm nhập vào các trung tâm dữ liệu đang bị các công ty hiện tại thống trị. Nếu kiến trúc HBC của họ đạt được hiệu quả như đã công bố, khoản tiết kiệm từ việc mua sắm bộ nhớ có thể đủ để biện minh cho việc định giá lại. Đối với Micron, rủi ro là sức mạnh định giá hôm nay đang gieo mầm cho sự hủy hoại nhu cầu ngày mai — một mô hình mà ngành công nghiệp bộ nhớ đã từng chứng kiến, dù chưa bao giờ được thúc đẩy bởi quy mô đầu tư kỹ thuật từ phía khách hàng lớn như vậy.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.