HBM so với DRAM: Vì sao các mô hình AI lớn lại phụ thuộc vào chúng? Cách chip nhớ đang phát triển từ "kỷ nguyên phẳng" đến "cuộc cách mạng 3D"

30 tháng 06 năm 2026: Bitcoin giao dịch trong biên độ hẹp quanh mức 60.000 USD, trong khi Ethereum giữ ổn định ở khoảng 1.600 USD. Sau một đợt điều chỉnh kéo dài suốt tháng 06, phe bán ngắn hạn tiếp tục chi phối thị trường tiền mã hóa. Tuy nhiên, khi các tài sản crypto bước vào giai đoạn "thời gian rác", một lĩnh vực khác lại chứng kiến sự tăng trưởng bùng nổ chưa từng có—bộ nhớ bán dẫn.

Báo cáo mùa Xuân năm 2026 của World Semiconductor Trade Statistics (WSTS) đã nâng mạnh kỳ vọng tăng trưởng ngành: thị trường bán dẫn toàn cầu có thể vượt 1,51 nghìn tỷ USD trong năm 2026, tăng 90% so với cùng kỳ năm trước. Chip bộ nhớ dự kiến tăng 250%, đạt 800 tỷ USD. Lần đầu tiên, sản lượng bộ nhớ sẽ vượt qua xưởng đúc wafer, trở thành động lực tăng trưởng chính của ngành bán dẫn.

Trung tâm của cuộc cách mạng bộ nhớ này là HBM (High Bandwidth Memory). Thị trường HBM dự kiến tăng 58% trong năm 2026, đạt 54,6 tỷ USD và chiếm gần 40% thị phần DRAM. Vậy HBM khác gì so với DRAM? Tại sao các mô hình AI lại phụ thuộc vào HBM đến vậy?

HBM vs. DRAM: Chung gốc, khác đường

HBM và DRAM sử dụng cùng một phương tiện lưu trữ cơ bản—bộ nhớ truy cập ngẫu nhiên động (DRAM). Tuy nhiên, hướng tiếp cận công nghệ, thiết kế kiến trúc và kịch bản ứng dụng của hai loại này đã rẽ theo những lối đi khác biệt.

DRAM truyền thống theo chiến lược "mở rộng ngang". Đại diện là DDR4 và DDR5, DRAM truyền thống sử dụng kiến trúc phẳng. Hiệu năng được cải thiện nhờ nâng cấp quy trình (ví dụ từ 20nm lên 2nm) và tối ưu hóa kiến trúc (như DDR5 mở rộng chiều rộng prefetch). Logic cốt lõi là liên tục thu nhỏ kích thước transistor và tăng tần số trên mặt phẳng hai chiều. Tuy nhiên, cách tiếp cận này đang chạm tới giới hạn vật lý—quy trình dưới 2nm gặp các vấn đề như hiệu ứng đường hầm lượng tử, và việc thu nhỏ đơn thuần không còn đáp ứng được nhu cầu băng thông bộ nhớ bùng nổ của AI.

HBM chọn lối "xếp chồng dọc" để vượt qua giới hạn này. HBM sử dụng cấu trúc 3D, ứng dụng công nghệ Through-Silicon Via (TSV) để xếp chồng nhiều die DRAM theo chiều dọc, tạo thành cấu trúc dạng khối. Hàng nghìn lỗ nhỏ được khoan trên chip DRAM, kết nối các lớp bằng điện cực dọc. Phía đáy là bộ điều khiển logic DRAM, quản lý thời gian và kiểm soát toàn bộ khối xếp chồng. Thiết kế "tháp" này giúp HBM đạt mật độ băng thông cực cao trong một diện tích vật lý nhỏ gọn.

Khoảng cách thế hệ giữa hai loại bộ nhớ thể hiện rõ qua các chỉ số hiệu năng chủ chốt:

Băng thông: DRAM truyền thống (ví dụ DDR5) cung cấp 50–100 GB/s, trong khi một stack HBM3E đơn lẻ có thể đạt 1,2 TB/s. Thế hệ HBM4 dự kiến vượt 2,0 TB/s. HBM cung cấp băng thông gấp hơn 10 lần DRAM thông thường.

Hiệu suất năng lượng: HBM có thể hoạt động dưới mức 5 pJ/bit, so với 10–15 pJ/bit của DRAM truyền thống. Trong các trung tâm dữ liệu vận hành hàng nghìn GPU cùng lúc, sự chênh lệch này tương đương hàng chục triệu USD chi phí điện mỗi năm.

Độ trễ: DRAM phẳng duy trì độ trễ khoảng 10 ns, còn HBM với số lớp xếp chồng tăng lên đẩy độ trễ lên khoảng 100 ns. Tuy nhiên, trong huấn luyện và suy luận AI, thông lượng quan trọng hơn độ trễ truy cập đơn lẻ—xử lý nhanh khối lượng tham số khổng lồ quan trọng hơn tốc độ truy xuất từng lần.

Chi phí: Sản xuất HBM đắt hơn nhiều so với DRAM truyền thống. Dù chi phí trên mỗi Gb của HBM4 thấp hơn HBM3 khoảng 30%, nhưng vẫn cao gấp 3–5 lần DDR5 cùng dung lượng. HBM tiêu tốn lượng wafer gấp 4–5 lần DDR5, và công nghệ TSV làm giảm mật độ bit so với DDR. Ví dụ, D1z DDR4 của SK Hynix có mật độ bit 0,296 Gb/mm², cao hơn HBM3 của hãng này (0,16 Gb/mm²) tới 85%. Diện tích bổ sung cho TSV và xếp chồng/đóng gói phức tạp là nguyên nhân chính khiến chi phí HBM cao.

Tóm lại: DRAM truyền thống hướng tới "đủ dùng với chi phí hợp lý", còn HBM theo đuổi "băng thông tối đa"—đây là cuộc chiến giữa ưu tiên chi phí và ưu tiên băng thông.

Khủng hoảng Memory Wall: Vì sao AI cần HBM

Sự phụ thuộc của AI vào HBM bắt nguồn từ nút thắt căn bản gọi là "Memory Wall".

Trong 20 năm qua, sức mạnh tính toán của GPU đã tăng gấp 60.000 lần, trong khi băng thông DRAM chỉ tăng gấp 100 lần. Tốc độ tính toán vượt xa tốc độ cung cấp dữ liệu—giống như một chiếc xe đua siêu tốc nhưng đường dẫn nhiên liệu vẫn ở tiêu chuẩn của 20 năm trước. GPU là động cơ; HBM là hệ thống phun nhiên liệu. Nếu nguồn nhiên liệu không theo kịp, động cơ mạnh nhất cũng chỉ quay tròn vô ích.

Các mô hình ngôn ngữ lớn càng làm rõ mâu thuẫn này. AI không chỉ truy xuất thông tin tĩnh mà còn duy trì liên tục "trạng thái làm việc" gồm cửa sổ ngữ cảnh, bộ nhớ KV cache, các kích hoạt trung gian và quyết định định tuyến. Những dữ liệu này phải được truy xuất thời gian thực với độ trễ cực thấp và luôn sẵn sàng. Trong quá trình xử lý chuỗi token đầy đủ, mô hình liên tục truy xuất và cập nhật ngữ cảnh—chỉ cần tăng nhẹ độ trễ bộ nhớ cũng có thể giảm thông lượng, làm chậm phản hồi hoặc buộc nhà vận hành bổ sung phần cứng.

Giai đoạn huấn luyện: Các mô hình hàng nghìn tỷ tham số lặp đi lặp lại trên tập dữ liệu khổng lồ, mỗi lần truyền tiến và truyền ngược đều cần đọc và cập nhật lượng lớn tham số. Băng thông TB/s của HBM quyết định thời gian huấn luyện được rút ngắn.

Giai đoạn suy luận: Khi mô hình đa phương thức và AI agent bùng nổ, số lần gọi token tăng vọt. Nút thắt của suy luận không phải "tính toán nhanh đến đâu", mà là "cung cấp dữ liệu nhanh đến đâu". Cuối con đường băng thông chính là HBM.

Toàn hệ thống, AI vận hành trên kiến trúc bộ nhớ phân lớp: HBM cung cấp dữ liệu cho bộ tăng tốc, DRAM lưu trữ trạng thái thời gian thực và bộ nhớ hội thoại, SSD nền NAND lưu trữ lâu dài cho tập dữ liệu, embedding, chỉ mục truy xuất, log và checkpoint. HBM nằm gần lõi tính toán nhất, đảm nhận nhiệm vụ cung cấp dữ liệu tần suất cao, cấp thiết nhất—không có phương tiện lưu trữ nào thay thế được vai trò này.

Đó là lý do tất cả bộ tăng tốc AI hàng đầu phục vụ huấn luyện và suy luận AI tạo sinh đều sử dụng HBM. HBM không phải "phụ kiện tùy chọn" cho AI—mà là "bình oxy" quyết định tốc độ phát triển của AI.

Cung cầu mất cân đối: Nhiều năm thiếu hụt cấu trúc

Nhu cầu HBM là cứng, nhưng nguồn cung lại "khóa cứng".

Phía cầu: Chi tiêu hạ tầng AI toàn cầu sẽ đạt 450 tỷ USD trong năm 2026, lần đầu tiên sức mạnh tính toán suy luận vượt 70%, thúc đẩy nhu cầu mạnh mẽ với GPU, HBM và chip mạng tốc độ cao. Tăng trưởng nhu cầu HBM năm 2026 chủ yếu do nâng cấp dung lượng AI ASIC, với dung lượng HBM trên mỗi chip AI tăng từ 96 GB/192 GB lên 216 GB/288 GB. Nền tảng Rubin của NVIDIA giữ dung lượng HBM trên mỗi GPU ở mức cũ, nhưng số lượng xuất xưởng tăng đẩy tổng nhu cầu lên cao. Chín nhà cung cấp đám mây lớn nhất thế giới dự kiến chi khoảng 830 tỷ USD trong năm 2026, tăng 79% so với năm trước.

Phía cung: Dù Samsung, SK Hynix và Micron dành 70% công suất mới/điều chỉnh cho HBM, khoảng cách cung HBM vẫn ở mức 50–60%. Đến quý I năm 2026, toàn bộ công suất HBM của ba ông lớn đều đã bán hết. SemiAnalysis báo cáo nguồn cung DRAM năm 2026 thấp hơn nhu cầu 7%, HBM thiếu hụt 6%, và khoảng cách này sẽ mở rộng lên 9% vào năm 2027.

Điều quan trọng là nguồn cung rất cứng. Dù ba nhà sản xuất lớn quyết định mở rộng ngay bây giờ, các rào cản vật lý như quy trình TSV, tỷ lệ đóng gói tiên tiến và thời gian dẫn thiết bị khiến công suất mới phải tới 2028–2029 mới có thể đi vào hoạt động. Các ngân hàng đầu tư quốc tế đều đồng thuận rằng thiếu hụt cấu trúc của HBM sẽ kéo dài ít nhất đến năm 2028. CEO NVIDIA Jensen Huang còn khẳng định: tình trạng thiếu hụt HBM toàn cầu "không phải biến động ngắn hạn của thị trường, mà là vấn đề cấu trúc của ngành sẽ kéo dài nhiều năm."

Giá cả: Samsung và SK Hynix đã tăng giá cung HBM3E năm 2026 gần 20%. Giá hợp đồng ban đầu cho HBM4 12 lớp dự kiến cao hơn hợp đồng HBM3E 12 lớp năm 2025 trên 10%.

Cục diện thị trường: Ai dẫn đầu cuộc cách mạng bộ nhớ?

Thị trường HBM tập trung cao độ. Các nhà phân tích dự báo SK Hynix sẽ chiếm khoảng 52% thị phần xuất xưởng năm 2026, Samsung khoảng 39%, Micron khoảng 8%, còn các doanh nghiệp Trung Quốc đại lục giữ thị phần nhỏ. Về doanh số, doanh thu HBM của SK Hynix có thể đạt 5,95 tỷ USD năm 2026, vững vàng ở vị trí số một toàn cầu.

Quý I năm 2026, SK Hynix chiếm khoảng 51,4% thị phần HBM toàn cầu. TrendForce dự báo thị phần HBM cả năm của hãng sẽ duy trì quanh 50%; Counterpoint dự đoán thị phần HBM4 sẽ đạt 54%.

Biên lợi nhuận gộp của ba ông lớn đều vượt 70%, thậm chí 80%. Phân phối lợi nhuận HBM tạo thành "kim tự tháp"—càng gần lõi công nghệ và nút thắt, tỷ lệ lợi nhuận càng cao.

Một xu hướng thú vị đang nổi lên: lợi nhuận DRAM phổ thông đang vượt cấu trúc HBM. Đến quý I năm 2026, khoảng cách biên lợi nhuận hoạt động giữa DRAM phổ thông và HBM đã nới rộng trên 15 điểm phần trăm. Ước tính thị trường cho thấy phân bổ công suất cho DRAM phổ thông tạo ra doanh thu trên mỗi wafer cao gấp đôi HBM, với biên lợi nhuận gộp gần gấp ba. Đây là lý do SK Hynix cân nhắc chuyển một phần nguồn lực trở lại DRAM phổ thông—nghịch lý xác nhận toàn thị trường bộ nhớ đang bước vào chu kỳ tăng trưởng toàn diện.

Góc nhìn đầu tư: Cơ hội trong siêu chu kỳ HBM

Thiếu hụt cấu trúc và giá HBM tăng cao mang lại logic ngành rõ ràng cho nhà đầu tư.

Nhà sản xuất bộ nhớ là bên hưởng lợi trực tiếp. SK Hynix (KRX), Samsung Electronics (KRX) và Micron (NASDAQ) tận dụng ưu thế công nghệ và công suất khan hiếm để chiếm phần lớn lợi nhuận vượt trội của ngành. Morgan Stanley dự báo giá DRAM bình quân tăng 62% năm 2026, đã nâng dự báo lợi nhuận cho các nhà sản xuất bộ nhớ lên 56–63%.

Chuỗi cung ứng thượng nguồn cũng hưởng lợi. Mở rộng quy mô của các nhà lãnh đạo bộ nhớ thúc đẩy nhu cầu thiết bị khắc, lắng màng mỏng, kiểm tra và các thiết bị bán dẫn khác, truyền sự thịnh vượng từ thượng nguồn xuống trung nguồn. Nhu cầu đóng gói tiên tiến của HBM cũng thúc đẩy công nghiệp hóa công nghệ đóng gói 2,5D như CoWoS.

Nhà sản xuất chip AI là động lực cuối cùng cho nhu cầu HBM. Các công ty chip AI hàng đầu như NVIDIA (NASDAQ) và Broadcom (NASDAQ) đang mở rộng mua sắm HBM. GPU Rubin Ultra của NVIDIA sẽ trang bị dung lượng HBM lên tới 1 TB mỗi chip.

Gate Stock Trading: Đầu tư bộ nhớ và AI toàn cầu chỉ với một nền tảng

Nhà đầu tư muốn tham gia vào siêu chu kỳ bộ nhớ này có thể lựa chọn Gate Stock như điểm đến thuận tiện.

Gate Stock hiện cung cấp hệ thống giao dịch 24/7 phủ các thị trường Mỹ, Hồng Kông và Hàn Quốc, hỗ trợ hơn 10.000 cổ phiếu và ETF Mỹ, hơn 1.500 cổ phiếu Hồng Kông, cùng 1.000 cổ phiếu Hàn Quốc—tổng cộng hơn 12.500 tài sản cổ phiếu và ETF toàn cầu. Danh sách gồm các doanh nghiệp dẫn đầu như Apple, NVIDIA, Microsoft, Tencent Holdings, Xiaomi Group, Samsung Electronics và SK Hynix.

Người dùng có thể đầu tư cổ phiếu toàn cầu qua tài khoản hợp nhất của Gate bằng USDT, với giao dịch cổ phiếu lẻ từ chỉ 0,01 cổ phiếu, đồng thời nhận cổ tức. Nền tảng cũng hỗ trợ các sự kiện doanh nghiệp như chia tách và hợp nhất cổ phiếu, phủ đầy đủ trên cả ứng dụng và web.

Gate Stock đã mở rộng vượt khung thời gian giao dịch truyền thống (tiền thị trường, phiên chính, sau phiên) để hỗ trợ giao dịch qua đêm và cuối tuần, phá vỡ giới hạn thời gian của thị trường chứng khoán thông thường. Dịch vụ chuyển khoản giữa các broker sẽ ra mắt sớm, tăng thêm tính linh hoạt và tiện lợi trong quản lý tài sản cổ phiếu.

Cách giao dịch: Sau khi nạp tiền vào tài khoản hợp nhất trên nền tảng Gate, người dùng chọn cổ phiếu mục tiêu trong module giao dịch cổ phiếu và mua/bán bằng USDT. Nền tảng cung cấp báo giá thời gian thực, công cụ phân tích kỹ thuật, các loại lệnh (lệnh thị trường, lệnh giới hạn, v.v.), trải nghiệm nhất quán với giao dịch tài sản crypto.

Kết luận

Sự khác biệt giữa HBM và DRAM nằm ở định hướng công nghệ "ưu tiên băng thông" so với "ưu tiên chi phí". Khi sức mạnh tính toán AI tiếp tục mở rộng, công nghệ xếp chồng 3D và TSV của HBM đã phá vỡ "bức tường bộ nhớ", trở thành thành phần cốt lõi không thể thay thế trong huấn luyện và suy luận mô hình lớn.

Năm 2026, thị trường bán dẫn toàn cầu sẽ vượt 1,51 nghìn tỷ USD, chip bộ nhớ tăng 250%, thị trường HBM tăng 58% lên 54,6 tỷ USD. Khoảng cách cung cầu lên tới 50–60%, toàn bộ công suất của ba nhà sản xuất lớn đều đã bán hết. Đây không phải biến động chu kỳ thông thường—mà là sự chuyển đổi cấu trúc do chi tiêu vốn dài hạn vào hạ tầng AI thúc đẩy.

Với nhà đầu tư, các nhà sản xuất bộ nhớ, nhà cung cấp thiết bị/vật liệu và nhà sản xuất chip AI đều có logic ngành rõ ràng hậu thuẫn. Dịch vụ giao dịch 24/7 cổ phiếu Mỹ, Hồng Kông và Hàn Quốc của Gate Stock cung cấp công cụ linh hoạt, hiệu quả để nhà đầu tư toàn cầu tham gia vào siêu chu kỳ bộ nhớ này. Trong bối cảnh thị trường cực kỳ sợ hãi (Chỉ số Fear 14–16), sự lệch pha giữa nền tảng ngành và tâm lý thị trường thường tạo ra cơ hội cấu trúc hấp dẫn nhất.

FAQ

Q1: Sự khác biệt cốt lõi giữa HBM và DRAM là gì?

Điểm khác biệt chính nằm ở kiến trúc. DRAM truyền thống sử dụng thiết kế phẳng, cải thiện hiệu năng nhờ nâng cấp quy trình. HBM áp dụng xếp chồng 3D, dùng TSV để xếp chồng nhiều die DRAM theo chiều dọc, tạo đường truyền dữ liệu siêu rộng. HBM3E cung cấp băng thông lên tới 1,2 TB/s—gấp hơn 10 lần DDR5—nhưng chi phí cao gấp 3–5 lần cùng dung lượng.

Q2: Vì sao mô hình AI cần HBM?

Huấn luyện và suy luận mô hình lớn đòi hỏi đọc/ghi tốc độ cao khối lượng tham số khổng lồ. Băng thông DRAM tăng trưởng chậm hơn nhiều so với sức mạnh tính toán (60.000 lần so với 100 lần trong 20 năm), tạo nút thắt "Memory Wall". Băng thông TB/s của HBM liên tục cung cấp dữ liệu cho GPU, tránh chu kỳ tính toán bị nhàn rỗi. Tất cả bộ tăng tốc AI hàng đầu đều dùng HBM.

Q3: Những doanh nghiệp nào dẫn đầu thị trường HBM?

Thị trường HBM tập trung cao độ. SK Hynix dự kiến chiếm khoảng 52% thị phần xuất xưởng năm 2026, Samsung khoảng 39%, Micron khoảng 8%. SK Hynix dẫn đầu doanh số, doanh thu HBM dự kiến đạt 5,95 tỷ USD năm 2026. Toàn bộ công suất HBM của ba ông lớn đều đã bán hết, một số khách hàng đã khóa nguồn cung tới năm 2028.

Q4: Tình trạng thiếu hụt HBM sẽ kéo dài bao lâu?

Các ngân hàng đầu tư quốc tế đều cho rằng thiếu hụt HBM sẽ kéo dài ít nhất tới năm 2028. Nhu cầu được thúc đẩy bởi chi tiêu vốn hạ tầng AI, trong khi nguồn cung bị hạn chế bởi quy trình TSV, tỷ lệ đóng gói và thời gian dẫn thiết bị. Dù mở rộng ngay bây giờ, công suất mới cũng phải đến 2028–2029 mới đi vào hoạt động. Jensen Huang gọi đây là "vấn đề cấu trúc ngành kéo dài nhiều năm".

Q5: Tôi có thể đầu tư cổ phiếu liên quan đến HBM trên Gate như thế nào?

Gate Stock cung cấp giao dịch 24/7 cho cổ phiếu Mỹ, Hồng Kông và Hàn Quốc, phủ hơn 12.500 cổ phiếu và ETF. Người dùng có thể đầu tư toàn cầu qua tài khoản hợp nhất bằng USDT, bắt đầu từ 0,01 cổ phiếu. Các mã liên quan HBM gồm nhà sản xuất bộ nhớ SK Hynix (KRX), Samsung Electronics (KRX), Micron (NASDAQ), và các nhà sản xuất chip AI như NVIDIA (NASDAQ).

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement

HBM so với DRAM: Vì sao các mô hình AI lớn lại phụ thuộc vào chúng? Cách chip nhớ đang phát triển từ "kỷ nguyên phẳng" đến "cuộc cách mạng 3D"

HBM vs. DRAM: Chung gốc, khác đường

Khủng hoảng Memory Wall: Vì sao AI cần HBM

Cung cầu mất cân đối: Nhiều năm thiếu hụt cấu trúc

Cục diện thị trường: Ai dẫn đầu cuộc cách mạng bộ nhớ?

Góc nhìn đầu tư: Cơ hội trong siêu chu kỳ HBM

Gate Stock Trading: Đầu tư bộ nhớ và AI toàn cầu chỉ với một nền tảng

Kết luận

FAQ

Tin nhanh

XRP phá vỡ kháng cự 1,08 USD khi khối lượng Upbit vượt qua Bitcoin, hướng tới mục tiêu 1,30 USD

Dự thảo ngân sách năm 2027 của Đức nêu rõ khoản vay ròng 118,7 tỷ euro và đầu tư 117,5 tỷ euro.

Vốn đầu tư mạo hiểm Trung Quốc tăng tốc vào AI Vật lý, Mô hình Thế giới; AI Vật lý thu hút 133,6 tỷ USD tài trợ

Giá nhà tại Vancouver giảm 6% so với cùng kỳ năm ngoái trong tháng 6 khi doanh số bán tăng 9,6%.

Dubai Financial Market Index tăng 1,14% lên 6.059,14 vào thứ Sáu

Chỉ số Altcoin Season giảm xuống dưới 50 có ý nghĩa gì?

Circle giảm mạnh 17%: Cạnh tranh giữa các stablecoin ngày càng khốc liệt và đánh giá lại mô hình kinh doanh USDC

MiCA chính thức có hiệu lực: USDT rút khỏi châu Âu, nhưng lợi thế tuân thủ của USDC sẽ kéo dài bao lâu?