HBM проти DRAM: Чому великі моделі штучного інтелекту залежать від них? Як мікросхеми пам’яті переходять ві

Markets
Оновлено: 30/06/2026 04:10

30 червня 2026 року: Bitcoin торгується у вузькому діапазоні біля 60 000 доларів, тоді як Ethereum стабільно тримається на рівні близько 1 600 доларів. Після тривалої корекції протягом червня короткострокові "ведмеді" продовжують домінувати на крипторинку. Однак, коли криптоактиви входять у фазу "garbage time" (період низької активності та волатильності), інший сектор демонструє безпрецедентне вибухове зростання — це ринок напівпровідникової пам’яті.

Весняний звіт World Semiconductor Trade Statistics (WSTS) за 2026 рік суттєво підвищив очікування щодо зростання галузі: глобальний ринок напівпровідників може перевищити 1,51 трильйона доларів у 2026 році, що на 90% більше, ніж минулого року. Очікується, що пам’ять виросте на 250%, досягнувши 800 мільярдів доларів. Вперше виробництво пам’яті перевищить обсяги wafer foundry (кремнієвих фабрик), ставши основним драйвером зростання напівпровідників.

У центрі цієї революції пам’яті — HBM (High Bandwidth Memory). Очікується, що ринок HBM зросте на 58% у 2026 році, досягнувши 54,6 мільярда доларів і становитиме майже 40% ринку DRAM. У чому принципова різниця між HBM і DRAM? Чому моделі штучного інтелекту настільки залежать від HBM?

HBM vs. DRAM: Спільне походження, різні шляхи

HBM і DRAM мають спільну базову технологію зберігання — динамічну оперативну пам’ять. Проте їхні технологічні підходи, архітектурні рішення та сфери застосування суттєво розійшлися.

Традиційний DRAM реалізує стратегію "горизонтального розширення". Представники DDR4 та DDR5 використовують плоску архітектуру. Підвищення продуктивності досягається за рахунок вдосконалення технологічного процесу (наприклад, перехід з 20нм на 2нм) і архітектурних оптимізацій (зокрема, збільшення prefetch width у DDR5). Основна логіка — постійно зменшувати розмір транзисторів і підвищувати частоту на площині. Але цей підхід наближається до фізичних меж: процеси нижче 2нм стикаються з проблемами квантового тунелювання, і подальша мініатюризація вже не забезпечує експоненційний попит AI на пропускну здатність пам’яті.

HBM застосовує "вертикальне складування" для подолання цих обмежень. HBM використовує тривимірну структуру, впроваджуючи технологію Through-Silicon Via (TSV) для вертикального складування кількох DRAM-кристалів, формуючи кубоподібну структуру. У DRAM-чипах свердлять тисячі мікроотворів, які з’єднують шари вертикальними електродами. На нижньому рівні розташований блок логічного контролю DRAM, що керує таймінгом і управлінням стеком. Така "баштова" конструкція дозволяє HBM досягати надвисокої щільності пропускної здатності при компактних розмірах.

Різниця між поколіннями чітко простежується за ключовими показниками:

Пропускна здатність: Традиційний DRAM (наприклад, DDR5) забезпечує 50–100 ГБ/с, тоді як один стек HBM3E досягає 1,2 ТБ/с. Наступне покоління HBM4 очікується понад 2,0 ТБ/с. HBM пропонує більш ніж у 10 разів більшу пропускну здатність порівняно з класичним DRAM.

Енергоефективність: HBM може працювати при споживанні нижче 5 пДж/біт, тоді як традиційний DRAM — 10–15 пДж/біт. У дата-центрах, де одночасно працюють тисячі GPU, ця різниця перетворюється на десятки мільйонів доларів економії електроенергії щороку.

Затримка: Планарний DRAM забезпечує затримку близько 10 нс, а збільшення кількості стеків у HBM призводить до затримки приблизно 100 нс. Проте для AI-тренування та інференсу важливіше загальна пропускна здатність, ніж затримка одного доступу — швидкість обробки масивних параметрів критичніша за швидкість окремих операцій.

Вартість: Виробництво HBM значно дорожче за традиційний DRAM. Хоча собівартість HBM4 на 30% нижча за HBM3, вона все ще у 3–5 разів вища за DDR5 тієї ж ємності. HBM споживає у 4–5 разів більше площі пластини, а TSV-технологія суттєво знижує щільність бітів порівняно з DDR. Наприклад, D1z DDR4 від SK Hynix має щільність 0,296 Гб/мм², що на 85% більше, ніж у HBM3 (0,16 Гб/мм²). Додаткова площа для TSV і складного складування/пакування — основна причина високої вартості HBM.

Підсумок: Традиційний DRAM орієнтується на "достатню доступність за прийнятною ціною", а HBM — на "максимальну пропускну здатність". Це протистояння технологій із пріоритетом вартості та пропускної здатності.

Кризис "Memory Wall": Чому AI-моделі потребують HBM

Залежність AI від HBM зумовлена базовим обмеженням, відомим як "Memory Wall" (пам’ятна стіна).

За останні 20 років обчислювальна потужність GPU зросла у 60 000 разів, а пропускна здатність DRAM — лише у 100 разів. Швидкість обчислень випередила швидкість подачі даних — як надпотужний болід із паливною системою, що залишилася на рівні двадцятирічної давності. GPU — це двигун, HBM — система впорскування пального. Якщо подача пального не встигає, навіть найпотужніший двигун просто "крутить холостий хід".

Великі мовні моделі ще більше загострюють цю суперечність. AI-моделі не просто отримують статичну інформацію — вони постійно підтримують "робочий стан", який включає контекстні вікна, KV-кеш, проміжні активації та маршрутизацію. Все це має бути доступним у реальному часі з мінімальною затримкою. Під час обробки повної послідовності токенів модель постійно звертається до контексту та оновлює його — навіть незначне збільшення затримки пам’яті знижує пропускну здатність, затримує відповіді або змушує операторів додавати апаратне забезпечення.

Фаза тренування: Моделі з трильйонами параметрів багаторазово проходять величезні набори даних, кожен forward та backward pass включає масові читання та оновлення параметрів. Пропускна здатність HBM у ТБ/с вирішує тривалість тренування.

Фаза інференсу: З поширенням мультимодальних моделей і AI-агентів кількість токен-колів стрімко зростає. Вузьким місцем стає не "швидкість обчислень", а "швидкість подачі даних". На кінцевій межі пропускної здатності стоїть HBM.

У системному масштабі AI працює на багаторівневій пам’ятній архітектурі: HBM подає дані прискорювачам, DRAM зберігає реальний стан і пам’ять розмов, NAND-SSD забезпечують постійну пам’ять для датасетів, embedding-ів, індексів, логів і чекпоінтів. HBM розташований найближче до обчислювального ядра, обслуговуючи найчастіші та найнагальніші запити на дані — цю роль не може замінити жоден інший тип пам’яті.

Тому всі провідні AI-прискорювачі для генеративного AI-тренування та інференсу використовують HBM. HBM — не "додатковий аксесуар" для AI, а "кисневий балон", що визначає швидкість розвитку AI.

Дисбаланс попиту й пропозиції: роки структурного дефіциту

Попит на HBM жорсткий, а пропозиція — "заблокована".

Сторона попиту: Світові витрати на AI-інфраструктуру досягнуть 450 мільярдів доларів у 2026 році, вперше інференс перевищить 70% загальної обчислювальної потужності, що стимулює попит на GPU, HBM і високошвидкісні мережеві чипи. Зростання попиту на HBM у 2026 році обумовлене оновленням ємності AI ASIC, коли ємність HBM на один AI-чип зростає з 96 ГБ/192 ГБ до 216 ГБ/288 ГБ. Платформа Rubin від NVIDIA зберігає ємність HBM на GPU на попередньому рівні, але збільшення поставок піднімає загальний попит. Дев’ять найбільших світових хмарних провайдерів витратять близько 830 мільярдів доларів у 2026 році, що на 79% більше, ніж минулого року.

Сторона пропозиції: Незважаючи на те, що Samsung, SK Hynix і Micron спрямовують 70% нових/регульованих потужностей на HBM, дефіцит HBM зберігається на рівні 50–60%. На перший квартал 2026 року вся ємність HBM від трьох лідерів вже розпродана. За даними SemiAnalysis, у 2026 році пропозиція DRAM буде на 7% нижча за попит, HBM — на 6% менша, а у 2027 році розрив збільшиться до 9%.

Важливо, що пропозиція жорстка. Навіть якщо три лідери почнуть розширення зараз, фізичні обмеження TSV-процесу, вихідність складного пакування та терміни постачання обладнання означають, що нові потужності з’являться не раніше 2028–2029 років. Міжнародні інвестбанки сходяться на думці, що структурний дефіцит HBM триватиме щонайменше до 2028 року. Генеральний директор NVIDIA Дженсен Хуанг ще пряміше: глобальний дефіцит HBM — це "не короткострокова ринкова флуктуація, а структурна дилема галузі, яка триватиме роками".

Ціноутворення: Samsung і SK Hynix підняли ціни на поставки HBM3E у 2026 році майже на 20%. Початкові контрактні ціни на 12-шаровий HBM4 очікуються з премією понад 10% порівняно з контрактами на 12-шаровий HBM3E 2025 року.

Ринкова картина: Хто очолює пам’ятну революцію?

Ринок HBM надзвичайно концентрований. Аналітики прогнозують, що SK Hynix матиме близько 52% частки поставок у 2026 році, Samsung — близько 39%, Micron — близько 8%, а китайські виробники збережуть мінімальну частку. За обсягом продажів SK Hynix може отримати 5,95 мільярда доларів доходу від HBM у 2026 році, впевнено займаючи перше місце у світі.

У першому кварталі 2026 року частка SK Hynix на глобальному ринку HBM становить близько 51,4%. TrendForce очікує, що річна частка HBM залишиться на рівні близько 50%; Counterpoint прогнозує, що частка HBM4 досягне 54%.

Валові маржі трьох лідерів перевищили 70%, а подекуди й 80%. Прибутковість HBM розподіляється за принципом "піраміди": чим ближче до технічного ядра і вузького місця, тим більша частка прибутку.

Водночас з’являється цікава тенденція: прибутковість універсального DRAM структурно випереджає HBM. На перший квартал 2026 року розрив операційної маржі між універсальним DRAM і HBM перевищив 15 процентних пунктів. За оцінками ринку, спрямування потужностей на універсальний DRAM приносить понад удвічі більше доходу з пластини, ніж HBM, і майже втричі більшу валову маржу. Саме тому SK Hynix розглядає можливість повернення частини ресурсів до універсального DRAM — іронічно підтверджуючи, що весь ринок пам’яті переживає широкомасштабний бум.

Інвестиційний погляд: Можливості у суперциклі HBM

Структурний дефіцит HBM і зростання цін формують для інвесторів чітку галузеву логіку.

Виробники пам’яті — прямі бенефіціари. SK Hynix (KRX), Samsung Electronics (KRX) і Micron (NASDAQ) використовують технічну перевагу та дефіцит потужностей для отримання більшості надприбутків галузі. Morgan Stanley, прогнозуючи зростання середньої ціни DRAM на 62% у 2026 році, підвищив прогнози прибутків виробників пам’яті на 56–63%.

Гравці upstream-ланцюга постачання також виграють. Масштабне розширення лідерів пам’яті прямо стимулює попит на обладнання для травлення, нанесення тонких плівок, тестування та інші напівпровідникові технології, передаючи процвітання від upstream до midstream. Потреби HBM у складному пакуванні також прискорюють індустріалізацію 2,5D-пакувальних технологій, таких як CoWoS.

Виробники AI-чипів — кінцеві драйвери попиту на HBM. Провідні AI-компанії, такі як NVIDIA (NASDAQ) і Broadcom (NASDAQ), нарощують закупівлі HBM. GPU Rubin Ultra від NVIDIA матиме до 1 ТБ HBM на чип.

Gate Stock Trading: Єдиний доступ до глобальних інвестицій у пам’ять і AI

Для інвесторів, які бажають взяти участь у цьому суперциклі пам’яті, Gate Stock пропонує зручний старт.

Gate Stock забезпечує цілодобову систему торгівлі акціями на ринках США, Гонконгу та Кореї, підтримуючи понад 10 000 американських акцій і ETF, понад 1 500 гонконзьких акцій і 1 000 корейських акцій — загалом понад 12 500 активів акцій і ETF по всьому світу. У списку — світові лідери, такі як Apple, NVIDIA, Microsoft, Tencent Holdings, Xiaomi Group, Samsung Electronics і SK Hynix.

Користувачі можуть інвестувати у глобальні акції через єдиний акаунт Gate з використанням USDT, торгуючи фрагментарними акціями від 0,01 акції, і отримувати дивіденди. Платформа підтримує корпоративні дії, такі як спліти та консолідації акцій, з повним охопленням у мобільному додатку та на веб-інтерфейсі.

Gate Stock розширив можливості торгівлі за межі традиційних pre-market, regular і after-hours, додавши нічну та вихідну торгівлю, тим самим подолавши часові обмеження класичних фондових ринків. Незабаром буде доступна послуга міжброкерських переказів, що ще більше підвищить гнучкість і зручність управління активами.

Метод торгівлі: Після поповнення єдиного акаунта на платформі Gate користувачі можуть обирати цільові акції у модулі торгівлі акціями та купувати або продавати їх у USDT. Платформа надає котирування в реальному часі, технічні аналітичні інструменти та типи ордерів (ринковий, лімітний тощо), забезпечуючи досвід, аналогічний торгівлі криптоактивами.

Висновок

Головна різниця між HBM і DRAM полягає у технологічному підході: "пріоритет пропускної здатності" проти "пріоритету вартості". З розширенням обчислювальної потужності AI, 3D-складування і TSV-технологія HBM подолали "memory wall", зробивши HBM незамінним ядром для тренування та інференсу великих моделей.

У 2026 році глобальний ринок напівпровідників перевищить 1,51 трильйона доларів, пам’ять виросте на 250%, а ринок HBM — на 58% до 54,6 мільярда доларів. Дефіцит пропозиції сягає 50–60%, і вся ємність трьох лідерів розпродана. Це не типова циклічна флуктуація, а структурна трансформація, зумовлена довгостроковими капітальними витратами на AI-інфраструктуру.

Для інвесторів виробники пам’яті, постачальники обладнання/матеріалів і виробники AI-чипів мають чітку галузеву логіку. Gate Stock із цілодобовим сервісом торгівлі акціями США, Гонконгу та Кореї пропонує глобальним інвесторам гнучкий і ефективний інструмент для участі у цьому суперциклі пам’яті. У сучасних умовах крайнього страху на ринку (Fear Index 14–16) розрив між фундаментальними показниками галузі та ринковими настроями часто створює найцікавіші структурні можливості.

FAQ

Q1: У чому принципова різниця між HBM і DRAM?

Основна різниця — в архітектурі. Традиційний DRAM використовує плоский дизайн, підвищуючи продуктивність за рахунок вдосконалення технологічного процесу. HBM застосовує 3D-складування, використовуючи TSV для вертикального складування кількох DRAM-кристалів і надшироких каналів даних. HBM3E забезпечує до 1,2 ТБ/с пропускної здатності — більш ніж у 10 разів більше, ніж DDR5, але коштує у 3–5 разів дорожче за аналогічну ємність.

Q2: Чому AI-моделі потребують HBM?

Тренування та інференс великих моделей вимагають високошвидкісного читання/запису масивних параметрів. Пропускна здатність DRAM зростала набагато повільніше за обчислювальну потужність (60 000x проти 100x за 20 років), що створило вузьке місце "memory wall". Пропускна здатність HBM у ТБ/с постійно подає дані GPU, запобігаючи простою обчислювальних ресурсів. Усі провідні AI-прискорювачі використовують HBM.

Q3: Хто основні гравці на ринку HBM?

Ринок HBM надзвичайно концентрований. Очікується, що SK Hynix матиме близько 52% частки поставок у 2026 році, Samsung — близько 39%, Micron — близько 8%. SK Hynix лідирує за обсягом продажів, прогнозований дохід від HBM у 2026 році — 5,95 мільярда доларів. Вся ємність HBM від трьох лідерів вже розпродана, деякі клієнти резервують поставки до 2028 року.

Q4: Скільки триватиме дефіцит HBM?

Міжнародні інвестбанки вважають, що дефіцит HBM триватиме щонайменше до 2028 року. Попит визначається капітальними витратами на AI-інфраструктуру, а пропозиція обмежена TSV-процесом, вихідністю пакування й термінами постачання обладнання. Навіть якщо розширення почнеться зараз, нові потужності з’являться не раніше 2028–2029 років. Дженсен Хуанг називає це "багаторічною структурною дилемою галузі".

Q5: Як інвестувати в акції, пов’язані з HBM, на Gate?

Gate Stock пропонує цілодобову торгівлю акціями США, Гонконгу та Кореї, охоплюючи понад 12 500 акцій і ETF. Користувачі можуть інвестувати глобально через єдиний акаунт з використанням USDT, починаючи з 0,01 акції. Серед HBM-активів — виробники пам’яті SK Hynix (KRX), Samsung Electronics (KRX), Micron (NASDAQ) і виробники AI-чипів, такі як NVIDIA (NASDAQ).

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Вподобати контент