четвер, 21 березня 2024 р.

Гігантські ШІ-моделі та найпродуктивніші чіпи: Nvidia випустила потужний GPU B200 зі скромним споживанням енергії

Гігантські ШІ-моделі та найпродуктивніші чіпи: Nvidia випустила потужний GPU B200 зі скромним споживанням енергії

Грабовий
хв

Корпорація Nvidia продовжує розвивати напрямок виробництва чіпів для ІІ-галузі. Наразі керівник американської компанії заявив про випуск найпотужнішого ІІ-чіпа у світі. Крім того, готові деякі модульні системи, що базуються на основі GPU B200, так називається новинка.

Що це за чіп і навіщо він потрібний?

Оскільки галузь штучного інтелекту зараз найактивніше розвивається, виробники чіпів та модулів на їх базі теж не стоять на місці. Один із найбільших представників цього ринку — корпорація Nvidia.

У березні 2024 року вона показала нові прискорювачі обчислень, що базуються на архітектурі Blackwell. Остання - "нащадок" Hopper, предтечі, представленої два роки тому.

Корпорація заявила, що новий чіп призначений для створення систем, які дають змогу навчати воістину гігантські моделі — вже не з мільярдами, а трильйонами параметрів. Це потрібно для вирішення таких завдань, як обробка природної мови, створення мультимодальних додатків, кодогенерація тощо. У неймінгу архітектури немає нічого дивного, вона названа на честь американського математика.

Варто відзначити, що чіпи H100/H200 вкрай потрібні на ринку, незважаючи на свою ціну. Новий чіп, наскільки можна судити, буде ще дорожчим, але, швидше за все, його теж масово купуватимуть. Тут варто детальніше розповісти про характеристики чіпа.

Так, новий GPU складається з двох кристалів, які виготовлені за спеціальною версією 4-нм техпроцесу TSMC 4NP (саме собою, на потужностях TSMC) та об'єднані 2,5D-упаковкою CoWoS-L. Цікаво, що це перший GPU компанії Nvidia з чіплетним компонуванням. Чіпи з'єднані шиною NV-HBI з пропускною здатністю 10 Тбайт/с та працюють як єдиний GPU. Загалом новинка налічує 208 млрд транзисторів. Свій продукт компанія називає двигуном нової промислової революції.

Власне, має право, оскільки його можливості справді відмінні. Наприклад, у обчисленнях FP4 та FP8 цей GPU показує продуктивність до 20 та 10 Пфлопс відповідно. Не в останню чергу функції чіпа обумовлені новими тензорними ядрами та другим поколінням механізму Transformer Engine. Він дозволяє виконувати тонке налаштування обчислень для різних завдань, що, звісно, ​​впливає швидкість навчання моделей. Blackwell підтримує роботу з різними форматами, включаючи FP4, FP6, FP8, INT8, BF16, FP16, TF32 і FP64.

Ну добре, чіп - це добре, а що щодо прискорювачів?

Головним продуктом тут стане Nvidia Grace Blackwell Superchip. У ньому два графічні процесори B200 і центральний Arm-чіп Nvidia Grace з 72 ядрами Neoverse V2. Загалом, недаремно до назви чіпа додали приставку Super, результат справді дивує. Продуктивність в операціях FP4 досягає 40 Пфлопс, тоді як в операціях FP8/FP6/INT8 новий GB200 здатний забезпечити 10 Пфлопс.

Порівняно з H100 новинка показує 30-кратний приріст продуктивності. Але при цьому вона ще й споживає менше енергії — повідомляється, що прискорювач у 25 разів енергоефективніший, ніж попередні моделі.

А ще компанія постачатиме системи GB200 NVL72. Це власна технологія - серверна стійка, в яку входять 36 Grace Blackwell Superchip і пара комутаторів NVSwitch 7.2T. Виходить, що в системі відразу 72 графічні процесори B200 і 36 чіпів Grace, які об'єднані NVLink п'ятого покоління.

І все це працює як єдиний GPU з ІІ-продуктивністю 1,4 ексафлопс (FP4) та 720 Пфлопс (FP8). Ця система стане будівельним блоком для нового суперкомп'ютера Nvidia DGX SuperPOD.

Але це ще не все, адже американська компанія представила також і серверні системи. Це насамперед HGX B100, HGX B200 та DGX B200. У кожній по вісім прискорювачів нового типу.

Nvidia заявляє, що є можливість створення дуже великих ІІ-систем, які включають від 10 тис. до 100 тис. прискорювачів GB200. Формувати їх можна за допомогою мережевих інтерфейсів Nvidia Quantum-X800 InfiniBand та Spectrum-X800 Ethernet. Вони також були анонсовані сьогодні та забезпечать передові мережеві можливості зі швидкістю до 800 Гбіт/с.

При цьому лише одна система GB200 NVL72 здатна виконати інференс моделі з 27 трлн параметрів. У тій же GPT-4, моделі, з якою знайомі багато читачів Хабра, 1,7 трлн параметрів. Відповідно, у найближчому майбутньому очікується появи ще більших і досконалих моделей, здатних дивувати нас різними технологічними нововведеннями і можливостями.

Крім новинок, показаних Nvidia, незабаром представлять свої системи на базі Nvidia B200 та інші корпорації, включаючи Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, QCT, Wistron, Wiwynn та ZT Systems.

Природно, новинки Nvidia вже зацікавили великі та середні компанії. Серед перших - ті корпорації, які надають послуги хмарних обчислень, наприклад, Amazon, Google, Microsoft та Oracle.

Немає коментарів:

Дописати коментар

Pure Acetone: "Pin Tweet to IPFS https://chro…" - Mastodon
https://mastodon.social/deck/@pureacetone/111421706607809813

  # **Getting Started with IPFS on Windows: A Simple Guide** ## Introduction In an era where decentralization is becoming increasingly impor...