Второ поколение Xe-HPC ускорител, който наследи Ponte Vecchio

С провеждането на ISC High Performance 2022 тази седмица в Хамбург, Германия, Intel използва първата лична версия на събитието от 3 години, за да предложи актуализация на състоянието на своите високопроизводителни планове за силиций/суперкомпютър. Голямата новина от шоуто тази година е, че Intel назовава наследника на ускорителя Ponte Vecchio, който компанията сега разкрива като Rialto Bridge.

Появявайки се по-рано в пътните карти на Intel като “Ponte Vecchio Next”, екипите на GPU на Intel планираха разработването на наследника на Ponte, дори когато първата голяма инсталация на Ponte (суперкомпютърът Aurora) все още се внедрява. Като част от 3-годишната (или така) пътна карта на компанията, която води до сближаване на процесора и ускорителя с Falcon Shores XPU, Rialto Bridge е частта, която, ако ми простите играта на думи, мост разликата между Ponte и Falcon, предлагайки еволюция на дизайна на Ponte, който използва по-нови технологии и производствени процеси.

Въпреки че Intel не предлага подробна техническа разбивка толкова рано в процеса, на високо ниво компанията говори малко за спецификациите, както и предоставя рендиране на бъдещия чип, което разсейва всяко съмнение, че това е наследник до Ponte, показвайки, че е съставен от десетки плочки/чиплети в същото оформление като Ponte. Най-голямата промяна, за която Intel говори днес, е, че ще увеличи общия брой изчислителни ядра Xe от 128 на Ponte до максимум 160 на моста Rialto, вероятно чрез увеличаване на броя на ядрата Xe във всяка плочка за изчисление.

Без конкретни подробности за изграждането, Intel най-малкото потвърждава, че Rialto ще използва нови възли за изграждане за своята компилация, заменяйки сегашния микс от TSMC N7 (Link Tile), TSMC N5 (Compute) и Intel 7 (Cover & Base ). Процесът на Intel 4 трябва да стартира тази година, така че би имало смисъл да се използва за надграждане на базата и кеша. В идеалния случай Intel също така би искала да продължи напред към процесните възли за изчислителни плочки, вероятно използвайки тази възможност за преместване на производството на тези плочки към Intel 4 – въпреки че не разчитаме и на TSMC N4.

Въпреки това, с риск да прочете твърде много в един рендер, Rialto има една забележителна разлика от Ponte, когато става въпрос за изчислителни ядра: докато Ponte използва двойки изчислителни ядра с кеш плочка между двете, Rialto на пръв поглед изглежда да се използват монолитни плочи. Това означава, че Intel е избрала да интегрира кеша на Rambo в чипа в изчислителни плочки и е готова да произвежда по-малко, по-големи изчислителни плочки. Това придава достоверност на идеята, че Intel поддържа производството на изчислителните плочки (тъй като вече произвеждат кеш плочките), но ще трябва да видим какво ще обяви Intel по-късно.

Интересното е, че Intel също обещава повече I/O честотна лента за Rialto – въпреки че отново това е много високо ниво (и не специфично) на детайлите. Ponte вече е един от първите продукти, които се доставят с PCIe 5.0 свързаност, и тъй като хардуерът на PCIe 6.0 все още малко изостава, може да става дума повече за честотна лента на чипа, отколкото извън чипа, или количеството честотна лента, налична между ускорителите, използващи Intel. Xe Link Interconnect.

HBM3 също е обувка за ускорителя от следващо поколение на Intel, като се има предвид, че той вече навлиза в доставката на ускорители тази година. HPC ускорителите почти живеят и умират от честотната лента на паметта, така че очакваме това да бъде първото нещо, което Intel обмисля за Rialto. И това би било в съответствие с неудобната формулировка на Intel „Повече GT/s“, тъй като честотната лента на паметта често се измерва в гигатрансфери.

И накрая, Intel уточнява, че Rialto ще се основава на по-нова версия на спецификацията на Open Accelerator Module (OAM), което е особено важно, тъй като следващата версия на OAM все още не е обявена. При липса на допълнителни подробности, най-големият диференциатор изглежда е поддръжката на захранване – докато OAM 1.x позволява на модулите да черпят до 700 вата, Intel говори за реализиране на до 800 вата на модул Rialto. Което, за добро или за лошо, е в съответствие с повишената консумация на енергия на по-ефективните версии на следващото поколение HPC ускорители и е важен фактор за преминаването към течно и охлаждащо охлаждане.Потапяне за оборудване от висок клас.

Сравнение на графични ускорители за изчисления
AnandTech Intel Intel Nvidia
Продукт Мост Риалто Понте Векио H100 80 GB
Архитектура Xe-HPC Xe-HPC ампер
Транзистори ? 100B 80B
Плочки (включително HBM) 31? 47 6 + 1 резерв
Изчислителни единици 160 128 132
Матрични ядра 1280? 1024 528
L2 / L3 ? 2 x 204 MB 50 MB
Капацитет на VRAM ? 128 GB 80 GB
Тип VRAM HBM3? 8 x HBM2e 5x HBM3
Ширина на VRAM ? 8192 бита 5120 бита
Пропускателна способност на VRAM ? ? 3,0 TB/s
Общо BW от чип до чип ? 64 × 11,25 GB/s
(4×16 90G SERDES)
18 x 50 GB/s
Консистенция на процесора да да С NVLink 4
производство ? Intel 7
TSMC N7
TSMC N5
TSMC N4
Форм Фактори OAM 2.0 (800W) OAM (600W) SXM4 (400W*)
Дата на излизане Средата на 2023 г. (извадка) 2022 г 2022 г
*Някои персонализирани разгръщания достигат до 600W

Като цяло Intel се стреми към 30% увеличение на производителността „на ниво приложение“ с моста Rialto. Което на пръв поглед не е голяма печалба, но също така е за част, която излиза около година след оригиналния Ponte Vecchio. Увеличението с 25% в броя на ядрата Xe означава, че по-голямата част от това повишаване на производителността трябва да бъде осигурено от допълнителния хардуер, за разлика от промените в тактовата честота, но тъй като Intel цитира действителните очаквания за производителност, а не теоретичната производителност, ние не бихме. бъдете твърде изненадани, ако спецификациите на Риалто на хартия бяха дори малко по-богати. Intel също така обещава, че Rialto трябва да бъде по-ефективен от Ponte, което на пръв поглед е разумно твърдение, тъй като производителността трябва да се увеличава по-бързо от консумацията на енергия.

Според пътната карта на Intel, мостът Риалто се очаква да започне да пробва в средата на 2023 г. Като се има предвид борбите на Intel да получи Ponte Vecchio навреме – все още не можете да го получите, освен ако не сте Aurora – това би било изненадващо бърз обрат за Intel. Но в същото време, тъй като това са конвейерни проекти с много силно архитектурно сходство, в идеалния случай Intel няма да има толкова много проблеми при стартиране с Rialto, колкото с Ponte. Но както винаги, ще видим какво наистина ще се случи следващата година, когато Intel е на път да достави следващия си ускорител.

Всички пътища водят до Falcon Shores

С добавянето на моста Rialto към плановете за HPC на Intel, текущата силиконова пътна карта на компанията изглежда така:

Ускорителите на HBM Xeon и HPC ще се слеят през 2024 г. с първия гъвкав XPU на Intel, Falcon Shores. Falcon Shores беше обявен за първи път на Зимната среща на инвеститорите на Intel по-рано тази година и ще бъде първият продукт на Intel, който извежда високопроизводителни CPU и GPU плочки до логичното им заключение, като позволява конфигурируем брой на всеки тип плочки. Съответно, Falcon Shores обхваща не само смесени CPU/GPU дизайни, но и (относително) чисти CPU и GPU дизайни, поради което е наследник на HPC CPU и HPC GPU на Intel.

За днешното събитие Intel не предлага повече подробности за Falcon Shores – така че компанията все още говори за насочване към 5x увеличения във всичко – от енергийната ефективност до плътността на изчисленията и честотната лента на паметта. Остава да видим как възнамеряват да постигнат това, освен че разчитат на своите планирани технологии за кондициониране и споделена памет. Но тази актуализация предлага по-добра представа за това къде Falcon Shores се вписва в продуктовите пътни карти на Intel, давайки представа как настоящите HBM-Xeon и Xe-HPC продукти ще се слеят там.

В крайна сметка Falcon Shores остава мощната игра на Intel за HPC индустрията. Компанията залага, че способността за предоставяне на тясно интегрирано (но все пак плочки и гъвкаво) изживяване с един API за всички ще бъде това, което ще им даде предимство на пазара на HPC, поставяйки ги пред традиционните базирани на GPU ускорители. И ако успеят да изпълнят тези планове, тогава 2024 г. се очертава като много интересна година във високопроизводителната компютърна индустрия.

Add Comment