اینتل در آستانه این رویداد Supercomputing 22 CPU های کلاس مرکز داده Xeon Max را معرفی کرده است. لازم به ذکر است که قبلا از این پردازنده ها با نام Sapphire Rapids HBM یاد می شد. علاوه بر این، تیم آبی از پردازنده های گرافیکی سری Intel Data Center GPU Max رونمایی کرده است. قبلاً GPUهای فوق الذکر به سادگی Ponte Vecchio نامیده می شدند. اینتل میگوید پردازندههای جدیدش برای پیچیدهترین پردازشهای ابررایانهای هستند.
سی پی یو های سری زئون مکس
برای چندین دهه، پردازنده های مبتنی بر معماری x86 برای انواع فرآیندهای فنی استفاده شده است. بنابراین، امروزه می توان از آنها برای انواع وظایف پردازشی استفاده کرد. با وجود پیشرفت های قابل توجه در عملکرد هسته های CPU در سال های اخیر، پردازنده های امروزی با دو محدودیت عمده در پردازش وظایف هوش مصنوعی و محاسبات با کارایی بالا (HPC) مواجه هستند: یکی پهنای باند حافظه و دیگری موازی بودن. اینتل قول داده است که پردازنده های سری Xeon Max آن هر دو محدودیت را دور خواهند زد.
بر اساس گزارش تامز سخت افزار، پردازنده های سری Xeon Max به 56 هسته قدرتمند بر اساس ریزمعماری Golden Cove مجهز شده اند. این هسته ها در قالب چهار چیپلت روی یک پلتفرم قرار گرفته اند و اینتل از طریق فناوری انحصاری EMIB بین چیپلت ها ارتباط برقرار می کند. به گفته اینتل، تراشه های جدید کلاس مرکز داده دارای موتورهای پردازش ویژه ای هستند که بر هوش مصنوعی و HPC متمرکز شده اند و از 64 گیگابایت حافظه داخلی HBM2E استفاده می کنند.
پردازنده های سری زئون مکس تا 56 هسته گلدن کوو پرقدرت دارند
پردازنده های جدید اینتل مانند سایر محصولات سری Sapphire Rapids از هشت کانال حافظه DDR5 و رابط PCIe Gen 5 با پروتکل CXL 1.1 پشتیبانی می کنند. هسته های بهبود یافته اینتل از فناوری AVX-512 و Deep Learning Boost و حتی شتاب دهنده ماتریس AMX استفاده می کنند. هسته های جدید نیز از DSA پشتیبانی می کنند. این تکنیک فشار ناشی از انتقال داده را از روی پردازنده حذف می کند.
استفاده از حافظه داخلی 64 گیگابایتی HBM2E (شامل چهار اسلات 16 گیگابایتی) منجر به حداکثر پهنای باند یک ترابایتی می شود که معادل تقریباً 1.14 گیگابایت حافظه و 18.28 گیگابایت بر ثانیه پهنای باند در هر هسته است. برای درک بهتر این اعداد بهتر است بدانید که پردازنده 56 هسته ای Sapphire Rapids که دارای هشت ماژول DDR5-4800 است، به پهنای باند 307.2 گیگابیت بر ثانیه یا بهتر بگوییم 5.484 گیگابایت بر ثانیه در هر هسته دست می یابد.
پردازنده های سری Xeon Max می توانند از حافظه HBM2E به روش های مختلفی استفاده کنند: به عنوان حافظه سیستم استفاده می شود، به عنوان حافظه پنهان با سرعت بالا برای زیر سیستم حافظه DDR5 استفاده می شود و به عنوان بخشی از حافظه یکپارچه HBM استفاده می شود. روش آخر نیاز به بهینه سازی نرم افزار دارد. اما دو روش اول نیازی به تغییر کد ندارند.
بسته به نوع پردازنده، اینتل می گوید که Xeon Max می تواند حدود 3.0 تا 5.3 برابر قدرتمندتر از Xeon Scalable 8380 عمل کند. پردازنده Xeon Scalable 8380 اکنون در بازار موجود است. به لطف حافظه HBM2E، پردازنده های نسل جدید اینتل تا 2.8 برابر قدرتمندتر از AMD EPYC 7773X در فرآیندهایی مانند توسعه مدل سه بعدی برای مولکول ها هستند. این پردازنده AMD به 3D V-Cache متکی است.
استفاده از حافظه HBM2E مزیت دیگری برای اینتل دارد و آن کاهش میزان انتقال داده بین CPU و GPU است. موضوعی که برای تعدادی از فرآیندهای HPC بسیار مهم است.
پردازنده های گرافیکی سری GPU Max اینتل
اینتل گفته است که پردازندههای گرافیکی جدیدش در زمینه مراکز داده بر اساس نسخهای از معماری Ponte Vecchio تولید میشوند. معماری که اولین بار در سال 2019 معرفی شد. اینتل مدت زیادی است که به طور بی سر و صدا در حال توسعه Ponte Vecchio بوده است تا اینکه در سال های 2020 و 2021 اطلاعات دقیقی در مورد آن منتشر کرد.
Ponte Vecchio پیچیده ترین پردازنده ای است که تاکنون ساخته شده است. زیرا بدون احتساب حافظه، بیش از 100 میلیارد ترانزیستور در 47 کاشی پردازشی (شامل هشت کاشی HBM2E) دارد. معماری Ponte Vecchio به طور گسترده از فناوری های بسته بندی تراشه مدرن اینتل مانند EMIB استفاده می کند. چندین شرکت تراشه های Ponte Vecchio متعددی را با فناوری های مختلف تولید می کنند.
اینتل می گوید که GPU های Data Center GPU Max را با استفاده از معماری اصلاح شده Xe-HPC می سازد که به طور خاص برای پردازش هوش مصنوعی و دامنه HPC بهینه شده است. با استفاده از این معماری، پردازنده های جدید از تعداد زیادی فرمت و دستورالعمل پشتیبانی می کنند.
مشخصات فنی گرافیک جدید کلاس مرکز داده اینتل | |||
---|---|---|---|
– | مرکز داده حداکثر 1100 | مرکز داده حداکثر 1350 | مرکز داده حداکثر 1550 |
فاکتور فرم | PCIe | OAM | OAM |
پردازش کاشی (چیپلت) | ? | ? | 47 |
ترانزیستور | ? | ? | 100 میلیارد |
هسته های Xe HPC | 56 | 112 | 128 |
هسته های رهگیر اشعه | 56 | 112 | 128 |
موتورهای برداری 512 بیتی | 448 | 896 | 1024 |
موتورهای ماتریسی 4096 بیتی | 448 | 896 | 1024 |
حافظه نهان L1 | ? | ? | 64 مگابایت |
کش L2 Rambo | ? | ? | 408 مگابایت |
حافظه HBM2E | 48 گیگابایت | 96 گیگابایت | 128 گیگابایت |
قدرت | 300 وات | 450 وات | 600 وات |
در مقایسه با Xe-HPG، معماری Xe-HPC دارای تعداد بسیار بیشتری زیرسیستم برای حافظه و کش است و از هسته های مختلفی استفاده می کند. معماری Xe-HPC واحد بافت ندارد. به همین دلیل نمی تواند محتوای گرافیکی را با روش های سنتی پردازش کند. در کمال تعجب، Xe-HPG از فناوری ردیابی پرتو برای تجسم داده ها در یک ابر رایانه پشتیبانی می کند.
یکی از ویژگی های مهم معماری Xe-HPC، تکنیک XMX است که به پردازنده های گرافیکی جدید اینتل کمک می کند تا 419 ترافلاپس در فرمت TF32 را بدست آورند. آزمایشات اولیه نشان می دهد که قدرتمندترین پردازنده Ponte Vecchio در اکثر سناریوها به Nvidia H100 نزدیک نمی شود و تقریباً در همه فرآیندها بهتر از AMD Instinct MI250X عمل نمی کند. اینتل می گوید که Data Center GPU Max 1550 در شبیه سازی Riskfuel تا 2.4 برابر سریعتر و در شبیه سازی NekRS تا 1.5 برابر سریعتر از A100 انویدیا است.
اینتل قصد دارد سه محصول جدید مبتنی بر Ponte Vecchio را عرضه کند. قدرتمندترین مدل Data Center GPU Max 1550 نام دارد و شامل 128 هسته Xe-HPC و 128 گیگابایت حافظه HBM2E و 600 وات قدرت می باشد. مدل دوم، Data Center GPU Max 1350، از 112 هسته Xe-HPC با 96 گیگابایت حافظه و 450 وات قدرت استفاده می کند. سومین و ضعیف ترین مدل، Data Center GPU Max 1100 است.این پردازنده دارای 56 هسته He-HPC، 56 گیگابایت حافظه HBM2E و 300 وات قدرت می باشد.
پل ریالتو؛ نسل بعدی گرافیک های مرکز داده اینتل
علاوه بر رونمایی از گرافیک سری دیتا سنتر GPU Max، اینتل جزئیات اولیه گرافیک سری Rialto Bridge را منتشر کرد. گرافیک در سال 2024 عرضه می شود. اینتل می گوید محصولات این خانواده از هسته های بهبود یافته Xe-HPC استفاده خواهند کرد و همچنان بر اساس معماری Ponte Vecchio خواهند بود. استفاده از هسته های جدید باعث می شود مصرف برق در پل ریالتو به حداکثر 800 وات برسد. ناگفته نماند که مدل هایی از این پردازنده ها با توان کمتری تولید می شوند.
اینتل می گوید که آزمایشگاه ملی آرگون در ایالات متحده یکی از اولین مشتریانی است که سری جدید Intel Xeon Max و محصولات Intel Data Center GPU Max را دریافت کرده است. این آزمایشگاه تحقیقاتی به تولید یک ابر رایانه با توان بیش از دو اگزافلاپس مشغول است. شرکای تجاری اینتل اوایل سال آینده دستگاه های مبتنی بر Xeon Max و Data Center GPU Max را برای بازار سرور عرضه خواهند کرد.