Mellanox (NVIDIA) MQM9790-NS2F InfiniBand Switch در عمل. بهینه سازی اتصال کم تاخیر برای RDMA / HPC / AI

May 28, 2026

از آنجایی که خوشه‌های آموزشی هوش مصنوعی در مقیاس بزرگ و مراکز محاسباتی با کارایی بالا (HPC) پهنای باند شبکه و الزامات تأخیر را به سطوح بی‌سابقه‌ای می‌رسانند، راه‌حل‌های سنتی اترنت به طور فزاینده‌ای با کنترل ازدحام و تأخیر غیرقابل پیش‌بینی دنباله تحت بارهای کاری RDMA دست و پنجه نرم می‌کنند. یک مرکز ملی ابر رایانه پیشرو اخیراً هنگام ارتقاء کلاستر GPU نسل بعدی خود دقیقاً با این چالش روبرو شد. پس از ارزیابی گزینه‌های اتصال چندگانه، تیم انتخاب کردملانوکس (NVIDIA) MQM9790-NS2Fبه عنوان سوئیچ اصلی پارچه - تصمیمی که اساساً مشخصات عملکرد خوشه آنها را تغییر داد.

پیشینه و چالش: دیوار مقیاس پذیری

پارچه HDR InfiniBand موجود در مرکز ابرکامپیوتر نزدیک به اشباع کار می کرد. با بیش از 2000 GPU در حال اجرا موازی کار آموزش هوش مصنوعی، عملیات ارتباط جمعی مانند همه کاهش و همه به همه با جهش قابل توجهی از تأخیر دم مواجه شدند. شبکه به گلوگاه اصلی تبدیل شده بود و باعث می شد زمان بیکاری GPU که هم منابع محاسباتی و هم انرژی را هدر می داد. مهندسان تخمین زدند که تقریباً 30 درصد از چرخه‌های محاسباتی در طول دوره‌های آموزشی توزیع‌شده در مقیاس بزرگ به سربار ارتباط گم می‌شوند.

چیزی که تیم نیاز داشت یک سوئیچ با قابلیت ارائه بود400 گیگابیت بر ثانیه در هر پورت، پشتیبانی از RDMA بومی و شتاب محاسبات درون شبکه - همگی با حفظ سازگاری با زیرساخت HDR موجود. پس از بررسیبرگه داده MQM9790-NS2Fومشخصات MQM9790-NS2F، آنها مشخص کردند کهسوئیچ MQM9790-NS2F InfiniBandتعادل ایده آل تراکم، عملکرد و مجموعه ویژگی را ارائه می دهد.

راه حل و استقرار: ارتقاء پارچه NDR 64 پورت

مرکز چهار نفر را مستقر کردMQM9790-NS2F 400Gb/s NDR 64 پورت OSFPسوئیچ ها در یک توپولوژی برگ ستون فقرات، 2048 GPU را در 64 گره محاسباتی به هم متصل می کنند. هر گره از طریق یک کابل تقسیم کننده OSFP به 4x100Gb/s متصل می شود و پهنای باند مجموع 400Gb/s را برای هر سرور فراهم می کند و در عین حال چگالی مدیریت کابل را بهینه می کند.

پارامتر استقرار	پیکربندی
مدل سوئیچ	NVIDIA Mellanox MQM9790-NS2F(4 واحد)
پیکربندی پورت	64x OSFP، 400Gb/s NDR در هر پورت
مجموع پردازنده های گرافیکی	2048 (NVIDIA H100)
ویژگی های درون شبکه	SHARPv3، مسیریابی تطبیقی، کنترل ازدحام

کلید استقرار اطمینان از کامل بودن بودسازگار با MQM9790-NS2Fعملکرد با آداپتورهای نقطه پایانی HDR موجود. مذاکره سرعت خودکار سوئیچ و ترجمه لایه پیوند به یک استراتژی مهاجرت مرحله‌ای اجازه می‌دهد - گره‌های قدیمی با سرعت HDR کار می‌کنند در حالی که سرورهای جدید با قابلیت NDR از پهنای باند کامل 400 گیگابیت بر ثانیه استفاده می‌کنند. این مرکز همچنین از تجمیع درون شبکه‌ای SHARPv3 استفاده می‌کند و ترافیک را تا بیش از 65 درصد برای اندازه‌های پیام بزرگ که معمولاً در آموزش LLM یافت می‌شود، کاهش می‌دهد.

برای کسانی که ارتقاهای مشابه را ارزیابی می کنند،قیمت MQM9790-NS2Fپرس و جو وMQM9790-NS2F برای فروشدر دسترس بودن به طور قابل توجهی در میان مشتریان سازمانی و تحقیقاتی افزایش یافته است. هزینه کل رقابتی مالکیت سوئیچ - با در نظر گرفتن تعداد سوئیچ کمتر به دلیل تراکم 64 پورت - آن را به گزینه ای جذاب هم برای ساخت های جدید و هم برای پروژه های تازه تبدیل می کند.

نتایج و مزایا: سود قابل اندازه گیری عملکرد

کاهش تمام تاخیر (پیام 1 گیگابایت):کاهش از 48µs به 19µs (60% بهبود)
استفاده موثر از GPU:از 71٪ به 93٪ در طول آموزش در مقیاس بزرگ افزایش یافته است
زمان تکمیل کار (معادل GPT-3 175B):41% کوتاه شده
تأخیر دم ناشی از شبکه (صدک 99):از 210µs به کمتر از 35µs برش دهید

به عنوان یکراه حل سوئیچ MQM9790-NS2F InfiniBand، استقرار نشان داد که پارچه های NDR با سرعت 400 گیگابیت بر ثانیه می توانند به وعده های نظری خود عمل کنند. ترکیبی از الگوریتم‌های کنترل تراکم و مسیریابی تطبیقی الگوهای فروپاشی «incast» را که بافت HDR قبلی را در طول مراحل ارتباط همه جانبه آزار می‌داد، حذف کرد.

خلاصه و چشم انداز: پایه ای برای Exascale AI

موفقیت مرکز ابر رایانه باMQM9790-NS2Fنقشه راه خود را به سمت قابلیت های هوش مصنوعی exascale تسریع کرده است. آن‌ها اکنون در حال برنامه‌ریزی فاز دوم هستند که با استفاده از موارد اضافی، تعداد GPU را دو برابر می‌کند و به 4096 می‌رساندMQM9790-NS2F 400Gb/s NDR 64 پورت OSFPسوئیچ در یک توپولوژی درخت چربی سه لایه. تله متری سوئیچ و ویژگی‌های مدیریت خارج از باند نیز امکان جلوگیری از تراکم پیش‌بینی‌کننده را فراهم کرده است و هزینه‌های عملیاتی را برای تیم شبکه کاهش می‌دهد.

برای معماران شبکه و مدیران فناوری اطلاعات که پارچه‌های نسل بعدی را ارزیابی می‌کنند،NVIDIA Mellanox MQM9790-NS2Fنشان دهنده یک راه حل بالغ و اثبات شده در تولید است. چه در حال ساخت یک خوشه تحقیقاتی هوش مصنوعی جدید باشید یا یک مرکز HPC موجود را ارتقا دهید، این سوئیچ پایه ای با تاخیر کم و پهنای باند بالا را برای بارهای کاری موازی مدرن ارائه می دهد.