NVIDIA Mellanox MCX556A-ECAT در عمل: RDMA / RoCE امکان ایجاد تاخیر بسیار کم و پیشرفت های خادم را فراهم می کند
April 23, 2026
در ذخیره سازی توزیع شده، محاسبات با عملکرد بالا (HPC) و خوشه های آموزش هوش مصنوعی، تاخیر شبکه و هزینه های اضافی CPU مدت ها است که عملکرد کلی سرور را محدود می کند.استفاده اخیر در یک ارائه دهنده خدمات ابری در مقیاس بزرگ نشان می دهد که چگونهNVIDIA Mellanox MCX556A-ECATاین چالش ها را از طریق فن آوری های RDMA و RoCE حل می کند و به دستاوردهای قابل اندازه گیری در کاهش سرعت تولید و تاخیر منجر می شود.
قبل از ارتقا، شما باید یک برنامه ذخیره سازی Ceph چند پیتا بایت داشته باشید که از هزاران دستگاه مجازی پشتیبانی می کند.زیرساخت 25GbE آنها با استفاده از استاندارد TCP / IP از بهره برداری CPU بالا (بیش از 60٪ در گره های ذخیره سازی) و تاخیر ناسازگار در طول بار های اوج رنج می برد. پنجره های پشتیبان گیری اغلب بیش از هشت ساعت بودند و مشاغل آموزش هوش مصنوعی از I / O توقف داشتند. تیم به یک راه حل نیاز داشت که می تواند مداخله CPU را کاهش دهد، تاخیر کمتری داشته باشد،و مقیاس بدون یک تعمیر کامل زیرساختبعد از بررسیورق اطلاعات MCX556A-ECATو مقایسهمشخصات MCX556A-ECAT، انتخاب کردندMCX556A-ECATبه عنوان جزء اصلی ارتقاء
معماري محورشکارت آداپتور اترنت MCX556A-ECAT، یک آداپتور دو پورت 100GbE که از PCIe 3.0/4.0 x16 پشتیبانی می کندکارت شبکه PCIe MCX556A-ECAT ConnectX، این امکان را برای RoCE v2 در سراسر توپولوژی موجود برگ - ستون فقرات با حداقل تغییرات سوئیچ فراهم می کند. مراحل کلیدی پیاده سازی شامل:
- تعویض آداپتورهای 25GbE باMCX556A-ECATدر 40 گره ذخیره سازی و 150 گره محاسباتی.
- امکان تخلیه سخت افزار: NVMe over Fabrics (NVMe-oF) ، GPUDirect RDMA و T10-DIF برای یکپارچگی داده ها.
- پیکربندی کنترل جریان اولویت (PFC) و انتخاب انتقال پیشرفته (ETS) برای حمل و نقل بدون زیان RoCE.
- بررسیسازگاری با MCX556A-ECATوضعیت با سوئیچ های اسپکتری Mellanox و QSFP28 موجود.
کل راه اندازی دو آخر هفته طول کشید، بدون هیچ وقفه ای با استفاده از مهاجرت زنده برای بارهای کار محاسباتی.
اندازه گیری های پس از راه اندازی نشان داد که بهبود چشمگیری در معیارهای کلیدی وجود دارد. جدول زیر مقایسه قبل و بعد را خلاصه می کند:
| متریک | قبل از (25GbE TCP/IP) | بعد از (MCX556A-ECAT با RoCE) | بهبود |
|---|---|---|---|
| استفاده از پردازنده گره ذخیره سازی | 62 درصد | ۱۸% | ↓ 71٪ |
| متوسط تاخیر (4K خواندن تصادفی) | ۴۵۰ μs | ۴۲ μs | ↓ 90.7٪ |
| حجم کل کلستر | ۳۸ گیگابایت در ثانیه | 172 گیگابایت در ثانیه | ↑ ۳۵۳% |
| مدت زمان پنجره پشتیبان گیری | 8.5 ساعت | 1.8 ساعت | ↓ 79% |
فراتر از اعداد، تیم مهندسی گزارش داد که RDMA به طور قابل توجهی اضطراب را کاهش می دهد، از بین بردن اوج "توانایی تأخیر" که قبلاً نقاط بازرسی آموزش هوش مصنوعی را آزار می داد.MCX556A-ECAT راه حل کارت آداپتور اترنتاین کارت همچنین رفع مشکل را از طریق تلمیتر داخلی و اطلاع رسانی از ازدحام ساده می کند.قیمت MCX556A-ECATدر مقابل دستاوردهای عملکرد، مشتری ROI را در عرض نه ماه به طور خالص از صرفه جویی در هسته CPU و تکمیل سریعتر کار دسته ای به دست آورد.MCX556A-ECAT برای فروشاز طریق شرکای چند کانال، این سطح عملکرد را برای شرکت های سطح متوسط نیز قابل دسترسی می کند.
این کار نشان می دهد کهMCX556A-ECATارائه می دهد وعده خود را: زیر میکرو ثانیه RDMA تاخیر، CPU شدید offload، و مقیاس بندی خطی throughput.NVIDIA Mellanox MCX556A-ECAT100GbE تبدیل به استاندارد جدید برای ستون فقرات مرکز داده می شود، راه حل های ساخته شده در اطراف این آداپتور همچنان از استیک های TCP / IP قدیمی بهتر است.برای برنامه ریزی دقیق، به مسئول مراجعه کنیدورق اطلاعات MCX556A-ECATیا با معماران راه حل برای تاییدسازگاری با MCX556A-ECATتنظیمات برای محیط خاص شما.

