NVIDIA Mellanox MCX653106A-HDAT در عمل: دستیابی به انتقال RDMA / RoCE کم تاخیر و پیشرفت های سرور
June 16, 2026
در محیطهای مرکز داده مدرن - فضای ذخیرهسازی توزیعشده، تجارت با فرکانس بالا، و خوشههای آموزشی هوش مصنوعی - دو چالش دائمی باقی میماند: کاهش تأخیر ناشی از شبکه و به حداکثر رساندن توان پردازشی سرور بدون بارگذاری بر CPU. این برنامه کاربردی به بررسی این میپردازد که چگونه یک ارائهدهنده زیرساخت ابری پیشرو با استقرار آن به این مسائل دقیق پرداخته استNVIDIA Mellanox MCX653106A-HDATآداپتور سرور در گره های محاسباتی و ذخیره سازی آنها.
پس زمینه و چالش
زیرساخت 25 گیگابایتی موجود ارائه دهنده، مبتنی بر آداپتورهای اترنت استاندارد با پشته های TCP/IP مبتنی بر نرم افزار، محدودیت های واضحی را نشان می داد. بارهای کاری ذخیره سازی با استفاده از NVMe روی Fabrics، افزایش تاخیر غیرقابل پیش بینی (اغلب بیش از 50 میکروثانیه) را تجربه کردند، در حالی که خوشه های پایگاه داده از استفاده بالای CPU رنج می بردند - تا 35٪ از هسته های مصرف شده توسط پردازش شبکه به تنهایی. تیم مهندسی به راهحلی نیاز داشت که بتواند تأخیر کمتر از 10 میکرو ثانیه را برای تراکنشهای RDMA ارائه کند و از توان عملیاتی 200 گیگابایتی بدون نیاز به بازنگری کامل معماری پشتیبانی کند.
پس از ارزیابی گزینه های متعدد، آنها به سمتکارت آداپتور اترنت MCX653106A-HDAT، که قول RoCE بارگذاری شده سخت افزاری (RDMA از طریق اترنت همگرا) و ادغام یکپارچه با توپولوژی برگ-اسپین مبتنی بر لینوکس کومولوس را می داد.
راه حل و رویکرد استقرار
استقرار در اطرافآداپتور MCX653106A-HDAT ConnectX کارت شبکه PCIe، از پیکربندی دو پورت 100GbE خود برای ایجاد یک پارچه غیر مسدود کننده استفاده می کند. هر گره محاسباتی یک آداپتور دریافت کرد، در حالی که گرههای ذخیرهسازی به دو مورد برای افزونگی مجهز شدند. مراحل اجرایی کلیدی شامل:
- فعال کردن RoCEv2 با PFC (کنترل جریان اولویت) و ECN (اعلان ازدحام صریح) برای اطمینان از حمل و نقل بدون تلفات
- پیکربندی SR-IOV برای اختصاص توابع مجازی به پایگاه داده با اولویت بالا و بارهای کاری ذخیره سازی
- استقرار آخرینسازگار با MCX653106A-HDATپشته درایور (NVIDIA DOCA 2.5) در سراسر گره های Ubuntu 22.04 LTS
- پیاده سازی شتاب DPDK مبتنی بر سخت افزار برای مسیرهای پردازش بسته
بر اساسبرگه داده MCX653106A-HDATو اعتبارسنجی قبل از استقرار، تیم تاخیر سختافزاری زیر 1µs و حداکثر 215 میلیون بسته در ثانیه (MPPS) را برای تراکنشهای بستههای کوچک پیشبینی کرد - معیارهایی که برنامهریزی ظرفیت آنها را هدایت میکرد.
نتایج و مزایای قابل اندازه گیری
پس از چهار هفته آزمایشی بر روی 50 گره تولید، تیم زیرساخت پیشرفتهای زیر را هنگام مقایسه ثبت کردند.NVIDIA Mellanox MCX653106A-HDATدر برابر آداپتورهای قدیمی آنها:
| متریک | آداپتور Legacy 25GbE | MCX653106A-HDAT (RoCE) | بهبود |
|---|---|---|---|
| تأخیر خواندن NVMe-oF (P99) | 52 میکروثانیه | 6.8 میکروثانیه | کاهش 87 درصدی |
| سربار CPU (پشته شبکه) | 34% | 7% | 27 درصد آزاد شد |
| خروجی کل (به ازای هر سرور) | 92 گیگابیت در ثانیه (پیوند شده) | 198 گیگابیت بر ثانیه | افزایش 115 درصدی |
| نرخ بسته کوچک (64B) | 48 Mpps | 187 Mpps | 290% سود |
فراتر از اعداد خام، تیم مهندسی خاطرنشان کرد کهراه حل کارت آداپتور اترنت MCX653106A-HDATراهحلهای تنظیمی که قبلاً مورد نیاز بود را حذف کرد - مانند هکهای ادغام وقفه و بافرهای دریافت بزرگ. بارگذاریهای سختافزاری آداپتور برای VXLAN و Geneve همچنین پشته شبکه کانتینری آنها را ساده کرد و تأخیر پاد به پاد را تا 40 درصد در محیطهای Kubernetes کاهش داد.
برای مدیران IT که هزینه ها را ارزیابی می کنند،قیمت MCX653106A-HDATمقایسه با راهحلهای قابل مقایسه با 200 گیگابایت نشان داد که هزینه کل مالکیت 15 تا 20 درصد پایینتر است، در حالی که صرفهجویی در هسته CPU و کاهش استفاده از پورت سوئیچ را در نظر میگیریم. در همین حال،MCX653106A-HDAT برای فروشدرخواستهای تیمهای مجاور - از جمله HPC و تجزیه و تحلیل بلادرنگ - قبلاً برای چرخه تدارکات بعدی ارسال شده است.
خلاصه و چشم انداز
استقرار آن را تایید می کندNVIDIA Mellanox MCX653106A-HDATصرفاً یک ارتقاء مشخصات نیست، بلکه یک جهش کاربردی برای محیطهای حساس به تأخیر و محدود به توان عملیاتی است. سازمانها با تغییر پردازش شبکه از نرمافزار به سختافزار - از طریق تخلیههای RoCE، SR-IOV و معماری آماده GPUDirect، میتوانند به تأخیر قطعی مقیاس میکروثانیه دست یابند و در عین حال چرخههای CPU را برای منطق برنامه بازیابی کنند.
همانطور که تیم زیرساخت گسترش خود را به بیش از 500 گره گسترش می دهد، آنها همچنین در حال بررسی رمزگذاری داخلی داخلی آداپتور (IPsec/TLS) برای امنیت چند مستاجر و PTP (IEEE 1588v2) برای بارهای کاری خدمات مالی هستند. برای مهندسانی که به دنبال تنظیمات معتبر هستند،مشخصات MCX653106A-HDATو طرح های مرجع از طریق پورتال توسعه دهنده DOCA NVIDIA در دسترس هستند. این مورد در دنیای واقعی یک چیز را روشن می کند:کارت شبکه PCIe آداپتور MCX653106A-HDAT ConnectXوعده اترنت با تاخیر کم و توان عملیاتی بالا را برای مراکز داده نسل بعدی ارائه می دهد.
برای بررسی فنی عمیق تر، با مقام رسمی مشورت کنیدبرگه داده MCX653106A-HDATیا با معمار راه حل NVIDIA منطقه ای خود تماس بگیرید.

