آداپتور سرور NVIDIA Mellanox MCX653105A-HDAT در عمل: افزایش توان عملیاتی با حمل و نقل با تأخیر کم RDMA/RoCE
March 16, 2026
یک شرکت فناوری مالی پیشرو، در حالی که در حال ساخت پلت فرم تجزیه و تحلیل داده های بزرگ نسل بعدی خود بود، با فشارهای شدید شبکه I / O مواجه شد.زیرساخت های موجود 10GbE برای رسیدگی به جریان عظیم داده های مورد نیاز برای ارزیابی ریسک در زمان واقعی و تجزیه و تحلیل تجارت با فرکانس بالا تلاش می کردند. هسته های پردازنده تا ۳۰ درصد از چرخه های خود را صرف مدیریت ترافیک شبکه می کردند و منابع کمتری را برای پردازش برنامه های حیاتی باقی می گذاشتند. چالش اصلی روشن بود:برای مقیاس بندی پایگاه داده توزیع شده و تجزیه و تحلیل مبتنی بر هوش مصنوعی، آنها نیاز داشتند تا به طور چشمگیری تاخیر را کاهش دهند و سرعت سرور موثر را بدون تعمیر کل ناوگان سرور خود افزایش دهند.
شبکه های سنتی TCP/IP دیگر قابل استفاده نبودند. هزینه های بالای شبکه هسته ای باعث افزایش تاخیر غیر قابل پیش بینی شد.به طور مستقیم بر عملکرد پایگاه داده های درون حافظه و خوشه های ذخیره سازی مبتنی بر NVMe تأثیر می گذارد.شرکت به راه حلی نیاز داشت که بتواند پردازش شبکه را از CPU خارج کند و انتقال مستقیم و سریع داده بین سرورها و ذخیره سازی را امکان پذیر کند. پس از ارزیابی چندین گزینه،تصمیم گرفته شد که迈络思 ((NVIDIA Mellanox) MCX653105A-HDATکارت آداپتور سرور در تمام گره های محاسبات و ذخیره سازی حیاتی آنها.
این کار متمرکز برMCX653105A-HDAT، یک آداپتور دو پورت 100 گیگابایت در ثانیه از خانواده NVIDIA Mellanox ConnectX-6 است. هدف اصلی آن پیاده سازی RDMA بر روی اترنات تبدیل شده (RoCE) برای دور زدن CPU برای انتقال داده بود.NVIDIA Mellanox MCX653105A-HDATبرای پشتیبانی سخت افزاری بومی برای RoCE انتخاب شده است که مزایای کم تاخیر InfiniBand را در حالی که بر روی یک پارچه استاندارد اترنت کار می کند، فراهم می کند.تضمین سازگاری با سوئیچ های موجود شبکه.
تیم مهندسی سرورها را در یک توپولوژی ستون فقرات تنظیم کرده است که امکان اتصال هر کسی با عملکرد قابل پیش بینی را فراهم می کند.کارت آداپتور اترنت MCX653105A-HDATدر هر دو سرور پایگاه داده و آرایه های ذخیره سازی تمام NVMe با استفاده از بارگذاری RoCE مبتنی بر سخت افزار،تیم یک پارچه بدون ضرر با کنترل جریان اولویت (PFC) برای اطمینان از سقوط بسته صفر ایجاد کرد، یک نیاز حیاتی برای عملیات RDMA کارآمد است.کارت شبکه PCIe MCX653105A-HDAT ConnectXدر این مورد ضروری بود، زیرا مکانیسم های پیشرفته کنترل ازدحام آن ثبات پارچه را حتی در صورت بار کامل حفظ می کرد.
ارتقاء عملکرد بلافاصله و قابل توجه بود. قبل از ارتقاء، زیرساخت 10GbE موجود سرعت سرور به سرور را در حدود 1.2 GB / s با استفاده بالا از CPU محدود می کرد.پس از ادغامMCX653105A-HDATآداپتورها و فعال کردن RoCEv2 ، خوشه به موارد زیر دست یافت:
| متریک | قبل از (10GbE/TCP) | بعد از (100GbE/RoCE با MCX653105A-HDAT) |
|---|---|---|
| تولید موثر (NVMe-oF) | ~1.1 GB/s | ~11.5 GB/s |
| متوسط تاخیر (دوران) | ~150 μs | < 5 μs |
| استفاده از پردازنده (I/O شبکه) | ~ 30% | < 5٪ |
این افزایش ۱۰ برابر در سرعت تولید در حالی که همزمان هسته های CPU را برای پردازش در سطح برنامه آزاد می کند، به دست آمده است.MCX653105A-HDATاز این رو، قابلیت های RDMA، در مقایسه با سیستم های دیگر، قابلیت های RDMA را به طور گسترده ای در اختیار کاربران قرار می دهد.به عنوان جزئیات در رسمیمشخصات MCX653105A-HDAT، امکان انتقال مستقیم حافظه به حافظه را فراهم می کند، هسته را دور می کند و تاخیر را به سطوحی که قبلاً فقط در خوشه های تخصصی HPC دیده می شد، کاهش می دهد.ورق اطلاعات MCX653105A-HDATبرای تنظیم دقیق پارامترهای PCIe، اطمینان از استفاده بهینه از پهنای باند Gen4.
این کار نشان می دهد کهMCX653105A-HDAT راه حل کارت آداپتور اترنتبا حل تنگنای CPU از طریق حمل و نقل RDMA / RoCE کارآمد،MCX653105A-HDATاین موفقیت راه را برای گسترش گسترش به خوشه های آموزش یادگیری ماشین خود فراهم کرده است.که ویژگی های کم تاخیرMCX653105A-HDAT براي فروشبرای معماران و مهندسان ارزیابی زیرساخت های با کارایی بالا،MCX653105A-HDAT سازگارطبیعت با سیستم عامل های موجود و ابزارهای مدیریت آن را یک انتخاب بی نقص برای ساخت مراکز داده مدرن و با سرعت بالا می کند.

