آداپتور سرور NVIDIA Mellanox MCX4121A-ACAT در عمل | حمل و نقل و سرور RDMA/RoCE با تاخیر کم
April 22, 2026
یک ارائه دهنده خدمات ابری در مقیاس بزرگ با یک چالش آشنا هنگام ساخت کلستر ذخیره سازی توزیع شده نسل بعدی خود روبرو شد.CPU overhead و جیتر تأخیر در سطح میکروسکنید ذاتی در استیک سنتی TCP / IP به شدت محدود NVMe-oF و عملکرد پایگاه داده توزیع شدهپس از ارزیابی دقیق، تیمNVIDIA Mellanox MCX4121A-ACATآداپتور سرور برای ارتقاء ساختار شبکه خود، استفاده از فناوری RDMA / RoCE برای تغییر اساسی مسیرهای داده.
پیش زمینه و چالش: گلوی فشنی TCP/IP در ترافیک شرق-غرب
در مراکز داده های مدرن، ترافیک شرق-غرب، ارتباطات بین سرورها بر الگوهای ترافیک کلی تسلط دارد.هر عملیات I/O نیاز به چندین مسیر رفت و آمد شبکه دارد.. استیک TCP معمولی بیش از 30 درصد از هسته های CPU را فقط برای پردازش پروتکل مصرف می کند، که باعث افزایش تاخیر غیر قابل پیش بینی می شود که عملکرد برنامه را کاهش می دهد.تیم به راه حلی نیاز داشت که بتواند هسته را دور بزند، مداخله پردازنده را کاهش می دهد و تاخیر زیر میکروس ثانیه ای ثابت را در کلستر ارائه می دهد.
راه حل و پیاده سازی: پیاده سازی MCX4121A-ACAT برای حمل و نقل RoCE
ارائه دهنده استفاده ازکارت آداپتور اترنت MCX4121A-ACATدر 120 گره ذخیره سازی، هر کدام با اتصال دو پورت 25GbE پیکربندی شده است.MCX4121A-ACAT ConnectX-4 Lx دو پورت 25GbE SFP28طراحی امکان پیاده سازی یکپارچه RoCE (RDMA over Converged Ethernet) را بدون نیاز به زیرساخت های اختصاصی InfiniBand فراهم می کند. پارامترهای اصلی پیاده سازی شامل:
- کنترل جریان اولویت (PFC) و انتخاب انتقال پیشرفته (ETS) در تمام سوئیچ های ToR پیکربندی شده است.
- علامت گذاری ECN برای حمل و نقل RoCE با توجه به ازدحام فعال شده است.
- نقش های شروع کننده و هدف NVMe-oF به طور مستقیم به موتورهای تخلیه سخت افزاری آداپتور نقشه برداری می شوند.
بر اساسورق اطلاعات MCX4121A-ACAT، حمل و نقل مبتنی بر سخت افزاری آداپتور نیاز به دخالت CPU در حرکت داده ها را از بین می برد. تیم سازگاری را در توزیع لینوکس موجود و SFP28 معتبر می کند.تاییدسازگاری با MCX4121A-ACATاکوسیستم تمام الزامات را برآورده می کند.
نتایج و مزایای: سود قابل اندازه گیری در تولید و تاخیر
تست های پس از پیاده سازی پیشرفت های چشمگیری را نشان داد. جدول زیر معیارهای کلیدی عملکرد قبل و بعد از مهاجرت به راه حل MCX4121A-ACAT را خلاصه می کند:
| متریک | TCP 10GbE قدیمی | MCX4121A-ACAT (RoCE) | بهبود |
|---|---|---|---|
| متوسط تاخیر (4KB I/O) | 35μs | 2.1μs | 16.6 برابر پایین تر |
| استفاده از پردازنده (در هر 10 گیگابایت در ثانیه) | 32 درصد | ۴٪ | 8 برابر کاهش |
| حجم کل (دو پورت) | ۱۸ گیگابایت در ثانیه | ۴۹ گیگابایت در ثانیه | 2.7 برابر بالاتر |
فراتر از اعداد خام،مشخصات MCX4121A-ACATترجمه شده به مزایای عملیاتی واقعی. تاخیر تکرار پایگاه داده توزیع شده بیش از 80٪ کاهش یافته است، که تضمینات سازگارتر را تضمین می کند. NVMe-oF IOPS خواندن / نوشتن دو برابر شده است،هسته های CPU گره های ذخیره سازی که قبلاً توسط پردازش استیک شبکه مصرف شده بودند برای خدمات داده واقعی استفاده مجدد شدندارائه دهنده همچنین اشاره کرد کهMCX4121A-ACAT راه حل کارت آداپتور اترنتکاهش هزینه کل مالکیت آنها نیاز به گره های کمتری برای دستیابی به عملکرد کلی یکسان داشت.
برای سازمان هایی که به روزرسانی های مشابهی را ارزیابی می کنند،قیمت MCX4121A-ACATدر حال حاضر چندین توزیع کننده در حال لیست کردن این راه حل ها هستند.MCX4121A-ACAT برای فروشبا قیمت گذاری حجم، گسترش RoCE در مقیاس بزرگ را به طور فزاینده قابل دسترسی می کند.
خلاصه و چشم انداز: یک طرح برای مراکز داده کم تاخیر
این کار نشان می دهد کهNVIDIA Mellanox MCX4121A-ACATبیشتر از یک ارتقاء مشخصات است، این یک عامل اساسی برای سیستم های توزیع شده با عملکرد بالا است. با ترکیب پهنای باند دو پورت 25GbE با حمل و نقل RoCE بدون بار سخت افزاری،آداپتور تنش طولانی مدت بین عملکرد شبکه و بهره وری CPU را حل می کنداز آنجایی که خوشه های آموزش هوش مصنوعی، ذخیره سازی تجزیه و تحلیل در زمان واقعی همچنان به تاخیر کمتر و خروجی بالاتر نیاز دارند، MCX4121A-ACAT یک راه ثابت و آماده تولید را فراهم می کند.معماران شبکه و مدیران فناوری اطلاعات به دنبال یک،آداپتور سرور با کارایی بالا نیازی به دنبال کردن بیشتر از این ConnectX-4 Lx نیروگاه نیست.

