راهنمای راه حل فنی: آداپتور سرور Mellanox (NVIDIA) MCX631102AN-ADAT برای انتقال با تأخیر کم RDMA/RoCE

March 12, 2026

راهنمای راه حل فنی: آداپتور سرور Mellanox (NVIDIA) MCX631102AN-ADAT برای انتقال با تأخیر کم RDMA/RoCE
1. پیشینه پروژه و تحلیل نیازهای

معماری های مدرن مرکز داده تحت فشار مداوم برای ارائه عملکرد بالاتر در حالی که حفظ بهره وری عملیاتی است. The exponential growth in data-intensive workloads—from real-time analytics and AI training to distributed storage and financial trading—has exposed the limitations of traditional network infrastructuresگلوچه اصلی در استیک شبکه TCP / IP معمولی است که منابع CPU قابل توجهی را مصرف می کند، تاخیر غیر قابل پیش بینی را معرفی می کند و کل سیستم را محدود می کند.

معماران شرکت با یک چالش مهم روبرو هستند: چگونه عملکرد شبکه را بدون افزایش متناسب هزینه و پیچیدگی مقیاس بندی کنیم.این راه حل نیاز به یک تغییر اساسی از شبکه های متمرکز بر CPU به شبکه های شتاب دهنده سخت افزاری دارداین کتاب سفید فنی یک راه حل جامع را ارائه می دهد که در اطراف Mellanox (NVIDIA) MCX631102AN-ADAT ساخته شده است.پاسخگویی به الزامات اساسی برای انتقال کم تاخیر و افزایش سرعت سرور از طریق فناوری RDMA/RoCE.

2. طراحی کلی معماری شبکه و سیستم

معماری پیشنهادی یک توپولوژی برگ ستون فقرات بهینه شده برای اتصال 25GbE با پشتیبانی RDMA / RoCE را اتخاذ می کند.در قلب این طراحی، اصل حذف هزینه های CPU مرتبط با شبکه در حالی که حفظ یکپارچه سازی با سرمایه گذاری زیرساخت های موجود است.

  • لایه برگ:سوئیچ های بالای قفسه که با PFC (کنترل جریان اولویت) و ECN (اطلاع صریح در مورد ازدحام) برای پشتیبانی از ترافیک RoCE v2 بدون ضرر تنظیم شده اند
  • لایه ستون فقرات:سوئیچ های با ظرفیت بالا که اتصال بدون مسدود کردن هر چیزی به هر چیزی را با لینک های صعودی 100GbE فراهم می کنند
  • لایه سرور:گره های محاسباتی و ذخیره سازی مجهز به آداپتورهای NVIDIA Mellanox MCX631102AN-ADAT ConnectX-6 Lx دو پورت 25GbE SFP28
  • شبکه ذخیره سازی:پارچه اختصاصی با قابلیت RoCE برای دسترسی NVMe-oF به آرایه های ذخیره سازی تمام فلش

این معماری از چندین دامنه بار کاری پشتیبانی می کند - از جمله مجازی سازی ، محیط های bare-metal و کانتینری شده - از طریق تقسیم ترافیک هوشمند و سیاست های QoS.هر سرور از قابلیت دو پورت MCX631102AN-ADAT برای تعادل بار فعال فعال یا پیکربندی های فعال و منفعل با قابلیت دسترسی بالا استفاده می کند.

3نقش ملانوکس (NVIDIA) MCX631102AN-ADAT در راه حل

کارت آداپتور اترن MCX631102AN-ADAT به عنوان رابط حیاتی بین منابع سرور و بافت شبکه عمل می کند. این آداپتور پیشرفته، بر اساس معماری ConnectX-6 Lx ساخته شده است.چندین قابلیت تغییر دهنده را ارائه می دهد:

  • RDMA/RoCE مبتنی بر سخت افزار:آداپتور RoCE v2 را در سخت افزار اجرا می کند و انتقال مستقیم داده ها را بدون دخالت CPU امکان پذیر می کند.این امر تاخیر را به یک میکروسکنید تک رقمی کاهش می دهد در حالی که هسته های CPU را برای پردازش برنامه آزاد می کند.
  • بهینه سازی هوشمند PCIe:با رابط میزبان PCIe 3.0/4.0 x8، مشخصات MCX631102AN-ADAT پشتیبانی از حداکثر 50Gb / s دو طرفه را نشان می دهد، از بین بردن تنگه های فشرده PCIe در سرورهای با عملکرد بالا.
  • پشتیبانی پیشرفته از مجازی سازی:این آداپتور SR-IOV مبتنی بر سخت افزار را با حداکثر 512 عملکرد مجازی فراهم می کند که عملکرد قابل پیش بینی را برای محیط های چند مستاجر تضمین می کند.
  • سرعت ذخیره سازی:پشتیبانی بومی برای NVMe-oF و iSER الگوهای دسترسی ذخیره سازی کارآمد را که برای زیرساخت های مدرن بسیار نزدیک شده ضروری است، امکان پذیر می کند.

پیکربندی دو پورت 25GbE SFP28 انعطاف پذیری استقرار را ارائه می دهد. پورت ها را می توان برای شبکه های جداگانه پیکربندی کرد (به عنوان مثال، یکی برای ذخیره سازی،یک برای محاسبات) یا جمع آوری شده برای افزایش پهنای باند و افزوده.

4توصیه های گسترش و گسترش

استفاده موفق از راه حل دو پورت MCX631102AN-ADAT ConnectX-6 Lx 25GbE SFP28 نیاز به برنامه ریزی دقیق در سطوح شبکه، سرور و برنامه دارد.روش مرحله ای زیر توصیه می شود:

فاز فعالیت ها ملاحظات کلیدی
1آمادگی زیرساخت ها بررسی پشتیبانی سوئیچ برای RoCE (PFC/ECN) ، کابل کشی (SFP28) و ظرفیت برق/برد به لیست سوئیچ های سازگار MCX631102AN-ADAT از NVIDIA Mellanox مراجعه کنید
2. تعيين خلبان استفاده در یک خوشه بار کاری نماینده (به عنوان مثال، گره های پایگاه داده یا تجزیه و تحلیل) اعتباربخشی مشخصات MCX631102AN-ADAT در برابر الزامات بار کاری
3. تنظیمات RoCE تنظیم اولویت های PFC، آستانه ECN و تخصیص بافر استفاده از راهنمای تنظیم عملکرد NVIDIA از صفحه داده MCX631102AN-ADAT
4. عرضه ی تولید مقیاس به کلستر با مدیریت پیکربندی سازگار اجرای نظارت و هشدار برای سلامت ترافیک RDMA

برای پیاده سازی چند سایت، اجرای RoCE را در شبکه های L3 با استفاده از ویژگی های پیشرفته مانند QoS مبتنی بر DSCP و انتشار اطلاعیه انسداد در نظر بگیرید.راه حل کارت آداپتور اترنت MCX631102AN-ADAT شامل پشتیبانی جامع برای این قابلیت ها است.

5عملیات، نظارت و بهینه سازی

حفظ عملکرد بهینه نیاز به دید در الگوهای ترافیک RDMA / RoCE و سلامت آداپتور دارد. شیوه های زیر عملکرد قابل اعتماد را تضمین می کند:

  • نظارت بر عملکرد:استفاده از ابزار Mellanox NVIDIA (mlxtool، ethtool) و ابزار استاندارد لینوکس برای نظارت بر آمار پورت، شمارنده های RDMA و خطاهای PCIe. معیارهای کلیدی شامل کاهش ازدحام RoCE، فریم های توقف PFC است.,و بسته های نشان داده شده ECN.
  • مدیریت نرم افزار و درایور:به روزرسانی های منظم دسترسی به آخرین ویژگی ها و رفع اشکال را تضمین می کند. MCX631102AN-ADAT برای فروش از طریق کانال های مجاز شامل حق ذخیره سازی نرم افزار شرکت NVIDIA است.
  • مدیریت ترافیک:اجرای تنظیم محدوده پویا برای بافرهای PFC بر اساس الگوهای بار کار. برای برنامه های حساس به تاخیر، گروه های اولویت جداگانه برای ترافیک RDMA و TCP سنتی را پیکربندی کنید.
  • چارچوب رفع مشکل:توسعه یک رویکرد سیستماتیک برای مسائل مشترک:
    • مسائل مربوط به پیوند: بررسی ماژول های SFP28، کیفیت کابل و سرعت مذاکره
    • اتصال RoCE: سنجش تقارن پیکربندی PFC در تمام سوئیچ ها
    • کاهش عملکرد: بررسی کمبود بافر یا ازدحام مداوم

مشخصات جامع MCX631102AN-ADAT شامل قابلیت های گسترده تشخیصی از طریق شمارنده های سخت افزاری و ثبت عیب یابی قابل دسترسی از طریق رابط های مدیریت استاندارد است.

6خلاصه و ارزیابی ارزش

آداپتور سرور Mellanox (NVIDIA) MCX631102AN-ADAT یک بلوک اساسی برای معماری های نسل بعدی مرکز داده است.با فعال کردن ارتباطات مبتنی بر RDMA/RoCE در تراکم های 25GbE، این راه حل ارائه می دهد:

  • کاهش 80-90٪ از هزینه های اضافی CPU مربوط به شبکه، اجازه می دهد تا یکپارچه سازی سرور و کاهش هزینه های مجوز
  • تاخیر کمتر از 10 میکرو ثانیهبرای ارتباطات بین سرورها، که کلاس های جدیدی از برنامه های توزیع شده را فعال می کند
  • مقیاس بندی خطی خروجیبا اندازه خوشه، از بین بردن تنگنایی های سنتی شبکه
  • سرمایه گذاری در آیندهبا سازگاری بین نسل های مختلف زیرساخت های سرور و ذخیره سازی

سازمان هایی که در نظر دارند MCX631102AN-ADAT را پیاده سازی کنند، می توانند اطلاعات دقیق قیمت MCX631102AN-ADAT و مشاوره فنی را از شرکای مجاز NVIDIA Mellanox دریافت کنند.معماری اثبات شده راه حل و پشتیبانی گسترده از اکوسیستم آن را انتخاب ترجیح داده شده برای شرکت های در حال انتقال به مدل های محاسباتی مبتنی بر داده می کند.