NVIDIA Mellanox MCX653106A-HDAT در عمل: تبدیل انتقال کم تاخیر RDMA / RoCE و خروجی سرور
March 17, 2026
در عصر تجزیه و تحلیل در زمان واقعی و بار کاری مبتنی بر هوش مصنوعی، مراکز داده تحت فشار مداوم برای ارائه داده های بیشتر با تاخیر کمتر هستند.یک ارائه دهنده خدمات ابر پیشرو اخیرا با یک چالش حیاتی روبرو شد: خوشه ذخیره سازی توزیع شده آنها با هزینه CPU و اضطراب تاخیر ناشی از پروتکل های سنتی TCP / IP مبارزه می کرد.آنها به راه حلی نیاز داشتند که بتواند پردازش شبکه را کاهش دهد و امکان عبور واقعی هسته را فراهم کند.اين داستان اينه که چطورMCX653106A-HDATسنگ بنای ارتقای زیرساخت های آنها شد.
محاسبات با کارایی بالا (HPC) و کارآموزان آموزش هوش مصنوعی شرکت نیاز به انتقال داده های عظیم بین صدها گره دارند.NIC های 25GbE موجود تا 30٪ از هسته های CPU را فقط برای مدیریت ترافیک شبکه مصرف می کردنداین امر نه تنها هزینه های عملیاتی را افزایش داد بلکه باعث افزایش تاخیر غیر قابل پیش بینی در طول بار های اوج شد.تیم مهندسی متوجه شدند که برای رسیدن به عملکرد مورد نظر برای سیستم فایل موازی خود، آنها نیاز به پذیرش RDMA ( دسترسی مستقیم از راه دور به حافظه) را بر روی اترنت همگرا (RoCE) داشتند.NVIDIA Mellanox MCX653106A-HDATراه حل شروع شد.
پس از ارزیابی کامل سخت افزار موجود، تیمکارت شبکه PCIe MCX653106A-HDAT ConnectX. این استقرار به گره های ذخیره سازی و محاسبات در محیط ابری خصوصی خود هدف قرار گرفت. با استفاده از پشتیبانی بومی کارت برای RoCE،تیم پارچه های اترنت بدون ضرر را با استفاده از کنترل جریان اولویت (PFC) و انتخاب انتقال پیشرفته (ETS) پیکربندی کرده است.فرآیند نصب توسط سازگاری PCIe 3.0/4.0 کارت ساده شده است، که امکان یکپارچه سازی در هر دو سرور جدید و موجود را فراهم می کند.
درکارت آداپتور اترنت MCX653106A-HDATبا استفاده از قابلیت های تخلیه سخت افزار معماری ConnectX-6،تیم با موفقیت پردازش شبکه را از CPU به خود آداپتور منتقل کردبرای اطمینان از عملکرد بهینه، مهندسان به طور گسترده ای بهمشخصات MCX653106A-HDATو راهنمای تنظیم برای تنظیم دقیق اندازه های بافر و قطع تنظیمات اعتدال، ایجاد یک پایه قوی برای ترافیک RDMA.
تاثیر استفاده ازMCX653106A-HDATجدول زیر نشان دهنده پیشرفت عملکردی است که در محیط تولید پس از مهاجرت به RDMA / RoCE مشاهده شده است:
| متریک | قبل از استفاده (TCP/IP) | پس از اعزام (RoCE v2) |
|---|---|---|
| متوسط تاخیر (IPC) | 12 μs | 2.1 μs |
| استفاده از CPU (شبکه) | ۲۸% | 5 درصد |
| میزان خروجی در هر گره | 18 گیگابایت در ثانیه (فعال) | 98 گیگابایت در ثانیه (سرعت خط) |
باNVIDIA Mellanox MCX653106A-HDATاین به طور مستقیم به بررسی سریعتر برای مدل های هوش مصنوعی و تجزیه و تحلیل زمان واقعی ساده تر تبدیل شد.هسته های CPU آزاد شده به بارهای کاری برنامه ها اختصاص داده شدند، افزایش بهره وری کل خوشه با بیش از 20٪ برای مدیران IT،قابلیت دید ارائه شده توسط تله متری پیشرفته آداپتور برنامه ریزی ظرفیت و تجزیه و تحلیل گلوی فشرده را به طور قابل توجهی دقیق تر کرد.
تیم مهندسی که از این موفقیت تشویق شده اند، در حال حاضر در حال برنامه ریزی برای گسترش استفاده از محیط های مجازی خود هستند.MCX653106A-HDAT سازگاردر حالی که آنها خرید واحدهای اضافی را ارزیابی می کنند، این شرکت در حال توسعه است.قیمت MCX653106A-HDATاین تیم همچنین در حال بررسی هزینه های مربوط به این پروژه است.MCX653106A-HDAT راه حل کارت آداپتور اترنتبرای پیاده سازی NVMe-oF، با هدف ایجاد یک ساختار ذخیره سازی کاملاً تجزیه شده.
این مطالعه موردی نشان می دهد که برای سازمان های جدی در مورد کاهش تاخیر و به حداکثر رساندن خروجی سرور،MCX653106A-HDATبرای نمودارهای معماری دقیق و برای تأیید نیازهای سیستم خود، این کارته رسمیصفحه اطلاعات MCX653106A-HDATتمام عمق فنی لازم را فراهم می کند.

