اتصال با قابلیت اطمینان بالا و بهینهسازی عملیات برای مراکز داده و شبکههای سازمانی
April 21, 2026
یک ارائهدهنده خدمات مالی منطقهای که دو مرکز داده اصلی و بیش از ۵۰ شعبه را اداره میکرد، با چالشهای فزایندهای در زیرساخت شبکه قدیمی خود مواجه بود. خرابیهای مکرر لینک، تأخیر غیرقابل پیشبینی در ساعات اوج معاملات، و عیبیابی دستی دستوپاگیر مستقیماً بر نرخ تکمیل تراکنشها و بهرهوری کارکنان فناوری اطلاعات تأثیر میگذاشت. هسته ۱۰ گیگابایتی موجود آنها قادر به پشتیبانی از حجم فزاینده تکثیر دادههای بیدرنگ بین مراکز داده نبود و همچنین تلهمتری مورد نیاز برای نگهداری پیشگیرانه را فراهم نمیکرد. تیم معماری به یک ارتقاء اساسی نیاز داشت - ارتقایی که قابلیت اطمینان در سطح حامل، قطع اتصال مجدد در کمتر از یک میلیثانیه، و دید عملیاتی عمیق را بدون نیاز به جایگزینی کامل کابلکشی و اپتیک موجود ارائه دهد.
پس از ارزیابی چندین پلتفرم، تیم مهندسی Mellanox (NVIDIA Mellanox) 980-9I510-00NS00 را به عنوان سنگ بنای نوسازی شبکه خود انتخاب کرد. محصول شبکه 980-9I510-00NS00 در یک معماری اسپاین-لِیف در هر دو مرکز داده مستقر شد و ۱۶ واحد هسته اصلی را تشکیل دادند. تصمیمات کلیدی استقرار مستقیماً از برگه داده 980-9I510-00NS00 و مشخصات 980-9I510-00NS00 که پشتیبانی از ۲۰۰ گیگابیت بر پورت، قطع اتصال لینک مبتنی بر سختافزار (کمتر از ۱ میلیثانیه) و جریان تلهمتری جامع را تأیید میکردند، گرفته شد. به طور حیاتی، این دستگاه با فیبر تکحالته و فرستندههای موجود آنها سازگار با 980-9I510-00NS00 بود و امکان مهاجرت مرحلهای در طول هشت هفته بدون وقفه در سرویس را فراهم کرد. این راه حل همچنین چارچوب مدیریت Net-Q انویدیا را ادغام کرد و نظارت مبتنی بر CLI پراکنده را با یک داشبورد یکپارچه جایگزین کرد.
نتایج پس از استقرار در سه بعد حیاتی از انتظارات فراتر رفت. اول، قابلیت اطمینان لینک: هسته شبکه پرسرعت مرکز داده شبکه پرسرعت مرکز داده 980-9I510-00NS00 در طول شش ماه ۹۹.۹۹۹۹٪ زمان فعال بودن را با صفر وقفه برنامهریزی نشده ارائه داد. قطع اتصال خودکار لینک، زمان بازیابی را از ۱۵ دقیقه مداخله دستی به تنها ۸۰۰ میلیثانیه کاهش داد. دوم، پیشبینیپذیری تأخیر: در طول پنجرههای اوج معاملات (۹:۳۰ تا ۱۱:۳۰ صبح)، لرزش تأخیر بین مراکز داده از ±۴۰ میکروثانیه به ±۳ میکروثانیه کاهش یافت که مستقیماً ثبات همگامسازی پایگاه داده را بهبود بخشید. سوم، صرفهجویی عملیاتی: تیم فناوری اطلاعات با استفاده از تلهمتری داخلی برای شناسایی پیشگیرانه یک ماژول اپتیک معیوب قبل از ایجاد اختلال، زمان عیبیابی شبکه را ۷۳٪ کاهش داد. هنگام ارزیابی ارزش بلندمدت، قیمت 980-9I510-00NS00 در مقایسه با راه حلهای قابل مقایسه آماده ۴۰۰ گیگابیتی بسیار رقابتی بود و ساختار تخفیف حجم 980-9I510-00NS00 برای فروش بازده سرمایهگذاری را بیشتر بهبود بخشید. NVIDIA Mellanox 980-9I510-00NS00 از آن زمان به عنوان استاندارد برای تمام اتصالات بالادستی شعب جدید، جایگزین مدارهای قدیمی ۱ گیگابیتی، پذیرفته شده است.
| حوزه چالش | قبل از 980-9I510-00NS00 | پس از استقرار |
|---|---|---|
| زمان قطع اتصال لینک | ~۱۵ دقیقه (دستی) | <۱ ثانیه (سختافزار) |
| لرزش تأخیر (اوج) | ±۴۰ میکروثانیه | ±۳ میکروثانیه |
| زمان عیبیابی در هفته | ۱۱ ساعت | ۳ ساعت |
| توان عملیاتی شرق به غرب | محدود به ۱۰ گیگابیت | ۲۰۰ گیگابیت بدون افت |
فراتر از عملکرد خام، راه حل محصول شبکه 980-9I510-00NS00 شامل چندین ویژگی در سطح سازمانی بود که مستقیماً به نقاط درد عملیاتی رسیدگی میکرد. ردیابی وضعیت لینک مبتنی بر سختافزار نیاز به تایمرهای نگهداری را که قبلاً باعث همگرایی کند میشد، از بین برد. جریان تلهمتری، که از طریق gRPC تحویل داده میشد، مستقیماً به پشته Prometheus/Grafana موجود آنها وارد میشد و هشدارهای سفارشی برای تخریب سیگنال و روند خطای CRC را فعال میکرد. علاوه بر این، پشتیبانی دستگاه از تلهمتری شبکه درونباند (INT) به تیم اجازه داد تا ازدحام میکرو انفجاری را تا جریانها و پورتهای خاصی مشخص کند، قابلیتی که سوئیچهای قدیمی آنها کاملاً فاقد آن بودند.
بر اساس این استقرار موفق، این سازمان اکنون قصد دارد دامنه 980-9I510-00NS00 را به مکانهای لبه و مراکز هممکانی گسترش دهد. آزمایشهای اولیه نشان میدهد که محصول شبکه 980-9I510-00NS00 به طور یکپارچه با نقشه راه DPU انویدیا ادغام میشود و راه را برای بخشبندی امنیتی صفر اعتماد و مسیرهای داده قابل برنامهریزی باز میکند. تیم رهبری فناوری اطلاعات همچنین درخواست نقل قولهای بهروز شده قیمت 980-9I510-00NS00 را برای خرید مرحله دوم ۴۰ واحد، با هدف استانداردسازی تمام هستههای شبکه بر روی یک پلتفرم واحد با قابلیت اطمینان بالا، ارائه کرده است. برای سایر شرکتهایی که با چالشهای مشابه قابلیت اطمینان و عملیاتی روبرو هستند، NVIDIA Mellanox 980-9I510-00NS00 مسیری اثبات شده و مبتنی بر برگه داده را برای بهبود قابل اندازهگیری ارائه میدهد - از استقرار اولیه تا مقیاس بلندمدت.

