قطعی کلودفلر

شبکه جهانی Cloudflare روز 18 نوامبر 2025 (27 آبان 1404) با یک اختلال گسترده روبه‌رو شد که باعث شد کاربران هنگام دسترسی به وب‌سایت‌های استفاده‌کننده از خدمات این شرکت، با خطاهای HTTP 5xx و قطعی کلودفلر مواجه شوند. این اختلال که از ساعت 14:50 به وقت تهران آغاز شد، به‌طور موقت بخش قابل توجهی از ترافیک اینترنت را دچار اختلال کرد.

علت اختلال و قطعی کلودفلر چه بود؟

این اختلال در ابتدا به‌عنوان یک حمله احتمالی DDoS تفسیر شد، اما بررسی‌های دقیق‌تر نشان داد که منشأ آن یک اشتباه داخلی در پیکربندی سیستم‌ها بود. یک تغییر ناخواسته در مجوزهای پایگاه داده، که منجر به اصلاح نادرست فایل پیکربندی مورد استفاده در سیستم Bot Management شد و جریان پردازش ترافیک اصلی شبکه را مختل کرد. حال از آنجایی که سیستم مدیریت ربات کلودفلر که بر اساس مدل‌های یادگیری ماشین برای شناسایی ربات‌ها عمل می‌کند، به دلیل بروز این خطا تمامی درخواست‌های وابسته را با خطای سرور پاسخ داد. این مشکل تا ساعت 18 ادامه داشت تا در نهایت ساعت 20:36 تمامی سیستم‌ها در کلودفلر به حالت عادی بازگشتند.

بررسی اختلال از منظر تیم فنی کلودفلر

بر اساس گزارش رسمی کلودفلر، این مشکل هیچ ارتباطی با حمله سایبری یا فعالیت مخرب نداشت. عامل اصلی، تغییر اشتباه در سطح دسترسی یکی از پایگاه‌داده‌های ClickHouse بود که باعث شد فایل پیکربندی ویژگی‌های سیستم Bot Management به‌صورت غیرعادی بزرگ شود.

این فایل که هر چند دقیقه یک‌بار به‌روزرسانی و در کل شبکه توزیع می‌شود، بعد از این تغییر، پایگاه داده شامل تعداد زیادی داده تکراری شد و اندازه آن تقریباً دو برابر شد. حال از آنجا که نرم‌افزارهای مسیریابی کلودفلر محدودیت مشخصی برای اندازه این فایل داشتند، دریافت نسخه بزرگ‌شده باعث از کار افتادن ماژول پردازش بات‌ها و در نتیجه اختلال در هسته پراکسی شبکه (FL/FL2) شد.

پیامدهای قطعی کلودفلر

این اختلال باعث شد چندین سرویس کلودفلر با مشکل مواجه شوند:

  • شبکه CDN و سرویس‌های امنیتی: بروز خطاهای HTTP 5xx برای کاربران نهایی
  • Turnstile: عدم بارگذاری سرویس و در نتیجه مشکل در ورود کاربران
  • Workers KV: افزایش خطاها به‌دلیل وابستگی به هسته پراکسی
  • Dashboard: عدم توانایی بسیاری از کاربران در ورود به حساب کاربری
  • Cloudflare Access: خطاهای گسترده در احراز هویت
  • Email Security: کاهش موقتی دقت سیستم تشخیص اسپم

همچنین کلودفلر اعلام کرد که مصرف بالای منابع در زمان رفع مشکل باعث افزایش چشمگیر زمان پاسخ‌دهی (Latency) در شبکه شده بود.

رفع مشکل قطعی کلودفلر

پس از چند ساعت بررسی و با وجود این‌که تیم فنی ابتدا احتمال حمله DDoS را مطرح کرده بود، علت اصلی شناسایی شد و از ساعت 18روند رفع اختلال آغاز شد. کلودفلر با توقف انتشار فایل اشتباه و جایگزینی آن با نسخه درست، توانست بخش عمده خدمات را به حالت عادی بازگرداند. در نهایت در ساعت 20:36 اعلام شد که تمام سرویس‌ها به وضعیت عادی بازگشته‌اند.

اقدامات کلودفلر برای جلوگیری از تکرار این اختلال

کلودفلر برای جلوگیری از رخدادهای مشابه، مجموعه‌ای از تغییرات و بهبودها را آغاز کرده است، از جمله:

  • ایجاد سازوکارهای ایمن‌تر برای دریافت و انتشار فایل‌های پیکربندی داخلی
  • افزودن امکان توقف سریع برای بخش‌های حساس
  • جلوگیری از اشباع سیستم‌ها در زمان تولید گزارش‌های خطا
  • بازبینی خطاهای بحرانی ماژول‌های هسته پراکسی

قطعی گسترده کلودفلر ChatGPT و X را تحت‌تأثیر قرار داد

کلودفلر یکی از مهم‌ترین ارائه‌دهندگان زیرساخت اینترنتی در جهان است و اختلال در خدمات این شرکت می‌تواند به سرعت بر صدها سرویس و میلیون‌ها کاربر اثر بگذارد. به همین دلیل، قطعی اخیر، بسیاری از وب‌سایت‌ها و اپلیکیشن‌های مطرح را از دسترس خارج کرد. پلتفرم‌هایی مانند X (توییتر سابق)، سامانه‌های مبتنی بر هوش مصنوعی همچون ChatGPT، سرویس‌های استریم موسیقی مانند Spotify و ابزارهای طراحی آنلاین از جمله Canva همگی با خطاهای مختلف مواجه شدند. حتی برخی وب‌سایت‌های نظارتی مانند DownDetector نیز که برای رصد خرابی سرویس‌ها استفاده می‌شوند، خودشان از دسترس خارج شدند.

کاربران در مواجهه با این مشکلات معمولاً با خطاهایی نظیر Internal Server Error یا کد 500 روبه‌رو شدند؛ خطاهایی که نشان می‌داد مشکل از سمت زیرساخت‌های شبکه است و ارتباطی با دستگاه کاربران ندارد. در بسیاری از وب‌سایت‌ها نیز پیام‌هایی نمایش داده می‌شد که نشان می‌داد مسیر درخواست‌ها در بخش تحت مدیریت کلودفلر با اشکال روبه‌رو شده است. علاوه بر این، گزارش‌ها تأکید دارند که داشبورد مدیریتی کلودفلر و رابط‌های برنامه‌نویسی (API) آن نیز لحظاتی غیرقابل دسترس بود و همین موضوع باعث شد اختلال‌ها سریع‌تر و گسترده‌تر خود را نشان دهند.

چه چیزی این اختلال را مهم می‌کند؟

کلودفلر یک شرکت زیرساختی است که از شبکه گسترده‌ای از سرورها برای سریع‌تر و امن‌تر کردن تحویل محتوا در سراسر جهان استفاده می‌کند. بسیاری از وب‌سایت‌ها برای محافظت در برابر حملات و افزایش سرعت بارگذاری صفحات به این شرکت وابسته‌اند. هنگامی که کلودفلر دچار قطعی می‌شود، ساختار توزیع‌شده آن باعث می‌شود بخش قابل توجهی از اینترنت با مشکل مواجه شود و بسیاری از کاربران عملاً امکان دسترسی به سرویس‌های مورد نیاز خود را از دست بدهند.

در پی این اختلال، هزاران گزارش از سوی کاربران در نقاط مختلف جهان منتشر شد و بسیاری از سرویس‌ها به‌طور کامل یا جزئی از کار افتادند. برخی از کاربران اعلام کردند صفحه‌ها بارگذاری نمی‌شود، گروهی دیگر با نمایش ناقص داده‌ها مواجه بودند و بعضی سرویس‌ها حتی امکان پردازش اولیه درخواست‌ها را نیز نداشتند.

از منظر کاربران، هیچ راه‌حل مشخص و عملی برای برطرف کردن این وضعیت وجود نداشت، زیرا مشکل مستقیماً از زیرساخت مرکزی کلودفلر نشأت می‌گرفت و ارتباطی با تنظیمات شبکه یا مشکلات فردی کاربران نداشت. نه تغییر آدرس IP، نه استفاده از VPN و نه راه‌اندازی مجدد مودم تأثیری بر این مسئله نداشت، زیرا مسیر ترافیک جهانی دچار اختلال شده بود.

در نهایت، تنها راه حل، صبر و انتظار تا رفع کامل اشکال از سوی تیم مهندسی کلودفلر بود. کاربران و کسب‌وکارها نیز ناچار بودند تا زمانی که این شرکت مشکل را برطرف کند، منتظر بمانند.

بیانیه کلودفلر

کلودفلر این حادثه را بزرگ‌ترین اختلال مجموعه از سال دانست و از کسانی که به خاطر ان اختلال دچار مشکل شدند عذرخواهی کرد:

با توجه به اهمیت کلودفلر در اینترنت، اختلالی در این ابعاد برای ما قابل قبول نیست. مشکل پیش آمده برای هر یک از اعضای تیم ما ناراحت کننده بود. ما می‌دانیم که امروز شما را ناامید کردیم و قول می‌دهیم چنین اتفاقی دوباره تکرار نشود.

قطعی کلودفلر

نمودار بالا حجم کدهای وضعیت HTTP 5xx شبکه کلودفلر را نشان می‌دهد.

منبع: blog.cloudflare.com

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *