شبکه جهانی Cloudflare روز 18 نوامبر 2025 (27 آبان 1404) با یک اختلال گسترده روبهرو شد که باعث شد کاربران هنگام دسترسی به وبسایتهای استفادهکننده از خدمات این شرکت، با خطاهای HTTP 5xx و قطعی کلودفلر مواجه شوند. این اختلال که از ساعت 14:50 به وقت تهران آغاز شد، بهطور موقت بخش قابل توجهی از ترافیک اینترنت را دچار اختلال کرد.
علت اختلال و قطعی کلودفلر چه بود؟
این اختلال در ابتدا بهعنوان یک حمله احتمالی DDoS تفسیر شد، اما بررسیهای دقیقتر نشان داد که منشأ آن یک اشتباه داخلی در پیکربندی سیستمها بود. یک تغییر ناخواسته در مجوزهای پایگاه داده، که منجر به اصلاح نادرست فایل پیکربندی مورد استفاده در سیستم Bot Management شد و جریان پردازش ترافیک اصلی شبکه را مختل کرد. حال از آنجایی که سیستم مدیریت ربات کلودفلر که بر اساس مدلهای یادگیری ماشین برای شناسایی رباتها عمل میکند، به دلیل بروز این خطا تمامی درخواستهای وابسته را با خطای سرور پاسخ داد. این مشکل تا ساعت 18 ادامه داشت تا در نهایت ساعت 20:36 تمامی سیستمها در کلودفلر به حالت عادی بازگشتند.
بررسی اختلال از منظر تیم فنی کلودفلر
بر اساس گزارش رسمی کلودفلر، این مشکل هیچ ارتباطی با حمله سایبری یا فعالیت مخرب نداشت. عامل اصلی، تغییر اشتباه در سطح دسترسی یکی از پایگاهدادههای ClickHouse بود که باعث شد فایل پیکربندی ویژگیهای سیستم Bot Management بهصورت غیرعادی بزرگ شود.
این فایل که هر چند دقیقه یکبار بهروزرسانی و در کل شبکه توزیع میشود، بعد از این تغییر، پایگاه داده شامل تعداد زیادی داده تکراری شد و اندازه آن تقریباً دو برابر شد. حال از آنجا که نرمافزارهای مسیریابی کلودفلر محدودیت مشخصی برای اندازه این فایل داشتند، دریافت نسخه بزرگشده باعث از کار افتادن ماژول پردازش باتها و در نتیجه اختلال در هسته پراکسی شبکه (FL/FL2) شد.
پیامدهای قطعی کلودفلر
این اختلال باعث شد چندین سرویس کلودفلر با مشکل مواجه شوند:
- شبکه CDN و سرویسهای امنیتی: بروز خطاهای HTTP 5xx برای کاربران نهایی
- Turnstile: عدم بارگذاری سرویس و در نتیجه مشکل در ورود کاربران
- Workers KV: افزایش خطاها بهدلیل وابستگی به هسته پراکسی
- Dashboard: عدم توانایی بسیاری از کاربران در ورود به حساب کاربری
- Cloudflare Access: خطاهای گسترده در احراز هویت
- Email Security: کاهش موقتی دقت سیستم تشخیص اسپم
همچنین کلودفلر اعلام کرد که مصرف بالای منابع در زمان رفع مشکل باعث افزایش چشمگیر زمان پاسخدهی (Latency) در شبکه شده بود.
رفع مشکل قطعی کلودفلر
پس از چند ساعت بررسی و با وجود اینکه تیم فنی ابتدا احتمال حمله DDoS را مطرح کرده بود، علت اصلی شناسایی شد و از ساعت 18روند رفع اختلال آغاز شد. کلودفلر با توقف انتشار فایل اشتباه و جایگزینی آن با نسخه درست، توانست بخش عمده خدمات را به حالت عادی بازگرداند. در نهایت در ساعت 20:36 اعلام شد که تمام سرویسها به وضعیت عادی بازگشتهاند.
اقدامات کلودفلر برای جلوگیری از تکرار این اختلال
کلودفلر برای جلوگیری از رخدادهای مشابه، مجموعهای از تغییرات و بهبودها را آغاز کرده است، از جمله:
- ایجاد سازوکارهای ایمنتر برای دریافت و انتشار فایلهای پیکربندی داخلی
- افزودن امکان توقف سریع برای بخشهای حساس
- جلوگیری از اشباع سیستمها در زمان تولید گزارشهای خطا
- بازبینی خطاهای بحرانی ماژولهای هسته پراکسی
قطعی گسترده کلودفلر ChatGPT و X را تحتتأثیر قرار داد
کلودفلر یکی از مهمترین ارائهدهندگان زیرساخت اینترنتی در جهان است و اختلال در خدمات این شرکت میتواند به سرعت بر صدها سرویس و میلیونها کاربر اثر بگذارد. به همین دلیل، قطعی اخیر، بسیاری از وبسایتها و اپلیکیشنهای مطرح را از دسترس خارج کرد. پلتفرمهایی مانند X (توییتر سابق)، سامانههای مبتنی بر هوش مصنوعی همچون ChatGPT، سرویسهای استریم موسیقی مانند Spotify و ابزارهای طراحی آنلاین از جمله Canva همگی با خطاهای مختلف مواجه شدند. حتی برخی وبسایتهای نظارتی مانند DownDetector نیز که برای رصد خرابی سرویسها استفاده میشوند، خودشان از دسترس خارج شدند.
کاربران در مواجهه با این مشکلات معمولاً با خطاهایی نظیر Internal Server Error یا کد 500 روبهرو شدند؛ خطاهایی که نشان میداد مشکل از سمت زیرساختهای شبکه است و ارتباطی با دستگاه کاربران ندارد. در بسیاری از وبسایتها نیز پیامهایی نمایش داده میشد که نشان میداد مسیر درخواستها در بخش تحت مدیریت کلودفلر با اشکال روبهرو شده است. علاوه بر این، گزارشها تأکید دارند که داشبورد مدیریتی کلودفلر و رابطهای برنامهنویسی (API) آن نیز لحظاتی غیرقابل دسترس بود و همین موضوع باعث شد اختلالها سریعتر و گستردهتر خود را نشان دهند.
چه چیزی این اختلال را مهم میکند؟
کلودفلر یک شرکت زیرساختی است که از شبکه گستردهای از سرورها برای سریعتر و امنتر کردن تحویل محتوا در سراسر جهان استفاده میکند. بسیاری از وبسایتها برای محافظت در برابر حملات و افزایش سرعت بارگذاری صفحات به این شرکت وابستهاند. هنگامی که کلودفلر دچار قطعی میشود، ساختار توزیعشده آن باعث میشود بخش قابل توجهی از اینترنت با مشکل مواجه شود و بسیاری از کاربران عملاً امکان دسترسی به سرویسهای مورد نیاز خود را از دست بدهند.
در پی این اختلال، هزاران گزارش از سوی کاربران در نقاط مختلف جهان منتشر شد و بسیاری از سرویسها بهطور کامل یا جزئی از کار افتادند. برخی از کاربران اعلام کردند صفحهها بارگذاری نمیشود، گروهی دیگر با نمایش ناقص دادهها مواجه بودند و بعضی سرویسها حتی امکان پردازش اولیه درخواستها را نیز نداشتند.
از منظر کاربران، هیچ راهحل مشخص و عملی برای برطرف کردن این وضعیت وجود نداشت، زیرا مشکل مستقیماً از زیرساخت مرکزی کلودفلر نشأت میگرفت و ارتباطی با تنظیمات شبکه یا مشکلات فردی کاربران نداشت. نه تغییر آدرس IP، نه استفاده از VPN و نه راهاندازی مجدد مودم تأثیری بر این مسئله نداشت، زیرا مسیر ترافیک جهانی دچار اختلال شده بود.
در نهایت، تنها راه حل، صبر و انتظار تا رفع کامل اشکال از سوی تیم مهندسی کلودفلر بود. کاربران و کسبوکارها نیز ناچار بودند تا زمانی که این شرکت مشکل را برطرف کند، منتظر بمانند.
بیانیه کلودفلر
کلودفلر این حادثه را بزرگترین اختلال مجموعه از سال دانست و از کسانی که به خاطر ان اختلال دچار مشکل شدند عذرخواهی کرد:
با توجه به اهمیت کلودفلر در اینترنت، اختلالی در این ابعاد برای ما قابل قبول نیست. مشکل پیش آمده برای هر یک از اعضای تیم ما ناراحت کننده بود. ما میدانیم که امروز شما را ناامید کردیم و قول میدهیم چنین اتفاقی دوباره تکرار نشود.

نمودار بالا حجم کدهای وضعیت HTTP 5xx شبکه کلودفلر را نشان میدهد.
منبع: blog.cloudflare.com




دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.