تغییرات اسنوفریک باعث بروز اختلالات گسترده در سطح جهان شد

تغییرات اسنوفریک باعث بروز اختلالات گسترده در سطح جهان شد

به‌روزرسانی اخیر شرکت اسنوفریک (Snowflake) منجر به بروز یک «اختلال عمده» در سطح جهان شده است. این حادثه، بسیاری از کاربران را با مشکلاتی نظیر عدم امکان پرس‌وجو از داده‌ها، شکست در بارگذاری فایل‌ها و دریافت پیام‌های خطا روبرو کرده است؛ اختلالی که بیش از ۱۳ ساعت ادامه یافت.

در بیانیه‌ای، شرکت اسنوفریک اعلام کرد: «تحقیقات اولیه ما نشان می‌دهد که آخرین نسخه منتشر شده، به‌طور ناخواسته یک به‌روزرسانی در طرح‌واره پایگاه داده (database schema) ایجاد کرده است. این امر باعث شد نسخه‌های قدیمی‌تر به اشتباه به فیلدهای به‌روز‌شده ارجاع دهند و خطاهای عدم تطابق نسخه را رقم بزنند که منجر به شکست عملیات یا تأخیر قابل توجه در انجام آن‌ها می‌شود.»

این به‌روزرسانی، عملکرد ۱۰ مورد از ۲۳ منطقه جغرافیایی اسنوفریک را مختل کرد. در ایالات متحده، این اختلال بر مشتریان شرکت در مراکز داده Azure واقع در ویرجینیا و AWS واقع در اورگان تأثیر گذاشت. مناطق دیگری که تحت‌تأثیر قرار گرفتند شامل ایرلند، زوریخ، لندن، سوئد، بمبئی، سنگاپور و مکزیک هستند.

اولین گزارش مربوط به مشکل در پلتفرم ابری اسنوفریک (Snowflake Data Cloud)، ساعت ۰۲:۵۵ UTC روز سه‌شنبه بود که کاربران با خطاهای SQL هنگام پرس‌وجو از داده‌ها مواجه شدند. حدود یک ساعت و نیم پس‌تر، اسنوفریک اعلام کرد که مشکل شناسایی شده است و کار روی رفع آن در جریان است. سیستم‌ها در نهایت در ساعت ۰۵:۰۰ UTC به حالت عادی بازگشتند.

جالب اینجاست که شرکت متعهد شده تا ظرف پنج روز از اتمام بررسی موضوع، تحلیل ریشه (root cause analysis) را منتشر کند؛ انتظار می‌رود این زمان تا یکشنبه آینده طول بکشد. نکته مهمی که باید به آن اشاره کرد این است که این دومین حادثه اسنوفریک در کمتر از یک هفته اخیر است.

پیش‌تر، در تاریخ ۱۰ دسامبر، بروز مشکل در زیرساخت پایگاه داده (database infrastructure) منجر به کاهش سرعت عملکرد کاربران متکی بر نرم‌افزار اسنوفریک در مرکز داده AWS واقع در اورگان شده بود. این اتفاقات نشان می‌دهند که حتی بزرگترین شرکت‌های ارائه‌دهنده خدمات ابری نیز می‌توانند با چالش‌های ناگهانی و غیرمنتظره‌ای روبرو شوند.

البته اسنوفریک تنها پلتفرم داده‌ای نیست که این ماه با مشکلاتی مواجه شده است. در بازه زمانی ۱۱ تا ۱۳ دسامبر، رقیب اصلی اسنوفریک یعنی Databricks، دچار اختلال در سرویس به مدت چند روز شد و مشتریان در چندین منطقه ایالات متحده، هنگام استفاده از Mosaic AI (دستیار شرکت برای ساختن عامل‌های هوش مصنوعی) با تأخیر یا خطاهایی روبرو شدند. این مشکل به‌طور خاص بر کاربران مراکز داده Azure Databricks در هفت منطقه از آمریکا اثر گذاشت.

این حادثه، پس از بروز اختلال کامل در سرویس و عدم دسترسی به خدمات Databrick برای حدود دو ساعت در تاریخ ۳ دسامبر در منطقه US Gov West AWS رخ داد. در حالی که اسنوفریک معمولاً علت‌های اولیه خرابی‌ها را اعلام کرده و تحلیل ریشه آن‌ها را نیز منتشر می‌کند، Databricks چنین کاری انجام نمی‌دهد.

📌 توجه: این مطلب از منابع بین‌المللی ترجمه و بازنویسی شده است.