بهروزرسانی اخیر شرکت اسنوفریک (Snowflake) منجر به بروز یک «اختلال عمده» در سطح جهان شده است. این حادثه، بسیاری از کاربران را با مشکلاتی نظیر عدم امکان پرسوجو از دادهها، شکست در بارگذاری فایلها و دریافت پیامهای خطا روبرو کرده است؛ اختلالی که بیش از ۱۳ ساعت ادامه یافت.
در بیانیهای، شرکت اسنوفریک اعلام کرد: «تحقیقات اولیه ما نشان میدهد که آخرین نسخه منتشر شده، بهطور ناخواسته یک بهروزرسانی در طرحواره پایگاه داده (database schema) ایجاد کرده است. این امر باعث شد نسخههای قدیمیتر به اشتباه به فیلدهای بهروزشده ارجاع دهند و خطاهای عدم تطابق نسخه را رقم بزنند که منجر به شکست عملیات یا تأخیر قابل توجه در انجام آنها میشود.»
این بهروزرسانی، عملکرد ۱۰ مورد از ۲۳ منطقه جغرافیایی اسنوفریک را مختل کرد. در ایالات متحده، این اختلال بر مشتریان شرکت در مراکز داده Azure واقع در ویرجینیا و AWS واقع در اورگان تأثیر گذاشت. مناطق دیگری که تحتتأثیر قرار گرفتند شامل ایرلند، زوریخ، لندن، سوئد، بمبئی، سنگاپور و مکزیک هستند.
اولین گزارش مربوط به مشکل در پلتفرم ابری اسنوفریک (Snowflake Data Cloud)، ساعت ۰۲:۵۵ UTC روز سهشنبه بود که کاربران با خطاهای SQL هنگام پرسوجو از دادهها مواجه شدند. حدود یک ساعت و نیم پستر، اسنوفریک اعلام کرد که مشکل شناسایی شده است و کار روی رفع آن در جریان است. سیستمها در نهایت در ساعت ۰۵:۰۰ UTC به حالت عادی بازگشتند.
جالب اینجاست که شرکت متعهد شده تا ظرف پنج روز از اتمام بررسی موضوع، تحلیل ریشه (root cause analysis) را منتشر کند؛ انتظار میرود این زمان تا یکشنبه آینده طول بکشد. نکته مهمی که باید به آن اشاره کرد این است که این دومین حادثه اسنوفریک در کمتر از یک هفته اخیر است.
پیشتر، در تاریخ ۱۰ دسامبر، بروز مشکل در زیرساخت پایگاه داده (database infrastructure) منجر به کاهش سرعت عملکرد کاربران متکی بر نرمافزار اسنوفریک در مرکز داده AWS واقع در اورگان شده بود. این اتفاقات نشان میدهند که حتی بزرگترین شرکتهای ارائهدهنده خدمات ابری نیز میتوانند با چالشهای ناگهانی و غیرمنتظرهای روبرو شوند.
البته اسنوفریک تنها پلتفرم دادهای نیست که این ماه با مشکلاتی مواجه شده است. در بازه زمانی ۱۱ تا ۱۳ دسامبر، رقیب اصلی اسنوفریک یعنی Databricks، دچار اختلال در سرویس به مدت چند روز شد و مشتریان در چندین منطقه ایالات متحده، هنگام استفاده از Mosaic AI (دستیار شرکت برای ساختن عاملهای هوش مصنوعی) با تأخیر یا خطاهایی روبرو شدند. این مشکل بهطور خاص بر کاربران مراکز داده Azure Databricks در هفت منطقه از آمریکا اثر گذاشت.
این حادثه، پس از بروز اختلال کامل در سرویس و عدم دسترسی به خدمات Databrick برای حدود دو ساعت در تاریخ ۳ دسامبر در منطقه US Gov West AWS رخ داد. در حالی که اسنوفریک معمولاً علتهای اولیه خرابیها را اعلام کرده و تحلیل ریشه آنها را نیز منتشر میکند، Databricks چنین کاری انجام نمیدهد.
📌 توجه: این مطلب از منابع بینالمللی ترجمه و بازنویسی شده است.