Глобальные сбои становятся частью нашей жизни

12 июня 2025 года пользователи по всему миру обнаружили, что привычные онлайн‑сервисы Google, Discord, Spotify, Snapchat, Twitch оказались недоступны одновременно. Причиной стал сбой сразу у трёх ключевых облачных провайдеров: Google Cloud, Cloudflare и частично Amazon Web Services. В Downdetector зафиксировали десятки тысяч жалоб по всему миру. Сбой длился от часа до трёх, а восстановление сервисов заняло большую часть дня. Инженеры Google и Cloudflare официально подтвердили проблемы в своих инфраструктурах: из строя вышли системы авторизации (IAM/OAuth) и ключевые хранилища Cloudflare. Для многих пользователей это обернулось полной потерей доступа ко всем онлайн-платформам, а для бизнеса — простоями и убытками.
Показательно, что в этот же период российские сервисы и облачные провайдеры, такие как Yandex Cloud, не зафиксировали массовых проблем. Локальная инфраструктура, ориентированная на внутренний рынок, часто оказывается более устойчивой к сбоям, охватывающим глобальных провайдеров. Аналогичные ситуации происходили и ранее, когда массовые сбои на зарубежных платформах почти не затрагивали российский сегмент. Это сегодня используется как один из аргументов в пользу цифрового суверенитета и развития собственных ИТ-решений.
Но этот инцидент далеко не первый и, увы, не последний. За последние несколько лет мы видим, как интернет может буквально «лечь» по всему миру, и происходит это всё чаще, несмотря на бурный рост технологий.
В июле 2024 года случился, пожалуй, самый масштабный ИТ-инцидент в истории: неудачное обновление агента CrowdStrike вывело из строя миллионы компьютеров под Windows по всему миру. Сбои затронули авиацию, банки, больницы, транспортные системы. Только в США отменили более 2 400 авиарейсов, Delta Air Lines подала иск на $550 млн, а Times Square в Нью-Йорке остался без наружной рекламы. Всё это стало наглядной иллюстрацией: теперь судьба целых отраслей зависит не только от работы облаков, но и от банального обновления софта. Одна ошибка и критически важные сферы оказываются на паузе.
Буквально через несколько недель после масштабного сбоя 2024 года клиенты Microsoft 365 столкнулись с перебоями в работе Outlook, Teams, Xbox Live и облачной платформы Azure. Сбой длился около трёх часов, пострадали десятки тысяч компаний по всему миру. Подобные истории для Microsoft стали почти обыденностью: проблемы в глобальной сети регулярно приводят к временной остановке работы сервисов.
Осенью 2023 года Австралия осталась без связи: оператор Optus на 12 часов лишил страну мобильного интернета, экстренных служб и банковских сервисов из-за сбоя маршрутизации BGP. Миллионы людей остались без связи, а ущерб достиг миллиардов долларов.
В июле 2022 года похожий случай произошёл в Канаде: после ошибки в BGP сеть Rogers рухнула на 15 часов. Без связи и экстренных вызовов остались 12 миллионов человек, убытки оценили в $142 млн, а в стране пересмотрели подход к резервированию сетей.
Пожалуй, самый громкий цифровой «блэкаут» последних лет — знаменитый сбой Facebook* в октябре 2021 года. Facebook*, Instagram*, WhatsApp и Oculus оказались недоступны более шести часов. Причиной стала ошибка в настройках маршрутизаторов, которая нарушила работу DNS. Миллиарды пользователей увидели, насколько уязвимы даже самые масштабные экосистемы.
В России тоже было немало резонансных случаев. 14 января 2025 года Россия столкнулась с серьезным интернет-сбоем, затронувшим множество пользователей и операторов связи. Основной причиной проблемы стало некорректное обновление Автоматической системы безопасности интернета (АСБИ), предназначенной для управления и фильтрации интернет-трафика. 7 мая 2025 года Москва частично осталась без мобильного интернета: были парализованы оплата, такси, транспорт, банковские сервисы. Экономический ущерб от часового простоя оценили в 30 млн рублей. Причиной стали технические работы и ввод новых фильтрационных систем, которые привели к падению трафика на 35%. В итоге понадобилось срочное вмешательство, чтобы вернуть связь.
Март 2024 года запомнился сбоями в платёжных системах и банках. Перебои энергоснабжения и неудачные обновления в дата-центрах привели к задержке переводов и остановке работы у миллионов клиентов по всей стране. Такие инциденты показывают: даже локальные сбои могут иметь всероссийский масштаб.
В январе 2025 года не выдержал даже ChatGPT, когда глобальный сбой платформы OpenAI затронул тысячи пользователей, в том числе в России. В Downdetector за час поступило более 1800 жалоб. Это в очередной раз напомнило: даже искусственный интеллект не застрахован от проблем в облаках.
Список можно продолжать. В ноябре 2022-го крупные российские онлайн-ретейлеры и транспортные платформы «легли» во время массовых распродаж. Нагрузка превышала возможности серверов, восстановление занимало часы, бизнес терял деньги и репутацию.
Отдельно можно отметить проблему с импортозамещением и нехваткой оборудования. После ухода крупных западных вендоров российские производители не всегда могут покрыть потребности рынка. Дефицит компонентов (микросхем, FPGA, современных процессоров) стал причиной затяжных перебоев у производителей телеком-оборудования и серверов. В I квартале 2024 года импорт процессоров Intel и AMD сократился в 15 раз, многие предприятия вынуждены покупать технику через параллельный импорт, что удорожает решения и увеличивает сроки поставки. Несмотря на заявления о 50% импортозамещения в ПО, часть задач в госструктурах и бизнесе по-прежнему нельзя решить отечественными решениями из-за несовместимости или отсутствия нужного функционала.
Свои сложности приносит и нехватка квалифицированных ИТ-специалистов. По разным оценкам, дефицит кадров в ИТ в России достигает 150 тысяч человек. Это замедляет внедрение новых технологий, развитие облачных сервисов и тестирование на устойчивость. Уход специалистов за рубеж только усугубляет ситуацию.
Почему же сбои становятся такой обыденностью? Причин несколько. Главная — высокая степень централизации: большинство сервисов завязано на несколько крупных облачных платформ и протоколов. Одна ошибка и весь мир «встает». Вторая причина — сложности с импортозамещением: при дефиците оборудования и ПО даже небольшая авария может привести к лавинообразному эффекту. Наконец, растёт число киберугроз и уязвимостей, связанных с DDoS-атаками, попытками взлома, случайными авариями на линиях связи.
И что с этим делать? Мир и российский рынок постепенно учатся реагировать на эти вызовы. Всё чаще компании переходят на собственные дата-центры, создают резервные каналы и тестируют устойчивость инфраструктуры к сбоям. Показатели отказоустойчивости, так называемый resilience, или по-русски «устойчивость к сбоям», становятся важной частью стратегии для бизнеса и государственных ИТ-систем. Организации всё чаще инвестируют в резервирование, дублирование и распределённость, а также регулярно отрабатывают сценарии аварийных переключений.
Для России развитие собственной технологической базы становится вопросом не только удобства, но и цифровой безопасности. Чем меньше зависимость от зарубежных облаков, тем спокойнее проходит очередная волна сбоев на Западе. Но пока внутренний рынок сталкивается с нехваткой оборудования, компонентов и специалистов, даже локальные инциденты способны перерасти в масштабные кризисы. И если сегодня крупный сбой удаётся устранить за часы, завтра цена ошибки может оказаться намного выше и для бизнеса, и для государства.
* Компания Meta признана в России экстремистской организацией и запрещена на территории страны. Принадлежащие ей социальные сети Facebook и Instagram заблокированы в России.
Опубликовано 13.06.2025