Метка: power outage

  • Итоги инцидента с питанием в Yandex Cloud

    Итоги инцидента с питанием в Yandex Cloud

    30 марта 2025 года произошел серьезный сбой в одном из важных центров обработки данных Яндекса. Сервисы, которые работали на этом центре, временно перестали работать из-за проблем с электропитанием. Это произошло из-за сбоя в электросети после аварии на подстанции, из-за которой перестали работать несколько линий электропередачи.

    Ключевые моменты:

    — Авария началась в 12:18 по московскому времени, и в течение нескольких минут напряжение упало до критического уровня.
    — Обе линии электропередачи, которые питали центр обработки данных, отключились одновременно, что редко случается.
    — Для поддержания работы важных систем были задействованы дизельные генераторы, но они не смогли справиться с полной нагрузкой.
    — Восстановление работы центра заняло около 10 часов, и к полуночи все сервисы были полностью восстановлены.

    План по предотвращению повторения сбоев:

    — В Яндексе планируют пересмотреть риски энергоснабжения и улучшить системы резервирования.
    — Они сосредоточатся не только на технических решениях, но и на оперативных мероприятиях и устойчивости в разных зонах.
    — Для клиентов Yandex Cloud будут доступны новые инструменты для защиты от сбоев, такие как Zonal Shift.

    Яндекс подчеркивает, что важно иметь систему, способную работать в разных зонах. Опыт с 30 марта показал, что необходимо пересмотреть системы резервирования и подготовки к редким аварийным ситуациям для повышения надежности работы.

  • Массовый сбой в ЦОД Яндекса затронул AM

    Массовый сбой в ЦОД Яндекса затронул AM

    Из-за несчастного случая в одном из центров обработки данных (ЦОД) компании Яндекс, перестали работать как собственные сервисы компании, так и ресурсы её клиентов, которые используют услуги Яндекс Облака. Среди пострадавших оказались службы доставки, федеральные розничные сети, стриминговые платформы и онлайн-кинотеатры.

    Сначала о проблемах сообщил сервис Яндекс.Музыка. Пользователи стали жаловаться на недоступность сервисов начиная с 12:00 по московскому времени, особенно много обращений поступило из Москвы.

    По словам представителей Яндекс.Музыки, у некоторых пользователей возникли временные трудности с доступом к сервисам. К 14:40 сервис снова заработал.

    Центр мониторинга и управления сетями связи общего пользования сообщил, что сбой в электроснабжении в одном из ЦОД Яндекса стал причиной проблем с работой сервисов, использующих Яндекс Облако.

    Помимо сервисов Яндекса, проблемы затронули онлайн-площадки других компаний, таких как М.Видео, Вкусно — и точка, Delivery Club, KFC, Кинопоиск и Аптека.ру. Также были проблемы у пользователей мобильных приложений Купер, Магнит и ЦИАН. Сайт РБК также оказался недоступен.

    Яндекс начал фиксировать инцидент с 12:25 и примерно через 40 минут сообщил о проблеме с электроснабжением. В 15:30 началось восстановление электроснабжения, а к 17:04 было объявлено о полном восстановлении подачи электроэнергии и запуске оборудования. Через час компания подтвердила возобновление работы базовой инфраструктуры.

    Ранее, 29 ноября 2024 года, Яндекс уже сталкивался с большим сбоем из-за отказа коммутатора ядра сети.