Один из серьезнейших в истории интернета сбой, случившийся 8 июня, вызвала ошибка в программном обеспечении американского провайдера услуг по «облачному доступу» Fastly. Множество интернет-сайтов по всему миру, включая британское правительство, ведущие СМИ — от CNN и New York Times до Guardian и Би-би-си — оказались недоступны или работали с тяжелыми перебоями из-за того, что некий пользователь, не догадываясь о последствиях, изменил настройки, активировав тем самым глобальный системный сбой.
Как говорится в заявлении компании, опубликованном по итогам разбирательства, обновление, содержавшее ошибку, было распространено в середине мая.
Сбой произошел около часа дня по московскому времени. Специалисты Fastly быстро ликвидировали проблему, но в течение 49 минут оставались недоступными важнейшие сайты, включая официальный сайт британского правительства, интернет-версии New York Times, Wall Street Journal, CNN, Bloomberg News, Financial Times и Guardian, крупнейшую торговую площадку Amazon, музыкальный портал Spotify, языковые службы Би-би-си и другие сервисы.
Пострадало порядка 85% трафика, идущего через серверы компании Fastly. При попытке зайти на тот или иной сайт появлялось сообщение об ошибке.
«Отключение было масштабным и жестким, и мы приносим искренние извинения нашим клиентам и всем тем, кто, в свою очередь, полагается на их услуги», — заявил ведущий технический специалист Fastly Ник Рокуэлл.
В компании признали, что проблему можно было предвидеть заранее.
Случившееся вызывает вопросы относительно того, насколько безопасно зависеть в управлении огромной инфраструктурой всего от нескольких крупных провайдеров.
Что такое CDN-провайдер
Андрей Захаров, корреспондент Би-би-си.
В обычном режиме контент с сайта на компьютер или смартфон пользователя доставляется так. Пользователь отправляет запрос на сайт — например, хочет открыть какую-то страницу. Физически запрос уходит на сервер, где хранятся данные. Оттуда в ответ приходят данные — и сайт грузится.
CDN-провайдеры хранят у себя популярные страницы и сайты, чтобы ускорять обмен данными между пользователями и серверами.
CDN-провайдер «по-умному» обрабатывает запрос и направляет его не на основной сервер, где хранятся данные, а на ближайший, куда была загружена их копия.
Серверы Fastly располагаются в стратегических точках по всему миру, чтобы ее клиенты могли сохранять свои данные ближе к конечным потребителям.
Однако один из пользователей, попытавшись вполне легально изменить системные настройки, невольно активировал ошибку в обновленном двумя неделями ранее программном обеспечении, которая до поры оставалась незамеченной. Это и «положило» сайты по всему миру.
Как говорится в заявлении компании, инженерам понадобилось 40 минут на то, чтобы установить причину сбоя. Еще 9 минут спустя 95% сайтов, связанных с провайдером, восстановили нормальную работу.
Компания начала тотальную проверку своей сети на наличие ошибок и пообещала позже опубликовать доклад о том, как именно она преодолевала сбой и почему ошибку не нашли во время предварительного тестирования.
Посмотрите, как выглядели первые версии популярных сайтов:
Это тоже интересно: