home.social

#сбой — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #сбой, aggregated by home.social.

  1. [Перевод] Сбой AWS 19­–20 октября: во всём виноват DNS. Постмортем

    19–20 октября 2025 года в регионе us-east-1 произошёл каскадный сбой, повлиявший на доступность глобальных сервисов. Компания AWS опубликовала детальный разбор, в котором раскрыла первопричину — дефект в автоматизированной системе управления DNS для сервиса DynamoDB. В статье приводятся полная хронология событий, описание воздействия на смежные сервисы (EC2, NLB, Lambda) и список запланированных улучшений для предотвращения подобных инцидентов в будущем.

    habr.com/ru/companies/flant/ar

    #dns #aws #dynamodb #lambda #ec2 #useast1 #сбой #nlb #amazon_web_services #сбой_aws

  2. [Перевод] Сбой AWS 19­–20 октября: во всём виноват DNS. Постмортем

    19–20 октября 2025 года в регионе us-east-1 произошёл каскадный сбой, повлиявший на доступность глобальных сервисов. Компания AWS опубликовала детальный разбор, в котором раскрыла первопричину — дефект в автоматизированной системе управления DNS для сервиса DynamoDB. В статье приводятся полная хронология событий, описание воздействия на смежные сервисы (EC2, NLB, Lambda) и список запланированных улучшений для предотвращения подобных инцидентов в будущем.

    habr.com/ru/companies/flant/ar

    #dns #aws #dynamodb #lambda #ec2 #useast1 #сбой #nlb #amazon_web_services #сбой_aws

  3. [Перевод] Сбой AWS 19­–20 октября: во всём виноват DNS. Постмортем

    19–20 октября 2025 года в регионе us-east-1 произошёл каскадный сбой, повлиявший на доступность глобальных сервисов. Компания AWS опубликовала детальный разбор, в котором раскрыла первопричину — дефект в автоматизированной системе управления DNS для сервиса DynamoDB. В статье приводятся полная хронология событий, описание воздействия на смежные сервисы (EC2, NLB, Lambda) и список запланированных улучшений для предотвращения подобных инцидентов в будущем.

    habr.com/ru/companies/flant/ar

    #dns #aws #dynamodb #lambda #ec2 #useast1 #сбой #nlb #amazon_web_services #сбой_aws

  4. [Перевод] Сбой AWS 19­–20 октября: во всём виноват DNS. Постмортем

    19–20 октября 2025 года в регионе us-east-1 произошёл каскадный сбой, повлиявший на доступность глобальных сервисов. Компания AWS опубликовала детальный разбор, в котором раскрыла первопричину — дефект в автоматизированной системе управления DNS для сервиса DynamoDB. В статье приводятся полная хронология событий, описание воздействия на смежные сервисы (EC2, NLB, Lambda) и список запланированных улучшений для предотвращения подобных инцидентов в будущем.

    habr.com/ru/companies/flant/ar

    #dns #aws #dynamodb #lambda #ec2 #useast1 #сбой #nlb #amazon_web_services #сбой_aws

  5. Как принимать решения при сбоях в IT-системах: методы поддержки принятия решений

    Представьте ситуацию: вечер, срабатывает тревога - ваш интернет-магазин лежит в самый разгар распродажи. В логах куча ошибок, но явной причины не видно. Знакомо? Вот тут-то и начинается самое интересное. Я 3 года проработал в отделе сопровождения информационных систем и накопил десятки подобных случаев. Расскажу, как принимать решения, когда стандартные "перезагрузи и проверь" не работают. Понимаю, что кому-то мой опыт может показаться небольшим, а с некоторыми предложенными методами вы не будете согласны - предлагаю всё обсудить в комментариях. Расскажите о том, как это делается у вас в системах, а также поделитесь своим мнением.

    habr.com/ru/articles/899266/

    #itil #itsm #сбой #инцидент #инцидентменеджмент #поддержка #администрирование

  6. Streamcast про Надежность(SRE)

    Всем привет! Мы (Дмитрий Масленников(ТБанк), Максим Иванов(ТБанк) и Марина Калетурина(Яндекс)) решили попробовать новый формат — стриминг. Не откладывая надолго, анонсируем первый первый стрим в следующее воскресенье 29 декабря в 19:00! — сохраняйте даты. Посмотреть стрим можно будет на Twitch и YouTube: youtube.com/@srepubstreamcast twitch.tv/srepubstreamcast Темой первого стрима будут этические вопросы в SRE: 1) Необвинительная(Blameless) культура, как ее понимать, 2) Допустимо ли врать в резюме, к чему все это может привести и подобное. Вы сможете задавать нам вопросы в чате, а мы постараемся ответить на них в прямом эфире.

    habr.com/ru/articles/869444/

    #sre #стрим #надежность #найм #сбой #отношения

  7. Как сбой CrowdStrike повлиял на авиацию

    19 июля обновление инструмента для защиты от кибератак CrowdStrike привело к сбою, который затронул 8,5 млн персональных компьютеров и серверов на Windows. Пострадали несколько сфер, включая здравоохранение, банки, экстренные службы и многие другие.

    habr.com/ru/articles/832696/

    #crowdstrike #авиация #самолеты #авиакомпании #сбой

  8. А в чем проблема работать с файлами?

    Данные - это важный компонент системы. Приложение может хранить их где угодно, но в результате все сводится к файлам. Файлы - это хорошая абстракция, но она протекает: если не знать того, как работают ОС или гарантии файловой системы, то легко выстрелить себе в ногу. Меня увлекла тема отказоустойчивости, а конкретно - отказоустойчивой работы с файлами. В этой статье я попытался соединить все полученные знания: Кто участвует в процессе записи Ошибки, которые могут произойти Что от нас зависит, а что нет И самое главное - как это этого защититься

    habr.com/ru/articles/803347/

    #отказоустойчивость #отказоустойчивое_хранилище #net #данные_приложения #хранение_данных #восстановление #сбой #целостность #файловая_система #файлы

  9. Как снять логи при краше мобильного приложения?

    Всем привет! Я Tech Lead QA в мобильной разработке. При тестировании приложений иногда сталкиваемся со сбоем приложения. И в таких ситуациях очень важно уметь собирать логи с устройства, чтобы максимально быстро пофиксить ошибки. В этой статье я хотел бы рассказать, как мы это делаем в Альфа-Банке. Осторожно, в статье много картинок.

    habr.com/ru/companies/alfa/art

    #android #ios #логи #сбой #сбор_данных #приложения #смартфоны #разработка #тестирование