#chaos_engineering — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #chaos_engineering, aggregated by home.social.
-
Хватит тестировать вполсилы: Фреймворк RES-ATTACK для симуляции комплексных угроз и его метрика R-score
Привет, Хабр. С вами AdminFuture. Давайте представим себе худший кошмар любого SRE-инженера или CISO. Пятница, вторая половина дня. Нагрузка на систему достигает пика, и в этот самый момент основной узел кластера вашей критически важной СУБД начинает сбоить. Автоматика запускает процедуру failover. Системы напряжены, инженеры наготове, но в целом ситуация под контролем — к такому вы готовились. Но именно в этот момент, в окне уязвимости, когда внутренние сервисы перестраивают сетевые маршруты, а часть проверок безопасности временно ослаблена, ваша система мониторинга безопасности взрывается алертами. На один из внутренних API, который стал доступен во время переключения, началась целенаправленная атака. Это не голливудский сценарий. Это «идеальный шторм» — комбинация инфраструктурного сбоя и кибератаки, которая становится все более реальной угрозой для современных сложных систем. 1 И самое опасное здесь то, что мы почти никогда не готовимся к таким комбинированным событиям. Наши подходы к обеспечению отказоустойчивости и безопасности работают в параллельных вселенных. С одной стороны, у нас есть Chaos Engineering — дисциплина, которая учит нас готовиться к отказам инфраструктуры. Мы научились виртуозно «убивать» поды, вносить сетевые задержки и перегружать CPU, чтобы убедиться, что система выстоит. 3 С другой стороны, есть Red Teaming — практика эмуляции действий злоумышленников, которая проверяет наши защитные бастионы на прочность с помощью таких фреймворков, как Atomic Red Team
https://habr.com/ru/articles/960320/
#chaos_engineering #red_teaming #sre #devsecops #кибербезопасность #управление_рисками #argo_workflows #chaos_mesh
-
Как ЮKassa готовится к распродажам-2025
Привет, меня зовут Анатолий, я руковожу группой нагрузочного тестирования в ЮMoney. Началась осень, и не за горами сезон распродаж: магазины уже готовятся к пиковым нагрузкам, продумывают акции и спецпредложения, обновляют ассортимент, договариваются с поставщиками. ЮKassa, наш сервис электронных платежей, тоже в ожидании сезона скидок. В этой статье я расскажу, как мы к нему готовимся, что помогает нашей системе выдержать пиковые нагрузки и как сделать так, чтобы все клиенты остались довольны.
https://habr.com/ru/companies/yoomoney/articles/947694/
#нагрузочное_тестирование #autoscaling #chaos_engineering #sre #sla #kubernetes #highload #инфрастуктура #отказоустойчивость #платежная_система
-
Kubernetes в джунглях агротех: как мы спасаем банановые кластеры
Перед вами не просто технический мануал — это SimCity для кластеров с банановым сюжетом! Если вы только начали выращивать свои первые «бананы» (поды) в Kubernetes и хотите разобраться в базовых механиках через игровые аналогии, то этот материал для вас. Я Михаил Костельцев, главный инженер Центра бесперебойной поддержки платформенных и интеграционных решений в РСХБ-Интех. Все кейсы — упрощенные сценарии из реальной жизни. Мы сознательно избегаем сложных терминов, заменяя их «садоводческими» метафорами. Вперед к бананам!
https://habr.com/ru/companies/rshb/articles/879470/
#kubernetes #banana #бэкапы #микросервисы #Chaos_Engineering
-
Тестирование на отказоустойчивость: ломаем, чтобы сделать лучше. Часть 2
Всем привет! Недавно в блоге выходила статья , в которой мой коллега Александр Волков рассказал про применение практик хаос-инжиниринга, продемонстрировал поведение системы при сбоях на примере демосервиса, оценил его отказоустойчивость и предложил стратегии для улучшения архитектуры. А в этой части я, Екатерина Ильина — QA-инженер Читать дальше
https://habr.com/ru/companies/cloud_ru/articles/865308/
#chaos_engineering #chaos_mesh #кейс #тестирование_отказоустойчивости #хаосинжиниринг
-
Тестирование на отказоустойчивость: ломаем, чтобы сделать лучше. Часть 1
Проведение экспериментов в IT-инфраструктуре стало важной практикой для повышения надежности и устойчивости систем. Пользователи ожидают мгновенного отклика и безотказной работы приложений, и даже небольшие перебои могут привести к потере репутации и значительным финансовым убыткам. Я Александр Волков — QA Lead Читать дальше
https://habr.com/ru/companies/cloud_ru/articles/863042/
#хаосинжиниринг #chaos_engineering #chaos_mesh #тестирование
-
[Перевод] Chaos engineering: проверяем устойчивость Vault с помощью Gremlin
Chaos engineering — это подход к проверке устойчивости приложений. Грубо говоря, мы умышленно ломаем что-либо в системе, чтобы посмотреть, как она будет себя вести, и делаем из этого эксперимента полезные выводы о надёжности и уязвимостях. Перевели статью, о том, как применить этот подход к HashiCorp Vault — системе по управлению секретами.
-
[Перевод] Chaos engineering: проверяем устойчивость Vault с помощью Gremlin
Chaos engineering — это подход к проверке устойчивости приложений. Грубо говоря, мы умышленно ломаем что-либо в системе, чтобы посмотреть, как она будет себя вести, и делаем из этого эксперимента полезные выводы о надёжности и уязвимостях. Перевели статью, о том, как применить этот подход к HashiCorp Vault — системе по управлению секретами.
-
[Перевод] Chaos engineering: проверяем устойчивость Vault с помощью Gremlin
Chaos engineering — это подход к проверке устойчивости приложений. Грубо говоря, мы умышленно ломаем что-либо в системе, чтобы посмотреть, как она будет себя вести, и делаем из этого эксперимента полезные выводы о надёжности и уязвимостях. Перевели статью, о том, как применить этот подход к HashiCorp Vault — системе по управлению секретами.