#backtesting_инцидентов — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #backtesting_инцидентов, aggregated by home.social.
-
[Перевод] Метрики как стоп-кран: безопасные релизы Cloudflare под нагрузкой
Cloudflare показывает, как превратить метрики в механизм безопасных релизов под глобальной нагрузкой. В основе — Health Mediated Deployments: решения о выкатывании принимаются по SLI/SLO из Prometheus/Thanos, с распределёнными агрегациями на уровне дата-центров, recording rules, бэктестингом инцидентов и адаптивным ограничением параллелизма. Результат — заметно быстрее вычисляются критичные запросы, батчи ускорены примерно в 15 раз, а откаты происходят до того, как проблема успевает разрастись. Смотреть разбор
https://habr.com/ru/companies/otus/articles/962416/
#load_qa #нагрузочное_тестирование #Prometheus #Thanos #backtesting_инцидентов #наблюдаемость #мониторинг #автооткат_релизов