home.social

#backtesting_инцидентов — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #backtesting_инцидентов, aggregated by home.social.

  1. [Перевод] Метрики как стоп-кран: безопасные релизы Cloudflare под нагрузкой

    Cloudflare показывает, как превратить метрики в механизм безопасных релизов под глобальной нагрузкой. В основе — Health Mediated Deployments: решения о выкатывании принимаются по SLI/SLO из Prometheus/Thanos, с распределёнными агрегациями на уровне дата-центров, recording rules, бэктестингом инцидентов и адаптивным ограничением параллелизма. Результат — заметно быстрее вычисляются критичные запросы, батчи ускорены примерно в 15 раз, а откаты происходят до того, как проблема успевает разрастись. Смотреть разбор

    habr.com/ru/companies/otus/art

    #load_qa #нагрузочное_тестирование #Prometheus #Thanos #backtesting_инцидентов #наблюдаемость #мониторинг #автооткат_релизов