#devops_практики — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #devops_практики, aggregated by home.social.
-
Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись
Инциденты случаются у всех. Разница между командами — не в их отсутствии, а в том, повторяются ли одни и те же сбои снова и снова. Часто разбор заканчивается быстро и предсказуемо: нашли виноватого, сделали вывод «надо быть внимательнее» и пошли дальше — до следующего инцидента. В этой статье разберём, почему такой подход не работает, что на самом деле стоит за blameless post‑mortem и как выстроить разбор инцидентов так, чтобы он приводил не к формальным выводам, а к конкретным изменениям в системе.
https://habr.com/ru/companies/otus/articles/1017054/
#team_lead #postmortem #разбор_инцидентов #blameless_культура #DevOps_практики #мониторинг_систем #инциденты_в_продакшене #root_cause_анализ
-
Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись
Инциденты случаются у всех. Разница между командами — не в их отсутствии, а в том, повторяются ли одни и те же сбои снова и снова. Часто разбор заканчивается быстро и предсказуемо: нашли виноватого, сделали вывод «надо быть внимательнее» и пошли дальше — до следующего инцидента. В этой статье разберём, почему такой подход не работает, что на самом деле стоит за blameless post‑mortem и как выстроить разбор инцидентов так, чтобы он приводил не к формальным выводам, а к конкретным изменениям в системе.
https://habr.com/ru/companies/otus/articles/1017054/
#team_lead #postmortem #разбор_инцидентов #blameless_культура #DevOps_практики #мониторинг_систем #инциденты_в_продакшене #root_cause_анализ
-
Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись
Инциденты случаются у всех. Разница между командами — не в их отсутствии, а в том, повторяются ли одни и те же сбои снова и снова. Часто разбор заканчивается быстро и предсказуемо: нашли виноватого, сделали вывод «надо быть внимательнее» и пошли дальше — до следующего инцидента. В этой статье разберём, почему такой подход не работает, что на самом деле стоит за blameless post‑mortem и как выстроить разбор инцидентов так, чтобы он приводил не к формальным выводам, а к конкретным изменениям в системе.
https://habr.com/ru/companies/otus/articles/1017054/
#team_lead #postmortem #разбор_инцидентов #blameless_культура #DevOps_практики #мониторинг_систем #инциденты_в_продакшене #root_cause_анализ
-
Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись
Инциденты случаются у всех. Разница между командами — не в их отсутствии, а в том, повторяются ли одни и те же сбои снова и снова. Часто разбор заканчивается быстро и предсказуемо: нашли виноватого, сделали вывод «надо быть внимательнее» и пошли дальше — до следующего инцидента. В этой статье разберём, почему такой подход не работает, что на самом деле стоит за blameless post‑mortem и как выстроить разбор инцидентов так, чтобы он приводил не к формальным выводам, а к конкретным изменениям в системе.
https://habr.com/ru/companies/otus/articles/1017054/
#team_lead #postmortem #разбор_инцидентов #blameless_культура #DevOps_практики #мониторинг_систем #инциденты_в_продакшене #root_cause_анализ
-
[Перевод] Почему observability-данные теряют ценность ещё при сборе
Observability давно стала стандартом, но качество решений на её основе остаётся нестабильным: данные есть, а понимания всё равно не хватает. Проблема часто возникает раньше, чем начинаются графики и алерты — в самой модели сбора телеметрии, где теряются связи между событиями и размывается контекст. В статье разбираем, почему это происходит, как это влияет на анализ продакшена и почему с ростом роли ИИ и агентных систем требования к данным становятся принципиально другими.
https://habr.com/ru/companies/otus/articles/1020952/
#observability #логирование #наблюдаемость #трассировка #метрики #кардинальность #DevOps_практики #качество_данных