home.social

#devops_практики — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #devops_практики, aggregated by home.social.

  1. Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись

    Инциденты случаются у всех. Разница между командами — не в их отсутствии, а в том, повторяются ли одни и те же сбои снова и снова. Часто разбор заканчивается быстро и предсказуемо: нашли виноватого, сделали вывод «надо быть внимательнее» и пошли дальше — до следующего инцидента. В этой статье разберём, почему такой подход не работает, что на самом деле стоит за blameless post‑mortem и как выстроить разбор инцидентов так, чтобы он приводил не к формальным выводам, а к конкретным изменениям в системе.

    habr.com/ru/companies/otus/art

    #team_lead #postmortem #разбор_инцидентов #blameless_культура #DevOps_практики #мониторинг_систем #инциденты_в_продакшене #root_cause_анализ

  2. Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись

    Инциденты случаются у всех. Разница между командами — не в их отсутствии, а в том, повторяются ли одни и те же сбои снова и снова. Часто разбор заканчивается быстро и предсказуемо: нашли виноватого, сделали вывод «надо быть внимательнее» и пошли дальше — до следующего инцидента. В этой статье разберём, почему такой подход не работает, что на самом деле стоит за blameless post‑mortem и как выстроить разбор инцидентов так, чтобы он приводил не к формальным выводам, а к конкретным изменениям в системе.

    habr.com/ru/companies/otus/art

    #team_lead #postmortem #разбор_инцидентов #blameless_культура #DevOps_практики #мониторинг_систем #инциденты_в_продакшене #root_cause_анализ

  3. Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись

    Инциденты случаются у всех. Разница между командами — не в их отсутствии, а в том, повторяются ли одни и те же сбои снова и снова. Часто разбор заканчивается быстро и предсказуемо: нашли виноватого, сделали вывод «надо быть внимательнее» и пошли дальше — до следующего инцидента. В этой статье разберём, почему такой подход не работает, что на самом деле стоит за blameless post‑mortem и как выстроить разбор инцидентов так, чтобы он приводил не к формальным выводам, а к конкретным изменениям в системе.

    habr.com/ru/companies/otus/art

    #team_lead #postmortem #разбор_инцидентов #blameless_культура #DevOps_практики #мониторинг_систем #инциденты_в_продакшене #root_cause_анализ

  4. Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись

    Инциденты случаются у всех. Разница между командами — не в их отсутствии, а в том, повторяются ли одни и те же сбои снова и снова. Часто разбор заканчивается быстро и предсказуемо: нашли виноватого, сделали вывод «надо быть внимательнее» и пошли дальше — до следующего инцидента. В этой статье разберём, почему такой подход не работает, что на самом деле стоит за blameless post‑mortem и как выстроить разбор инцидентов так, чтобы он приводил не к формальным выводам, а к конкретным изменениям в системе.

    habr.com/ru/companies/otus/art

    #team_lead #postmortem #разбор_инцидентов #blameless_культура #DevOps_практики #мониторинг_систем #инциденты_в_продакшене #root_cause_анализ

  5. [Перевод] Почему observability-данные теряют ценность ещё при сборе

    Observability давно стала стандартом, но качество решений на её основе остаётся нестабильным: данные есть, а понимания всё равно не хватает. Проблема часто возникает раньше, чем начинаются графики и алерты — в самой модели сбора телеметрии, где теряются связи между событиями и размывается контекст. В статье разбираем, почему это происходит, как это влияет на анализ продакшена и почему с ростом роли ИИ и агентных систем требования к данным становятся принципиально другими.

    habr.com/ru/companies/otus/art

    #observability #логирование #наблюдаемость #трассировка #метрики #кардинальность #DevOps_практики #качество_данных