home.social

#mttr — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #mttr, aggregated by home.social.

  1. Если инцидент закрыт, это не значит, что проблема решена

    Пятница, 23:40, прод лежит. Дежурный поднимает сервис за сорок минут: перезапустил контейнер, всё заработало. Инцидент закрыт, MTTR красивый, все спать. Через десять дней то же самое: тот же сервис, та же ошибка в логах. Снова подняли и снова закрыли.

    habr.com/ru/companies/simpleon

    #ITSM #SDLC #инцидент #баг #Service_Desk #DevOps #MTTR #управление_инцидентами

  2. Если инцидент закрыт, это не значит, что проблема решена

    Пятница, 23:40, прод лежит. Дежурный поднимает сервис за сорок минут: перезапустил контейнер, всё заработало. Инцидент закрыт, MTTR красивый, все спать. Через десять дней то же самое: тот же сервис, та же ошибка в логах. Снова подняли и снова закрыли.

    habr.com/ru/companies/simpleon

    #ITSM #SDLC #инцидент #баг #Service_Desk #DevOps #MTTR #управление_инцидентами

  3. Если инцидент закрыт, это не значит, что проблема решена

    Пятница, 23:40, прод лежит. Дежурный поднимает сервис за сорок минут: перезапустил контейнер, всё заработало. Инцидент закрыт, MTTR красивый, все спать. Через десять дней то же самое: тот же сервис, та же ошибка в логах. Снова подняли и снова закрыли.

    habr.com/ru/companies/simpleon

    #ITSM #SDLC #инцидент #баг #Service_Desk #DevOps #MTTR #управление_инцидентами

  4. Если инцидент закрыт, это не значит, что проблема решена

    Пятница, 23:40, прод лежит. Дежурный поднимает сервис за сорок минут: перезапустил контейнер, всё заработало. Инцидент закрыт, MTTR красивый, все спать. Через десять дней то же самое: тот же сервис, та же ошибка в логах. Снова подняли и снова закрыли.

    habr.com/ru/companies/simpleon

    #ITSM #SDLC #инцидент #баг #Service_Desk #DevOps #MTTR #управление_инцидентами

  5. Что такое DORA-метрики и как их измерять, часть 1

    Проблема большинства команд не в том, что они работают медленно. Проблема в том, что они толком не понимают, где именно теряют время, сколько стоит каждая ошибка и насколько тяжёлым стал сам процесс поставки изменений. Именно здесь и полезны DORA-метрики. Разберём, что они измеряют, где их чаще всего трактуют неправильно и как применять их без KPI-магии.

    habr.com/ru/companies/simpleon

    #dora #doraметрики #devops #cicd #метрики_разработки #deployment_frequency #lead_time #change_failure_rate #mttr #sdlc

  6. Что такое DORA-метрики и как их измерять, часть 1

    Проблема большинства команд не в том, что они работают медленно. Проблема в том, что они толком не понимают, где именно теряют время, сколько стоит каждая ошибка и насколько тяжёлым стал сам процесс поставки изменений. Именно здесь и полезны DORA-метрики. Разберём, что они измеряют, где их чаще всего трактуют неправильно и как применять их без KPI-магии.

    habr.com/ru/companies/simpleon

    #dora #doraметрики #devops #cicd #метрики_разработки #deployment_frequency #lead_time #change_failure_rate #mttr #sdlc

  7. Что такое DORA-метрики и как их измерять, часть 1

    Проблема большинства команд не в том, что они работают медленно. Проблема в том, что они толком не понимают, где именно теряют время, сколько стоит каждая ошибка и насколько тяжёлым стал сам процесс поставки изменений. Именно здесь и полезны DORA-метрики. Разберём, что они измеряют, где их чаще всего трактуют неправильно и как применять их без KPI-магии.

    habr.com/ru/companies/simpleon

    #dora #doraметрики #devops #cicd #метрики_разработки #deployment_frequency #lead_time #change_failure_rate #mttr #sdlc

  8. Что такое DORA-метрики и как их измерять, часть 1

    Проблема большинства команд не в том, что они работают медленно. Проблема в том, что они толком не понимают, где именно теряют время, сколько стоит каждая ошибка и насколько тяжёлым стал сам процесс поставки изменений. Именно здесь и полезны DORA-метрики. Разберём, что они измеряют, где их чаще всего трактуют неправильно и как применять их без KPI-магии.

    habr.com/ru/companies/simpleon

    #dora #doraметрики #devops #cicd #метрики_разработки #deployment_frequency #lead_time #change_failure_rate #mttr #sdlc

  9. Метрики технического долга в ИБ

    Представьте ситуацию: директор спрашивает про состояние информационной безопасности, а вы отвечаете — «Мы закрыли 100 уязвимостей за квартал». Звучит солидно. Для бизнеса же это почти ничего не значит. Руководству важнее понимать, насколько снизился риск и работает ли вообще то, на что компания тратит деньги. Поговорим о метриках технического долга в ИБ, которые помогают ответить на эти вопросы и перевести ценность безопасности на язык, понятный бизнесу.

    habr.com/ru/companies/otus/art

    #метрики #технический_долг #метрики_ИБ #управление_рисками #уязвимости #MTTR

  10. A new global survey of 750 CISOs by Absolute Security has uncovered a critical "recovery reality gap" that is redefining modern security priorities. The data reveals a sobering truth: not a single organization reported being able to fully restore business operations within 24 hours of a major cyber incident.

    Read More: security.land/the-24-hour-reco

    #SecurityLand #BusinessShield #CyberSecurity #CISO #MTTR #AbsoluteSecurity #CyberResilience #CyberDefense #Research

  11. [Перевод] Сначала Agile, потом — агентный ИИ

    Агентные ИИ-системы обещают ускорить разработку, но ускоряют только там, где уже налажен быстрый поток поставки: автономные продуктовые команды, короткие циклы, непрерывная обратная связь. Реальность же прозаична: по DORA многие организации релизят реже раза в неделю, у четверти change failure rate доходит до 40%, а инциденты чинятся неделями. В статье разбираемся, почему без «взрослого» Agile и DevOps ИИ-агенты всего лишь делают узкие места заметнее, и как организационная агентность (право и способность команд действовать) становится предпосылкой для реальной выгоды от ИИ. Agile → ИИ-агенты: что важно

    habr.com/ru/companies/otus/art

    #агентный_ИИ #агентность #agile #метрики_dora #частота_релизов #MTTR #автономность_команды #devops

  12. [Перевод] Разработка, деплой, эксплуатация: как перестать терять ценность на пути к продакшену

    Сколько и куда инвестировать в дев-инструменты и платформу, как считать отдачу от оптимизаций (хоть от снижения CPU), и где гонять тесты — на пресабмите или на интеграции? Простых ответов нет. В этой статье я предлагаю целостную модель баланса между затратами разработки и создаваемой ценностью с учётом рисков: успех продукта, продуктивность команды, эффективность ресурсов и стратегические возможности. Дам практичные ориентиры для продактов, инженеров и менеджеров, а также покажу, как инфраструктура и архитектура сдвигают этот баланс и где именно выгодно усиливать автоматизацию и проверки.

    habr.com/ru/companies/otus/art

    #метрики_DORA #cicd #канареечный_релиз #mttr #инженерная_емкость #наблюдаемость #shift_left_тестирование #lead_time

  13. Мониторинг бизнес-процессов с помощью OpenTelemetry

    Если у вас большой сложный продукт, который разрабатывают несколько команд, бывает трудно избежать ситуации, когда продакшен лежит, бизнес стоит, а инженеры несколько часов перекидывают стрелки друг на друга. При этом каждый считает, что проблема на другой стороне. Чтобы найти верное решение, нужен не столько подходящий инструмент, сколько общий подход для мониторинга всех частей приложения. В этой статье расскажу, как мы объединили несколько разных команд разработки Райффайзен Онлайн общим Observability и с помощью исключительно технических метрик отслеживаем здоровье бизнес-процессов. Как всё это помогает мгновенно находить первопричину сбоя. Как устроен OpenTelemetry и как с его помощью рассчитать доступность приложения в девятках, а также MTTR (Mean Time to Recovery).

    habr.com/ru/companies/oleg-bun

    #opentelemetry #мониторинг #endtoend_testing #999 #трейсинг #collector #zscore #tsdb #mttr #availability

  14. Are we getting better as and practitioners? Not quite.
    For the third year in a row, people report the mean time to recovery from production incidents is increasing!
    And only 10% report practicing full .
    Check out the insights I shared with APMdigest, based on the yearly Observability Pulse survey by Logz.io:
    𝐂𝐡𝐚𝐥𝐥𝐞𝐧𝐠𝐞𝐬 𝐚𝐧𝐝 𝐓𝐫𝐞𝐧𝐝𝐬 𝐢𝐧 𝐎𝐛𝐬𝐞𝐫𝐯𝐚𝐛𝐢𝐥𝐢𝐭𝐲 𝐀𝐝𝐨𝐩𝐭𝐢𝐨𝐧 𝟐𝟎𝟐𝟒
    apmdigest.com/challenges-and-t

  15. Are we getting better as DevOps and SRE practitioners? Not quite.
    For the third year in a row, people report the mean time to recovery (MTTR) from production incidents is increasing!
    And only 10% report practicing full observability.
    Check out the insights I shared with APMdigest, based on the yearly Observability Pulse survey by Logz.io:
    𝐂𝐡𝐚𝐥𝐥𝐞𝐧𝐠𝐞𝐬 𝐚𝐧𝐝 𝐓𝐫𝐞𝐧𝐝𝐬 𝐢𝐧 𝐎𝐛𝐬𝐞𝐫𝐯𝐚𝐛𝐢𝐥𝐢𝐭𝐲 𝐀𝐝𝐨𝐩𝐭𝐢𝐨𝐧 𝟐𝟎𝟐𝟒
    apmdigest.com/challenges-and-t

  16. This week on Slight Reliability I had the honour of interviewing Courtney Nash about why mean time to recover (#MTTR) is an unhelpful metric, what she learned by analysing 10+ incident reports, and much more.

    🕵🏽‍♀️ Instead of MTTR, let's focus on learning from incidents, observing patterns and themes, involving leadership, and adding an "accident investigator" lens after the fact to enhance the learning.

    #SRE #DevOps #incidents #SlightReliability

    youtube.com/watch?v=k-tuE9aMg3

  17. 🎙️ ✨ A new episode has been published on @ITSPmagazine

    Show: Redefining CyberSecurity With @seanmartin

    Episode: Implementing Meaningful Information Security Metrics

    Guests: Allie Mellen and Jeff Pollard

    Podcast format: Video & Audio

    Enjoy!

    👉itspmagazine.com/redefining-cy

    #metrics #MTTD #MTTR #cybersecurity #datasecurity #infosec #security #technology #tech

  18. The 2022 VOID Report is out today! Find out why it's time to retire MTTR, and how to move past shallow incident metrics like duration and severity. bit.ly/3FPz15o

    (via Courtney Nash) #sre #resilience #incidents #mttr #devops

  19. „Wer sich selbst nicht fühlen kann, kann auch keine #Empathie empfinden“: Julia Friese über nationalsozialistische #Erziehung & ihr Buch #MTTR #education #books