home.social

#alerting — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #alerting, aggregated by home.social.

  1. Heartbeat-мониторинг cron-job'ов: dead-man-switch на FastAPI

    Обычный uptime-мониторинг проверяет, отвечает ли сервис на запросы. Cron-job ничего не отвечает — он запускается раз в N часов, делает работу и молча завершается. Если cron перестал запускаться (uptime daemon упал, машина в read-only mode после fsck, disk full) — обычный мониторинг этого не видит. Решение известно с 70-х — паттерн dead-man-switch (он же heartbeat). Я недавно делал heartbeat-эндпоинты для Valpero. Здесь разберу серверную часть на FastAPI + клиентский bash-pattern, и edge-кейсы которые их ломают. В конце готовый код, который можно адаптировать под свой стек.

    habr.com/ru/articles/1035624/

    #cron #heartbeat #deadmanswitch #monitoring #alerting #bash #FastAPI #Celery #devops #linux

  2. Multi-region quorum: «все регионы согласны» против «N из M»

    К-of-N или all-must-agree? Два подхода к quorum-логике в multi-region мониторинге. Я остановился на all-must-agree с consecutive-failure threshold. С Redis-схемой, кодом и разбором edge-кейсов где каждый подход ломается.

    habr.com/ru/articles/1035600/

    #мониторинг #quorum #SRE #false_positive #Redis #distributed_systems #alerting #threshold #uptime #incident_management

  3. Multi-region quorum: «все регионы согласны» против «N из M»

    К-of-N или all-must-agree? Два подхода к quorum-логике в multi-region мониторинге. Я остановился на all-must-agree с consecutive-failure threshold. С Redis-схемой, кодом и разбором edge-кейсов где каждый подход ломается.

    habr.com/ru/articles/1035600/

    #мониторинг #quorum #SRE #false_positive #Redis #distributed_systems #alerting #threshold #uptime #incident_management

  4. Multi-region quorum: «все регионы согласны» против «N из M»

    К-of-N или all-must-agree? Два подхода к quorum-логике в multi-region мониторинге. Я остановился на all-must-agree с consecutive-failure threshold. С Redis-схемой, кодом и разбором edge-кейсов где каждый подход ломается.

    habr.com/ru/articles/1035600/

    #мониторинг #quorum #SRE #false_positive #Redis #distributed_systems #alerting #threshold #uptime #incident_management

  5. Multi-region quorum: «все регионы согласны» против «N из M»

    К-of-N или all-must-agree? Два подхода к quorum-логике в multi-region мониторинге. Я остановился на all-must-agree с consecutive-failure threshold. С Redis-схемой, кодом и разбором edge-кейсов где каждый подход ломается.

    habr.com/ru/articles/1035600/

    #мониторинг #quorum #SRE #false_positive #Redis #distributed_systems #alerting #threshold #uptime #incident_management

  6. Deep dive on Slack webhooks and apps for alerts, approvals, and workflow automation. Block Kit buttons, signature verification, Go and Python examples.

    #integration #alerting #observability #golang #python #Architecture #Dev #Go

    glukhov.org/app-architecture/i

  7. Deep dive on Slack webhooks and apps for alerts, approvals, and workflow automation. Block Kit buttons, signature verification, Go and Python examples.

    #integration #alerting #observability #golang #python #Architecture #Dev #Go

    glukhov.org/app-architecture/i

  8. Deep dive on Slack webhooks and apps for alerts, approvals, and workflow automation. Block Kit buttons, signature verification, Go and Python examples.

    #integration #alerting #observability #golang #python #Architecture #Dev #Go

    glukhov.org/app-architecture/i

  9. Deep dive on Slack webhooks and apps for alerts, approvals, and workflow automation. Block Kit buttons, signature verification, Go and Python examples.

    #integration #alerting #observability #golang #python #Architecture #Dev #Go

    glukhov.org/app-architecture/i

  10. Deep dive on Slack webhooks and apps for alerts, approvals, and workflow automation. Block Kit buttons, signature verification, Go and Python examples.

    glukhov.org/app-architecture/i

  11. Deep dive on Discord webhooks and bots for alerts, approvals, and human-in-the-loop control. Go and Python examples, security, idempotency, and routing.

    #integration #observability #alerting #bots #python #Architecture #Dev #Go #Golang

    glukhov.org/app-architecture/i

  12. Deep dive on Discord webhooks and bots for alerts, approvals, and human-in-the-loop control. Go and Python examples, security, idempotency, and routing.

    #integration #observability #alerting #bots #python #Architecture #Dev #Go #Golang

    glukhov.org/app-architecture/i

  13. Deep dive on Discord webhooks and bots for alerts, approvals, and human-in-the-loop control. Go and Python examples, security, idempotency, and routing.

    #integration #observability #alerting #bots #python #Architecture #Dev #Go #Golang

    glukhov.org/app-architecture/i

  14. Deep dive on Discord webhooks and bots for alerts, approvals, and human-in-the-loop control. Go and Python examples, security, idempotency, and routing.

    #integration #observability #alerting #bots #python #Architecture #Dev #Go #Golang

    glukhov.org/app-architecture/i

  15. Deep dive on Discord webhooks and bots for alerts, approvals, and human-in-the-loop control. Go and Python examples, security, idempotency, and routing.

    glukhov.org/app-architecture/i

  16. A practical pillar page on alerting design, routing, noise reduction, and human response across observability systems, paging tools, and chat platforms.

    #observability #alerting #prometheus #Architecture #Dev

    glukhov.org/observability/aler

  17. A practical pillar page on alerting design, routing, noise reduction, and human response across observability systems, paging tools, and chat platforms.

    #observability #alerting #prometheus #Architecture #Dev

    glukhov.org/observability/aler

  18. A practical pillar page on alerting design, routing, noise reduction, and human response across observability systems, paging tools, and chat platforms.

    #observability #alerting #prometheus #Architecture #Dev

    glukhov.org/observability/aler

  19. A practical pillar page on alerting design, routing, noise reduction, and human response across observability systems, paging tools, and chat platforms.

    #observability #alerting #prometheus #Architecture #Dev

    glukhov.org/observability/aler

  20. A practical pillar page on alerting design, routing, noise reduction, and human response across observability systems, paging tools, and chat platforms.

    glukhov.org/observability/aler

  21. Колобок-стек: я от бабушки ушёл, или как мы написали свой сервер алертов на 16 МБ

    Pusk — self-hosted сервер алертов на 16 МБ. Один бинарник, без внешних сервисов, частично совместим с Telegram Bot API (13 методов из 80+). Типичная ситуация: несколько серверов, Zabbix собирает метрики, Python‑боты шлют алерты в Telegram. У кого‑то это веб‑проект, у кого‑то видеонаблюдение, у кого‑то живые эфиры, где 2 минут без алерта = зрители видят чёрный экран. Работало годами. А потом канал до API отвалился. Причина неважна — лимиты, блокировки, авария на стороне провайдера. Алерты встали. Нужен был свой канал доставки, который не зависит от внешних сервисов. Покатились →

    habr.com/ru/articles/1018932/

    #pusk #selfhosted #alerting #telegram_bot_api #go #sqlite #devops #monitoring #alertmanager #pwa

  22. Колобок-стек: я от бабушки ушёл, или как мы написали свой сервер алертов на 16 МБ

    Pusk — self-hosted сервер алертов на 16 МБ. Один бинарник, без внешних сервисов, частично совместим с Telegram Bot API (13 методов из 80+). Типичная ситуация: несколько серверов, Zabbix собирает метрики, Python‑боты шлют алерты в Telegram. У кого‑то это веб‑проект, у кого‑то видеонаблюдение, у кого‑то живые эфиры, где 2 минут без алерта = зрители видят чёрный экран. Работало годами. А потом канал до API отвалился. Причина неважна — лимиты, блокировки, авария на стороне провайдера. Алерты встали. Нужен был свой канал доставки, который не зависит от внешних сервисов. Покатились →

    habr.com/ru/articles/1018932/

    #pusk #selfhosted #alerting #telegram_bot_api #go #sqlite #devops #monitoring #alertmanager #pwa

  23. Колобок-стек: я от бабушки ушёл, или как мы написали свой сервер алертов на 16 МБ

    Pusk — self-hosted сервер алертов на 16 МБ. Один бинарник, без внешних сервисов, частично совместим с Telegram Bot API (13 методов из 80+). Типичная ситуация: несколько серверов, Zabbix собирает метрики, Python‑боты шлют алерты в Telegram. У кого‑то это веб‑проект, у кого‑то видеонаблюдение, у кого‑то живые эфиры, где 2 минут без алерта = зрители видят чёрный экран. Работало годами. А потом канал до API отвалился. Причина неважна — лимиты, блокировки, авария на стороне провайдера. Алерты встали. Нужен был свой канал доставки, который не зависит от внешних сервисов. Покатились →

    habr.com/ru/articles/1018932/

    #pusk #selfhosted #alerting #telegram_bot_api #go #sqlite #devops #monitoring #alertmanager #pwa

  24. Колобок-стек: я от бабушки ушёл, или как мы написали свой сервер алертов на 16 МБ

    Pusk — self-hosted сервер алертов на 16 МБ. Один бинарник, без внешних сервисов, частично совместим с Telegram Bot API (13 методов из 80+). Типичная ситуация: несколько серверов, Zabbix собирает метрики, Python‑боты шлют алерты в Telegram. У кого‑то это веб‑проект, у кого‑то видеонаблюдение, у кого‑то живые эфиры, где 2 минут без алерта = зрители видят чёрный экран. Работало годами. А потом канал до API отвалился. Причина неважна — лимиты, блокировки, авария на стороне провайдера. Алерты встали. Нужен был свой канал доставки, который не зависит от внешних сервисов. Покатились →

    habr.com/ru/articles/1018932/

    #pusk #selfhosted #alerting #telegram_bot_api #go #sqlite #devops #monitoring #alertmanager #pwa

  25. #Gotify + #Canopsis 🎯 A vous les #Notifications ciblées et instantanées !

    Dans le cadre de la #Supervision et de l'#Hypervision, recevoir rapidement et de manière claire les bonnes informations peut faire toute la différence... Surtout en dehors des heures ouvrées ou pendant les #Astreintes.

    Découvrez comment cette intégration simple et puissante améliore votre réactivité opérationnelle dans ce nouvel article :
    canopsis.fr/gotify-canopsis-po

    #ITOps #Alerting #OpenSource #Observabilité

  26. #Gotify + #Canopsis 🎯 A vous les #Notifications ciblées et instantanées !

    Dans le cadre de la #Supervision et de l'#Hypervision, recevoir rapidement et de manière claire les bonnes informations peut faire toute la différence... Surtout en dehors des heures ouvrées ou pendant les #Astreintes.

    Découvrez comment cette intégration simple et puissante améliore votre réactivité opérationnelle dans ce nouvel article :
    canopsis.fr/gotify-canopsis-po

    #ITOps #Alerting #OpenSource #Observabilité

  27. #Gotify + #Canopsis 🎯 A vous les #Notifications ciblées et instantanées !

    Dans le cadre de la #Supervision et de l'#Hypervision, recevoir rapidement et de manière claire les bonnes informations peut faire toute la différence... Surtout en dehors des heures ouvrées ou pendant les #Astreintes.

    Découvrez comment cette intégration simple et puissante améliore votre réactivité opérationnelle dans ce nouvel article :
    canopsis.fr/gotify-canopsis-po

    #ITOps #Alerting #OpenSource #Observabilité

  28. #CanopTips 💡 Testez vos règles Canopsis en toute autonomie grâce à l'enregistrement d'événements !

    Valider des règles d’enrichissement, de corrélation ou des scénarios nécessite souvent de redemander des événements aux clients, ce qui peut être contraignant et chronophage.

    Avec l'enregistrement d’événements de #Canopsis, cette dépendance disparaît.

    🔗 canopsis.fr/enregistrement-d-e
    #SupervisionIT #Hypervision #ITOps #Observabilité #EventManagement #Alerting #OpenSource #Monitoring #SI

  29. #CanopTips 💡 Testez vos règles Canopsis en toute autonomie grâce à l'enregistrement d'événements !

    Valider des règles d’enrichissement, de corrélation ou des scénarios nécessite souvent de redemander des événements aux clients, ce qui peut être contraignant et chronophage.

    Avec l'enregistrement d’événements de #Canopsis, cette dépendance disparaît.

    🔗 canopsis.fr/enregistrement-d-e
    #SupervisionIT #Hypervision #ITOps #Observabilité #EventManagement #Alerting #OpenSource #Monitoring #SI

  30. #CanopTips 💡 Testez vos règles Canopsis en toute autonomie grâce à l'enregistrement d'événements !

    Valider des règles d’enrichissement, de corrélation ou des scénarios nécessite souvent de redemander des événements aux clients, ce qui peut être contraignant et chronophage.

    Avec l'enregistrement d’événements de #Canopsis, cette dépendance disparaît.

    🔗 canopsis.fr/enregistrement-d-e
    #SupervisionIT #Hypervision #ITOps #Observabilité #EventManagement #Alerting #OpenSource #Monitoring #SI

  31. Canopsis × #Teams 🔔 Quand l’alarme sort de la console d’#Hypervision pour arriver là où travaillent les équipes !

    Avec l’intégration #Canopsis × Teams, les alertes sont notifiées au bon moment, au bon endroit et aux bonnes personnes.

    Au-delà du message brut, la notification devient un véritable support de communication clair et synthétique.

    👉 Moins de friction, plus de réactivité et une #Collaboration réellement efficace !

    canopsis.fr/microsoft-teams-ca
    #ITOps #Alerting #Observabilité

  32. Canopsis × #Teams 🔔 Quand l’alarme sort de la console d’#Hypervision pour arriver là où travaillent les équipes !

    Avec l’intégration #Canopsis × Teams, les alertes sont notifiées au bon moment, au bon endroit et aux bonnes personnes.

    Au-delà du message brut, la notification devient un véritable support de communication clair et synthétique.

    👉 Moins de friction, plus de réactivité et une #Collaboration réellement efficace !

    canopsis.fr/microsoft-teams-ca
    #ITOps #Alerting #Observabilité

  33. Canopsis × #Teams 🔔 Quand l’alarme sort de la console d’#Hypervision pour arriver là où travaillent les équipes !

    Avec l’intégration #Canopsis × Teams, les alertes sont notifiées au bon moment, au bon endroit et aux bonnes personnes.

    Au-delà du message brut, la notification devient un véritable support de communication clair et synthétique.

    👉 Moins de friction, plus de réactivité et une #Collaboration réellement efficace !

    canopsis.fr/microsoft-teams-ca
    #ITOps #Alerting #Observabilité

  34. Canop'Tips 💡 Maîtrisez vos alarmes avec les compteurs #Canopsis !
    Dans un contexte où les équipes IT sont submergées d'alertes, Canopsis propose une réponse simple, visuelle et efficace : les compteurs d’alarmes.

    ✅ Donner une vision synthétique à un pilote / une équipe
    ✅ Suivre la charge opérationnelle d'un périmètre
    ✅ Augmenter la réactivité et l’efficacité des équipes
    ✅ Construire des tableaux de bord orientés pilotage

    canopsis.fr/compteurs-dalarmes/
    #OpenSource #SupervisionIT #ITOps #Alerting

  35. Canop'Tips 💡 Maîtrisez vos alarmes avec les compteurs #Canopsis !
    Dans un contexte où les équipes IT sont submergées d'alertes, Canopsis propose une réponse simple, visuelle et efficace : les compteurs d’alarmes.

    ✅ Donner une vision synthétique à un pilote / une équipe
    ✅ Suivre la charge opérationnelle d'un périmètre
    ✅ Augmenter la réactivité et l’efficacité des équipes
    ✅ Construire des tableaux de bord orientés pilotage

    canopsis.fr/compteurs-dalarmes/
    #OpenSource #SupervisionIT #ITOps #Alerting

  36. Canop'Tips 💡 Maîtrisez vos alarmes avec les compteurs #Canopsis !
    Dans un contexte où les équipes IT sont submergées d'alertes, Canopsis propose une réponse simple, visuelle et efficace : les compteurs d’alarmes.

    ✅ Donner une vision synthétique à un pilote / une équipe
    ✅ Suivre la charge opérationnelle d'un périmètre
    ✅ Augmenter la réactivité et l’efficacité des équipes
    ✅ Construire des tableaux de bord orientés pilotage

    canopsis.fr/compteurs-dalarmes/
    #OpenSource #SupervisionIT #ITOps #Alerting

  37. Как не сойти с ума с Grafana Unified Alerting: настраиваем алерт и разбираем все грабли

    В какой-то момент простого дашборда уже не хватает. Хочется, чтобы метрики не просто “где-то красиво лежали”, а сами приходили и били в лицо, когда что-то пошло не так. Разберёмся с Grafana Unified Alerting , expressions , темплейтами уведомлений и типичными ошибками, которые легко словить, если вы впервые лезете в алерты.

    habr.com/ru/articles/966902/

    #performance #android #mobile #kotlin #grafana #alerts #alerting

  38. Как не сойти с ума с Grafana Unified Alerting: настраиваем алерт и разбираем все грабли

    В какой-то момент простого дашборда уже не хватает. Хочется, чтобы метрики не просто “где-то красиво лежали”, а сами приходили и били в лицо, когда что-то пошло не так. Разберёмся с Grafana Unified Alerting , expressions , темплейтами уведомлений и типичными ошибками, которые легко словить, если вы впервые лезете в алерты.

    habr.com/ru/articles/966902/

    #performance #android #mobile #kotlin #grafana #alerts #alerting

  39. Как не сойти с ума с Grafana Unified Alerting: настраиваем алерт и разбираем все грабли

    В какой-то момент простого дашборда уже не хватает. Хочется, чтобы метрики не просто “где-то красиво лежали”, а сами приходили и били в лицо, когда что-то пошло не так. Разберёмся с Grafana Unified Alerting , expressions , темплейтами уведомлений и типичными ошибками, которые легко словить, если вы впервые лезете в алерты.

    habr.com/ru/articles/966902/

    #performance #android #mobile #kotlin #grafana #alerts #alerting

  40. Как не сойти с ума с Grafana Unified Alerting: настраиваем алерт и разбираем все грабли

    В какой-то момент простого дашборда уже не хватает. Хочется, чтобы метрики не просто “где-то красиво лежали”, а сами приходили и били в лицо, когда что-то пошло не так. Разберёмся с Grafana Unified Alerting , expressions , темплейтами уведомлений и типичными ошибками, которые легко словить, если вы впервые лезете в алерты.

    habr.com/ru/articles/966902/

    #performance #android #mobile #kotlin #grafana #alerts #alerting