home.social

#alerting — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #alerting, aggregated by home.social.

  1. Колобок-стек: я от бабушки ушёл, или как мы написали свой сервер алертов на 16 МБ

    Pusk — self-hosted сервер алертов на 16 МБ. Один бинарник, без внешних сервисов, частично совместим с Telegram Bot API (13 методов из 80+). Типичная ситуация: несколько серверов, Zabbix собирает метрики, Python‑боты шлют алерты в Telegram. У кого‑то это веб‑проект, у кого‑то видеонаблюдение, у кого‑то живые эфиры, где 2 минут без алерта = зрители видят чёрный экран. Работало годами. А потом канал до API отвалился. Причина неважна — лимиты, блокировки, авария на стороне провайдера. Алерты встали. Нужен был свой канал доставки, который не зависит от внешних сервисов. Покатились →

    habr.com/ru/articles/1018932/

    #pusk #selfhosted #alerting #telegram_bot_api #go #sqlite #devops #monitoring #alertmanager #pwa

  2. #Gotify + #Canopsis 🎯 A vous les #Notifications ciblées et instantanées !

    Dans le cadre de la #Supervision et de l'#Hypervision, recevoir rapidement et de manière claire les bonnes informations peut faire toute la différence... Surtout en dehors des heures ouvrées ou pendant les #Astreintes.

    Découvrez comment cette intégration simple et puissante améliore votre réactivité opérationnelle dans ce nouvel article :
    canopsis.fr/gotify-canopsis-po

    #ITOps #Alerting #OpenSource #Observabilité

  3. #CanopTips 💡 Testez vos règles Canopsis en toute autonomie grâce à l'enregistrement d'événements !

    Valider des règles d’enrichissement, de corrélation ou des scénarios nécessite souvent de redemander des événements aux clients, ce qui peut être contraignant et chronophage.

    Avec l'enregistrement d’événements de #Canopsis, cette dépendance disparaît.

    🔗 canopsis.fr/enregistrement-d-e
    #SupervisionIT #Hypervision #ITOps #Observabilité #EventManagement #Alerting #OpenSource #Monitoring #SI

  4. Canopsis × #Teams 🔔 Quand l’alarme sort de la console d’#Hypervision pour arriver là où travaillent les équipes !

    Avec l’intégration #Canopsis × Teams, les alertes sont notifiées au bon moment, au bon endroit et aux bonnes personnes.

    Au-delà du message brut, la notification devient un véritable support de communication clair et synthétique.

    👉 Moins de friction, plus de réactivité et une #Collaboration réellement efficace !

    canopsis.fr/microsoft-teams-ca
    #ITOps #Alerting #Observabilité

  5. Canop'Tips 💡 Maîtrisez vos alarmes avec les compteurs #Canopsis !
    Dans un contexte où les équipes IT sont submergées d'alertes, Canopsis propose une réponse simple, visuelle et efficace : les compteurs d’alarmes.

    ✅ Donner une vision synthétique à un pilote / une équipe
    ✅ Suivre la charge opérationnelle d'un périmètre
    ✅ Augmenter la réactivité et l’efficacité des équipes
    ✅ Construire des tableaux de bord orientés pilotage

    canopsis.fr/compteurs-dalarmes/
    #OpenSource #SupervisionIT #ITOps #Alerting

  6. Как не сойти с ума с Grafana Unified Alerting: настраиваем алерт и разбираем все грабли

    В какой-то момент простого дашборда уже не хватает. Хочется, чтобы метрики не просто “где-то красиво лежали”, а сами приходили и били в лицо, когда что-то пошло не так. Разберёмся с Grafana Unified Alerting , expressions , темплейтами уведомлений и типичными ошибками, которые легко словить, если вы впервые лезете в алерты.

    habr.com/ru/articles/966902/

    #performance #android #mobile #kotlin #grafana #alerts #alerting

  7. Multi-Hazard Improves App Retention - Comparison Of Alerting & Attrition For The Multi-Hazards SD Emergency & The Single-Hazard #QuakeAlert
    --
    doi.org/10.1016/j.ijdrr.2025.1 <-- shared paper
    --
    “• Fire is responsible for over 50 % of alerts for County of San Diego, California, USA.
    • App installation rates closely mirror the timing of hazard events.
    • Multi-hazard apps retain users at a 15 % higher rate compared to single-hazard apps.
    • Higher retention improves likelihood people will receive an alert for low-frequency high-impact events like earthquakes..."
    #GIS #spatial #mapping #naturalhazards #Alert #warning #smartphone #userretention #wildfire #SanDiego #California #USA #risk #hazard #mitigation #humanimpacts #socialmedia #push #mobileapps #alerting #earlywarning #warningsystem #multihazard #fire #spatiotemporal #spatialanalysis #earthquake #tsunami #flooding #weather #earlywarning #hazardmanagement #usecase #statistics #events #effect #effectiveness #community #public #infrastructure #loss #damage #cost

  8. Prometheus 📊 L’#OpenSource au service du #monitoring et de l’#alerting

    Dans un monde IT toujours plus complexe, Prometheus s’impose comme une référence. Combiné à #Canopsis, il devient un atout majeur pour :

    ✅ Centraliser les métriques et les alertes
    ✅ Gagner en visibilité sur le SI
    ✅ Accélérer la détection et la remédiation

    Découvrez comment cette synergie renforce l’#observabilité et la performance de votre SI : canopsis.fr/prometheus-lopen-s

    #Supervision #DevOps #ITOps #DevOps #Hypervision

  9. Как я перестал гнаться за 100% аптаймом

    Когда я только начинал работать, 100% аптайма казались мне священным граалем. Казалось: если сервис никогда не падает — пользователи счастливы, бизнес доволен, инженеры спят спокойно. Но реальность быстро показала: каждая дополнительная «девятка» стоит всё дороже, а выгоды становятся всё менее заметными. В статье делюсь опытом: почему гонка за идеальной надёжностью — тупик, как помогает концепция Error Budget и почему лучше найти баланс между стабильностью и развитием.

    habr.com/ru/articles/941734/

    #sre #slo #sli #error_budget #devops #observability #monitoring #alerting #постмортем #oncall

  10. Как я перестал бояться алертов и полюбил дежурства

    Когда я только начинал дежурить, телефон ночью был моим главным врагом: PagerDuty вырывал из сна десятки раз, а инциденты превращались в хаос. Со временем я понял, что on-call можно превратить в предсказуемый процесс — с правильными алертами, runbook-ами и командной культурой. В этой статье расскажу, как я перестал бояться алертов и научился относиться к дежурствам спокойно. Будет личный опыт, фейлы и практические советы

    habr.com/ru/articles/941030/

    #sre #slo #sli #error_budget #devops #observability #monitoring #alerting #постмортем #oncall

  11. Как я перестал тушить пожары и начал говорить с бизнесом на языке SLO

    Когда я только начинал работать с инфраструктурой, всё выглядело как бесконечный пожар: сотни алертов, ночные звонки, хаотичные релизы и нервы на пределе. Мы гасили инциденты вручную, но проблема возвращалась снова и снова. Ситуация изменилась, когда я познакомился с практиками SRE: SLO, SLI и error budget. Они помогли превратить хаос в систему и объяснить бизнесу надёжность на понятном языке. Теперь вместо бессмысленного «сервис упал!» мы обсуждаем конкретные цифры: сколько бюджета ошибок потрачено и когда можно катить релиз. В этой статье расскажу, как мы внедрили наблюдаемость на основе golden signals, научились писать постмортемы без поиска виноватых и встроили задачи по надёжности прямо в бэклог. Всё — из реальной практики инженера, который за год прошёл путь от «тушения пожаров» к спокойной работе с прогнозируемой стабильностью. Узнать, как выйти из этого хаоса

    habr.com/ru/articles/940796/

    #sre #slo #sli #error_budget #devops #observability #monitoring #alerting #ci_cd #постмортем

  12. Алертинг метрик Pilot в Prometheus

    Настройка алертинга для своевременного оповещения о возможных проблемах с системой Pilot. Используется инструмент AlerManager, который будет отправлять оповещения на основе метрик Pilot-Server из Prometheus.

    habr.com/ru/articles/915260/

    #pilotbim #pilotice #prometheus #alertmanager #alerting

  13. Пожалуй, самый простой способ спасти ваше .NET-приложение, или Prometheus (и не только) спешит на помощь

    Существует множество возможных проблем приложений, которые удается заметить лишь с опозданием. Особенно когда релиз уже состоялся… К счастью, существует пара ключевых инструментов, которые выручают почти в любой ситуации, — и вряд ли найдется что-то проще. Меня зовут Александр Пугач, я — Senior .NET Developer в проекте Data Warehouse «Лаборатории Касперского» (да-да, вы могли не знать, но у нас в компании широко используются .NET и «шарпы» ). В этой статье я расскажу, как работать с метриками в .NET на примере OpenTelemetry и Prometheus — систем, которые помогают отслеживать проблемы в работе приложений и быстро на них реагировать, обеспечивая стабильную и отказоустойчивую работу сервисов. Когда-то метрики изменили мой процесс разработки, и теперь я надеюсь, что эта статья поможет вам перевернуть ваш взгляд на свои проекты.

    habr.com/ru/companies/kaspersk

    #net #c# #net_core #программирование #aspnet_core #visual_studio #aspnet #c#net #разработка #OpenTelemetry #Prometheus #opentelemetrydotnet #opentelemetrydotnetcontrib #Colleсtor_AppMetrics #prometheusnet #HealthChecks #Alerting #Grafana #Мониторинг #Obsevability #Docker

  14. For those of you who are interested in #homeserver & #homelab setups, what is your approach to monitoring and alerting?

    I've always really loved #icinga but I'm wondering what other people are using.

    #server #icinga2 #monitoring #alerting #serverlife