#prometheus — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #prometheus, aggregated by home.social.
-
🚀 How to Install and Configure Node Exporter on #Debian #VPS This article will provide a guide for how to install and configure Node Exporter on Debian VPS.
What is Node Exporter?
Node Exporter is a #Prometheus exporter that collects and exposes hardware and OS-level metrics from Linux and Unix-like systems. It runs as a background service and makes these metrics available ...
Continued 👉 https://blog.radwebhosting.com/install-and-configure-node-exporter-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.raddemo.host #selfhosted #nodeexporter #letsencrypt #opensource #selfhosting #observability -
🚀 How to Install and Configure Node Exporter on #Debian #VPS This article will provide a guide for how to install and configure Node Exporter on Debian VPS.
What is Node Exporter?
Node Exporter is a #Prometheus exporter that collects and exposes hardware and OS-level metrics from Linux and Unix-like systems. It runs as a background service and makes these metrics available ...
Continued 👉 https://blog.radwebhosting.com/install-and-configure-node-exporter-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.raddemo.host #selfhosted #nodeexporter #letsencrypt #opensource #selfhosting #observability -
🚀 How to Install and Configure Node Exporter on #Debian #VPS This article will provide a guide for how to install and configure Node Exporter on Debian VPS.
What is Node Exporter?
Node Exporter is a #Prometheus exporter that collects and exposes hardware and OS-level metrics from Linux and Unix-like systems. It runs as a background service and makes these metrics available ...
Continued 👉 https://blog.radwebhosting.com/install-and-configure-node-exporter-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.raddemo.host #selfhosted #nodeexporter #letsencrypt #opensource #selfhosting #observability -
Зачем нужны APM-платформы, если есть Prometheus и Grafana
Зачем APM-платформы, если есть Prometheus и Grafana Всем привет! Мы разрабатываем APM-платформу и регулярно сталкиваемся с вопросом — зачем платить, если есть стек с открытым исходным кодом вроде Prometheus и Grafana? Поэтому давайте посмотрим на достаточно интересную тему, где я как разработчик, знаю продукт изнутри и топлю за него, но и не могу отрицать стандарты индустрии на open-source. Вокруг наблюдаемости давно есть устойчивый стек из open-source продуктов: Prometheus, Grafana, Loki, Jaeger/Tempo и других. Для многих команд это дефолтный выбор — гибкий и контролируемый. В то же время, когда речь идёт о мониторинге сложных, распределенных систем и более быстром внедрении, APM-платформы (Application Performance Monitoring and Observability) предлагают другой подход: готовый продукт с уже встроенной корреляцией данных, автоматизацией и минимальной настройкой. Буду сравнивать по четырем ключевым метрикам: функциональные возможности, скорость развертывания, поддержка и адаптация к изменениям.
https://habr.com/ru/companies/rkt/articles/1031782/
#apm #apmмониторинг #observability #monitoring #мониторинг #zabbix #prometheus #grafana #opensource #opentracing
-
Зачем нужны APM-платформы, если есть Prometheus и Grafana
Зачем APM-платформы, если есть Prometheus и Grafana Всем привет! Мы разрабатываем APM-платформу и регулярно сталкиваемся с вопросом — зачем платить, если есть стек с открытым исходным кодом вроде Prometheus и Grafana? Поэтому давайте посмотрим на достаточно интересную тему, где я как разработчик, знаю продукт изнутри и топлю за него, но и не могу отрицать стандарты индустрии на open-source. Вокруг наблюдаемости давно есть устойчивый стек из open-source продуктов: Prometheus, Grafana, Loki, Jaeger/Tempo и других. Для многих команд это дефолтный выбор — гибкий и контролируемый. В то же время, когда речь идёт о мониторинге сложных, распределенных систем и более быстром внедрении, APM-платформы (Application Performance Monitoring and Observability) предлагают другой подход: готовый продукт с уже встроенной корреляцией данных, автоматизацией и минимальной настройкой. Буду сравнивать по четырем ключевым метрикам: функциональные возможности, скорость развертывания, поддержка и адаптация к изменениям.
https://habr.com/ru/companies/rkt/articles/1031782/
#apm #apmмониторинг #observability #monitoring #мониторинг #zabbix #prometheus #grafana #opensource #opentracing
-
Зачем нужны APM-платформы, если есть Prometheus и Grafana
Зачем APM-платформы, если есть Prometheus и Grafana Всем привет! Мы разрабатываем APM-платформу и регулярно сталкиваемся с вопросом — зачем платить, если есть стек с открытым исходным кодом вроде Prometheus и Grafana? Поэтому давайте посмотрим на достаточно интересную тему, где я как разработчик, знаю продукт изнутри и топлю за него, но и не могу отрицать стандарты индустрии на open-source. Вокруг наблюдаемости давно есть устойчивый стек из open-source продуктов: Prometheus, Grafana, Loki, Jaeger/Tempo и других. Для многих команд это дефолтный выбор — гибкий и контролируемый. В то же время, когда речь идёт о мониторинге сложных, распределенных систем и более быстром внедрении, APM-платформы (Application Performance Monitoring and Observability) предлагают другой подход: готовый продукт с уже встроенной корреляцией данных, автоматизацией и минимальной настройкой. Буду сравнивать по четырем ключевым метрикам: функциональные возможности, скорость развертывания, поддержка и адаптация к изменениям.
https://habr.com/ru/companies/rkt/articles/1031782/
#apm #apmмониторинг #observability #monitoring #мониторинг #zabbix #prometheus #grafana #opensource #opentracing
-
Зачем нужны APM-платформы, если есть Prometheus и Grafana
Зачем APM-платформы, если есть Prometheus и Grafana Всем привет! Мы разрабатываем APM-платформу и регулярно сталкиваемся с вопросом — зачем платить, если есть стек с открытым исходным кодом вроде Prometheus и Grafana? Поэтому давайте посмотрим на достаточно интересную тему, где я как разработчик, знаю продукт изнутри и топлю за него, но и не могу отрицать стандарты индустрии на open-source. Вокруг наблюдаемости давно есть устойчивый стек из open-source продуктов: Prometheus, Grafana, Loki, Jaeger/Tempo и других. Для многих команд это дефолтный выбор — гибкий и контролируемый. В то же время, когда речь идёт о мониторинге сложных, распределенных систем и более быстром внедрении, APM-платформы (Application Performance Monitoring and Observability) предлагают другой подход: готовый продукт с уже встроенной корреляцией данных, автоматизацией и минимальной настройкой. Буду сравнивать по четырем ключевым метрикам: функциональные возможности, скорость развертывания, поддержка и адаптация к изменениям.
https://habr.com/ru/companies/rkt/articles/1031782/
#apm #apmмониторинг #observability #monitoring #мониторинг #zabbix #prometheus #grafana #opensource #opentracing
-
Modernizing .NET Part 24! 📊
Today we’re implementing modern observability with Prometheus and Grafana.
✅ OpenTelemetry metrics
✅ Runtime health (GC, Threads)
✅ Kubernetes-native monitoring
https://medium.com/@michael.kopt/modernizing-net-part-24-modern-monitoring-with-prometheus-and-grafana-d83647e9737b
#dotnet #csharp #aspnet #aspnetcore #csharp #prometheus #grafana #monitoring -
Modernizing .NET Part 24! 📊
Today we’re implementing modern observability with Prometheus and Grafana.
✅ OpenTelemetry metrics
✅ Runtime health (GC, Threads)
✅ Kubernetes-native monitoring
https://medium.com/@michael.kopt/modernizing-net-part-24-modern-monitoring-with-prometheus-and-grafana-d83647e9737b
#dotnet #csharp #aspnet #aspnetcore #csharp #prometheus #grafana #monitoring -
Modernizing .NET Part 24! 📊
Today we’re implementing modern observability with Prometheus and Grafana.
✅ OpenTelemetry metrics
✅ Runtime health (GC, Threads)
✅ Kubernetes-native monitoring
https://medium.com/@michael.kopt/modernizing-net-part-24-modern-monitoring-with-prometheus-and-grafana-d83647e9737b
#dotnet #csharp #aspnet #aspnetcore #csharp #prometheus #grafana #monitoring -
Modernizing .NET Part 24! 📊
Today we’re implementing modern observability with Prometheus and Grafana.
✅ OpenTelemetry metrics
✅ Runtime health (GC, Threads)
✅ Kubernetes-native monitoring
https://medium.com/@michael.kopt/modernizing-net-part-24-modern-monitoring-with-prometheus-and-grafana-d83647e9737b
#dotnet #csharp #aspnet #aspnetcore #csharp #prometheus #grafana #monitoring -
Modernizing .NET Part 24! 📊
Today we’re implementing modern observability with Prometheus and Grafana.
✅ OpenTelemetry metrics
✅ Runtime health (GC, Threads)
✅ Kubernetes-native monitoring
https://medium.com/@michael.kopt/modernizing-net-part-24-modern-monitoring-with-prometheus-and-grafana-d83647e9737b
#dotnet #csharp #aspnet #aspnetcore #csharp #prometheus #grafana #monitoring -
Deploy Full #Monitoring Stack on #Debian #VPS Here’s a comprehensive guide to deploy full monitoring stack on Debian VPS, including:
✅ #Prometheus – Metrics collection
✅ Node Exporter – System metrics
✅ #Grafana – Visualization
✅ #Alertmanager – Alert notifications
✅ #Loki – Log aggregation
✅ #Promtail – Log shipping to Loki🎯 Goal
A ...
Continued 👉 https://blog.radwebhosting.com/deploy-full-monitoring-stack-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.raddemo.host #selfhosting #opensource #selfhosted #nodeexporter #letsencrypt -
Deploy Full #Monitoring Stack on #Debian #VPS Here’s a comprehensive guide to deploy full monitoring stack on Debian VPS, including:
✅ #Prometheus – Metrics collection
✅ Node Exporter – System metrics
✅ #Grafana – Visualization
✅ #Alertmanager – Alert notifications
✅ #Loki – Log aggregation
✅ #Promtail – Log shipping to Loki🎯 Goal
A ...
Continued 👉 https://blog.radwebhosting.com/deploy-full-monitoring-stack-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.raddemo.host #selfhosting #opensource #selfhosted #nodeexporter #letsencrypt -
Deploy Full #Monitoring Stack on #Debian #VPS Here’s a comprehensive guide to deploy full monitoring stack on Debian VPS, including:
✅ #Prometheus – Metrics collection
✅ Node Exporter – System metrics
✅ #Grafana – Visualization
✅ #Alertmanager – Alert notifications
✅ #Loki – Log aggregation
✅ #Promtail – Log shipping to Loki🎯 Goal
A ...
Continued 👉 https://blog.radwebhosting.com/deploy-full-monitoring-stack-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.raddemo.host #selfhosting #opensource #selfhosted #nodeexporter #letsencrypt -
Does anyone use Prometheus/VictoriaMetrics vmagent and (AWS) EC2 Service Discovery with your PromScrape config? I am running it on a server with an IAM Profile that has read-only access to EC2 but:
skipping some ec2_sd_config targets for job_name=ec2_instances because of error: error when fetching instances data from EC2: cannot obtain instances: unexpected status code for "https://ec2.eu-west-2.amazonaws.com/?Action=DescribeInstances&Version=2016-11-15"; got 401; want 200;
I guess it doesn't know how to use an IAM Profile?
-
Deploy Full #Monitoring Stack on #Debian #VPS Here’s a comprehensive guide to deploy full monitoring stack on Debian VPS, including:
✅ #Prometheus – Metrics collection
✅ Node Exporter – System metrics
✅ #Grafana – Visualization
✅ #Alertmanager – Alert notifications
✅ #Loki – Log aggregation
✅ #Promtail – Log shipping to Loki🎯 Goal
A ...
Continued 👉 https://blog.radwebhosting.com/deploy-full-monitoring-stack-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.social #nodeexporter #selfhosted #letsencrypt #opensource #selfhosting -
Deploy Full #Monitoring Stack on #Debian #VPS Here’s a comprehensive guide to deploy full monitoring stack on Debian VPS, including:
✅ #Prometheus – Metrics collection
✅ Node Exporter – System metrics
✅ #Grafana – Visualization
✅ #Alertmanager – Alert notifications
✅ #Loki – Log aggregation
✅ #Promtail – Log shipping to Loki🎯 Goal
A ...
Continued 👉 https://blog.radwebhosting.com/deploy-full-monitoring-stack-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.social #nodeexporter #selfhosted #letsencrypt #opensource #selfhosting -
Deploy Full #Monitoring Stack on #Debian #VPS Here’s a comprehensive guide to deploy full monitoring stack on Debian VPS, including:
✅ #Prometheus – Metrics collection
✅ Node Exporter – System metrics
✅ #Grafana – Visualization
✅ #Alertmanager – Alert notifications
✅ #Loki – Log aggregation
✅ #Promtail – Log shipping to Loki🎯 Goal
A ...
Continued 👉 https://blog.radwebhosting.com/deploy-full-monitoring-stack-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.social #nodeexporter #selfhosted #letsencrypt #opensource #selfhosting -
Deploy Full #Monitoring Stack on #Debian #VPS Here’s a comprehensive guide to deploy full monitoring stack on Debian VPS, including:
✅ #Prometheus – Metrics collection
✅ Node Exporter – System metrics
✅ #Grafana – Visualization
✅ #Alertmanager – Alert notifications
✅ #Loki – Log aggregation
✅ #Promtail – Log shipping to Loki🎯 Goal
A ...
Continued 👉 https://blog.radwebhosting.com/deploy-full-monitoring-stack-on-debian-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.social #nodeexporter #selfhosted #letsencrypt #opensource #selfhosting -
Daddy Prometheus
Meditations on Prometheus. Read for more details.https://vianegativa6.wordpress.com/2026/05/09/daddy-prometheus/
-
3 Easy Steps to Integrate Monitoring Tools for Apache Reverse Proxy Server #apache #elasticsearch #grafana #nagios #opensource #prometheus #proxy #proxyserver #reverseproxy #selfhosted #selfhosting #Cloud #Guides #VPS
3 Easy Steps to Integrate Moni... -
3 Easy Steps to Integrate Monitoring Tools for Apache Reverse Proxy Server #apache #elasticsearch #grafana #nagios #opensource #prometheus #proxy #proxyserver #reverseproxy #selfhosted #selfhosting #Cloud #Guides #VPS
3 Easy Steps to Integrate Moni... -
Ultimate Guide to #VPS #Security Hardening This article provides a guide to VPS security hardening. Securing a Virtual Private Server (VPS) is not a one-time task—it’s an ... Continued 👉 #rockylinux #prometheus #logwatch #ossec #wazuh #grafana #firewalld #ufw #vpsguide #netdata
-
Some nice updates to #dietpi and #prometheus support! I always wanted to try that out...
DietPi 10.3 brings Orange Pi 4 LTS image, Prometheus monitoring, USB auto-mount, and more | AlternativeTo
https://alternativeto.net/news/2026/4/dietpi-10-3-brings-orange-pi-4-lts-image-prometheus-monitoring-usb-auto-mount-and-more/ -
Ultimate Guide to #VPS #Security Hardening
This article provides a guide to VPS security hardening.
Securing a Virtual Private Server (VPS) is not a one-time task—it’s an ongoing discipline. Whether you’re hosting websites, applications, databases, or client workloads, a hardened VPS dramatically reduces the risk of compromise, data loss, downtime, and ...
Continued 👉 https://blog.radwebhosting.com/vps-security-hardening/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.social #netdata #rockylinux #wazuh #firewalld #prometheus #grafana #ossec #logwatch #vpsguide #ufw -
Deleted my old #ceph cluster #homelab #selfhosted .
This cluster was mostly idle.
-
Ultimate Guide to #VPS #Security Hardening
This article provides a guide to VPS security hardening.
Securing a Virtual Private Server (VPS) is not a one-time task—it’s an ongoing discipline. Whether you’re hosting websites, applications, databases, or client workloads, a hardened VPS dramatically reduces the risk of compromise, data loss, downtime, and ...
Continued 👉 https://blog.radwebhosting.com/vps-security-hardening/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.social #logwatch #prometheus #ufw #firewalld #grafana #rockylinux #ossec #netdata #wazuh #vpsguide -
The next #LightningTalk at #OggCamp was about Self-hosted Observability, using various #Grafana projects and #Prometheus etc.
Alan was using some #YAML files to provision the services via docker etc.I didn't quite understand it all, but there's a few extra Grafana products I should check out - Alloy and Mimir.
-
Keeping applications up and running is a key responsibility in DevOps. Exam Objective 704.2 of the LPI DevOps Tools Engineer v2.0 covers Prometheus Monitoring for this task.
Learn more from Fabian Thorns and Uirá Ribeiro: https://lpi.org/3v3t
#prometheus #devops #monitoring #observability #promql #grafana #alertmanager #LPI
-
Deckhouse Prom++: как мы посадили Prometheus на RAM-диету и сэкономили 89 % памяти в хранилище данных
Утро: 3,8 ТБ памяти на кластеры Prometheus. Вечер: 0,6 ТБ. Между ними — переход на Deckhouse Prom++. Мы потратили месяцы на внимательный анализ данных и разработку: писали свои структуры данных на С++, экономя каждый байт и охотясь за каждой наносекундой производительности. Разнообразные энкодеры для специфических данных, вектор с дырками и упакованные структуры — в статье делимся деталями реализации Open Source-проекта, который вы можете уже сейчас использовать для реальной экономии на мониторинге.
https://habr.com/ru/companies/flant/articles/1024370/
#prom++ #c++ #оптимизация_кода #prometheus #deckhouse #deckhouse_prom++ #мониторинг #observability
-
Xenomorph Origins Explained: The Prometheus Timeline That Changes Everything #AlienMovie #Xenomorph #Prometheus #AlienCovenant #SciFiLore #MovieLoreExplained #MindBlownFacts #UnexplainedOrigins #FilmTheory #WeylandYutani #SpaceHorror https://www.gsnsp.com/alien-timeline-xenomorph-origins-prometheus/
-
Working with time-series data at scale? “How Prometheus Keeps Its TSDB Sane” breaks down how Prometheus keeps its own storage manageable and safe.
Read More: https://zalt.me/blog/2026/04/prometheus-tsdb-sanity
-
Alertmanager-evateam для интеграции алертов в EvaTeam — отечественный трекер
Если вы работаете с мониторингом в Prometheus или VictoriaMetrics, то наверняка знаете, и Alertmanager для удобного конфигурирования алертов. А если вы ещё и используйте EvaTeam (российский аналог Jira) и хотите автоматизировать полностью цикл создания, работы над алертами в этих систмах, то это решение очень вероятно вам поможет осуществить такую связку! Alertmanager-evateam это Alertmanager (webhook) плагин, который создаёт и управляет задачами в EvaTeam на основе алертов, с акцентом на гибкость.
https://habr.com/ru/articles/1016654/
#opensource_projects #evateam #eva #alertmanager #alert #prometheus #victoriametrics #itsm #itil #поддержка
-
ML-пайплайны в Kubernetes: от первой строки кода до автоскейлинга и за его пределами
Ваша ML-модель работает в ноутбуке, а в продакшене — нет. Бывало такое? Именно здесь начинается настоящая инженерная задача: взять эксперимент из Jupyter-ноутбука и превратить его в воспроизводимый, наблюдаемый и масштабируемый пайплайн — от сырых данных до стабильного инференса под реальной нагрузкой. Kubernetes давно стал де-факто стандартом для этой работы: более 70% компаний используют его в продакшене — это не дань хайпу, это прагматичный выбор тех, кто уже наступал на грабли. В этой статье разберем, почему K8s выигрывает у альтернатив именно для ML-нагрузок, а также обсудим какие мифы и анти-паттерны тормозят команды на пути к продакшену. Пройдемся по полному стеку: от подготовки кластера и фиксации данных через DVC до canary-деплоя модели и автоскейлинга GPU-подов. В конце вас ждет взгляд на то, куда движется индустрия: serverless-ML, multi-LLM-ops и edge-развертывания. Если вы DevOps- или MLOps-инженер, которому приходится запускать обучение и инференс в одном кластере, или R&D-инженер, чьи модели «магически ломаются» при переходе в прод — читать обязательно.
https://habr.com/ru/companies/cloud_ru/articles/1011810/
#Kubernetes #MLOps #ML_pipeline #KServe #TFX #DVC #HPA #Prometheus #Grafana #DevOps
-
@tksst It's about a very interesting scientific #study about the #reconstruction of the #face of an #Australopithecus #fossil from South Africa, in scientific literature sometimes referred as A. #prometheus, the trivial name is "#littlefoot" (#StW573). The damaged, but preserved #skull was studied via #synchrotronXray imaging in order to carefully reconstruct bone fractions digitally. Study by A. BEAUDET et al. (2026).
-
Learn the critical failure points when running LLM inference on Kubernetes, including resource constraints, operator compatibility, security, scalability, and monitoring best practices for production workloads.
#Kubernetes #LLM Inference #Dynatrace #GPU Resource Allocation #Service Mesh #Network Policies #KEDA #Triton Inference Server #Redis #Prometheus
https://dasroot.net/posts/2026/02/running-llm-inference-on-kubernetes-what-breaks-first/
-
You already know that you can visualize your metrics from #Prometheus in #OpenSearch Dashboard's Discover Metrics experience (if not, check the comments).
But what if we could add some #AI sauce to detect anomalies and extrapolate forecasts?
Check out the new RFC for time series #anomalyDetection and #forecasting in @OpenSearchProject and chime in with your feedback.
https://github.com/opensearch-project/OpenSearch-Dashboards/issues/11439#OpenSearchAmbassador #timeseries #metrics #monitoring #cloudnative
@Prometheus -
You already know that you can visualize your metrics from #Prometheus in #OpenSearch Dashboard's Discover Metrics experience (if not, check the comments).
But what if we could add some #AI sauce to detect anomalies and extrapolate forecasts?
Check out the new RFC for time series #anomalyDetection and #forecasting in @OpenSearchProject and chime in with your feedback.
https://github.com/opensearch-project/OpenSearch-Dashboards/issues/11439#OpenSearchAmbassador #timeseries #metrics #monitoring #cloudnative
@Prometheus -
You already know that you can visualize your metrics from #Prometheus in #OpenSearch Dashboard's Discover Metrics experience (if not, check the comments).
But what if we could add some #AI sauce to detect anomalies and extrapolate forecasts?
Check out the new RFC for time series #anomalyDetection and #forecasting in @OpenSearchProject and chime in with your feedback.
https://github.com/opensearch-project/OpenSearch-Dashboards/issues/11439#OpenSearchAmbassador #timeseries #metrics #monitoring #cloudnative
@Prometheus -
You already know that you can visualize your metrics from #Prometheus in #OpenSearch Dashboard's Discover Metrics experience (if not, check the comments).
But what if we could add some #AI sauce to detect anomalies and extrapolate forecasts?
Check out the new RFC for time series #anomalyDetection and #forecasting in @OpenSearchProject and chime in with your feedback.
https://github.com/opensearch-project/OpenSearch-Dashboards/issues/11439#OpenSearchAmbassador #timeseries #metrics #monitoring #cloudnative
@Prometheus -
You already know that you can visualize your metrics from #Prometheus in #OpenSearch Dashboard's Discover Metrics experience (if not, check the comments).
But what if we could add some #AI sauce to detect anomalies and extrapolate forecasts?
Check out the new RFC for time series #anomalyDetection and #forecasting in @OpenSearchProject and chime in with your feedback.
https://github.com/opensearch-project/OpenSearch-Dashboards/issues/11439#OpenSearchAmbassador #timeseries #metrics #monitoring #cloudnative
@Prometheus -
Гайд по быстрому мониторингу Linux-хостов в Grafana без Zabbix
Всем привет! Меня зовут Анатолий Зотов, я системный архитектор SOC в RED Security. Как центр мониторинга и реагирования на кибератаки, мы должны быстро и внятно видеть, что происходит с железом и ОС на хостах: не кончается ли место на диске, не улетела ли память и не уперся ли CPU в потолок. Как это реализовать, да еще и безопасно? Когда мы только приступали к задаче, первой мыслью, конечно, был Zabbix, как и у половины планеты. Но у нас никто не горел желанием поднимать еще одну систему, раскатывать агенты, подбирать шаблоны и разбираться с нюансами. Времени, как обычно, не завезли. А вот Grafana у нас уже была, поэтому я подумал — а что, если просто использовать то, что уже есть? Так я и наткнулся на связку «node_exporter → Prometheus → Grafana». Эта статья для тех, кто хочет быстро начать мониторить хосты и не готов тратить вечность на внедрение тяжелой системы, особенно если Grafana уже живет в вашей инфраструктуре. Если Grafana и Prometheus у вас еще нет, то дополнительно расскажу быстрый старт через Docker Compose.
https://habr.com/ru/companies/ru_mts/articles/1008244/
#Prometheus #Grafana #Node_Exporter #мониторинг #Linux #системный_мониторинг #TLS #mTLS #Docker_Compose #observability
-
Meta, AI 슈퍼클러스터에 6.6GW 원전 확보, 500만 가구 규모 전력
Meta가 6.6GW 규모 원전 계약 발표. 500만 가구 전력 규모로 AI 슈퍼클러스터 Prometheus 가동. 빅테크의 원전 러시 배경과 의미를 분석합니다. -
When @h47 is running a World of Darkness game
#grognard #garage #grognardgarage #GG #ttrpg #wod #Storytellers #tabletop #rpg #games #dice #mathrocks #d10 #VtM #Mage #Scion #Werewolf #Changeling #Prometheus #Mummy #gonzo #dickens #Muppets #rizzo #dickensianDrip #CharlieDSwag #poultryPapa -
Demis Hassabis'in gece nöbeti, Prometheus'tan AGI'ya yolculuğumuzun adeta kısa bir özeti. Bilinçaltımızda yatan kadim ikilemin bir yansıması.
#YapayZekaFelsefesi #AIEtiği #DemisHassabis #Frankenstein #AGIGüvenliği #Prometheus #DeepMind #Gemini3 #YZveİnsanlık #GelecekveTeknoloji #FelsefePodcasti #TeknolojiPodcasti #Baba-OğulÇatışması #YZManipülasyon #GeceNöbeti #MaryShelley #YapayGenelZeka
https://monologblg.com/insan-neden-kendi-frankensteinini-yaratir-demis-hassabisin-anlamli-nobeti/
https://www.podbean.com/eas/pb-hp4jv-19e229a
Resim ImageFX
-
Today, trying to get the k3s cluster back to a working and smooth sailing state...
It has been somewhat unstable since the moving, and with little time to take care of it, outages were around every corner
Turns out, CNPG wasn't clearing out WAL on local replicas, inflating local disk usage, making them unavailable for scheduling...
Now that I understand why everything goes down, it is time to setup ntfy and link with with alertmanager+prometheus to get proper insights on the cluster in realtime
Now, back to rebuilding all Longhorn volumes because of those random outages *sight*
But underlining the importance of having good backups ! Because no data was lost, despite random downtimes
#k3s #devops #kubernetes #prometheus #alertmanager #cluster #cnpg #wal #postgres #psql #ntfy #longhorn #volume #backups #homelab #selfhosted
-
Как быстро проверить, что сервер «здоров»
Представьте: вы получаете алерт "сервер тормозит" или замечаете странные лаги в приложении. Отставить панику)) В этой статье мы разберем, как провести технический осмотр Linux-сервера и найти корень проблемы без углубления в тонны логов. Сейчас расскажем вам про методику RED S.O.S. - структурированный подход, который превращает хаотичную проверку в системный диагноз. Это ваш чеклист для экстренного реагирования. Он не заменяет системы мониторинга (Prometheus, Zabbix), но дает моментальный снимок здоровья системы. Фокус здесь на ключевых ресурсах: R esources (Ресурсы), E rrors (Ошибки), D ependencies (Зависимости)
https://habr.com/ru/articles/958286/
#сервер #devops #linux #linuxсервер #системное_администрирование #мониторинг #sre #load_average #htop #prometheus
-
SLA, SLO и SLI простыми словами и с примерами
Большинство инженеров начинают путь с простой задачи - сделать так, чтобы ничего не падало. И в этом нет ничего плохого. Мы ставим мониторинг, настраиваем алерты и радуемся когда всё “зеленое” Но что делать когда этого не достаточно и пользователи все равно жалуются?
https://habr.com/ru/articles/956318/
#качество #управление_продуктом #управление_разработкой #мониторинг #prometheus #slo #sla #sli #soth