#сбор_метрик — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #сбор_метрик, aggregated by home.social.
-
Почему важно мониторить поисковую систему: Manticore → Prometheus → Grafana
Один из наших пользователей недавно пришёл к нам со знакомой проблемой: поиск внезапно стал заметно медленнее, хотя внешне ничего явно не ломалось. Сервис работал, ошибок в логах не было, загрузка CPU выглядела нормально, но пользователи уже начали жаловаться, что поиск тормозит. Так обычно и проявляются проблемы с поиском в продакшене. Не как драматичный сбой, а как медленное, ползучее ухудшение. Чуть больше трафика здесь, чуть больше индексации там, и прежде чем вы это заметите, производительность уже просела. К тому моменту, когда пользователи это замечают, настоящая проблема нередко копится уже несколько часов. Без хорошей видимости остаётся только гадать: система перегружена? Одна таблица съедает ресурсы? Или незаметно что-то идёт не так? Вот почему мониторинг важен. С ним расплывчатое «поиск стал медленным» превращается в проблему, которую можно диагностировать и исправить.
https://habr.com/ru/articles/1023608/
#grafanaдашборд #prometheus #мониторинг #сбор_метрик #визуализация_метрик #высокая_производительность #метрики_производительности #оптимизация_производительности
-
Мониторинг Manticore Search в Grafana одной командой
Самый неприятный тип инцидента — когда база данных не падает полностью, а просто начинает работать медленнее. Пользователи замечают это сразу. Жалобы начинают поступать. Технически всё по-прежнему работает, но явно что‑то не так. И обычно самое сложное здесь не заметить проблему, а понять, что на самом деле происходит.
https://habr.com/ru/articles/1023116/
#grafana #docker #мониторинг #дашборд #визуализация_метрик #сбор_метрик #контейнеризация
-
Мониторинг, который кричал «Волк»! Что мы придумали для корректного сбора метрик
Привет, Хабр! Меня зовут Станислав Савостин, в СберТехе я занимаюсь системой мониторинга «Маяк». Это наш внутренний сервис, который основан на Prometheus, но включает много доработок и «тюнинга» под наши условия и стандарты работы. Основная задача мониторинга — быстро выявить проблему (до того, как что‑то упало) и отреагировать, чтобы пользователи не заметили. Из‑за высокого темпа уведомлений и реакций часто возникает риск пойти по неправильному сценарию. Например, перезагрузка брокера Kafka или Artemis занимает около 30 секунд, поэтому упустить такую ситуацию легко, хотя для нас это критически важная метрика. Ложная тревога или задержка передачи метрик — максимально неприятные события, так что мы постоянно дорабатываем систему и уже научились отслеживать перезагрузки сервисов. Я расскажу, как мы дорабатывали мониторинг, как реагируем на действительно опасные ситуации и что помогает нам ловить дзен, когда все кричат: «Волк!»
-
Прозрачность процессов как инструмент эффективного взаимодействия
Привет, Хабр! Меня зовут Анастасия, я из Газпромбанк.Тех. На текущий момент являюсь одним из HOP QA, но довольно долго была просто тестлидом. Поэтому много мыслей в этой статье использованы ещё с того периода времени. В этой статье, я хочу рассказать, что такое прозрачность процесса. Зачем она нужна команде и как тимлид может объяснить, зачем вводит в процессы атрибуты прозрачности — диаграммы, метрики, инструментарий и прочее.
https://habr.com/ru/companies/oleg-bunin/articles/799927/
#процессы_тестирования #процессы_в_it #прозрачность_процесса #прозрачность_бизнеса #микроменеджмент #управление_ожиданиями #узкое_горлышко #сбор_метрик