home.social

#sreинженер — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #sreинженер, aggregated by home.social.

  1. df врёт. du врёт. Где на самом деле гигабайты?

    Сервер лагает. Смотришь на диск — df -h говорит 95% занято. Запускаешь du -sh /* — в сумме набирается 20%. Куда делись остальные 75%? Файлы не найти, место не освободить, сервис падает. Это не баг и не магия. Это фундаментальная особенность того как Linux работает с файлами. Разберём почему так происходит и как это чинить за две команды.

    habr.com/ru/articles/1017290/

    #devops #sreинженер #linux #системное_администрирование #nginx #логи #logrotate

  2. Кто такой SRE-инженер и чем он занимается в Авито

    Всем привет! Меня зовут Денис Захаров, я инженер в Автотеке Авито . В этой статье я расскажу о нелёгкой судьбе SRE на своём опыте: с чем я столкнулся в работе и как в общих чертах SRE-направление представлено в Авито. Статья будет полезна как разработчикам, так и малюткам, желающим узнать, что есть в мире IT.

    habr.com/ru/companies/avito/ar

    #avito #авито #sre #sreинженер #sreпроцессы #avitotech

  3. Postmortem без обвинений: Миф или реальность?

    Человеческий мозг эволюционировал для выживания в саванне, а не для анализа распределенных систем. Когда что-то идет не так, наш древний мозг кричит: "Найди угрозу! Накажи виновного! Защити племя!" Эта реакция спасала наших предков от саблезубых тигров, но разрушает современные инженерные команды. Статистика, которая отрезвляет:

    habr.com/ru/articles/958042/

    #sre #sreинженер #postmortem #инцидентменеджмент #инцидент

  4. HAProxy в 2025: от TCP до L7 — балансировка без боли

    Привет, Habr. Сегодня снова поговорим о прокси — это, пожалуй, моя любимая тема, и я рад вернуться к ней. На этот раз речь пойдёт об универсальном солдате в мире балансировки — HAProxy . Этот инструмент уже много лет остаётся стандартом в высоконагруженных системах, но за последние релизы он стал ещё мощнее и гибче. Напомню, HAProxy ( High Availability Proxy ) — это высокопроизводительный, отказоустойчивый прокси-сервер и балансировщик нагрузки, способный работать как с HTTP(S), так и с TCP-трафиком. Это делает его идеальным решением не только для веб-приложений, но и для баз данных, почтовых систем, брокеров сообщений и других сервисов. В этой статье я разберу последнюю доступную версию — 3.2.3 , расскажу о ключевых изменениях, особенностях конфигурации и поделюсь приёмами, которые помогают выжать из HAProxy максимум. Итак, чем же хорош HAProxy как балансировщик и что интересного появилось в новых версиях?

    habr.com/ru/companies/gnivc/ar

    #sreинженер #devops #haproxy #proxyserver #hight_availability

  5. SRE у штурвала, хаос — за бортом: курс на стабильность

    Представим себе идеальный центр управления: метрики в норме, зеленые графики, контроль на всех уровнях. Но когда система начинает сбоить, кто берет управление на себя? Кто видит всплеск latency и не ждет, а действует? Этот комикс — об инженерной миссии без паники, но с вызовом. Про то, как DevOps и SRE-специалисты справляются с аномалиями не на адреналине, а на архитектуре, процессе и взаимопонимании в команде. Про реальность, где высоконагруженные проекты — не просто строчка в описании вакансии, а зона личного влияния: ты действительно управляешь, решаешь, отстраиваешь.

    habr.com/ru/specials/913848/

    #карьера #девопс #разработка #рунити #алгоритмы #комикс #системное_администрирование #sreинженер #devops #devopsинженер

  6. Интервью без стресса: как в Рунити нанимают DevOps-инженеров

    Привет, Хабр! Мы в Рунити верим, что собеседование — не гонка за правильными ответами, а диалог на равных. В этом интервью расскажем, как мы нанимаем DevOps-инженеров в команду. Внутри о том, что мы предлагаем кандидатам вместо стресс-интервью, замысловатых тестовых и бесконечных этапов отбора. От нас — внимание к глубине опыта и интерес к подходам кандидата. Эксперты Рунити — Анна Попова, рекрутмент-партнер, и Тимур Парфенов, директор департамента эксплуатации, поделятся тем, как мы оцениваем инженеров, на что смотрим в резюме и какие навыки стоит подсветить. Приятного «разворачивания» статьи!

    habr.com/ru/companies/runity/a

    #devops #sre #sreинженер #devopsинженер #поиск_работы #интервью #cicd #kubernetes #gitops #инфраструктура

  7. Обучение системного инженера. Путеводитель по ключевым навыкам и знаниям

    Всем привет! Меня зовут Максим, я работаю системным инженером в Yandex Cloud и в Яндекс Практикуме на курсе «

    habr.com/ru/companies/yandex_p

    #devops #sre #sreинженер #обучение_администрированию #развитие_навыков #системный_инженер #системный_администратор

  8. [Перевод] Уровни серьёзности инцидентов для онлайн-платформ

    Классификация инцидентов по степени серьёзности – ключевой момент в управлении инцидентами. Она нужна, чтобы SRE команда могла быстро и эффективно устранять неполадки в сложных системах и минимизировать их влияние на клиентов. В этой статье описана система SEV (Security Evaluation Version), которая помогает стандартизировать процесс устранения проблем, быстрее восстановить работу системы и уведомить о происшествии всех, кого это касается, в зависимости от серьёзности инцидента.

    habr.com/ru/companies/slurm/ar

    #sre #sreинженер #sreпроцессы #site_reliability_engineer #инцидентменеджмент #инциденты

  9. [Перевод] Как реализован SRE подход в Power BI

    Команда Power BI рассказала, как она обеспечивает надёжную, производительную и масштабируемую работу своего сервиса. В этой статье вы узнаете, как в Power BI устроен мониторинг состояния сервиса, как SRE команды устраняют инциденты и принимают меры по улучшению сервисов.

    habr.com/ru/companies/slurm/ar

    #sre #sreинженер #sreпроцессы #sreкоманды #site_reliability_engineer #itинфраструктура #инцидентменеджмент #инциденты

  10. Как стать SRE-инженером в 2024 году

    Традиционным ИТ-командам трудно успеть за быстрым ростом масштабов и сложности приложений. Растут и требования, которые предъявляют к приложениям пользователи. В этих условиях крайне важно поддерживать бесперебойную работу инфраструктуры. На помощь приходят SRE-инженеры. SRE (Site Reliability Engineering) фокусируется на создании высоконадежных систем и их поддержке. Главная задача SRE-инженеров — поддерживать высокую доступность приложений и быстрое реагировать на проблемы в производственной среде. Сегодня мы разберемся, насколько востребована и перспективна эта специализация, какие навыки потребуются, чтобы освоить ее с начального уровня.

    habr.com/ru/companies/cloud_mt

    #SRE #sreинженер