home.social

#platform_engineering — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #platform_engineering, aggregated by home.social.

  1. Как мы поймали drift в Kubernetes и зачем после этого перешли на GitOps

    История инцидента в продакшене: после планового релиза новая версия сервиса не поднялась, а откат на предыдущую версию тоже не помог. Причина оказалась не в коде, а в расхождении между тем, что было описано в Git, и тем, что реально жило в Kubernetes. Ручная правка ConfigMap несколько месяцев существовала только в кластере, пока очередной релиз не пересоздал поды и не вытащил проблему наружу. Разбираю, как мы нашли причину, почему Git не был настоящим источником правды и зачем после этого перешли на GitOps с Argo CD.

    habr.com/ru/articles/1031108/

    #gitops #kubernetes #argocd #gitlabci #cicd #devops #drift #helm #secrets #platform_engineering

  2. Как мы поймали drift в Kubernetes и зачем после этого перешли на GitOps

    История инцидента в продакшене: после планового релиза новая версия сервиса не поднялась, а откат на предыдущую версию тоже не помог. Причина оказалась не в коде, а в расхождении между тем, что было описано в Git, и тем, что реально жило в Kubernetes. Ручная правка ConfigMap несколько месяцев существовала только в кластере, пока очередной релиз не пересоздал поды и не вытащил проблему наружу. Разбираю, как мы нашли причину, почему Git не был настоящим источником правды и зачем после этого перешли на GitOps с Argo CD.

    habr.com/ru/articles/1031108/

    #gitops #kubernetes #argocd #gitlabci #cicd #devops #drift #helm #secrets #platform_engineering

  3. Как мы поймали drift в Kubernetes и зачем после этого перешли на GitOps

    История инцидента в продакшене: после планового релиза новая версия сервиса не поднялась, а откат на предыдущую версию тоже не помог. Причина оказалась не в коде, а в расхождении между тем, что было описано в Git, и тем, что реально жило в Kubernetes. Ручная правка ConfigMap несколько месяцев существовала только в кластере, пока очередной релиз не пересоздал поды и не вытащил проблему наружу. Разбираю, как мы нашли причину, почему Git не был настоящим источником правды и зачем после этого перешли на GitOps с Argo CD.

    habr.com/ru/articles/1031108/

    #gitops #kubernetes #argocd #gitlabci #cicd #devops #drift #helm #secrets #platform_engineering

  4. Как мы поймали drift в Kubernetes и зачем после этого перешли на GitOps

    История инцидента в продакшене: после планового релиза новая версия сервиса не поднялась, а откат на предыдущую версию тоже не помог. Причина оказалась не в коде, а в расхождении между тем, что было описано в Git, и тем, что реально жило в Kubernetes. Ручная правка ConfigMap несколько месяцев существовала только в кластере, пока очередной релиз не пересоздал поды и не вытащил проблему наружу. Разбираю, как мы нашли причину, почему Git не был настоящим источником правды и зачем после этого перешли на GitOps с Argo CD.

    habr.com/ru/articles/1031108/

    #gitops #kubernetes #argocd #gitlabci #cicd #devops #drift #helm #secrets #platform_engineering

  5. Как перестать терять данные в Kafka: окно безопасности и проактивный мониторинг «возраста» данных

    В Kafka данные могут пропадать, даже если в конфигах стоит хранение 7 дней. В этом коротком кейсе — как я решил проблему потери данных, внедрив мониторинг «окна безопасности». Проблема: Байты сильнее времени Решение: Метрика «Data Safety Window» Конфигурация — это лишь декларация о намерениях. Реальное окно жизни данных диктует нагрузка в моменте. Чтобы не гадать по конфигам, я внедрил расчет фактического запаса времени в Grafana.

    habr.com/ru/articles/1020422/

    #Kafka #Data_Loss #Platform_Engineering #Observability #Grafana #Monitoring #DevOps #SRE #Data_Infrastructure #Retention

  6. Как перестать терять данные в Kafka: окно безопасности и проактивный мониторинг «возраста» данных

    В Kafka данные могут пропадать, даже если в конфигах стоит хранение 7 дней. В этом коротком кейсе — как я решил проблему потери данных, внедрив мониторинг «окна безопасности». Проблема: Байты сильнее времени Решение: Метрика «Data Safety Window» Конфигурация — это лишь декларация о намерениях. Реальное окно жизни данных диктует нагрузка в моменте. Чтобы не гадать по конфигам, я внедрил расчет фактического запаса времени в Grafana.

    habr.com/ru/articles/1020422/

    #Kafka #Data_Loss #Platform_Engineering #Observability #Grafana #Monitoring #DevOps #SRE #Data_Infrastructure #Retention

  7. Как перестать терять данные в Kafka: окно безопасности и проактивный мониторинг «возраста» данных

    В Kafka данные могут пропадать, даже если в конфигах стоит хранение 7 дней. В этом коротком кейсе — как я решил проблему потери данных, внедрив мониторинг «окна безопасности». Проблема: Байты сильнее времени Решение: Метрика «Data Safety Window» Конфигурация — это лишь декларация о намерениях. Реальное окно жизни данных диктует нагрузка в моменте. Чтобы не гадать по конфигам, я внедрил расчет фактического запаса времени в Grafana.

    habr.com/ru/articles/1020422/

    #Kafka #Data_Loss #Platform_Engineering #Observability #Grafana #Monitoring #DevOps #SRE #Data_Infrastructure #Retention

  8. Как перестать терять данные в Kafka: окно безопасности и проактивный мониторинг «возраста» данных

    В Kafka данные могут пропадать, даже если в конфигах стоит хранение 7 дней. В этом коротком кейсе — как я решил проблему потери данных, внедрив мониторинг «окна безопасности». Проблема: Байты сильнее времени Решение: Метрика «Data Safety Window» Конфигурация — это лишь декларация о намерениях. Реальное окно жизни данных диктует нагрузка в моменте. Чтобы не гадать по конфигам, я внедрил расчет фактического запаса времени в Grafana.

    habr.com/ru/articles/1020422/

    #Kafka #Data_Loss #Platform_Engineering #Observability #Grafana #Monitoring #DevOps #SRE #Data_Infrastructure #Retention

  9. Закрытый контур без боли для разработчиков — миф или реальность?

    Всем привет! Меня зовут Александр Барыков, я руковожу платформенной командой DevOps и являюсь лидером DevOps-комьюнити в нашей компании. Сегодня хочу поделиться опытом, который мы накопили за последние четыре года. Речь пойдет о достаточно специфической, но знакомой многим теме – организации процесса скачивания и проверки внешних артефактов для размещения во внутреннем закрытом контуре. Эта статья будет полезна разработчикам, DevOps-инженерам и архитекторам, которые сталкиваются с необходимостью соблюдения строгих требований безопасности без потери темпа разработки, особенно в финансовом секторе, где есть регуляторные требования.

    habr.com/ru/companies/moex/art

    #devops #devsecops #информационная_безопасность #проверка_подлинности #sandbox #whitelist #idp #internal_developer_platform #cicd #platform_engineering

  10. CoffeeOps 2026-03: Workshop Engenharia de Plataforma na Prática

    Laboratório Hacker de Campinas, sábado, 14 de março às 09:00 BRT

    Neste workshop Miguel[0] e Oscar[1] apresentarão conceitos essenciais de Engenharia de Plataforma, Kubernetes e Internal Developer Platforms (IDPs) aplicados a cenários reais. Utilizando o Cloud Programming Shell (CPS1[2]) para atividades práticas.

    Requisitos: conhecimento básico de Kubernetes e laptop com docker, kubectl, kind e helm.

    Vagas limitadas, faça sua reserva gratuita em https://pretix.lhc.net.br/coffeeops/2026-03/

    A participação é gratuita, mas adoraríamos que você trouxesse algo para compartilhar: um café especial, um bolo caseiro ou qualquer outra coisa que te agrade.

    Os CoffeeOps[3] são encontros descontraídos para compartilhar conhecimento, trocar experiências e construir juntos. É a sua chance de aprender com outros hackers, devs, makers e entusiastas da tecnologia[4].

    Compartilhe suas experiências, projetos e dúvidas. Todos os níveis de conhecimento são bem-vindos!

    Agenda:

    09:00: Boas-vindas, Café e apresentação dos participantes

    09:15: Workshop Engenharia de Plataforma na Prática

    [0] Miguel Di Ciurcio Filho: Cientista da Computação, pós-graduado em Redes pela UNICAMP, com mais de 20 anos de experiência em cloud, automação e DevOps. Cofundador da CPS1 e palestrante em eventos como DevOpsDays e PuppetConf. Mais em https://www.linkedin.com/in/mciurcio/

    [1] Oscar Esgalha: Cientista da Computação e mestrando pela UNICAMP, com mais de 14 anos em desenvolvimento de software. Ex-CTO da Instruct e cofundador da CPS1, atuando em plataformas cloud native. Mais em https://www.linkedin.com/in/oesgalha/

    [2] https://cps1.tech/pt

    [3] https://coffeeopscampinassp.github.io/

    [4]https://eventos.lhc.net.br/

    eventos.lhc.net.br/event/coffe

  11. Краткий дайджест обновлений Deckhouse Kubernetes Platform 1.48-1.60

    В этой статье мы рассмотрим самые важные обновления Deckhouse Kubernetes Platform версий 1.48–1.60, произошедшие почти за год — именно столько времени прошло с момента выхода нашего последнего обзора новых фичей.

    habr.com/ru/companies/flant/ar

    #kubernetes #deckhouse #Deckhouse_Kubernetes_Platform #devops #istio #grafana #distroless #обновления #platform_engineering #отечественное_по