home.social

#автоскейлинг — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #автоскейлинг, aggregated by home.social.

  1. Предиктивный автоскейлинг в Kubernetes: масштабируемся на опережение

    Современный Kubernetes приучил нас к тому, что инфраструктура должна быть эластичной. Для управления ресурсами традиционно мы можем использовать Horizontal Pod Autoscaler (HPA): растёт трафик — увеличивается количество подов, трафик падает — лишние поды удаляются. Но в высоконагруженных системах при быстром росте нагрузки стандартные инструменты масштабирования могут стать менее эффективными. Проблема заложена в самой природе реактивного подхода: система всегда догоняет реальность, а не формирует её. Решение лежит на поверхности: надо повышать осознанность и внедрять ИИ. Меня зовут Дмитрий Чуринов, я руководитель команды разработки в трайбе Synapse. Хочу поделиться практическим опытом внедрения механизмов предиктивного масштабирования. Мой коллега Александр Козлов курирует разработку нескольких продуктов в СберТехе, в том числе Platform V SynAI , отвечающего за интерактивное управление трафиком на основе систем машинного обучения и моделирования. Вместе мы разберём, как настроить предиктивное управление в Kubernetes на основе open source-компонентов, и почему нам этого не хватило.

    habr.com/ru/companies/sberbank

    #kubernetes #автоскейлинг #масштабирование #инфраструктура

  2. Как работает облако на самом деле. Простое объяснение на реальном примере

    Облако это гибкая и экономичная модель, которая подстраивается под нагрузку и помогает бизнесу расти без лишних затрат. На простом, но реалистичном примере разбираемся, как всё устроено внутри и почему облачные подходы в некоторых случаях выигрывают у традиционного хостинга.

    habr.com/ru/companies/hostkey/

    #облачные_вычисления #vps #автоматизация #масштабируемость #мониторинг #облако #api #бизнеслогика #автоскейлинг #архитектура

  3. Как работает облако на самом деле. Простое объяснение на реальном примере

    Облако это гибкая и экономичная модель, которая подстраивается под нагрузку и помогает бизнесу расти без лишних затрат. На простом, но реалистичном примере разбираемся, как всё устроено внутри и почему облачные подходы в некоторых случаях выигрывают у традиционного хостинга.

    habr.com/ru/companies/hostkey/

    #облачные_вычисления #vps #автоматизация #масштабируемость #мониторинг #облако #api #бизнеслогика #автоскейлинг #архитектура

  4. Как работает облако на самом деле. Простое объяснение на реальном примере

    Облако это гибкая и экономичная модель, которая подстраивается под нагрузку и помогает бизнесу расти без лишних затрат. На простом, но реалистичном примере разбираемся, как всё устроено внутри и почему облачные подходы в некоторых случаях выигрывают у традиционного хостинга.

    habr.com/ru/companies/hostkey/

    #облачные_вычисления #vps #автоматизация #масштабируемость #мониторинг #облако #api #бизнеслогика #автоскейлинг #архитектура

  5. Как работает облако на самом деле. Простое объяснение на реальном примере

    Облако это гибкая и экономичная модель, которая подстраивается под нагрузку и помогает бизнесу расти без лишних затрат. На простом, но реалистичном примере разбираемся, как всё устроено внутри и почему облачные подходы в некоторых случаях выигрывают у традиционного хостинга.

    habr.com/ru/companies/hostkey/

    #облачные_вычисления #vps #автоматизация #масштабируемость #мониторинг #облако #api #бизнеслогика #автоскейлинг #архитектура

  6. Больше не нужен рестарт: как Kubernetes позволяет менять ресурсы контейнеров «на лету»

    Теперь ресурсы контейнеров в Kubernetes можно менять «на лету» — без перезапуска и простоев. В статье рассказываем, как работает in-place resize, где эта функция реально спасает приложения от перегрузки и какие ограничения стоит учитывать на практике.

    habr.com/ru/companies/flant/ar

    #kubernetes #autoscaling #vpa #kubelet #resources #ресайз_ресурсов #автоскейлинг #k8s #нехватка_памяти

  7. Как справиться с нагрузкой в черную пятницу? Автоскейлинг инференса в Kubernetes

    У многих наступление осени вызывает разные чувства и эмоции: от ностальгии во время просмотра Гарри Поттера под теплым пледом до депрессивных мыслей у дождливого окна в кофейне. Именно в этот период компании проводят масштабные мероприятия, одно из них — известная черная пятница. Клиенты пытаются «урвать» по хорошей скидке товары и купить подарки к Новому году. В связи с этим «атакуют» своим трафиком популярные сайты e-commerce, которые могут быть не готовы к такой нагрузке. Ни для кого не секрет, как сохранить и инфраструктуру в пиковые нагрузки, и трафик клиентов. При этом не понести большие убытки. Деплоим сервис в облако, скейлим ресурсы по требованию и радуемся продажам! Но это в e-commerce, мы же с вами интересуемся ML production. Привет, Хабр! Я — Антон, DevOps-инженер в команде Data/ML-продуктов Selectel . В этой статье расскажу, зачем нужен автоскейлинг GPU-ресурсов, как настроить масштабирование реплик в Kubernetes по трафику, а также как сделать свой высоконагруженный ChatGPT.

    habr.com/ru/companies/selectel

    #selectel #автоскейлинг #Kubernetes #devops