#автоскейлинг — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #автоскейлинг, aggregated by home.social.
-
Предиктивный автоскейлинг в Kubernetes: масштабируемся на опережение
Современный Kubernetes приучил нас к тому, что инфраструктура должна быть эластичной. Для управления ресурсами традиционно мы можем использовать Horizontal Pod Autoscaler (HPA): растёт трафик — увеличивается количество подов, трафик падает — лишние поды удаляются. Но в высоконагруженных системах при быстром росте нагрузки стандартные инструменты масштабирования могут стать менее эффективными. Проблема заложена в самой природе реактивного подхода: система всегда догоняет реальность, а не формирует её. Решение лежит на поверхности: надо повышать осознанность и внедрять ИИ. Меня зовут Дмитрий Чуринов, я руководитель команды разработки в трайбе Synapse. Хочу поделиться практическим опытом внедрения механизмов предиктивного масштабирования. Мой коллега Александр Козлов курирует разработку нескольких продуктов в СберТехе, в том числе Platform V SynAI , отвечающего за интерактивное управление трафиком на основе систем машинного обучения и моделирования. Вместе мы разберём, как настроить предиктивное управление в Kubernetes на основе open source-компонентов, и почему нам этого не хватило.
-
Как работает облако на самом деле. Простое объяснение на реальном примере
Облако это гибкая и экономичная модель, которая подстраивается под нагрузку и помогает бизнесу расти без лишних затрат. На простом, но реалистичном примере разбираемся, как всё устроено внутри и почему облачные подходы в некоторых случаях выигрывают у традиционного хостинга.
https://habr.com/ru/companies/hostkey/articles/968492/
#облачные_вычисления #vps #автоматизация #масштабируемость #мониторинг #облако #api #бизнеслогика #автоскейлинг #архитектура
-
Как работает облако на самом деле. Простое объяснение на реальном примере
Облако это гибкая и экономичная модель, которая подстраивается под нагрузку и помогает бизнесу расти без лишних затрат. На простом, но реалистичном примере разбираемся, как всё устроено внутри и почему облачные подходы в некоторых случаях выигрывают у традиционного хостинга.
https://habr.com/ru/companies/hostkey/articles/968492/
#облачные_вычисления #vps #автоматизация #масштабируемость #мониторинг #облако #api #бизнеслогика #автоскейлинг #архитектура
-
Как работает облако на самом деле. Простое объяснение на реальном примере
Облако это гибкая и экономичная модель, которая подстраивается под нагрузку и помогает бизнесу расти без лишних затрат. На простом, но реалистичном примере разбираемся, как всё устроено внутри и почему облачные подходы в некоторых случаях выигрывают у традиционного хостинга.
https://habr.com/ru/companies/hostkey/articles/968492/
#облачные_вычисления #vps #автоматизация #масштабируемость #мониторинг #облако #api #бизнеслогика #автоскейлинг #архитектура
-
Как работает облако на самом деле. Простое объяснение на реальном примере
Облако это гибкая и экономичная модель, которая подстраивается под нагрузку и помогает бизнесу расти без лишних затрат. На простом, но реалистичном примере разбираемся, как всё устроено внутри и почему облачные подходы в некоторых случаях выигрывают у традиционного хостинга.
https://habr.com/ru/companies/hostkey/articles/968492/
#облачные_вычисления #vps #автоматизация #масштабируемость #мониторинг #облако #api #бизнеслогика #автоскейлинг #архитектура
-
Больше не нужен рестарт: как Kubernetes позволяет менять ресурсы контейнеров «на лету»
Теперь ресурсы контейнеров в Kubernetes можно менять «на лету» — без перезапуска и простоев. В статье рассказываем, как работает in-place resize, где эта функция реально спасает приложения от перегрузки и какие ограничения стоит учитывать на практике.
https://habr.com/ru/companies/flant/articles/936724/
#kubernetes #autoscaling #vpa #kubelet #resources #ресайз_ресурсов #автоскейлинг #k8s #нехватка_памяти
-
Как справиться с нагрузкой в черную пятницу? Автоскейлинг инференса в Kubernetes
У многих наступление осени вызывает разные чувства и эмоции: от ностальгии во время просмотра Гарри Поттера под теплым пледом до депрессивных мыслей у дождливого окна в кофейне. Именно в этот период компании проводят масштабные мероприятия, одно из них — известная черная пятница. Клиенты пытаются «урвать» по хорошей скидке товары и купить подарки к Новому году. В связи с этим «атакуют» своим трафиком популярные сайты e-commerce, которые могут быть не готовы к такой нагрузке. Ни для кого не секрет, как сохранить и инфраструктуру в пиковые нагрузки, и трафик клиентов. При этом не понести большие убытки. Деплоим сервис в облако, скейлим ресурсы по требованию и радуемся продажам! Но это в e-commerce, мы же с вами интересуемся ML production. Привет, Хабр! Я — Антон, DevOps-инженер в команде Data/ML-продуктов Selectel . В этой статье расскажу, зачем нужен автоскейлинг GPU-ресурсов, как настроить масштабирование реплик в Kubernetes по трафику, а также как сделать свой высоконагруженный ChatGPT.