#high_availability — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-14 · 11:42 UTC

Как построить и проверить катастрофоустойчивость в облаке: от плана до Game Day

Довольно много компаний при работе в облаке выстраивают катастрофоустойчивость, ориентируясь на условные «лучшие практики»: составляют планы, предусматривают резервные площадки, настраивают репликацию. Вместе с тем во время реальных инцидентов многие сталкиваются с тем, что все предусмотренное не работает или работает не так, как ожидалось: восстановление занимает часы вместо минут, данные теряются в критическом для бизнеса объеме, а команды оказываются не готовы к действиям в условиях стресса. Причина часто кроется в том, что меры обеспечения катастрофоустойчивости либо обеспечиваются формально («чтобы было»), либо проектируются без учета полного цикла рисков — от технических ограничений до организационной готовности. В статье разберем, как проектировать решения, которые переживают не отдельные сбои, а крупные аварии.

https://habr.com/ru/companies/vktech/articles/1034702/

#катастрофоустойчивость #облачные_технологии #disaster_recovery #high_availability #rto #rpo #cloud_native #отказоустойчивость #kubernetes #vk_tech

#vk_tech #kubernetes #отказоустойчивость #cloud_native #rpo #rto

Habr @[email protected] · 2026-05-14 · 11:42 UTC

Как построить и проверить катастрофоустойчивость в облаке: от плана до Game Day

Довольно много компаний при работе в облаке выстраивают катастрофоустойчивость, ориентируясь на условные «лучшие практики»: составляют планы, предусматривают резервные площадки, настраивают репликацию. Вместе с тем во время реальных инцидентов многие сталкиваются с тем, что все предусмотренное не работает или работает не так, как ожидалось: восстановление занимает часы вместо минут, данные теряются в критическом для бизнеса объеме, а команды оказываются не готовы к действиям в условиях стресса. Причина часто кроется в том, что меры обеспечения катастрофоустойчивости либо обеспечиваются формально («чтобы было»), либо проектируются без учета полного цикла рисков — от технических ограничений до организационной готовности. В статье разберем, как проектировать решения, которые переживают не отдельные сбои, а крупные аварии.

https://habr.com/ru/companies/vktech/articles/1034702/

#катастрофоустойчивость #облачные_технологии #disaster_recovery #high_availability #rto #rpo #cloud_native #отказоустойчивость #kubernetes #vk_tech

#vk_tech #kubernetes #отказоустойчивость #cloud_native #rpo #rto

Habr @[email protected] · 2026-05-14 · 11:42 UTC

Как построить и проверить катастрофоустойчивость в облаке: от плана до Game Day

Довольно много компаний при работе в облаке выстраивают катастрофоустойчивость, ориентируясь на условные «лучшие практики»: составляют планы, предусматривают резервные площадки, настраивают репликацию. Вместе с тем во время реальных инцидентов многие сталкиваются с тем, что все предусмотренное не работает или работает не так, как ожидалось: восстановление занимает часы вместо минут, данные теряются в критическом для бизнеса объеме, а команды оказываются не готовы к действиям в условиях стресса. Причина часто кроется в том, что меры обеспечения катастрофоустойчивости либо обеспечиваются формально («чтобы было»), либо проектируются без учета полного цикла рисков — от технических ограничений до организационной готовности. В статье разберем, как проектировать решения, которые переживают не отдельные сбои, а крупные аварии.

https://habr.com/ru/companies/vktech/articles/1034702/

#катастрофоустойчивость #облачные_технологии #disaster_recovery #high_availability #rto #rpo #cloud_native #отказоустойчивость #kubernetes #vk_tech

#vk_tech #kubernetes #отказоустойчивость #cloud_native #rpo #rto

Habr @[email protected] · 2026-05-14 · 11:42 UTC

Как построить и проверить катастрофоустойчивость в облаке: от плана до Game Day

Довольно много компаний при работе в облаке выстраивают катастрофоустойчивость, ориентируясь на условные «лучшие практики»: составляют планы, предусматривают резервные площадки, настраивают репликацию. Вместе с тем во время реальных инцидентов многие сталкиваются с тем, что все предусмотренное не работает или работает не так, как ожидалось: восстановление занимает часы вместо минут, данные теряются в критическом для бизнеса объеме, а команды оказываются не готовы к действиям в условиях стресса. Причина часто кроется в том, что меры обеспечения катастрофоустойчивости либо обеспечиваются формально («чтобы было»), либо проектируются без учета полного цикла рисков — от технических ограничений до организационной готовности. В статье разберем, как проектировать решения, которые переживают не отдельные сбои, а крупные аварии.

https://habr.com/ru/companies/vktech/articles/1034702/

#катастрофоустойчивость #облачные_технологии #disaster_recovery #high_availability #rto #rpo #cloud_native #отказоустойчивость #kubernetes #vk_tech

#катастрофоустойчивость #облачные_технологии #disaster_recovery #high_availability #rto #rpo

Habr @[email protected] · 2026-04-28 · 12:52 UTC

Не только про производительность — балансировщик как основа отказоустойчивости современных инфраструктур

Когда говорят о балансировщике нагрузки, чаще всего имеют в виду распределение трафика между серверами. Но в реальной инфраструктуре его ключевая роль проявляется в другом — в способности системы продолжать работать, когда что-то ломается. Причём ломаться может всё: отдельные серверы, сервисы, целые дата-центры. В этой статье разбираем, как балансировщик становится точкой принятия решений в сценариях отказоустойчивости — от health checks до переключения между ЦОД — и почему без этих механизмов одной «балансировки» недостаточно.

https://habr.com/ru/companies/dsol/articles/1029114/

#балансировщик #балансировка_нагрузки #отказоустойчивость #отказоустойчивый_кластер #масштабирование #high_availability #высокая_доступность

#высокая_доступность #high_availability #масштабирование #отказоустойчивый_кластер #отказоустойчивость #балансировка_нагрузки

Habr @[email protected] · 2026-04-28 · 12:52 UTC

Не только про производительность — балансировщик как основа отказоустойчивости современных инфраструктур

Когда говорят о балансировщике нагрузки, чаще всего имеют в виду распределение трафика между серверами. Но в реальной инфраструктуре его ключевая роль проявляется в другом — в способности системы продолжать работать, когда что-то ломается. Причём ломаться может всё: отдельные серверы, сервисы, целые дата-центры. В этой статье разбираем, как балансировщик становится точкой принятия решений в сценариях отказоустойчивости — от health checks до переключения между ЦОД — и почему без этих механизмов одной «балансировки» недостаточно.

https://habr.com/ru/companies/dsol/articles/1029114/

#балансировщик #балансировка_нагрузки #отказоустойчивость #отказоустойчивый_кластер #масштабирование #high_availability #высокая_доступность

#высокая_доступность #high_availability #масштабирование #отказоустойчивый_кластер #отказоустойчивость #балансировка_нагрузки

Habr @[email protected] · 2026-04-28 · 12:52 UTC

Не только про производительность — балансировщик как основа отказоустойчивости современных инфраструктур

Когда говорят о балансировщике нагрузки, чаще всего имеют в виду распределение трафика между серверами. Но в реальной инфраструктуре его ключевая роль проявляется в другом — в способности системы продолжать работать, когда что-то ломается. Причём ломаться может всё: отдельные серверы, сервисы, целые дата-центры. В этой статье разбираем, как балансировщик становится точкой принятия решений в сценариях отказоустойчивости — от health checks до переключения между ЦОД — и почему без этих механизмов одной «балансировки» недостаточно.

https://habr.com/ru/companies/dsol/articles/1029114/

#балансировщик #балансировка_нагрузки #отказоустойчивость #отказоустойчивый_кластер #масштабирование #high_availability #высокая_доступность

#высокая_доступность #high_availability #масштабирование #отказоустойчивый_кластер #отказоустойчивость #балансировка_нагрузки

Habr @[email protected] · 2026-04-28 · 12:52 UTC

Не только про производительность — балансировщик как основа отказоустойчивости современных инфраструктур

Когда говорят о балансировщике нагрузки, чаще всего имеют в виду распределение трафика между серверами. Но в реальной инфраструктуре его ключевая роль проявляется в другом — в способности системы продолжать работать, когда что-то ломается. Причём ломаться может всё: отдельные серверы, сервисы, целые дата-центры. В этой статье разбираем, как балансировщик становится точкой принятия решений в сценариях отказоустойчивости — от health checks до переключения между ЦОД — и почему без этих механизмов одной «балансировки» недостаточно.

https://habr.com/ru/companies/dsol/articles/1029114/

#балансировщик #балансировка_нагрузки #отказоустойчивость #отказоустойчивый_кластер #масштабирование #high_availability #высокая_доступность

#балансировщик #балансировка_нагрузки #отказоустойчивость #отказоустойчивый_кластер #масштабирование #high_availability

Habr @[email protected] · 2026-03-25 · 10:02 UTC

Как Redis Auto Failover повышает отказоустойчивость наших БД

Привет! Меня зовут Иван Откидач, я DevOps-инженер в команде DBA. Моя основная специализация — NoSQL-базы данных, в частности Redis и MongoDB. С каждым месяцем количество Redis, находящихся на нашей поддержке, растёт, поэтому обеспечение их стабильной и надёжной работы — один из приоритетов нашего подразделения. В этой статье мы разберем, как устроен механизм отказоустойчивости в Redis Cluster и почему он может давать сбои в multi-AZ-инфраструктуре. Также покажем один из практических подходов к решению этой проблемы.

https://habr.com/ru/companies/wildberries/articles/1013760/

#redis #базы_данных #devops #nosql #high_availability #sre

#sre #high_availability #nosql #devops #базы_данных #redis

Habr @[email protected] · 2026-02-16 · 11:02 UTC

[Bus Factor] Почему ваша незаменимость — это архитектурная уязвимость (SPOF), а не повод для гордости

Понедельник, 09:30. Вы открываете Slack, Telegram и Jira. Там уже горит. В личке пять непрочитанных: «Посмотри, тут прод упал», «Ты единственный знаешь, как работает этот костыль», «Без твоего аппрува не можем покатить релиз» . В этот момент в лимбической системе происходит мощный выброс дофамина. Включается режим Атланта. «Без меня тут всё рухнет. Я несущая стена этого карточного домика. Я избранный». Мысленно надевается плащ Супермена (поверх офисной рубашки или мятой футболки), расправляются плечи, берется ведро кофе и начинается операция «Спасение проекта». К вечеру ресурс батареи на нуле, глаз дергается, но есть глубокое удовлетворение. ЧСВ почесано, ценность для человечества доказана. Спойлер: Я сам жил в этом режиме несколько лет. И сейчас, глядя на логи, могу сказать честно. С точки зрения системной архитектуры это не героизм. Это классический паттерн SPOF (Single Point of Failure). Единая точка отказа. Инженер в такой позиции совсем не Супермен. Он тот самый старый сервер в углу, на который боятся дышать, потому что он держится на изоленте и честном слове. Сегодня поговорим о Bus Factor. Почему быть «священной коровой» проекта означает тупиковую ветвь эволюции для Сеньора. И как перестать быть инженером, которого боятся отправить в отпуск.

https://habr.com/ru/articles/996612/

#Bus_factor #карьера_в_it #управление_командой #архитектура #технический_долг #делегирование #knowledge_sharing #документация #отказоустойчивость #high_availability

#high_availability #отказоустойчивость #документация #knowledge_sharing #делегирование #технический_долг

Habr @[email protected] · 2026-01-31 · 22:12 UTC

Записки самозванца. Защита кольцевой топологии с помощью RRPP

Документация по RRPP у Huawei обширная, но разобраться в ней с первого раза — то ещё приключение. Собрал в одном месте всё, что нужно знать про защиту кольцевых топологий: от базовых понятий до подводных камней при работе с несколькими кольцами. Пролистать и забить

https://habr.com/ru/articles/991396/

#протокол #huawei #rrpp #high_availability

#high_availability #rrpp #huawei #протокол

Habr @[email protected] · 2026-01-31 · 22:12 UTC

Записки самозванца. Защита кольцевой топологии с помощью RRPP

Документация по RRPP у Huawei обширная, но разобраться в ней с первого раза — то ещё приключение. Собрал в одном месте всё, что нужно знать про защиту кольцевых топологий: от базовых понятий до подводных камней при работе с несколькими кольцами. Пролистать и забить

https://habr.com/ru/articles/991396/

#протокол #huawei #rrpp #high_availability

#high_availability #rrpp #huawei #протокол

Habr @[email protected] · 2026-01-31 · 22:12 UTC

Записки самозванца. Защита кольцевой топологии с помощью RRPP

Документация по RRPP у Huawei обширная, но разобраться в ней с первого раза — то ещё приключение. Собрал в одном месте всё, что нужно знать про защиту кольцевых топологий: от базовых понятий до подводных камней при работе с несколькими кольцами. Пролистать и забить

https://habr.com/ru/articles/991396/

#протокол #huawei #rrpp #high_availability

#high_availability #rrpp #huawei #протокол

Habr @[email protected] · 2026-01-31 · 22:12 UTC

Записки самозванца. Защита кольцевой топологии с помощью RRPP

Документация по RRPP у Huawei обширная, но разобраться в ней с первого раза — то ещё приключение. Собрал в одном месте всё, что нужно знать про защиту кольцевых топологий: от базовых понятий до подводных камней при работе с несколькими кольцами. Пролистать и забить

https://habr.com/ru/articles/991396/

#протокол #huawei #rrpp #high_availability

Habr @[email protected] · 2025-11-27 · 10:32 UTC

Масштабируемый мониторинг: Настраиваем VictoriaMetrics в HA-конфигурации с VMAgent и Grafana

Сегодня мы построим масштабируемую, отказоустойчивую систему , которая будет расти вместе с вашей инфраструктурой и не сломается в самый неподходящий момент. Вместо 3 часов дебага падающего Prometheus вы смотрите дашборд, который показывает 99.9% uptime вашего мониторинга. Это реальность с правильно настроенным стеком на основе VictoriaMetrics .

https://habr.com/ru/articles/970490/

#victoriametrics #мониторинг #kubernetes #devops #prometheus #grafana #monitoring #time_series #high_availability #кластер

#victoriametrics #мониторинг #kubernetes #devops #prometheus #grafana

Habr @[email protected] · 2025-11-27 · 10:32 UTC

Масштабируемый мониторинг: Настраиваем VictoriaMetrics в HA-конфигурации с VMAgent и Grafana

Сегодня мы построим масштабируемую, отказоустойчивую систему , которая будет расти вместе с вашей инфраструктурой и не сломается в самый неподходящий момент. Вместо 3 часов дебага падающего Prometheus вы смотрите дашборд, который показывает 99.9% uptime вашего мониторинга. Это реальность с правильно настроенным стеком на основе VictoriaMetrics .

https://habr.com/ru/articles/970490/

#victoriametrics #мониторинг #kubernetes #devops #prometheus #grafana #monitoring #time_series #high_availability #кластер

#кластер #high_availability #time_series #monitoring #grafana #prometheus

Habr @[email protected] · 2025-09-19 · 17:12 UTC

Proxmox VE + ZFS/CEPH для малого продакшена: экономим, но без авантюр

В современном IT-ландшафте малый и средний бизнес (SMB) сталкивается с фундаментальным противоречием: необходимость в инфраструктуре корпоративного уровня надежности при бюджете, который редко можно назвать корпоративным. Требования к аптайму, целостности данных и катастрофоустойчивости сегодня высоки как никогда, но традиционные решения от лидеров рынка становятся все менее доступными. Недавние изменения на рынке виртуализации, в частности, последствия приобретения VMware компанией Broadcom, лишь усилили эту тенденцию, заставив многих искать мощные и экономически эффективные альтернативы. В этом контексте Proxmox Virtual Environment (VE) выделяется как один из ведущих претендентов на роль стандартной платформы для SMB. Это комплексное решение с открытым исходным кодом, которое объединяет в себе гипервизор KVM, контейнеризацию LXC, программно-определяемые хранилища (SDS) и сети (SDN) в едином управляемом интерфейсе. Proxmox VE предлагает функциональность, ранее доступную только в дорогостоящих коммерческих продуктах, делая ее доступной для широкого круга компаний. Однако внедрение Proxmox в прод ставит перед системным архитектором ключевой выбор, определяющий всю дальнейшую архитектуру, стоимость и уровень отказоустойчивости системы. Этот выбор — технология хранения данных. Настоящая статья посвящена детальному разбору двух основных путей. К сути дела

https://habr.com/ru/articles/948696/

#proxmox #zfs #ceph #sds #виртуализация #гиперконвергенция #pbs #high_availability #open_source #smb

#smb #open_source #high_availability #pbs #гиперконвергенция #виртуализация

Habr @[email protected] · 2025-09-11 · 21:52 UTC

Записки самозванца. Защита от петель коммутации в локальной сети

С этого момента я начну, спонтанную и нерегулярную серию статей по сетевым технологиям, читай, дневник. В этой серии не будут рассматриваться основы сетей, разбора базовых принципов и так далее. Если вы тут за этим, то ребята из LinkMeUp со своей СДСМ справились настолько великолепно, что лучше уже, как говорится, не будет. Я же хочу поговорить про более, если угодно, скучные и рутинные задачи сетевого инженера в маленьком провайдере последней мили, предоставляющим услуги связи нескольких видов на территории некоторого количества объектов. То есть, клиент - бизнес. А бизнес крайне чувствителен к любым задержкам в предоставлении сервиса. И среди этой рутины, выделить, как минимум, для себя, какие-то интересные, не очень очевидные моменты, а так же поделиться опытом работы с оборудованием конкретных вендоров и моделей, перенять опыт хабровчан, если повезет.

https://habr.com/ru/articles/946214/

#high_availability #case #networking #qtech #hp #switching

Habr @[email protected] · 2025-04-23 · 11:42 UTC

Как мы помогли Piklema Predictive создать надежную и масштабируемую IT-инфраструктуру

Piklema Predictive — российская компания, разрабатывающая решения для оптимизации горного производства через анализ данных диспетчеризации, цифровые советчики, MES-систем и планирования. За 4 года сотрудничества AvantIT выполнил три миграции их инфраструктуры между облаками (Azure → AWS → GCP → Azure), внедрил Kubernetes и настроил мониторинг, что позволило клиентам Piklema снизить затраты на производство на 15–20%. Проблема: Piklema столкнулась с двумя критичными ограничениями. Во-первых, их инфраструктура на Docker Compose не обеспечивала отказоустойчивость, требуемую промышленными заказчиками. Во-вторых, зависимость от грантов вынуждала ежегодно менять облачного провайдера, что приводило к ручным миграциям длительностью до 2 месяцев. Отсутствие мониторинга усугубляло риски: о нехватке ресурсов (например, места на диске) узнавали только после сбоев. Цель проекта: Создать гибкую, отказоустойчивую инфраструктуру, которую относительно просто переносить между облаками при завершении гранта. Она должна...

https://habr.com/ru/articles/903564/

#Миграция_между_облаками #Kubernetes #Terraform #Ansible #cicd #Hashicorp_Vault #GitOps #ArgoCD #high_availability

#миграция_между_облаками #kubernetes #terraform #ansible #cicd #hashicorp_vault

Habr @[email protected] · 2025-04-23 · 11:42 UTC

Как мы помогли Piklema Predictive создать надежную и масштабируемую IT-инфраструктуру

Piklema Predictive — российская компания, разрабатывающая решения для оптимизации горного производства через анализ данных диспетчеризации, цифровые советчики, MES-систем и планирования. За 4 года сотрудничества AvantIT выполнил три миграции их инфраструктуры между облаками (Azure → AWS → GCP → Azure), внедрил Kubernetes и настроил мониторинг, что позволило клиентам Piklema снизить затраты на производство на 15–20%. Проблема: Piklema столкнулась с двумя критичными ограничениями. Во-первых, их инфраструктура на Docker Compose не обеспечивала отказоустойчивость, требуемую промышленными заказчиками. Во-вторых, зависимость от грантов вынуждала ежегодно менять облачного провайдера, что приводило к ручным миграциям длительностью до 2 месяцев. Отсутствие мониторинга усугубляло риски: о нехватке ресурсов (например, места на диске) узнавали только после сбоев. Цель проекта: Создать гибкую, отказоустойчивую инфраструктуру, которую относительно просто переносить между облаками при завершении гранта. Она должна...

https://habr.com/ru/articles/903564/

#Миграция_между_облаками #Kubernetes #Terraform #Ansible #cicd #Hashicorp_Vault #GitOps #ArgoCD #high_availability

#миграция_между_облаками #kubernetes #terraform #ansible #cicd #hashicorp_vault

Habr @[email protected] · 2025-04-23 · 11:42 UTC

Как мы помогли Piklema Predictive создать надежную и масштабируемую IT-инфраструктуру

Piklema Predictive — российская компания, разрабатывающая решения для оптимизации горного производства через анализ данных диспетчеризации, цифровые советчики, MES-систем и планирования. За 4 года сотрудничества AvantIT выполнил три миграции их инфраструктуры между облаками (Azure → AWS → GCP → Azure), внедрил Kubernetes и настроил мониторинг, что позволило клиентам Piklema снизить затраты на производство на 15–20%. Проблема: Piklema столкнулась с двумя критичными ограничениями. Во-первых, их инфраструктура на Docker Compose не обеспечивала отказоустойчивость, требуемую промышленными заказчиками. Во-вторых, зависимость от грантов вынуждала ежегодно менять облачного провайдера, что приводило к ручным миграциям длительностью до 2 месяцев. Отсутствие мониторинга усугубляло риски: о нехватке ресурсов (например, места на диске) узнавали только после сбоев. Цель проекта: Создать гибкую, отказоустойчивую инфраструктуру, которую относительно просто переносить между облаками при завершении гранта. Она должна...

https://habr.com/ru/articles/903564/

#Миграция_между_облаками #Kubernetes #Terraform #Ansible #cicd #Hashicorp_Vault #GitOps #ArgoCD #high_availability

#миграция_между_облаками #kubernetes #terraform #ansible #cicd #hashicorp_vault

Habr @[email protected] · 2025-04-23 · 11:42 UTC

Как мы помогли Piklema Predictive создать надежную и масштабируемую IT-инфраструктуру

Piklema Predictive — российская компания, разрабатывающая решения для оптимизации горного производства через анализ данных диспетчеризации, цифровые советчики, MES-систем и планирования. За 4 года сотрудничества AvantIT выполнил три миграции их инфраструктуры между облаками (Azure → AWS → GCP → Azure), внедрил Kubernetes и настроил мониторинг, что позволило клиентам Piklema снизить затраты на производство на 15–20%. Проблема: Piklema столкнулась с двумя критичными ограничениями. Во-первых, их инфраструктура на Docker Compose не обеспечивала отказоустойчивость, требуемую промышленными заказчиками. Во-вторых, зависимость от грантов вынуждала ежегодно менять облачного провайдера, что приводило к ручным миграциям длительностью до 2 месяцев. Отсутствие мониторинга усугубляло риски: о нехватке ресурсов (например, места на диске) узнавали только после сбоев. Цель проекта: Создать гибкую, отказоустойчивую инфраструктуру, которую относительно просто переносить между облаками при завершении гранта. Она должна...

https://habr.com/ru/articles/903564/

#Миграция_между_облаками #Kubernetes #Terraform #Ansible #cicd #Hashicorp_Vault #GitOps #ArgoCD #high_availability

#high_availability #argocd #gitops #hashicorp_vault #cicd #ansible

Habr @[email protected] · 2025-04-21 · 07:52 UTC

Балансировка в Angie: Алгоритмы

Сергей Каличев, старший разработчик, Angie Software Это вторая статья из цикла "Балансировка в Angie". Первая была посвящена обзору и общим принципам работы балансировки в продуктах Angie и почти не касалась конкретных алгоритмов. В этой статье разберём алгоритмы балансировки более предметно, с привязкой к характеристикам, обозначенным в первой статье. Если характеристика была подробно рассмотрена в первой статье, то повторяться не буду. В тексте алгоритмы балансировки называются просто "балансировщиками", поскольку каждый алгоритм представлен отдельным модулем.

https://habr.com/ru/articles/902052/

#angie #балансировка_нагрузки #nginx #balancing #upstream #angie_pro #angie_adc #highload #high_availability #backend

#angie #балансировка_нагрузки #nginx #balancing #upstream #angie_pro

Habr @[email protected] · 2025-04-05 · 08:42 UTC

IPsecHub+. Отказоустойчивость и динамическая маршрутизация

В этой статье цикла мы поднимем один из самых важных вопросов построения любой топологии - вопрос отказоустойчивости. Предлагаю вам рассмотреть, как мы можем сделать наш концентратор отказоустойчивым.

https://habr.com/ru/companies/1cupis/articles/897644/

#ipsec #gre #vti #high_availability #bgp

Habr @[email protected] · 2025-04-05 · 08:42 UTC

IPsecHub+. Отказоустойчивость и динамическая маршрутизация

В этой статье цикла мы поднимем один из самых важных вопросов построения любой топологии - вопрос отказоустойчивости. Предлагаю вам рассмотреть, как мы можем сделать наш концентратор отказоустойчивым.

https://habr.com/ru/companies/1cupis/articles/897644/

#ipsec #gre #vti #high_availability #bgp

Habr @[email protected] · 2025-04-05 · 08:42 UTC

IPsecHub+. Отказоустойчивость и динамическая маршрутизация

В этой статье цикла мы поднимем один из самых важных вопросов построения любой топологии - вопрос отказоустойчивости. Предлагаю вам рассмотреть, как мы можем сделать наш концентратор отказоустойчивым.

https://habr.com/ru/companies/1cupis/articles/897644/

#ipsec #gre #vti #high_availability #bgp

Habr @[email protected] · 2025-04-05 · 08:42 UTC

IPsecHub+. Отказоустойчивость и динамическая маршрутизация

В этой статье цикла мы поднимем один из самых важных вопросов построения любой топологии - вопрос отказоустойчивости. Предлагаю вам рассмотреть, как мы можем сделать наш концентратор отказоустойчивым.

https://habr.com/ru/companies/1cupis/articles/897644/

#ipsec #gre #vti #high_availability #bgp

#bgp #high_availability #vti #gre #ipsec

Habr @[email protected] · 2025-03-04 · 07:32 UTC

Балансировка в Angie

Статья посвящена обзору возможностей балансировки в трёх продуктах: Angie, Angie PRO, Angie Load Balancer в составе Angie ADC. Angie - бесплатный продукт с открытым исходным кодом, остальные два - коммерческие продукты. Некогда Angie был создан как форк NGINX. Это первая статья из цикла статей, не знаю пока насколько длинного, о балансировке в Angie. В ней я постарался сделать обзор балансировки в целом, не касаясь конкретных балансировщиков и подробностей их конфигурирования. Вместо этого рассказываю, что между ними есть общего, принципы работы. Во второй статье планирую перечислить все балансировщики продуктов с описанием того, что они могут, для чего предназначены и некоторых их неявных особенностей. Подробностей конфигурирования по-прежнему не будет, это и так описано в документации . А тут хотелось бы скорее целостного обзора, нежели описания всех опций.

https://habr.com/ru/articles/887490/

#angie #балансировка_нагрузки #nginx #balancing #upstream #angie_pro #angie_adc #highload #high_availability #backend

#angie #балансировка_нагрузки #nginx #balancing #upstream #angie_pro

Habr @[email protected] · 2025-02-10 · 17:42 UTC

Гарантии видимости в распределённых хранилищах

Здравствуйте, меня зовут Дмитрий Карловский и я.. стараюсь сложные вещи рассказывать простым языком , а простые вещи — эзоповым. И часто оказывается так, что в процессе упрощения и структурирования, на самом видном месте обнаруживаются скелеты древних динозавров, присыпанные мутными формулировками так, что долгие годы их никто не замечает . Что ж, если вы хотите окончательно разобраться в уровнях изоляции транзакций и гарантиях порядка операций , до давайте копать вместе. Выпускайте эскалатор!

https://habr.com/ru/articles/881204/

#Monotonic #Causal #Sequential #Linearizable #Read_Uncommitted #Read_Committed #Repeatable_Read #Serializable #High_Availability #CRDT

#crdt #high_availability #serializable #repeatable_read #read_committed #read_uncommitted

Habr @[email protected] · 2025-02-10 · 17:42 UTC

Гарантии видимости в распределённых хранилищах

Здравствуйте, меня зовут Дмитрий Карловский и я.. стараюсь сложные вещи рассказывать простым языком , а простые вещи — эзоповым. И часто оказывается так, что в процессе упрощения и структурирования, на самом видном месте обнаруживаются скелеты древних динозавров, присыпанные мутными формулировками так, что долгие годы их никто не замечает . Что ж, если вы хотите окончательно разобраться в уровнях изоляции транзакций и гарантиях порядка операций , до давайте копать вместе. Выпускайте эскалатор!

https://habr.com/ru/articles/881204/

#Monotonic #Causal #Sequential #Linearizable #Read_Uncommitted #Read_Committed #Repeatable_Read #Serializable #High_Availability #CRDT

#crdt #high_availability #serializable #repeatable_read #read_committed #read_uncommitted

Habr @[email protected] · 2025-02-10 · 17:42 UTC

Гарантии видимости в распределённых хранилищах

Здравствуйте, меня зовут Дмитрий Карловский и я.. стараюсь сложные вещи рассказывать простым языком , а простые вещи — эзоповым. И часто оказывается так, что в процессе упрощения и структурирования, на самом видном месте обнаруживаются скелеты древних динозавров, присыпанные мутными формулировками так, что долгие годы их никто не замечает . Что ж, если вы хотите окончательно разобраться в уровнях изоляции транзакций и гарантиях порядка операций , до давайте копать вместе. Выпускайте эскалатор!

https://habr.com/ru/articles/881204/

#Monotonic #Causal #Sequential #Linearizable #Read_Uncommitted #Read_Committed #Repeatable_Read #Serializable #High_Availability #CRDT

#crdt #high_availability #serializable #repeatable_read #read_committed #read_uncommitted

Habr @[email protected] · 2025-02-10 · 17:42 UTC

Гарантии видимости в распределённых хранилищах

Здравствуйте, меня зовут Дмитрий Карловский и я.. стараюсь сложные вещи рассказывать простым языком , а простые вещи — эзоповым. И часто оказывается так, что в процессе упрощения и структурирования, на самом видном месте обнаруживаются скелеты древних динозавров, присыпанные мутными формулировками так, что долгие годы их никто не замечает . Что ж, если вы хотите окончательно разобраться в уровнях изоляции транзакций и гарантиях порядка операций , до давайте копать вместе. Выпускайте эскалатор!

https://habr.com/ru/articles/881204/

#Monotonic #Causal #Sequential #Linearizable #Read_Uncommitted #Read_Committed #Repeatable_Read #Serializable #High_Availability #CRDT

#monotonic #causal #sequential #linearizable #read_uncommitted #read_committed

Habr @[email protected] · 2024-11-18 · 06:22 UTC

CI/CD Kubernetes платформа Gitorion. Highly Available исполнение

Привет, всем! В данной статье мы расскажем о Highly Available исполнении CI/CD платформы Gitorion . В данном случае платформа размещается в двух дата центрах. При отказе любого из дата центров команда разработчиков может продолжить непрерывную интеграцию и доставку в выжившем дата центре.

https://habr.com/ru/companies/gitorion/articles/857596/

#ci/cd #high_availability #высокая_доступность #kubernetes

#kubernetes #высокая_доступность #high_availability #ci

Habr @[email protected] · 2024-10-26 · 12:22 UTC

Межсетевые экраны в 2024 году

Статья посвящена межсетевым экранам (МЭ) в 2024 году, их функционалу, архитектуре, и ключевым параметрам. Автор рассматривает функциональные возможности присущие межсетевым экранам на момент 2024 года без привязки к конкретным производителям. В статье рассмотрена архитектура и аппаратные компоненты, такие как процессоры, сетевые карты, оперативная память, и аппаратные ускорители, которые влияют на производительность. Особое внимание уделено реализации в МЭ задач позволяющих обеспечить надежность и управляемость решений.

https://habr.com/ru/articles/853674/

#firewall #межсетевой_экран #межсетевой_экран_нового_поколения #производительность #тестирование_производительности #межсетевые_экраны #vpn #ips #cloud_security #high_availability

#firewall #межсетевой_экран #межсетевой_экран_нового_поколения #производительность #тестирование_производительности #межсетевые_экраны

Habr @[email protected] · 2024-10-26 · 12:22 UTC

Межсетевые экраны в 2024 году

Статья посвящена межсетевым экранам (МЭ) в 2024 году, их функционалу, архитектуре, и ключевым параметрам. Автор рассматривает функциональные возможности присущие межсетевым экранам на момент 2024 года без привязки к конкретным производителям. В статье рассмотрена архитектура и аппаратные компоненты, такие как процессоры, сетевые карты, оперативная память, и аппаратные ускорители, которые влияют на производительность. Особое внимание уделено реализации в МЭ задач позволяющих обеспечить надежность и управляемость решений.

https://habr.com/ru/articles/853674/

#firewall #межсетевой_экран #межсетевой_экран_нового_поколения #производительность #тестирование_производительности #межсетевые_экраны #vpn #ips #cloud_security #high_availability

#firewall #межсетевой_экран #межсетевой_экран_нового_поколения #производительность #тестирование_производительности #межсетевые_экраны

Habr @[email protected] · 2024-10-26 · 12:22 UTC

Межсетевые экраны в 2024 году

Статья посвящена межсетевым экранам (МЭ) в 2024 году, их функционалу, архитектуре, и ключевым параметрам. Автор рассматривает функциональные возможности присущие межсетевым экранам на момент 2024 года без привязки к конкретным производителям. В статье рассмотрена архитектура и аппаратные компоненты, такие как процессоры, сетевые карты, оперативная память, и аппаратные ускорители, которые влияют на производительность. Особое внимание уделено реализации в МЭ задач позволяющих обеспечить надежность и управляемость решений.

https://habr.com/ru/articles/853674/

#firewall #межсетевой_экран #межсетевой_экран_нового_поколения #производительность #тестирование_производительности #межсетевые_экраны #vpn #ips #cloud_security #high_availability

#firewall #межсетевой_экран #межсетевой_экран_нового_поколения #производительность #тестирование_производительности #межсетевые_экраны

Habr @[email protected] · 2024-10-26 · 12:22 UTC

Межсетевые экраны в 2024 году

Статья посвящена межсетевым экранам (МЭ) в 2024 году, их функционалу, архитектуре, и ключевым параметрам. Автор рассматривает функциональные возможности присущие межсетевым экранам на момент 2024 года без привязки к конкретным производителям. В статье рассмотрена архитектура и аппаратные компоненты, такие как процессоры, сетевые карты, оперативная память, и аппаратные ускорители, которые влияют на производительность. Особое внимание уделено реализации в МЭ задач позволяющих обеспечить надежность и управляемость решений.

https://habr.com/ru/articles/853674/

#firewall #межсетевой_экран #межсетевой_экран_нового_поколения #производительность #тестирование_производительности #межсетевые_экраны #vpn #ips #cloud_security #high_availability

#high_availability #cloud_security #ips #vpn #межсетевые_экраны #тестирование_производительности

Habr @[email protected] · 2024-10-21 · 22:02 UTC

Кластеры и мир: хроника высокодоступного Pub/Sub в Redis

В статье рассматриваются основные принципы и особенности использования Redis в режиме Pub/Sub для масштабируемых и высоконагруженных приложений. Описаны два подхода к обеспечению высокой доступности — Redis Sentinel и Redis Cluster, их преимущества, ограничения и примеры настройки. Приведены примеры использования Pub/Sub в реальных системах, а также практические конфигурации и код для настройки отказоустойчивого кластера Redis. Статья предназначена для разработчиков, которые ищут решения для создания надежных систем обмена сообщениями с высокой производительностью и отказоустойчивостью.

https://habr.com/ru/companies/rostelecom/articles/852362/

#high_availability #redis #highload #python #java #nosql

Habr @[email protected] · 2024-10-01 · 06:22 UTC

CI/CD Kubernetes платформа Gitorion. Реплицируемый NAS для Highly Available кластера Kubernetes

Привет всем! В предыдущей статье в рамках построения Highly Available варианта CI/CD Kubernetes платформы Gitorion мы рассмотрели реализацию Highly Available плоскости управления Kubernetes, разнесенную в два дата центра и способную пережить падение любого из них. Инстансы Gitea/Forgejo, Jenkins и Docker-registry в составе платформы являются Statefull приложениями и хранят свои данные во внешних Persistent Volume. В данной статей предлагаем вашему вниманию вариант реплицируемого NAS и способ его подключения к Highly Available кластеру Kubernetes, позволяющие модулям Statefull приложений платформы, в случае падения любого из дата центров, продолжить работу со своими файлами в выжившем дата центре.

https://habr.com/ru/companies/gitorion/articles/845120/

#high_availability #высокая_доступность #kubernetes #nas #ci/cd

#ci #nas #kubernetes #высокая_доступность #high_availability

Habr @[email protected] · 2024-09-09 · 06:32 UTC

REDIS: такой простой и такой сложный

Меня зовут Андрей Комягин, я СТО компании STM Labs. Мы занимаемся разработкой очень больших распределённых высоконагруженных систем для различных отраслей и в своей работе широко используем open-source решения, в том числе СУБД Redis. Недавно я подробно рассказывал об этой системе на конференции Saint HighLoad++, а теперь с удовольствием поделюсь основной информацией с читателями Хабра. Итак, поехали.

https://habr.com/ru/companies/stm_labs/articles/841792/

#redis #highload #highload++ #high_performance #high_availability #cache #caching #database_design #базы_данных #архитектура

#архитектура #базы_данных #database_design #caching #cache #high_availability

Habr @[email protected] · 2024-09-09 · 06:32 UTC

REDIS: такой простой и такой сложный

Меня зовут Андрей Комягин, я СТО компании STM Labs. Мы занимаемся разработкой очень больших распределённых высоконагруженных систем для различных отраслей и в своей работе широко используем open-source решения, в том числе СУБД Redis. Недавно я подробно рассказывал об этой системе на конференции Saint HighLoad++, а теперь с удовольствием поделюсь основной информацией с читателями Хабра. Итак, поехали.

https://habr.com/ru/companies/stm_labs/articles/841792/

#redis #highload #highload++ #high_performance #high_availability #cache #caching #database_design #базы_данных #архитектура

#архитектура #базы_данных #database_design #caching #cache #high_availability

Habr @[email protected] · 2024-09-09 · 06:32 UTC

REDIS: такой простой и такой сложный

Меня зовут Андрей Комягин, я СТО компании STM Labs. Мы занимаемся разработкой очень больших распределённых высоконагруженных систем для различных отраслей и в своей работе широко используем open-source решения, в том числе СУБД Redis. Недавно я подробно рассказывал об этой системе на конференции Saint HighLoad++, а теперь с удовольствием поделюсь основной информацией с читателями Хабра. Итак, поехали.

https://habr.com/ru/companies/stm_labs/articles/841792/

#redis #highload #highload++ #high_performance #high_availability #cache #caching #database_design #базы_данных #архитектура

#redis #highload #high_performance #high_availability #cache #caching

Habr @[email protected] · 2024-08-29 · 16:02 UTC

Доступность IT-систем: поругаться или договориться?

Всем привет, меня зовут Александр Москвин, я начальник управления эксплуатации X5 Облака в X5 Tech. У меня несколько зон ответственности, но важнейшая из них – это обеспечение доступности облачной инфраструктуры Х5. Конечно, для того, чтобы управлять доступностью, необходимо оцифровать этот показатель. Статья родилась из жарких дебатов по целевым показателям доступности частного облака X5 и серии больших внутренних митапов, посвящённых этой теме. Кажется, что результатами стоит поделиться с сообществом, т. к. накопилась критическая масса материалов и выводов. Мысли будут полезны менеджерам, принимающим решения, и solution-архитекторам для переговоров с заказчиками, лидам команд инфраструктуры и разработки. К сожалению, получился лонгрид, так как охватить все аспекты данной темы короткой статьёй не выйдет.

https://habr.com/ru/companies/X5Tech/articles/839626/

#high_availability #высокая_доступность #надежность #sre #стабильность_системы #облачная_инфраструктура #кластеризация #непрерывность_бизнеса #критически_важные_системы #отказоустойчивость

#отказоустойчивость #критически_важные_системы #непрерывность_бизнеса #кластеризация #облачная_инфраструктура #стабильность_системы

Habr @[email protected] · 2024-08-29 · 16:02 UTC

Доступность IT-систем: поругаться или договориться?

Всем привет, меня зовут Александр Москвин, я начальник управления эксплуатации X5 Облака в X5 Tech. У меня несколько зон ответственности, но важнейшая из них – это обеспечение доступности облачной инфраструктуры Х5. Конечно, для того, чтобы управлять доступностью, необходимо оцифровать этот показатель. Статья родилась из жарких дебатов по целевым показателям доступности частного облака X5 и серии больших внутренних митапов, посвящённых этой теме. Кажется, что результатами стоит поделиться с сообществом, т. к. накопилась критическая масса материалов и выводов. Мысли будут полезны менеджерам, принимающим решения, и solution-архитекторам для переговоров с заказчиками, лидам команд инфраструктуры и разработки. К сожалению, получился лонгрид, так как охватить все аспекты данной темы короткой статьёй не выйдет.

https://habr.com/ru/companies/X5Tech/articles/839626/

#high_availability #высокая_доступность #надежность #sre #стабильность_системы #облачная_инфраструктура #кластеризация #непрерывность_бизнеса #критически_важные_системы #отказоустойчивость

#отказоустойчивость #критически_важные_системы #непрерывность_бизнеса #кластеризация #облачная_инфраструктура #стабильность_системы

Habr @[email protected] · 2024-08-29 · 16:02 UTC

Доступность IT-систем: поругаться или договориться?

Всем привет, меня зовут Александр Москвин, я начальник управления эксплуатации X5 Облака в X5 Tech. У меня несколько зон ответственности, но важнейшая из них – это обеспечение доступности облачной инфраструктуры Х5. Конечно, для того, чтобы управлять доступностью, необходимо оцифровать этот показатель. Статья родилась из жарких дебатов по целевым показателям доступности частного облака X5 и серии больших внутренних митапов, посвящённых этой теме. Кажется, что результатами стоит поделиться с сообществом, т. к. накопилась критическая масса материалов и выводов. Мысли будут полезны менеджерам, принимающим решения, и solution-архитекторам для переговоров с заказчиками, лидам команд инфраструктуры и разработки. К сожалению, получился лонгрид, так как охватить все аспекты данной темы короткой статьёй не выйдет.

https://habr.com/ru/companies/X5Tech/articles/839626/

#high_availability #высокая_доступность #надежность #sre #стабильность_системы #облачная_инфраструктура #кластеризация #непрерывность_бизнеса #критически_важные_системы #отказоустойчивость

#high_availability #высокая_доступность #надежность #sre #стабильность_системы #облачная_инфраструктура

Habr @[email protected] · 2024-08-15 · 19:02 UTC

SQL server: темная сторона AlwaysOn

В SQL server есть замечательная технология - AlwaysOn . Она используется для DR (disaster recovery, асинхронная репликация данных), HA (high availability, часто с automatic failover, что возможно при синхронной репликации), и для того, что мы обсудим в статье: readonly replica для DWH/OLAP/Reporting workload. Ничто не совершенно (хотя я восхищаюсь простотой установки некоторых решений в MS SQL по сравнению с Postgre и Oracle. Хотя бы бэкапы... А AlwaysOn для маленьких баз заводится буквально в пару кликов). Cегодня мы рассмотрим проблемы при использовании AlwaysOn для DWH/OLAP/Reporting.

https://habr.com/ru/articles/836386/

#sql #microsoft_sql_server #alwayson #high_availability

#high_availability #alwayson #microsoft_sql_server #sql