#оптимизация_базы_данных — Public Fediverse posts on home.social

Habr @[email protected] · 2026-02-25 · 09:02 UTC

[Перевод] Стоп-слова, исключения и словоформы в Manticore

Теперь Manticore Search поддерживает прямое указание настроек токенизации непосредственно в команде CREATE TABLE . Таким образом, исчезает необходимость создавать внешние файлы при настройке стоп-слов, исключений, словоформ и слов без позиции, делая создание таблиц проще и удобнее для развертывания.

https://habr.com/ru/articles/995662/

#алгоритмы_поиска #оптимизация_базы_данных #fulltext_search #sql #database_optimization

#database_optimization #sql #fulltext_search #оптимизация_базы_данных #алгоритмы_поиска

Habr @[email protected] · 2026-02-25 · 09:02 UTC

[Перевод] Стоп-слова, исключения и словоформы в Manticore

Теперь Manticore Search поддерживает прямое указание настроек токенизации непосредственно в команде CREATE TABLE . Таким образом, исчезает необходимость создавать внешние файлы при настройке стоп-слов, исключений, словоформ и слов без позиции, делая создание таблиц проще и удобнее для развертывания.

https://habr.com/ru/articles/995662/

#алгоритмы_поиска #оптимизация_базы_данных #fulltext_search #sql #database_optimization

#database_optimization #sql #fulltext_search #оптимизация_базы_данных #алгоритмы_поиска

Habr @[email protected] · 2026-02-25 · 09:02 UTC

[Перевод] Стоп-слова, исключения и словоформы в Manticore

Теперь Manticore Search поддерживает прямое указание настроек токенизации непосредственно в команде CREATE TABLE . Таким образом, исчезает необходимость создавать внешние файлы при настройке стоп-слов, исключений, словоформ и слов без позиции, делая создание таблиц проще и удобнее для развертывания.

https://habr.com/ru/articles/995662/

#алгоритмы_поиска #оптимизация_базы_данных #fulltext_search #sql #database_optimization

#database_optimization #sql #fulltext_search #оптимизация_базы_данных #алгоритмы_поиска

Habr @[email protected] · 2026-02-25 · 09:02 UTC

[Перевод] Стоп-слова, исключения и словоформы в Manticore

Теперь Manticore Search поддерживает прямое указание настроек токенизации непосредственно в команде CREATE TABLE . Таким образом, исчезает необходимость создавать внешние файлы при настройке стоп-слов, исключений, словоформ и слов без позиции, делая создание таблиц проще и удобнее для развертывания.

https://habr.com/ru/articles/995662/

#алгоритмы_поиска #оптимизация_базы_данных #fulltext_search #sql #database_optimization

Habr @[email protected] · 2025-09-05 · 07:52 UTC

Недооценённые фичи SQL: PIVOT/UNPIVOT, CROSS APPLY/LATERAL и частичные индексы

В большинстве материалов по SQL обсуждаются знакомые всем конструкции — SELECT , JOIN , WHERE , группировки, простые индексы. Но когда вы обрабатываете сложные данные, оптимизируете производительность или строите аналитические отчёты, ограничиваться только базовыми операторами — значит добровольно усложнять себе жизнь. В SQL есть мощные, но редко упоминаемые функции, которые помогают решить задачи элегантно и эффективно. В этой статье, основанной на личных экспериментах и наблюдениях, мы рассмотрим три таких инструмента: PIVOT / UNPIVOT , CROSS APPLY / LATERAL и частичные (filtered) индексы.

https://habr.com/ru/companies/otus/articles/942044/

#sql #индексы #PIVOT #производительность_запросов #оптимизация_базы_данных #PostgreSQL

#postgresql #оптимизация_базы_данных #производительность_запросов #pivot #индексы #sql

Habr @[email protected] · 2025-07-29 · 09:52 UTC

Оптимизация Redis для высоких нагрузок: полное руководство

Привет, Хабр! На связи Александр Горьев, ведущий разработчик

https://habr.com/ru/companies/selectel/articles/931760/

#selectel #redis #программирование #базы_данных #оптимизация_базы_данных #dbaas

Habr @[email protected] · 2025-07-11 · 10:02 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 3 – ещё три способа шардирования

Всем привет! И снова с вами Илья Криволапов – системный аналитик в SENSE, где мы вместе с командой трудимся над проектом одного из цветных банков РФ. Напоминаю, что в профессии я уже больше пяти лет и, несмотря на фамилию, прод все еще живой и здоровый (ну почти)! В свободное от работы время, я преподаю курс «Хранение и обработка больших объемов данных», где успел накопить немало наблюдений, кейсов и выводов, которые не хочется держать в столе. Поэтому всё самое полезное оформил в цикл статей на Хабре – рассказываю как строить базы данных с прицелом на рост и не сойти с ума под нагрузкой. В первой части мы говорили о базовых стратегиях масштабирования: вертикальной и горизонтальной. Покрутили в руках репликацию, рассмотрели кейсы, когда и как можно к ней обращаться. Во второй углубились в шардинг и разобрали три популярных подхода: по диапазону, хэшу и геозонам. А сегодня будет финальная, третья часть. В ней мы рассмотрим ещё три способа шардирования: директивный, круговой и динамический. Расскажу, как они устроены, когда применяются, в чём их сильные стороны и где скрывается подвох. Материал будет полезен всем, кто проектирует, масштабирует или просто поддерживает «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Финальный рывок – поехали!

https://habr.com/ru/companies/it_sense/articles/926602/

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование #оптимизация_базы_данных #производительность_sql #базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование

Habr @[email protected] · 2025-07-11 · 10:02 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 3 – ещё три способа шардирования

Всем привет! И снова с вами Илья Криволапов – системный аналитик в SENSE, где мы вместе с командой трудимся над проектом одного из цветных банков РФ. Напоминаю, что в профессии я уже больше пяти лет и, несмотря на фамилию, прод все еще живой и здоровый (ну почти)! В свободное от работы время, я преподаю курс «Хранение и обработка больших объемов данных», где успел накопить немало наблюдений, кейсов и выводов, которые не хочется держать в столе. Поэтому всё самое полезное оформил в цикл статей на Хабре – рассказываю как строить базы данных с прицелом на рост и не сойти с ума под нагрузкой. В первой части мы говорили о базовых стратегиях масштабирования: вертикальной и горизонтальной. Покрутили в руках репликацию, рассмотрели кейсы, когда и как можно к ней обращаться. Во второй углубились в шардинг и разобрали три популярных подхода: по диапазону, хэшу и геозонам. А сегодня будет финальная, третья часть. В ней мы рассмотрим ещё три способа шардирования: директивный, круговой и динамический. Расскажу, как они устроены, когда применяются, в чём их сильные стороны и где скрывается подвох. Материал будет полезен всем, кто проектирует, масштабирует или просто поддерживает «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Финальный рывок – поехали!

https://habr.com/ru/companies/it_sense/articles/926602/

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование #оптимизация_базы_данных #производительность_sql #базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование

Habr @[email protected] · 2025-07-11 · 10:02 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 3 – ещё три способа шардирования

Всем привет! И снова с вами Илья Криволапов – системный аналитик в SENSE, где мы вместе с командой трудимся над проектом одного из цветных банков РФ. Напоминаю, что в профессии я уже больше пяти лет и, несмотря на фамилию, прод все еще живой и здоровый (ну почти)! В свободное от работы время, я преподаю курс «Хранение и обработка больших объемов данных», где успел накопить немало наблюдений, кейсов и выводов, которые не хочется держать в столе. Поэтому всё самое полезное оформил в цикл статей на Хабре – рассказываю как строить базы данных с прицелом на рост и не сойти с ума под нагрузкой. В первой части мы говорили о базовых стратегиях масштабирования: вертикальной и горизонтальной. Покрутили в руках репликацию, рассмотрели кейсы, когда и как можно к ней обращаться. Во второй углубились в шардинг и разобрали три популярных подхода: по диапазону, хэшу и геозонам. А сегодня будет финальная, третья часть. В ней мы рассмотрим ещё три способа шардирования: директивный, круговой и динамический. Расскажу, как они устроены, когда применяются, в чём их сильные стороны и где скрывается подвох. Материал будет полезен всем, кто проектирует, масштабирует или просто поддерживает «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Финальный рывок – поехали!

https://habr.com/ru/companies/it_sense/articles/926602/

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование #оптимизация_базы_данных #производительность_sql #базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование

Habr @[email protected] · 2025-07-11 · 10:02 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 3 – ещё три способа шардирования

Всем привет! И снова с вами Илья Криволапов – системный аналитик в SENSE, где мы вместе с командой трудимся над проектом одного из цветных банков РФ. Напоминаю, что в профессии я уже больше пяти лет и, несмотря на фамилию, прод все еще живой и здоровый (ну почти)! В свободное от работы время, я преподаю курс «Хранение и обработка больших объемов данных», где успел накопить немало наблюдений, кейсов и выводов, которые не хочется держать в столе. Поэтому всё самое полезное оформил в цикл статей на Хабре – рассказываю как строить базы данных с прицелом на рост и не сойти с ума под нагрузкой. В первой части мы говорили о базовых стратегиях масштабирования: вертикальной и горизонтальной. Покрутили в руках репликацию, рассмотрели кейсы, когда и как можно к ней обращаться. Во второй углубились в шардинг и разобрали три популярных подхода: по диапазону, хэшу и геозонам. А сегодня будет финальная, третья часть. В ней мы рассмотрим ещё три способа шардирования: директивный, круговой и динамический. Расскажу, как они устроены, когда применяются, в чём их сильные стороны и где скрывается подвох. Материал будет полезен всем, кто проектирует, масштабирует или просто поддерживает «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Финальный рывок – поехали!

https://habr.com/ru/companies/it_sense/articles/926602/

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование #оптимизация_базы_данных #производительность_sql #базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#ошибки_баз_данных #базы_данных_для_высоких_нагрузок #производительность_sql #оптимизация_базы_данных #шардирование #масштабирование_postgresql

Habr @[email protected] · 2025-06-23 · 18:22 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 2 – когда репликации недостаточно и пора использовать шардинг

Всем привет! На связи снова Илья Криволапов — системный аналитик в SENSE, где мы трудимся на проекте одного из цветных банков РФ. Работаю в профессии уже пятый год и, несмотря на мою фамилию, с продом у нас в целом тёплые отношения. Помимо боевых задач, я преподаю курс «Хранение и обработка больших объемов данных» и за это время накопил немало практических кейсов и наблюдений. Всё это добро я решил не держать при себе и собрал самое полезное в виде ультимативного гайда по оптимизации и грамотному проектированию баз данных с расчетом на масштабирование, который сейчас публикую на Хабре. Цикл состоит из 3 частей. В первой мы обсудили два базовых подхода к масштабированию БД: вертикальный и горизонтальный. Поговорили о плюсах, минусах и о том, как делать точно не стоит. Во второй части – то есть сейчас – мы нырнём глубже в мир горизонтального масштабирования и разберем три первых способа шардирования : по диапазону, по хэшу и по географическим зонам. Я расскажу, как каждый из них работает, где пригодится и в каких случаях может дать сбой. Материал по-прежнему будет полезен всем, кто заботится о «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Готовы продолжать? Тогда поехали!

https://habr.com/ru/companies/it_sense/articles/920344/

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование #оптимизация_базы_данных #производительность_sql #базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование

Habr @[email protected] · 2025-06-23 · 18:22 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 2 – когда репликации недостаточно и пора использовать шардинг

Всем привет! На связи снова Илья Криволапов — системный аналитик в SENSE, где мы трудимся на проекте одного из цветных банков РФ. Работаю в профессии уже пятый год и, несмотря на мою фамилию, с продом у нас в целом тёплые отношения. Помимо боевых задач, я преподаю курс «Хранение и обработка больших объемов данных» и за это время накопил немало практических кейсов и наблюдений. Всё это добро я решил не держать при себе и собрал самое полезное в виде ультимативного гайда по оптимизации и грамотному проектированию баз данных с расчетом на масштабирование, который сейчас публикую на Хабре. Цикл состоит из 3 частей. В первой мы обсудили два базовых подхода к масштабированию БД: вертикальный и горизонтальный. Поговорили о плюсах, минусах и о том, как делать точно не стоит. Во второй части – то есть сейчас – мы нырнём глубже в мир горизонтального масштабирования и разберем три первых способа шардирования : по диапазону, по хэшу и по географическим зонам. Я расскажу, как каждый из них работает, где пригодится и в каких случаях может дать сбой. Материал по-прежнему будет полезен всем, кто заботится о «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Готовы продолжать? Тогда поехали!

https://habr.com/ru/companies/it_sense/articles/920344/

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование #оптимизация_базы_данных #производительность_sql #базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование

Habr @[email protected] · 2025-06-23 · 18:22 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 2 – когда репликации недостаточно и пора использовать шардинг

Всем привет! На связи снова Илья Криволапов — системный аналитик в SENSE, где мы трудимся на проекте одного из цветных банков РФ. Работаю в профессии уже пятый год и, несмотря на мою фамилию, с продом у нас в целом тёплые отношения. Помимо боевых задач, я преподаю курс «Хранение и обработка больших объемов данных» и за это время накопил немало практических кейсов и наблюдений. Всё это добро я решил не держать при себе и собрал самое полезное в виде ультимативного гайда по оптимизации и грамотному проектированию баз данных с расчетом на масштабирование, который сейчас публикую на Хабре. Цикл состоит из 3 частей. В первой мы обсудили два базовых подхода к масштабированию БД: вертикальный и горизонтальный. Поговорили о плюсах, минусах и о том, как делать точно не стоит. Во второй части – то есть сейчас – мы нырнём глубже в мир горизонтального масштабирования и разберем три первых способа шардирования : по диапазону, по хэшу и по географическим зонам. Я расскажу, как каждый из них работает, где пригодится и в каких случаях может дать сбой. Материал по-прежнему будет полезен всем, кто заботится о «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Готовы продолжать? Тогда поехали!

https://habr.com/ru/companies/it_sense/articles/920344/

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование #оптимизация_базы_данных #производительность_sql #базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование

Habr @[email protected] · 2025-06-23 · 18:22 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 2 – когда репликации недостаточно и пора использовать шардинг

Всем привет! На связи снова Илья Криволапов — системный аналитик в SENSE, где мы трудимся на проекте одного из цветных банков РФ. Работаю в профессии уже пятый год и, несмотря на мою фамилию, с продом у нас в целом тёплые отношения. Помимо боевых задач, я преподаю курс «Хранение и обработка больших объемов данных» и за это время накопил немало практических кейсов и наблюдений. Всё это добро я решил не держать при себе и собрал самое полезное в виде ультимативного гайда по оптимизации и грамотному проектированию баз данных с расчетом на масштабирование, который сейчас публикую на Хабре. Цикл состоит из 3 частей. В первой мы обсудили два базовых подхода к масштабированию БД: вертикальный и горизонтальный. Поговорили о плюсах, минусах и о том, как делать точно не стоит. Во второй части – то есть сейчас – мы нырнём глубже в мир горизонтального масштабирования и разберем три первых способа шардирования : по диапазону, по хэшу и по географическим зонам. Я расскажу, как каждый из них работает, где пригодится и в каких случаях может дать сбой. Материал по-прежнему будет полезен всем, кто заботится о «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Готовы продолжать? Тогда поехали!

https://habr.com/ru/companies/it_sense/articles/920344/

#репликация #репликация_баз_данных #базы_данных #sql #масштабирование_postgresql #шардирование #оптимизация_базы_данных #производительность_sql #базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#ошибки_баз_данных #базы_данных_для_высоких_нагрузок #производительность_sql #оптимизация_базы_данных #шардирование #масштабирование_postgresql

Habr @[email protected] · 2025-05-29 · 14:52 UTC

Как оптимизировать PostgreSQL и не лишиться сна: разбор для разработчиков

Когда вы разворачиваете веб-приложение, чаще всего у вас веб-сервер, бэкенд, база данных и авторизация оказываются на одном сервере. Первые пользователи, обычно тестировщики и менеджер, счастливы — все летает. Но потом приложение выходит в продакшн и начинается боль. Запросы тормозят и отвечают по пять секунд, CPU не загружен даже на треть, веб-сервер швыряет 504 Gateway Timeout и т. д. И вот вы сидите ночью и чините прод, потому что PostgreSQL — не просто «табличка с данными», а сложный инструмент с кэшем, индексами, буферами и планировщиком запросов. Привет, Хабр! Меня зовут Александр Гришин, я продакт-менеджер в Selectel и отвечаю за развитие

https://habr.com/ru/companies/selectel/articles/913572/

#selectel #postgresql #dbaas #базы_данных #облачные_сервисы #оптимизация_базы_данных

#оптимизация_базы_данных #облачные_сервисы #базы_данных #dbaas #postgresql #selectel

Habr @[email protected] · 2025-05-19 · 16:22 UTC

Как заставить вашу базу данных летать, а не ползать. Часть 1 масштабирование и репликация

Всем привет! Меня зовут Илья Криволапов, тружусь системным аналитиком в SENSE на проекте одного из цветных банков РФ. В профессии я уже пятый год и, несмотря на фамилию, ломал прод всего лишь несколько незначительных раз (надеюсь). На досуге я преподаю в университете дисциплину «Хранение и обработка больших объемов данных» и за все время у меня накопилось много полезной информации. Непростительно хранить такой клад у себя в столе, поэтому я подготовил для читателей Хабра ультимативный гайд по оптимизации или хорошему такому, грамотному проектированию баз данных с расчетом на масштабирование. Всего в цикле будет 3 статьи. В первой поговорим о двух разных подходах масштабирования БД и о том, как лучше его делать и как лучше не делать (Никогда. Пожалуйста). Кому будет полезно? Всем отвечающим за «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам. Согласны? Узнали? Тогда поехали!

https://habr.com/ru/companies/it_sense/articles/910632/

#оптимизация_базы_данных #шардирование #репликация #масштабирование_postgresql #sql #производительность_sql #Базы_данных_для_высоких_нагрузок #ошибки_баз_данных

#ошибки_баз_данных #базы_данных_для_высоких_нагрузок #производительность_sql #sql #масштабирование_postgresql #репликация

Habr @[email protected] · 2025-03-17 · 11:02 UTC

Повышение эффективности аналитических баз данных: кейс «Комус» и Arenadata

Хабр, привет! Современные высоконагруженные системы требуют точной настройки и регулярного мониторинга, чтобы обеспечить стабильную производительность в условиях постоянно растущих объёмов данных. Когда речь идёт о крупной аналитической базе данных, развёрнутой в облачной среде, оптимизация её работы становится критически важной задачей. В прошлой статье мы уже рассказывали о типичных ошибках при работе с Arenadata DB (ADB), о том, как их избежать и значительно повысить производительность кластера. Сегодня же поделимся реальным опытом на примере компании «Комус» — лидера в области B2B-ритейла, которая обратилась к Arenadata за проведением комплексного аудита своего кластера ADB. В этой статье мы детально разобрали, как с помощью анализа и оптимизации удалось выявить точки роста, подготовить кластер к текущим и будущим нагрузкам и предложить план улучшений. Мы рассмотрим технические детали аудита, проблемы, с которыми пришлось столкнуться, и эффективные практики, позволившие повысить производительность аналитической базы данных. Что там с нагрузкой на кластер?

https://habr.com/ru/companies/arenadata/articles/887792/

#arenadata_db #оптимизация_базы_данных #etl #высоконагруженные_системы #highload #партиционирование #аудит #data_analysis #базы_данных #аналитические_базы_данных

#аналитические_базы_данных #базы_данных #data_analysis #аудит #партиционирование #highload

Habr @[email protected] · 2025-03-12 · 12:22 UTC

Жизненный цикл данных под контролем: знакомство с ILM на примере расширения для Postgres Pro Enterprise 17

Если данные в БД растут как на дрожжах, а вместе с ними и расходы на хранение, то пора познакомиться с концепцией управления жизненным циклом информации (ILM). Мы уже внедрили в Postgres Pro Enterprise 17 возможность для внедрения автоматического переноса редко используемых данных в более дешёвые хранилища. Подробности в статье.

https://habr.com/ru/companies/postgrespro/articles/890238/

#iml #postgresql #postgres_pro #управление_данными #хранение_данных #базы_данных #оптимизация_базы_данных

#оптимизация_базы_данных #базы_данных #хранение_данных #управление_данными #postgres_pro #postgresql

Habr @[email protected] · 2025-01-29 · 11:52 UTC

Что нового в Postgres Pro 17: от Proxima до интеллектуального управления данными

Вышел Postgres Pro 17, и этот релиз принесёт улучшения в области производительности и масштабирования. Одно из ключевых нововведений — расширение Proxima, объединяющее функции пулера, прокси и балансировщика нагрузки, интегрированное непосредственно в ядро СУБД. Кроме того, разработчиков ждут новые возможности управлять очередями сообщений, инструменты оптимизации запросов, средства обеспечения безопасности и функции интеллектуального хранения данных. Узнать о нововведениях

https://habr.com/ru/companies/postgrespro/articles/877300/

#postgresql #postgres #безопасность_баз_данных #высокая_производительность #базы_данных #оптимизация_запросов_postgresql #оптимизация_базы_данных #хранение_данных

#хранение_данных #оптимизация_базы_данных #оптимизация_запросов_postgresql #базы_данных #высокая_производительность #безопасность_баз_данных