home.social

#cloudberry — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #cloudberry, aggregated by home.social.

  1. Apache Cloudberry — преемник Greenplum?

    Greenplum много лет был в опенсорсе на GitHub под лицензией Apache 2.0. Казалось бы, лицензия Apache 2.0, что может пойти не так? Осенью 2023 года репозиторий неожиданно перестал принимать наши пул‑реквесты. Все наши CLA отозвали, а новые не подтвердили без каких‑либо пояснений. А в мае 2024-го репозиторий был закрыт. Да, к опенсорс‑проекту могут потерять интерес — и он окажется заброшен. Но здесь, по сути, присвоили наши пул‑реквесты, изменив лицензию у кода, который мы написали, просто потому, что «ничего личного, это бизнес». Обстоятельства менялись, и вот — новые правила использования БД. Твои опыт и достижения либо присваиваются корпорацией, либо обнуляются. В этой статье попробую проанализировать, где вчерашние пользователи и контрибьюторы в Greenplum могут найти решения, у которых есть будущее.

    habr.com/ru/companies/yandex_c

    #greenplum #cloudberry #greengage #ymatrix #apache

  2. Нагрузочное тестирование YMatrix

    Привет, Хабр! На связи Марк — ведущий архитектор группы компаний «ГлоуБайт». Сегодня мы немного расширим результаты нагрузочного тестирования из предыдущей статьи “ Нагрузочное тестирование GP6 vs GP7 vs Cloudberry ” и поделимся результатами тестирования YMatrix. Сразу оговорюсь, что это дополнение к предыдущей статье, для того, чтобы сформировать понимание сравнимости результатов различных форков GreenPlum, поэтому акцентировать внимание будем только на YMatrix. Детали по методике тестирования и как были получены результаты для GP6, GP7 и Cloudberry 1.6, можно прочитать в предыдущей статье по ссылке выше.

    habr.com/ru/companies/glowbyte

    #нагрузочное_тестирование #sql #posgresql #dwh #gp7 #gp6 #ymatrix #glowbyte #cloudberry #tpcds

  3. Гид по Cloudberry ч.2: advanced-возможности, дорожная карта и планы развития

    В прошлый раз, в первой части нашего гида по Apache Cloudberry™ , мы поговорили об истории проекта, его архитектуре, ядре СУБД и функциях платформы. Но помимо ядра СУБД, мы также хотим использовать data‑lakehouse‑запросы. В Data Lakehouse есть некоторые проблемы: мы не можем получать данные оттуда напрямую. В Cloudberry разработана технология, с помощью которой можно это делать, так что поговорим об этом подробнее. А также рассмотрим ещё несколько интересных возможностей и расскажем о планах проекта.

    habr.com/ru/companies/yandex_c

    #greenplum #cloudberry #mpp #postgresql #postgres #vector_database #pgvector #векторная_база_данных

  4. Гид по Apache Cloudberry ч.1: история появления, архитектура и функции

    В конце августа вышел релиз распределённой СУБД Apache Cloudberry 2.0.0 — опенсорс‑проекта, который в режиме инкубации находится в Apache Soft Foundation (ASF). В новой версии состоялся переход на кодовую базу PostgreSQL 14, а также было добавлено множество улучшений. При этом на Хабре до сих пор незаслуженно мало статей, посвящённых этой СУБД. Мы решили исправить это совместно с Максом Янгом, техническим лидером и участником PPMC Apache Cloudberry (Incubating). Эти статьи созданы по материалам совместного митапа Yandex Cloud Data Platform — про Greenplum® и не только . В этот раз пройдёмся по базовым особенностям и функциям этой СУБД, а в следующий — доберёмся до advanced‑возможностей.

    habr.com/ru/companies/yandex_c

    #cloudberry #greenplum #mpp #postgresql

  5. Нагрузочное тестирование GP6 vs GP7 vs Cloudberry

    Привет, Хабр! На связи Марк – ведущий архитектор группы компаний "ГлоуБайт". В этой статье я поделюсь результатами нагрузочного тестирования, которое мы с коллегами провели для сравнения Greenplum 6 с Greenplum 7 и Cloudberry.

    habr.com/ru/companies/glowbyte

    #greenplum #gp6 #gp7 #cloudberry #нагрузочное_тестирование #postgres #sql #data #dwh #tpcds

  6. «Попал в Яндекс через опенсорс»: как коммиты в опенсорсные СУБД помогают развивать продукт и команду

    Привет, Хабр! На связи Андрей Бородин, в Yandex Cloud я руковожу направлением разработки СУБД с открытым исходным кодом — и я попал в Яндекс через опенсорс. Я уже немного рассказывал , что и зачем мы делаем в опенсорсных БД с точки зрения облачных сервисов, где мы развиваем PostgreSQL, Greenplum, Cloudberry, Valkey и другие решения. Но из этих историй часто ускользает человеческая сторона: мы занимаемся опенсорсом не только для того, чтобы сделать решения с открытым кодом более облачными, не только потому, что это модно, но и потому, что это приносит пользу не только продукту, но и самим разработчикам‑контрибьюторам. На масштабах Яндекса возникают нетривиальные задачи, которые интересно решать. А когда мы делимся решениями с сообществом, то можем получить от них новый взгляд на проблему, и продолжить совместную разработку новой фичи в удобном формате: с кем‑то на условиях независимого сотрудничества, а кого‑то можем позвать в команду (как это было и со мной). В общем, если придерживаться опенсорс‑философии, может возникнуть ситуация win‑win. Сегодня с коллегами Леонидом Борчуком @leborchuk и Дмитрием Сарафанниковым расскажу пару историй про то, как это бывает с опенсорсными СУБД.

    habr.com/ru/companies/yandex/a

    #postgresql #greenplum #cloudberry #slru #vacuum #bloat

  7. @plantarum

    This is lovely! Thanks for sharing the link.

    I had no idea these are called bakeapple. I've only travelled in the Scandinavian Arctic where they use "cloudberry" and "multe" instead.

    And I've never seen them in flower, only in fruit. And I didn't know they were connected beneath the ground or that there were male and female plants.

    Wonderful!

    #Bakeapple #Cloudberry #Multe

  8. Первичный анализ производительности запросов в Arenadata DB 6.27 и Cloudberry Database 1.6

    Некоторое время назад руководитель задал мне вопрос: «Какой MPP-кластер лучше с точки зрения разработчика: Arenadata 6 или Cloudberry?» Я рассказал про версии PostgreSQL, лежащие в основе этих кластеров, - 9 и 14 соответственно. Еще сказал, что для детального анализа производительности желательно развернуть кластеры на серверах, заполнить их данными и выполнить побольше разных запросов. Мой ответ руководителю не понравился, пришлось выдумывать методику первичного анализа производительности кластеров «на берегу», до разворачивания на серверах. Оказалось, что интересные данные о производительности кластеров можно получить и на персональном компьютере.

    habr.com/ru/articles/882082/

    #arenadata #mppбазы #cloudberry #производительность #sqlзапросы

  9. #ClimateChange brings cloudberry to Svalbard arctictoday.com/climate-change

    "July 2023 became the warmest ever at the #Arctic archipelago, with an average temperature above 10° Celsius... Although this is the first time ripe #cloudberries are seen, the flowers have been documented at #Svalbard before... For the #cloudberry to ripen, temperatures should be above 10° C combined with little rain."