#apache_iceberg — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-14 · 11:02 UTC

DWH в 2026: четыре зоны вместо Inmon, Kimball и Data Vault 2.0

Когда инженер слышит «нам нужно хранилище данных», задача редко звучит однозначно. Кто-то задыхается на боевой OLTP-базе под аналитической нагрузкой. Кто-то впервые строит BI и не понимает, с какого края подходить. У кого-то накопились данные из десятка систем-источников, и существующих средств уже не хватает. У всех «хранилище». А правильный технический ответ зависит от условий задачи. За годы работы в банках, ритейле и системной интеграции мы пришли к простой картине: для среднего и крупного бизнеса большинство DWH-проектов сводится к четырёхзонной архитектуре поверх двух специализированных движков. Не Inmon, не Kimball-star-schema, не Data Vault 2.0 - и при этом не «modern data stack как у Databricks один-в-один». В этой статье разберу архитектуру по зонам, потом честно скажу что осталось живо от классических методологий и где они продолжают работать, а где безнадёжно отстали от колоночной эры. И в конце - типичные ошибки, которые наблюдаем в проектах коллег и собственных пилотах.

https://habr.com/ru/articles/1035136/

#dwh #data_warehouse #clickhouse #apache_iceberg #trino #lakehouse #data_engineering #архитектура_данных #data_vault #dba

#dba #data_vault #архитектура_данных #data_engineering #lakehouse #trino

Habr @[email protected] · 2026-05-14 · 11:02 UTC

DWH в 2026: четыре зоны вместо Inmon, Kimball и Data Vault 2.0

Когда инженер слышит «нам нужно хранилище данных», задача редко звучит однозначно. Кто-то задыхается на боевой OLTP-базе под аналитической нагрузкой. Кто-то впервые строит BI и не понимает, с какого края подходить. У кого-то накопились данные из десятка систем-источников, и существующих средств уже не хватает. У всех «хранилище». А правильный технический ответ зависит от условий задачи. За годы работы в банках, ритейле и системной интеграции мы пришли к простой картине: для среднего и крупного бизнеса большинство DWH-проектов сводится к четырёхзонной архитектуре поверх двух специализированных движков. Не Inmon, не Kimball-star-schema, не Data Vault 2.0 - и при этом не «modern data stack как у Databricks один-в-один». В этой статье разберу архитектуру по зонам, потом честно скажу что осталось живо от классических методологий и где они продолжают работать, а где безнадёжно отстали от колоночной эры. И в конце - типичные ошибки, которые наблюдаем в проектах коллег и собственных пилотах.

https://habr.com/ru/articles/1035136/

#dwh #data_warehouse #clickhouse #apache_iceberg #trino #lakehouse #data_engineering #архитектура_данных #data_vault #dba

#dba #data_vault #архитектура_данных #data_engineering #lakehouse #trino

Habr @[email protected] · 2026-05-14 · 11:02 UTC

DWH в 2026: четыре зоны вместо Inmon, Kimball и Data Vault 2.0

Когда инженер слышит «нам нужно хранилище данных», задача редко звучит однозначно. Кто-то задыхается на боевой OLTP-базе под аналитической нагрузкой. Кто-то впервые строит BI и не понимает, с какого края подходить. У кого-то накопились данные из десятка систем-источников, и существующих средств уже не хватает. У всех «хранилище». А правильный технический ответ зависит от условий задачи. За годы работы в банках, ритейле и системной интеграции мы пришли к простой картине: для среднего и крупного бизнеса большинство DWH-проектов сводится к четырёхзонной архитектуре поверх двух специализированных движков. Не Inmon, не Kimball-star-schema, не Data Vault 2.0 - и при этом не «modern data stack как у Databricks один-в-один». В этой статье разберу архитектуру по зонам, потом честно скажу что осталось живо от классических методологий и где они продолжают работать, а где безнадёжно отстали от колоночной эры. И в конце - типичные ошибки, которые наблюдаем в проектах коллег и собственных пилотах.

https://habr.com/ru/articles/1035136/

#dwh #data_warehouse #clickhouse #apache_iceberg #trino #lakehouse #data_engineering #архитектура_данных #data_vault #dba

#dba #data_vault #архитектура_данных #data_engineering #lakehouse #trino

Habr @[email protected] · 2026-05-14 · 11:02 UTC

DWH в 2026: четыре зоны вместо Inmon, Kimball и Data Vault 2.0

Когда инженер слышит «нам нужно хранилище данных», задача редко звучит однозначно. Кто-то задыхается на боевой OLTP-базе под аналитической нагрузкой. Кто-то впервые строит BI и не понимает, с какого края подходить. У кого-то накопились данные из десятка систем-источников, и существующих средств уже не хватает. У всех «хранилище». А правильный технический ответ зависит от условий задачи. За годы работы в банках, ритейле и системной интеграции мы пришли к простой картине: для среднего и крупного бизнеса большинство DWH-проектов сводится к четырёхзонной архитектуре поверх двух специализированных движков. Не Inmon, не Kimball-star-schema, не Data Vault 2.0 - и при этом не «modern data stack как у Databricks один-в-один». В этой статье разберу архитектуру по зонам, потом честно скажу что осталось живо от классических методологий и где они продолжают работать, а где безнадёжно отстали от колоночной эры. И в конце - типичные ошибки, которые наблюдаем в проектах коллег и собственных пилотах.

https://habr.com/ru/articles/1035136/

#dwh #data_warehouse #clickhouse #apache_iceberg #trino #lakehouse #data_engineering #архитектура_данных #data_vault #dba

#dwh #data_warehouse #clickhouse #apache_iceberg #trino #lakehouse

Habr @[email protected] · 2026-01-07 · 08:22 UTC

Как JOIN изменил наш подход к инфраструктуре данных в NAVER

После миграции с ClickHouse на StarRocks NAVER существенно оптимизировала обработку многотабличных JOIN. StarRocks повысил производительность запросов, обеспечил бесшовное масштабирование и позволил построить единый слой запросов, совместимый с множеством источников данных. Эти улучшения позволили предоставлять инсайты в реальном времени и поддерживать принятие решений на основе данных во всей экосистеме NAVER.

https://habr.com/ru/articles/983356/

#StarRocks #ClickHouse #Apache_Iceberg #Lakehouse #JOIN #OLAP #Kubernetes #материализованные_представления #federated_analytics #аналитика_в_реальном_времени

#аналитика_в_реальном_времени #federated_analytics #материализованные_представления #kubernetes #olap #join

Habr @[email protected] · 2026-01-07 · 08:22 UTC

Как JOIN изменил наш подход к инфраструктуре данных в NAVER

После миграции с ClickHouse на StarRocks NAVER существенно оптимизировала обработку многотабличных JOIN. StarRocks повысил производительность запросов, обеспечил бесшовное масштабирование и позволил построить единый слой запросов, совместимый с множеством источников данных. Эти улучшения позволили предоставлять инсайты в реальном времени и поддерживать принятие решений на основе данных во всей экосистеме NAVER.

https://habr.com/ru/articles/983356/

#StarRocks #ClickHouse #Apache_Iceberg #Lakehouse #JOIN #OLAP #Kubernetes #материализованные_представления #federated_analytics #аналитика_в_реальном_времени

#аналитика_в_реальном_времени #federated_analytics #материализованные_представления #kubernetes #olap #join

Habr @[email protected] · 2026-01-07 · 08:22 UTC

Как JOIN изменил наш подход к инфраструктуре данных в NAVER

После миграции с ClickHouse на StarRocks NAVER существенно оптимизировала обработку многотабличных JOIN. StarRocks повысил производительность запросов, обеспечил бесшовное масштабирование и позволил построить единый слой запросов, совместимый с множеством источников данных. Эти улучшения позволили предоставлять инсайты в реальном времени и поддерживать принятие решений на основе данных во всей экосистеме NAVER.

https://habr.com/ru/articles/983356/

#StarRocks #ClickHouse #Apache_Iceberg #Lakehouse #JOIN #OLAP #Kubernetes #материализованные_представления #federated_analytics #аналитика_в_реальном_времени

#аналитика_в_реальном_времени #federated_analytics #материализованные_представления #kubernetes #olap #join

Habr @[email protected] · 2026-01-07 · 08:22 UTC

Как JOIN изменил наш подход к инфраструктуре данных в NAVER

После миграции с ClickHouse на StarRocks NAVER существенно оптимизировала обработку многотабличных JOIN. StarRocks повысил производительность запросов, обеспечил бесшовное масштабирование и позволил построить единый слой запросов, совместимый с множеством источников данных. Эти улучшения позволили предоставлять инсайты в реальном времени и поддерживать принятие решений на основе данных во всей экосистеме NAVER.

https://habr.com/ru/articles/983356/

#StarRocks #ClickHouse #Apache_Iceberg #Lakehouse #JOIN #OLAP #Kubernetes #материализованные_представления #federated_analytics #аналитика_в_реальном_времени

#starrocks #clickhouse #apache_iceberg #lakehouse #join #olap

Habr @[email protected] · 2025-12-04 · 06:52 UTC

StarRocks 4.0: Real-Time Intelligence on Lakehouse

StarRocks 4.0: Real‑Time Intelligence on Lakehouse. Сквозная оптимизация конвейера в реальном времени, 3–15× ускорение JSON, SQL Plan Manager, Decimal256 и поддержка Apache Iceberg для нативной Lakehouse‑аналитики.

https://habr.com/ru/articles/973110/

#Lakehouse #Apache_Iceberg #аналитика_в_реальном_времени #JSON #SQL_Plan_Manager #starrocks

#starrocks #sql_plan_manager #json #аналитика_в_реальном_времени #apache_iceberg #lakehouse

Habr @[email protected] · 2025-12-02 · 06:02 UTC

Как мы строили хранилище на 70 ПБ данных и не планируем останавливаться

Привет, сегодня я расскажу о том, как наша команда строила платформу обработки и хранения данных для обучения GenAI-моделей в Сбере, и как мы выросли до 70 ПБ сырых данных. Меня зовут Александр, я работаю в Сбере и два года занимался развитием этой платформы.

https://habr.com/ru/companies/sberbank/articles/972078/

#Apache_Spark #apache_iceberg #parquet #s3 #big_data

#big_data #s3 #parquet #apache_iceberg #apache_spark

Habr @[email protected] · 2025-11-05 · 16:02 UTC

Оптимизация производительности запросов: мощный тандем StarRocks и Apache Iceberg

Apache Iceberg — табличный формат для озёр данных с поддержкой ACID, Schema Evolution, Hidden Partition и версионирования, но при больших метаданных и работе через S3 страдает планирование запросов и латентность. В связке со StarRocks мы показываем, как распределённый Job Plan, Manifest Cache, CBO с гистограммами, Data Cache и материализованные представления выводят lakehouse‑аналитику на уровень DWH: снижают накладные расходы на метаданные, ускоряют планы и выполнение, а запись обратно в Iceberg сохраняет единый источник истины. Разбираем архитектуру Iceberg, типовые узкие места и практики оптимизации на StarRocks 3.2–3.3, включая кейс WeChat/Tencent.

https://habr.com/ru/articles/963410/

#apache_iceberg #starrocks #lakehouse #data_analysis #data_lake #parquet #manifest #materialized_views

#apache_iceberg #starrocks #lakehouse #data_analysis #data_lake #parquet

:rss: DevelopersIO @[email protected] · 2025-08-31 · 05:09 UTC

【Apache Iceberg】Apache IcebergのブランチとGlue Data QualityでWAPパターンのデータ品質管理をやってみる
https://dev.classmethod.jp/articles/apache-iceberg-branch-glue-data-quality-wap/

#dev_classmethod #Apache_Iceberg #AWS #AWS_Glue_Data_Quality #AWS_Glue

#dev_classmethod #apache_iceberg #aws #aws_glue_data_quality #aws_glue

:rss: DevelopersIO @[email protected] · 2025-06-29 · 04:56 UTC

[セッションレポート] オープンテーブルフォーマットで実現する、大規模データ分析基盤の構築と運用 #AWSSummit
https://dev.classmethod.jp/articles/aws-summit-japan-2025-otf-data-analysis-basis-aws-47/

#dev_classmethod #AWS #SageMaker_Lakehouse #Apache_Iceberg

#awssummit #dev_classmethod #aws #sagemaker_lakehouse #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-06-26 · 04:46 UTC

【セッションレポート】オープンテーブルフォーマットで実現する、大規模データ分析基盤の構築と運用 (AWS-47) #AWSSummit
https://dev.classmethod.jp/articles/aws-summit-tokyo-2025-session-report-aws-47/

#dev_classmethod #AWS #Apache_Iceberg #Amazon_SageMaker #SageMaker_Lakehouse

#awssummit #dev_classmethod #aws #apache_iceberg #amazon_sagemaker #sagemaker_lakehouse

:rss: DevelopersIO @[email protected] · 2025-06-24 · 15:05 UTC

Google CloudのIceberg「BigLake tables for Apache Iceberg in BigQuery」を試しつつ気になるトピックを調べてみた
https://dev.classmethod.jp/articles/google-cloud-iceberg-biglake-tables-for-apache-iceberg-in-bigquery/

#dev_classmethod #Google_BigQuery #Google_Cloud_GCP #Apache_Iceberg

#dev_classmethod #google_bigquery #google_cloud_gcp #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-06-13 · 08:02 UTC

【Iceberg】S3汎用バケットとS3 TablesにおけるIcebergパーティション追加設定の違い
https://dev.classmethod.jp/articles/iceberg-s3gp-s3tables-iceberg-add-partition/

#dev_classmethod #Apache_Iceberg #Amazon_S3 #S3_Tables #AWS_Glue

#dev_classmethod #apache_iceberg #amazon_s3 #s3_tables #aws_glue

:rss: DevelopersIO @[email protected] · 2025-06-02 · 10:08 UTC

[登壇レポート] Storage JAWS & BigData JAWS 共同開催 ~ S3×Icebergが切り拓く、OTF時代の分析基盤 ~ 「S3 Tables を図解でやさしくおさらい～基本から QuickSight 連携まで」という内容で登壇してきました #storagejaws #bdjaws #jawsug
https://dev.classmethod.jp/articles/s3-tables-illustrated-basics-quicksight/

#dev_classmethod #S3_Tables #Apache_Iceberg #AWS #イベント #JAWS_UG

#storagejaws #bdjaws #jawsug #dev_classmethod #s3_tables #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-05-28 · 01:49 UTC

【AWS Glue】Glueジョブでdynamic_frameをソースに利用したらキャストエラーで困った話
https://dev.classmethod.jp/articles/aws-glue-glue-dynamic-frame-cast-error/

#dev_classmethod #AWS_Glue #Apache_Spark #PySpark #Apache_Iceberg

#dev_classmethod #aws_glue #apache_spark #pyspark #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-05-27 · 06:51 UTC

【S3 Tables】メンテナンスジョブのファイル圧縮について調べてみよう
https://dev.classmethod.jp/articles/s3-tables-file-compaction/

#dev_classmethod #S3_Tables #Amazon_S3 #Apache_Iceberg

#dev_classmethod #s3_tables #amazon_s3 #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-05-24 · 08:04 UTC

DuckDBでCloudShellやローカルPCからIceberg tableへSelectしてみた
https://dev.classmethod.jp/articles/tried-duckdb-iceberg-select-cloudshell-local-pc/

#dev_classmethod #DuckDB #Apache_Iceberg

#dev_classmethod #duckdb #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-04-10 · 06:30 UTC

【Databricks】Iceberg REST catalogを利用してPyIcebergでアクセスしてみた
https://dev.classmethod.jp/articles/databricks-iceberg-rest-catalog-pyiceberg/

#dev_classmethod #Databricks #Apache_Iceberg #Python #Amazon_S3 #SQL

#dev_classmethod #databricks #apache_iceberg #python #amazon_s3 #sql

:rss: DevelopersIO @[email protected] · 2025-04-09 · 23:32 UTC

【小ネタ】 Amazon AthenaのMERGE INTOでIcebergテーブルへのソースデータ重複を検証
https://dev.classmethod.jp/articles/athena-iceberg-merge-into-duplicate-source-behavior/

#dev_classmethod #Amazon_Athena #Apache_Iceberg

#dev_classmethod #amazon_athena #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-03-31 · 08:35 UTC

LambdaからDuckDBを使って、S3 TablesのIcebergテーブルにアクセスしてみた
https://dev.classmethod.jp/articles/try-to-access-iceberg-in-s3-tables-from-lambda-using-duckdb/

#dev_classmethod #S3_Tables #DuckDB #Apache_Iceberg #AWS

#dev_classmethod #s3_tables #duckdb #apache_iceberg #aws

:rss: DevelopersIO @[email protected] · 2025-03-21 · 02:23 UTC

AWS FirehoseでApache Icebergテーブルに配信する際の「一意のキー設定」と「JSONQuery式（JQ式）」の違いについて
https://dev.classmethod.jp/articles/aws-firehose-s3-tables-jq-unique-keys-difference/

#dev_classmethod #AWS #Amazon_Data_Firehose #Amazon_S3 #S3_Tables #Apache_Iceberg

#dev_classmethod #aws #amazon_data_firehose #amazon_s3 #s3_tables #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-03-21 · 00:48 UTC

S3 Tables 向けの Iceberg REST Catalog API が追加されたので、PyIcebergからアクセスしてみた。
https://dev.classmethod.jp/articles/add-s3-tables-iceberg-rest-catalog-api/

#dev_classmethod #S3_Tables #Apache_Iceberg #AWS_Lambda #AWS

#dev_classmethod #s3_tables #apache_iceberg #aws_lambda #aws

:rss: DevelopersIO @[email protected] · 2025-03-18 · 02:41 UTC

【S3 Tables】スナップショット削除の実行タイミングを確認してみた
https://dev.classmethod.jp/articles/s3-tables-snapshots-delete-schedule/

#dev_classmethod #S3_Tables #Amazon_S3 #Apache_Iceberg

#dev_classmethod #s3_tables #amazon_s3 #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-03-07 · 10:29 UTC

【S3 Tables】ローカルのVSCodeからS3 Tables上のIcebergテーブルを触りたい
https://dev.classmethod.jp/articles/s3-tables-iceberg-local-vscode/

#dev_classmethod #Apache_Iceberg #S3_Tables #Amazon_S3 #Python

#dev_classmethod #apache_iceberg #s3_tables #amazon_s3 #python

:rss: DevelopersIO @[email protected] · 2025-03-05 · 08:34 UTC

【S3 Tables】汎用バケットで作成したIcebergのテーブルをそのままS3Tablesに移行できるのか？
https://dev.classmethod.jp/articles/s3-tables-iceberg-migration/

#dev_classmethod #S3_Tables #Amazon_S3 #Apache_Iceberg

#dev_classmethod #s3_tables #amazon_s3 #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-03-05 · 03:52 UTC

PyIcebergを使ってLambdaからS3 TablesのIcebergテーブルに書き込んでみる
https://dev.classmethod.jp/articles/tried-to-write-to-iceberg-tables-in-s3-tables-from-lambda-using-pyiceberg/

#dev_classmethod #AWS #S3_Tables #Apache_Iceberg #AWS_Lambda

#dev_classmethod #aws #s3_tables #apache_iceberg #aws_lambda

:rss: DevelopersIO @[email protected] · 2025-03-03 · 01:45 UTC

Amazon Athenaから利用する際のAWS GlueのIcebergテーブルについて、メンテナンスコマンドの必要性をまとめてみた
https://dev.classmethod.jp/articles/amazon-athena-glue-iceberg-table-maintenance-command-knowledge/

#dev_classmethod #AWS #Amazon_Athena #Apache_Iceberg #AWS_Glue

#dev_classmethod #aws #amazon_athena #apache_iceberg #aws_glue

:rss: DevelopersIO @[email protected] · 2025-02-28 · 04:21 UTC

[登壇レポート]Apache Icebergと超えていくデータレイクの限界 -S3とSnowflake活用事例-でSnowflake×Icebergの機能と活用例についてお話しました #datalake_findy
https://dev.classmethod.jp/articles/speeking-report-findy-iceberg-s3-snowflake/

#dev_classmethod #Snowflake #Apache_Iceberg

#datalake_findy #dev_classmethod #snowflake #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-02-25 · 04:53 UTC

Amazon AthenaのIcebergテーブルのメタデータと使い所
https://dev.classmethod.jp/articles/amazon-athena-iceberg-table-metadata-usecase/

#dev_classmethod #AWS #Apache_Iceberg #Amazon_Athena

#dev_classmethod #aws #apache_iceberg #amazon_athena

:rss: DevelopersIO @[email protected] · 2025-02-17 · 12:39 UTC

Amazon S3 Tables の Iceberg テーブルに Amazon Athenaから更新クエリを試す！（今更だったらゴメンね）
https://dev.classmethod.jp/articles/amazon-s3-tables-update-query-using-athena/

#dev_classmethod #AWS #S3_Tables #Amazon_Athena #Apache_Iceberg

#dev_classmethod #aws #s3_tables #amazon_athena #apache_iceberg

:rss: DevelopersIO @[email protected] · 2025-02-14 · 08:00 UTC

【Glue/Iceberg】S3に置いたデータIcebergテーブルへ連携するGlueを自動化してみる
https://dev.classmethod.jp/articles/s3-apache-iceberg-glue-etl-automation/

#dev_classmethod #AWS #Amazon_S3 #Apache_Iceberg #AWS_Step_Functions #AWS_Glue #Amazon_EventBridge #Amazon_Athena

#dev_classmethod #aws #amazon_s3 #apache_iceberg #aws_step_functions #aws_glue

:rss: DevelopersIO @[email protected] · 2025-02-13 · 17:05 UTC

BigQuery tables for Apache Icebergで定義されたテーブルをSnowflakeのIceberg Tableとしてクエリできるようにしてみた
https://dev.classmethod.jp/articles/bigquery-tables-for-apache-iceberg-to-snowflake-iceberg-table/

#dev_classmethod #Snowflake #Google_BigQuery #Apache_Iceberg

#dev_classmethod #snowflake #google_bigquery #apache_iceberg

:rss: DevelopersIO @[email protected] · 2024-12-30 · 13:59 UTC

Amazon S3 Table の「メンテナンス」を設定してみた
https://dev.classmethod.jp/articles/amazon-s3-table-maintenance/

#dev_classmethod #S3_Tables #Amazon_S3 #Apache_Iceberg

#dev_classmethod #s3_tables #amazon_s3 #apache_iceberg

:rss: DevelopersIO @[email protected] · 2024-12-20 · 07:38 UTC

「祝！Iceberg祭開幕！re:Invent 2024データレイク関連アップデート10分総ざらい」という登壇をしました #regrowth_osaka
https://dev.classmethod.jp/articles/regrowth-osaka-2024-iceberg-festival/

#dev_classmethod #Apache_Iceberg #AWS #S3_Tables #S3_Metadata #Amazon_Data_Firehose

#regrowth_osaka #dev_classmethod #apache_iceberg #aws #s3_tables #s3_metadata

:rss: DevelopersIO @[email protected] · 2024-12-18 · 16:16 UTC

[レポート]Apache Iceberg を使用してリアルタイムの洞察のためのオープンテーブルデータレイクを構築する #AWSreInvent
https://dev.classmethod.jp/articles/reinvent2024-ant402-iceberg-realtime-insight/

#dev_classmethod #AWS #Apache_Iceberg #Apache_Spark #AWS_Glue_Data_Catalog

#awsreinvent #dev_classmethod #aws #apache_iceberg #apache_spark #aws_glue_data_catalog

:rss: DevelopersIO @[email protected] · 2024-12-18 · 04:39 UTC

DockerでローカルにIceberg + Spark環境を構築し、DBeaverで接続してみた
https://dev.classmethod.jp/articles/docker-iceberg-spark-dbeaver/

#dev_classmethod #Docker #Docker_Compose #Apache_Iceberg #Apache_Spark #DBeaver

#dev_classmethod #docker #docker_compose #apache_iceberg #apache_spark #dbeaver

Habr @[email protected] · 2024-10-18 · 06:12 UTC

Инфраструктура для Data-Engineer Data Lake Apache Iceberg

В этой статье вы узнаете что такое Apache Iceberg, как его можно использовать и для чего он вообще нужен. В статье также рассматривается вопрос Data Lake.

https://habr.com/ru/articles/850674/

#data #data_lake #data_engineering #data_engineer #apache_spark #apache_iceberg #sql #дата_лейк #озеро_данных #datalakehouse

#data #data_lake #data_engineering #data_engineer #apache_spark #apache_iceberg