#duckdb — Public Fediverse posts on home.social

Jason Punyon @jasonpunyon · 2026-05-14 · 14:15 UTC

#duckdb has client-server now. game changer.

#duckdb

N-gated Hacker News @[email protected] · 2026-05-12 · 19:47 UTC

🚨 Breaking news! 🚨 In a groundbreaking development nobody asked for, we now have "Quack," the #DuckDB client-server #protocol, because clearly what the world needs is more DB protocols named after waterfowl. 🦆🌊 Thank you, tech industry, for yet again overcomplicating the simple task of fetching data! 🎉🙄
https://duckdb.org/2026/05/12/quack-remote-protocol #QuackDB #DatabaseTech #Overcomplication #DataFetching #HackerNews #ngated

#duckdb #protocol #quackdb #databasetech #overcomplication #datafetching

Hacker News @[email protected] · 2026-05-12 · 19:47 UTC

Quack: The DuckDB Client-Server Protocol

https://duckdb.org/2026/05/12/quack-remote-protocol

#HackerNews #Quack #DuckDB #Client #Server #Protocol #Database #Technology #OpenSource #DataAnalytics

#hackernews #quack #duckdb #client #server #protocol

Hacker News @[email protected] · 2026-05-12 · 19:47 UTC

Quack: The DuckDB Client-Server Protocol

https://duckdb.org/2026/05/12/quack-remote-protocol

#HackerNews #Quack #DuckDB #Client #Server #Protocol #Database #Technology #OpenSource #DataAnalytics

#hackernews #quack #duckdb #client #server #protocol

Hacker News @[email protected] · 2026-05-12 · 19:47 UTC

Quack: The DuckDB Client-Server Protocol

https://duckdb.org/2026/05/12/quack-remote-protocol

#HackerNews #Quack #DuckDB #Client #Server #Protocol #Database #Technology #OpenSource #DataAnalytics

#hackernews #quack #duckdb #client #server #protocol

Hacker News @[email protected] · 2026-05-12 · 19:47 UTC

Quack: The DuckDB Client-Server Protocol

https://duckdb.org/2026/05/12/quack-remote-protocol

#HackerNews #Quack #DuckDB #Client #Server #Protocol #Database #Technology #OpenSource #DataAnalytics

#dataanalytics #opensource #technology #database #protocol #server

Hacker News @[email protected] · 2026-05-12 · 19:47 UTC

Quack: The DuckDB Client-Server Protocol

https://duckdb.org/2026/05/12/quack-remote-protocol

#HackerNews #Quack #DuckDB #Client #Server #Protocol #Database #Technology #OpenSource #DataAnalytics

#hackernews #quack #duckdb #client #server #protocol

Katharina Brunner @[email protected] · 2026-05-08 · 11:14 UTC

How to get the Openstreetmap buildings/polygones from a list of addresses

https://katharinabrunner.de/2026/05/how-to-get-the-openstreetmap-buildings-polygones-from-a-list-of-addresses/

#duckdb #geocoding #openstreetmap #osm

Spatialists @[email protected] · 2026-05-07 · 21:44 UTC

Joining 130 million points: Dewey Dunnington revisits his 2024 benchmark of #spatialjoin operations on 130 million points, now testing #SedonaDB and #DuckDB #Spatial in comparison to the original tools. The results are remarkable: 6 seconds on a laptop replacing 3-5 minutes...
https://spatialists.ch/posts/2026/05/07-joining-130-million-points/ #GIS #GISchat #geospatial #SwissGIS

#spatialjoin #sedonadb #duckdb #spatial #gis #gischat

InfoQ @[email protected] · 2026-05-07 · 05:00 UTC

DuckDB Labs released #DuckLake 1.0 - a data lake format that stores table metadata in a SQL database, rather than spreading it across object storage files.

Key features:
• catalog-stored small updates
• improved sorting and partitioning
• compatibility with Iceberg-style data features

Learn more ⇨ https://bit.ly/48PsPIS

#InfoQ #DuckDB #ApacheIceberg #AI #DataLake #DataStorage

#ducklake #infoq #duckdb #apacheiceberg #ai #datalake

InfoQ @[email protected] · 2026-05-07 · 05:00 UTC

DuckDB Labs released #DuckLake 1.0 - a data lake format that stores table metadata in a SQL database, rather than spreading it across object storage files.

Key features:
• catalog-stored small updates
• improved sorting and partitioning
• compatibility with Iceberg-style data features

Learn more ⇨ https://bit.ly/48PsPIS

#InfoQ #DuckDB #ApacheIceberg #AI #DataLake #DataStorage

#ducklake #infoq #duckdb #apacheiceberg #ai #datalake

InfoQ @[email protected] · 2026-05-07 · 05:00 UTC

DuckDB Labs released #DuckLake 1.0 - a data lake format that stores table metadata in a SQL database, rather than spreading it across object storage files.

Key features:
• catalog-stored small updates
• improved sorting and partitioning
• compatibility with Iceberg-style data features

Learn more ⇨ https://bit.ly/48PsPIS

#InfoQ #DuckDB #ApacheIceberg #AI #DataLake #DataStorage

#datastorage #datalake #ai #apacheiceberg #duckdb #infoq

InfoQ @infoq · 2026-05-07 · 05:00 UTC

DuckDB Labs released #DuckLake 1.0 - a data lake format that stores table metadata in a SQL database, rather than spreading it across object storage files.

Key features:
• catalog-stored small updates
• improved sorting and partitioning
• compatibility with Iceberg-style data features

Learn more ⇨ https://bit.ly/48PsPIS

#InfoQ #DuckDB #ApacheIceberg #AI #DataLake #DataStorage

#ducklake #infoq #duckdb #apacheiceberg #ai #datalake

hasamba @[email protected] · 2026-04-22 · 09:59 UTC

----------------

🛠️ Tool
===================

Opening: Mecha Hayabusa is a tool that bridges the Hayabusa Windows event log CSV output with large language models using the Model Context Protocol (MCP). The project aims to enable a structured, LLM-driven DFIR workflow rather than a simple free-text search over logs.

Key Features:
• Automatic ingestion of Hayabusa CSV timelines into a local DuckDB instance to enable fast, structured queries over large log datasets.
• Read-only SQL execution against the logs table with built-in safety constraints to avoid destructive operations.
• Cross-field search, dataset profiling, time-window summarization, and host-centric timeline assembly for focused investigations.
• Extraction of Indicators of Compromise (IOCs), aggregation of rule titles, and parsing of Details fields from Hayabusa output.
• Base64 PowerShell decoding and correlation routines to identify lateral movement patterns across hosts.
• A dedicated investigation skill that codifies a DFIR workflow and supports standardized incident report generation in Japanese and English.

Technical Implementation:
Mecha Hayabusa converts Hayabusa CSV timelines into a local DuckDB database, exposing read-only query capabilities and structured summarization endpoints over an MCP-compatible HTTP transport. The system exposes dataset management (list, switch, unload), profiling endpoints, and specialized analysis primitives (IOC extraction, PowerShell decoding, lateral correlation). Integration with LLMs is mediated through MCP, allowing the model to orchestrate a sequence of analysis steps (triage, hypothesis development, host-level deep dives, and report generation) rather than returning isolated search hits.

Use Cases:
• Incident responders who need rapid host-centric timelines and cross-host correlation from exported Hayabusa results.
• Threat hunters seeking automated ATT&CK tactic classification and IOC extraction from large CSV exports.
• Organizations that want consistent, LLM-assisted incident reports in multiple languages, improving repeatability of DFIR workflows.

Limitations:
• Functionality depends on structured Hayabusa CSV exports; format deviations will reduce effectiveness.
• The system performs read-only SQL and analysis; it is not designed for endpoint remediation or live collection.
• Accuracy of natural-language summaries and report content depends on the connected LLM and its prompt/context handling.

Closing:
Mecha Hayabusa represents a targeted approach to integrating structured log storage (DuckDB) with LLM orchestration via MCP to operationalize repeatable DFIR investigations and report generation. #tool #DFIR #MCP #DuckDB #Hayabusa

🔗 Source: https://github.com/Yamato-Security/mecha-hayabusa

#hayabusa #duckdb #mcp #dfir #tool

🔏 Matthias Wiesmann @[email protected] · 2026-04-21 · 11:53 UTC

Today I discovered duckdb, a nice tool to query structured files like CSV or JSON, so you run commands like:

duckdb -c "SELECT * FROM 'whatever.csv' WHERE item_count > 100000"

And you get a pretty table in the CLI, you can also output to JSON…

#duckdb #csv #json #cli

🔏 Matthias Wiesmann @[email protected] · 2026-04-21 · 11:53 UTC

Today I discovered duckdb, a nice tool to query structured files like CSV or JSON, so you run commands like:

duckdb -c "SELECT * FROM 'whatever.csv' WHERE item_count > 100000"

And you get a pretty table in the CLI, you can also output to JSON…

#duckdb #csv #json #cli

🔏 Matthias Wiesmann @[email protected] · 2026-04-21 · 11:53 UTC

Today I discovered duckdb, a nice tool to query structured files like CSV or JSON, so you run commands like:

duckdb -c "SELECT * FROM 'whatever.csv' WHERE item_count > 100000"

And you get a pretty table in the CLI, you can also output to JSON…

#duckdb #csv #json #cli

🔏 Matthias Wiesmann @[email protected] · 2026-04-21 · 11:53 UTC

Today I discovered duckdb, a nice tool to query structured files like CSV or JSON, so you run commands like:

duckdb -c "SELECT * FROM 'whatever.csv' WHERE item_count > 100000"

And you get a pretty table in the CLI, you can also output to JSON…

#duckdb #csv #json #cli

#cli #json #csv #duckdb

🔏 Matthias Wiesmann @[email protected] · 2026-04-21 · 11:53 UTC

Today I discovered duckdb, a nice tool to query structured files like CSV or JSON, so you run commands like:

duckdb -c "SELECT * FROM 'whatever.csv' WHERE item_count > 100000"

And you get a pretty table in the CLI, you can also output to JSON…

#duckdb #csv #json #cli

Habr @[email protected] · 2026-04-16 · 12:02 UTC

[Перевод] Укрощение «диких» CSV: продвинутые техники DuckDB для инженеров данных

CSV-файлы редко бывают такими простыми, какими кажутся на первый взгляд. За внешней структурой часто скрываются проблемы с типами, разделителями, схемами и «сломанными» строками, из-за которых загрузка данных превращается в цепочку костылей и ручной предобработки. В этой статье — практический разбор того, как DuckDB позволяет диагностировать и обрабатывать такие случаи прямо в SQL: от понимания того, как система интерпретирует файл, до устойчивой загрузки и работы с неконсистентными данными. Разобраться в CSV

https://habr.com/ru/companies/otus/articles/1024158/

#CSV #DuckDB #обработка_данных #грязные_данные #качество_данных #импорт_данных #data_engineering #etl

#etl #data_engineering #импорт_данных #качество_данных #грязные_данные #обработка_данных

Habr @[email protected] · 2026-04-16 · 12:02 UTC

[Перевод] Укрощение «диких» CSV: продвинутые техники DuckDB для инженеров данных

CSV-файлы редко бывают такими простыми, какими кажутся на первый взгляд. За внешней структурой часто скрываются проблемы с типами, разделителями, схемами и «сломанными» строками, из-за которых загрузка данных превращается в цепочку костылей и ручной предобработки. В этой статье — практический разбор того, как DuckDB позволяет диагностировать и обрабатывать такие случаи прямо в SQL: от понимания того, как система интерпретирует файл, до устойчивой загрузки и работы с неконсистентными данными. Разобраться в CSV

https://habr.com/ru/companies/otus/articles/1024158/

#CSV #DuckDB #обработка_данных #грязные_данные #качество_данных #импорт_данных #data_engineering #etl

#etl #data_engineering #импорт_данных #качество_данных #грязные_данные #обработка_данных

Habr @[email protected] · 2026-04-16 · 12:02 UTC

[Перевод] Укрощение «диких» CSV: продвинутые техники DuckDB для инженеров данных

CSV-файлы редко бывают такими простыми, какими кажутся на первый взгляд. За внешней структурой часто скрываются проблемы с типами, разделителями, схемами и «сломанными» строками, из-за которых загрузка данных превращается в цепочку костылей и ручной предобработки. В этой статье — практический разбор того, как DuckDB позволяет диагностировать и обрабатывать такие случаи прямо в SQL: от понимания того, как система интерпретирует файл, до устойчивой загрузки и работы с неконсистентными данными. Разобраться в CSV

https://habr.com/ru/companies/otus/articles/1024158/

#CSV #DuckDB #обработка_данных #грязные_данные #качество_данных #импорт_данных #data_engineering #etl

#etl #data_engineering #импорт_данных #качество_данных #грязные_данные #обработка_данных

Habr @[email protected] · 2026-04-16 · 12:02 UTC

[Перевод] Укрощение «диких» CSV: продвинутые техники DuckDB для инженеров данных

CSV-файлы редко бывают такими простыми, какими кажутся на первый взгляд. За внешней структурой часто скрываются проблемы с типами, разделителями, схемами и «сломанными» строками, из-за которых загрузка данных превращается в цепочку костылей и ручной предобработки. В этой статье — практический разбор того, как DuckDB позволяет диагностировать и обрабатывать такие случаи прямо в SQL: от понимания того, как система интерпретирует файл, до устойчивой загрузки и работы с неконсистентными данными. Разобраться в CSV

https://habr.com/ru/companies/otus/articles/1024158/

#CSV #DuckDB #обработка_данных #грязные_данные #качество_данных #импорт_данных #data_engineering #etl

#csv #duckdb #обработка_данных #грязные_данные #качество_данных #импорт_данных

N-gated Hacker News @[email protected] · 2026-04-14 · 02:13 UTC

Ah, yes, the riveting world of DuckDB—a #database system named after everyone's favorite pond-dwelling bird. 🦆💾 Dive deep into this 15-week #course where you can learn how to turn your #SQL queries into quacking noises. But hey, at least your undergrads will finally know what to blame when their projects waddle. 😂📚
https://duckdb.org/library/design-and-implementation-of-duckdb-internals/ #DuckDB #Learning #Fun #Education #Humor #HackerNews #ngated

#database #course #sql #duckdb #learning #fun

Habr @[email protected] · 2026-04-13 · 09:22 UTC

[Перевод] DuckDB как микро-хранилище: заменяем «ETL + Postgres» одним файлом, одним движком и SLA

Частая история: данные приложения попадают куда-то, джоб их чистит, Postgres хранит их «для аналитики» и вдруг вы обслуживаете ETL-пайплайн и базу данных, которая никогда не была рада OLAP-нагрузке. По моему мнению, для большинства команд это лишние сложности. Главная сила DuckDB не в том, что он быстрый (хотя это правда). Она в том, что он может работать как микро-хранилище: один .duckdb -файл, который ведёт себя как аккуратный аналитический движок, находится рядом с данными и обеспечивает дашборды, аудиты и еженедельные отчёты без платформенного оверхеда.

https://habr.com/ru/articles/1022746/

#duckdb #postgresql #etl #etlпайплайн

#etlпайплайн #etl #postgresql #duckdb