#text2sql — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #text2sql, aggregated by home.social.
-
Метан: как data governance и ИИ вместе создают интерфейс к данным
Хабр, привет! Меня зовут Андрей Вихров, я создавал аналитические системы и внедрял data governance (DG) в крупных компаниях больше 15 лет, а сейчас занимаюсь метаданными в Data Office МТС. Тема порядка в данных для меня не нова, а какие выгоды можно извлечь из нее сегодня — стоит отдельного рассказа. В компании накоплен огромный массив данных — только в дата-каталоге зарегистрировано более 500 тысяч таблиц. С ними ежедневно работают сотни специалистов: от продуктовых аналитиков до инженеров данных, строящих витрины для ML-моделей. Но в каталоге описаны в основном таблицы — их назначение, поля, владельцы, а вот терминов и тем более их связей на порядок меньше. И это объяснимо: формировать термины сложнее, в производственный процесс они вписываются с трудом, а польза от них неочевидна. Поэтому каталог чаще всего помогает находить описания по уже известной таблице, но не ответы на конкретные бизнес-запросы. С ними аналитику всё равно приходится разбираться самому, изучая материалы и консультируясь с коллегами, что отнимает много времени. Логичный выход — автоматизировать процесс. Но если опытный аналитик справляется (рано или поздно) с задачей в существующих условиях, то ИИ-агент этого сделать уже не сможет, поскольку опирается только на метаданные. В нашем случае сложились два фактора. За годы работы над DG мы накопили экспертизу в описании и структурировании метаданных. А появление LLM дало возможность создавать семантические слои на промышленной основе и использовать их для ответа на вопросы пользователей. Объединив одно с другим, мы создали и пилотируем систему Метан (метаданные + аналитика).
-
Как OpenAI похоронила традиционный BI — и что пришло ему на смену
Зачем OpenAI купила базу данных Rockset за $117M и тут же убила её для всех клиентов. Как устроена архитектура «пять слоёв контекста». Почему принцип «meaning lives in code» меняет подход к документированию данных. И что из этого может взять обычная компания уже сейчас без GPT-5 и без $117M.
https://habr.com/ru/articles/1002254/
#openai #chat_bi #text2sql #ai_agents #кейс #дашборды_в_компании
-
Как OpenAI похоронила традиционный BI — и что пришло ему на смену
Зачем OpenAI купила базу данных Rockset за $117M и тут же убила её для всех клиентов. Как устроена архитектура «пять слоёв контекста». Почему принцип «meaning lives in code» меняет подход к документированию данных. И что из этого может взять обычная компания уже сейчас без GPT-5 и без $117M.
https://habr.com/ru/articles/1002254/
#openai #chat_bi #text2sql #ai_agents #кейс #дашборды_в_компании
-
Как OpenAI похоронила традиционный BI — и что пришло ему на смену
Зачем OpenAI купила базу данных Rockset за $117M и тут же убила её для всех клиентов. Как устроена архитектура «пять слоёв контекста». Почему принцип «meaning lives in code» меняет подход к документированию данных. И что из этого может взять обычная компания уже сейчас без GPT-5 и без $117M.
https://habr.com/ru/articles/1002254/
#openai #chat_bi #text2sql #ai_agents #кейс #дашборды_в_компании
-
Как OpenAI похоронила традиционный BI — и что пришло ему на смену
Зачем OpenAI купила базу данных Rockset за $117M и тут же убила её для всех клиентов. Как устроена архитектура «пять слоёв контекста». Почему принцип «meaning lives in code» меняет подход к документированию данных. И что из этого может взять обычная компания уже сейчас без GPT-5 и без $117M.
https://habr.com/ru/articles/1002254/
#openai #chat_bi #text2sql #ai_agents #кейс #дашборды_в_компании
-
Генерируем SQL–запросы на локальных моделях
На связи команда внутренних инициативных сервисов ecom.tech . Мы занимаемся разработкой продуктов для внутренних нужд компании, экспериментируем с внутренними AI-продуктами для сотрудников: от забавных и полезных ботов до автоматизации повседневных задач. Сегодня мы расскажем, как помогли разгрузить аналитиков от их типовых задач с помощью искусственного интеллекта – внутри реальные кейсы, гайды и пошаговые инструкции на примере ecom.tech . Поехали!
-
Генерируем SQL–запросы на локальных моделях
На связи команда внутренних инициативных сервисов ecom.tech . Мы занимаемся разработкой продуктов для внутренних нужд компании, экспериментируем с внутренними AI-продуктами для сотрудников: от забавных и полезных ботов до автоматизации повседневных задач. Сегодня мы расскажем, как помогли разгрузить аналитиков от их типовых задач с помощью искусственного интеллекта – внутри реальные кейсы, гайды и пошаговые инструкции на примере ecom.tech . Поехали!
-
Генерируем SQL–запросы на локальных моделях
На связи команда внутренних инициативных сервисов ecom.tech . Мы занимаемся разработкой продуктов для внутренних нужд компании, экспериментируем с внутренними AI-продуктами для сотрудников: от забавных и полезных ботов до автоматизации повседневных задач. Сегодня мы расскажем, как помогли разгрузить аналитиков от их типовых задач с помощью искусственного интеллекта – внутри реальные кейсы, гайды и пошаговые инструкции на примере ecom.tech . Поехали!
-
Генерируем SQL–запросы на локальных моделях
На связи команда внутренних инициативных сервисов ecom.tech . Мы занимаемся разработкой продуктов для внутренних нужд компании, экспериментируем с внутренними AI-продуктами для сотрудников: от забавных и полезных ботов до автоматизации повседневных задач. Сегодня мы расскажем, как помогли разгрузить аналитиков от их типовых задач с помощью искусственного интеллекта – внутри реальные кейсы, гайды и пошаговые инструкции на примере ecom.tech . Поехали!
-
Fine‑tune mô hình nhỏ để Text2SQL nhanh hơn! 🚀
Dùng `distil‑cli` + Claude skill: tạo model, chuẩn bị dữ liệu, train, xuất `model.gguf` (2.2 GB) rồi `ollama create/run`. Kết quả: độ chính xác LLM‑as‑a‑Judge tăng từ 36 % → 74 % (gần bằng teacher) và ROUGE ~88 %. Ví dụ: câu hỏi “số ứng viên mỗi vị trí” → SQL chi tiết hơn. Demo: script Python đọc CSV → SQLite, hỏi “trung bình lương mỗi phòng ban”. #AI #MachineLearning #FineTuning #Ollama #Text2SQL #TríTuệNhânTạo #HọcMáy #TinhChỉnhMôHình #CôngNghệ -
Выжимаем максимум из опенсорсных моделей и готовим Text2SQL
В любой крупной компании есть повторяющийся сценарий. Аналитик сидит над экспериментом или моделью, строит А/В тесты и дашборды, и в этот момент приходит бизнес и просит быстро посмотреть «продажи жвачки за вчера». Аналитик переключается, пишет запрос, отдаёт результат, а через десять минут прилетает почти такой же вопрос. Потом ещё один и ещё. День заканчивается, а свои задачи стоят и покрываются ржавчиной. Так выглядит ручной доступ к данным. Бизнес понимает, что нужные данные в хранилище есть, но не всегда может их быстро получить. А аналитик становится «бутылочным горлышком», через которое проходит большой поток запросов. Мы хотели упростить работу с данными. Чтобы пользователь задавал вопрос, сервис превращал его в SQL, выполнял в хранилище и возвращал аналитический ответ. Чтобы рутина уходила в инструмент, а аналитик переставал быть «бутылочным горлышком». Вроде ничего нового, но в реальной инфраструктуре вскрывается много интересного: специфическая лексика, свойственная каждому из направлений бизнеса, громоздкие витрины, опыт работы с легаси системами и поведение LLM, которую сначала надо надрессировать.
https://habr.com/ru/companies/oleg-bunin/articles/981494/
#text2sql #large_language_models #open_source_llm #qwen #gpt #аналитика_данных #bird #spider #prompt_engineering #prompt_injection
-
Выжимаем максимум из опенсорсных моделей и готовим Text2SQL
В любой крупной компании есть повторяющийся сценарий. Аналитик сидит над экспериментом или моделью, строит А/В тесты и дашборды, и в этот момент приходит бизнес и просит быстро посмотреть «продажи жвачки за вчера». Аналитик переключается, пишет запрос, отдаёт результат, а через десять минут прилетает почти такой же вопрос. Потом ещё один и ещё. День заканчивается, а свои задачи стоят и покрываются ржавчиной. Так выглядит ручной доступ к данным. Бизнес понимает, что нужные данные в хранилище есть, но не всегда может их быстро получить. А аналитик становится «бутылочным горлышком», через которое проходит большой поток запросов. Мы хотели упростить работу с данными. Чтобы пользователь задавал вопрос, сервис превращал его в SQL, выполнял в хранилище и возвращал аналитический ответ. Чтобы рутина уходила в инструмент, а аналитик переставал быть «бутылочным горлышком». Вроде ничего нового, но в реальной инфраструктуре вскрывается много интересного: специфическая лексика, свойственная каждому из направлений бизнеса, громоздкие витрины, опыт работы с легаси системами и поведение LLM, которую сначала надо надрессировать.
https://habr.com/ru/companies/oleg-bunin/articles/981494/
#text2sql #large_language_models #open_source_llm #qwen #gpt #аналитика_данных #bird #spider #prompt_engineering #prompt_injection
-
Выжимаем максимум из опенсорсных моделей и готовим Text2SQL
В любой крупной компании есть повторяющийся сценарий. Аналитик сидит над экспериментом или моделью, строит А/В тесты и дашборды, и в этот момент приходит бизнес и просит быстро посмотреть «продажи жвачки за вчера». Аналитик переключается, пишет запрос, отдаёт результат, а через десять минут прилетает почти такой же вопрос. Потом ещё один и ещё. День заканчивается, а свои задачи стоят и покрываются ржавчиной. Так выглядит ручной доступ к данным. Бизнес понимает, что нужные данные в хранилище есть, но не всегда может их быстро получить. А аналитик становится «бутылочным горлышком», через которое проходит большой поток запросов. Мы хотели упростить работу с данными. Чтобы пользователь задавал вопрос, сервис превращал его в SQL, выполнял в хранилище и возвращал аналитический ответ. Чтобы рутина уходила в инструмент, а аналитик переставал быть «бутылочным горлышком». Вроде ничего нового, но в реальной инфраструктуре вскрывается много интересного: специфическая лексика, свойственная каждому из направлений бизнеса, громоздкие витрины, опыт работы с легаси системами и поведение LLM, которую сначала надо надрессировать.
https://habr.com/ru/companies/oleg-bunin/articles/981494/
#text2sql #large_language_models #open_source_llm #qwen #gpt #аналитика_данных #bird #spider #prompt_engineering #prompt_injection
-
Выжимаем максимум из опенсорсных моделей и готовим Text2SQL
В любой крупной компании есть повторяющийся сценарий. Аналитик сидит над экспериментом или моделью, строит А/В тесты и дашборды, и в этот момент приходит бизнес и просит быстро посмотреть «продажи жвачки за вчера». Аналитик переключается, пишет запрос, отдаёт результат, а через десять минут прилетает почти такой же вопрос. Потом ещё один и ещё. День заканчивается, а свои задачи стоят и покрываются ржавчиной. Так выглядит ручной доступ к данным. Бизнес понимает, что нужные данные в хранилище есть, но не всегда может их быстро получить. А аналитик становится «бутылочным горлышком», через которое проходит большой поток запросов. Мы хотели упростить работу с данными. Чтобы пользователь задавал вопрос, сервис превращал его в SQL, выполнял в хранилище и возвращал аналитический ответ. Чтобы рутина уходила в инструмент, а аналитик переставал быть «бутылочным горлышком». Вроде ничего нового, но в реальной инфраструктуре вскрывается много интересного: специфическая лексика, свойственная каждому из направлений бизнеса, громоздкие витрины, опыт работы с легаси системами и поведение LLM, которую сначала надо надрессировать.
https://habr.com/ru/companies/oleg-bunin/articles/981494/
#text2sql #large_language_models #open_source_llm #qwen #gpt #аналитика_данных #bird #spider #prompt_engineering #prompt_injection
-
"Text2SQL is dead – or is it? 🤔 Attend our Product Innovation #Summit, where we’ll pretend we invented analytics while throwing #buzzwords like 'Lakehouse Turbo' and 'Sovereign AI' at you. 🚀 Spoiler: It's just SQL with a more expensive hat! 🎩💸"
https://www.exasol.com/blog/text-to-sql-governance/ #Text2SQL #ProductInnovation #LakehouseTurbo #SovereignAI #HackerNews #ngated -
"Text2SQL is dead – or is it? 🤔 Attend our Product Innovation #Summit, where we’ll pretend we invented analytics while throwing #buzzwords like 'Lakehouse Turbo' and 'Sovereign AI' at you. 🚀 Spoiler: It's just SQL with a more expensive hat! 🎩💸"
https://www.exasol.com/blog/text-to-sql-governance/ #Text2SQL #ProductInnovation #LakehouseTurbo #SovereignAI #HackerNews #ngated -
"Text2SQL is dead – or is it? 🤔 Attend our Product Innovation #Summit, where we’ll pretend we invented analytics while throwing #buzzwords like 'Lakehouse Turbo' and 'Sovereign AI' at you. 🚀 Spoiler: It's just SQL with a more expensive hat! 🎩💸"
https://www.exasol.com/blog/text-to-sql-governance/ #Text2SQL #ProductInnovation #LakehouseTurbo #SovereignAI #HackerNews #ngated -
"Text2SQL is dead – or is it? 🤔 Attend our Product Innovation #Summit, where we’ll pretend we invented analytics while throwing #buzzwords like 'Lakehouse Turbo' and 'Sovereign AI' at you. 🚀 Spoiler: It's just SQL with a more expensive hat! 🎩💸"
https://www.exasol.com/blog/text-to-sql-governance/ #Text2SQL #ProductInnovation #LakehouseTurbo #SovereignAI #HackerNews #ngated -
Text2SQL is dead – long live text2SQL
https://www.exasol.com/blog/text-to-sql-governance/
#HackerNews #Text2SQL #dead #text2SQL #governance #data #analytics #AI #technology
-
Text2SQL is dead – long live text2SQL
https://www.exasol.com/blog/text-to-sql-governance/
#HackerNews #Text2SQL #dead #text2SQL #governance #data #analytics #AI #technology
-
Text2SQL is dead – long live text2SQL
https://www.exasol.com/blog/text-to-sql-governance/
#HackerNews #Text2SQL #dead #text2SQL #governance #data #analytics #AI #technology
-
Text2SQL is dead – long live text2SQL
https://www.exasol.com/blog/text-to-sql-governance/
#HackerNews #Text2SQL #dead #text2SQL #governance #data #analytics #AI #technology
-
Text2SQL is dead – long live text2SQL
https://www.exasol.com/blog/text-to-sql-governance/
#HackerNews #Text2SQL #dead #text2SQL #governance #data #analytics #AI #technology
-
Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников
Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest в Новосибирске, по которому и написана данная статья. В ней я расскажу о нашем опыте построения сервиса text2sql — интеллектуального помощника, который позволяет получать доступ к данным из баз по запросу на естественном языке. Такой сервис особенно актуален для крупных компаний с развитой аналитической культурой и большим объемом данных: он позволяет менеджерам и аналитикам запрашивать нужную информацию в виде таблицы, графика или конкретного ответа, не прибегая к помощи специалистов по SQL.
https://habr.com/ru/companies/X5Tech/articles/949694/
#nlp #text2sql #llm #искусственный_интеллект #машинное_обучение #ии #ии_ассистент
-
Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников
Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest в Новосибирске, по которому и написана данная статья. В ней я расскажу о нашем опыте построения сервиса text2sql — интеллектуального помощника, который позволяет получать доступ к данным из баз по запросу на естественном языке. Такой сервис особенно актуален для крупных компаний с развитой аналитической культурой и большим объемом данных: он позволяет менеджерам и аналитикам запрашивать нужную информацию в виде таблицы, графика или конкретного ответа, не прибегая к помощи специалистов по SQL.
https://habr.com/ru/companies/X5Tech/articles/949694/
#nlp #text2sql #llm #искусственный_интеллект #машинное_обучение #ии #ии_ассистент
-
Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников
Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest в Новосибирске, по которому и написана данная статья. В ней я расскажу о нашем опыте построения сервиса text2sql — интеллектуального помощника, который позволяет получать доступ к данным из баз по запросу на естественном языке. Такой сервис особенно актуален для крупных компаний с развитой аналитической культурой и большим объемом данных: он позволяет менеджерам и аналитикам запрашивать нужную информацию в виде таблицы, графика или конкретного ответа, не прибегая к помощи специалистов по SQL.
https://habr.com/ru/companies/X5Tech/articles/949694/
#nlp #text2sql #llm #искусственный_интеллект #машинное_обучение #ии #ии_ассистент
-
Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников
Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest в Новосибирске, по которому и написана данная статья. В ней я расскажу о нашем опыте построения сервиса text2sql — интеллектуального помощника, который позволяет получать доступ к данным из баз по запросу на естественном языке. Такой сервис особенно актуален для крупных компаний с развитой аналитической культурой и большим объемом данных: он позволяет менеджерам и аналитикам запрашивать нужную информацию в виде таблицы, графика или конкретного ответа, не прибегая к помощи специалистов по SQL.
https://habr.com/ru/companies/X5Tech/articles/949694/
#nlp #text2sql #llm #искусственный_интеллект #машинное_обучение #ии #ии_ассистент
-
Semantic RAG – как научить AI-ассистентов понимать, а не угадывать
Одна из самых распространённых задач для AI-ассистента — поиск ответов на вопросы. Пользователи ожидают, что он сможет находить информацию во внутренних wiki, базах знаний техподдержки, Word-документах, Excel-файлах и других корпоративных источниках. Сегодня такой поиск чаще всего реализуется с помощью подхода Retrieval-Augmented Generation (RAG). Суть проста: сначала ассистент находит фрагменты документов, которые кажутся релевантными запросу, и уже на их основе формирует связанный ответ. На первый взгляд схема выглядит логичной. Но на практике у классического RAG есть целый ряд ограничений, которые быстро дают о себе знать при реальных внедрениях. В этой статье мы разберём основные проблемы и покажем, как можно их обойти.
-
Semantic RAG – как научить AI-ассистентов понимать, а не угадывать
Одна из самых распространённых задач для AI-ассистента — поиск ответов на вопросы. Пользователи ожидают, что он сможет находить информацию во внутренних wiki, базах знаний техподдержки, Word-документах, Excel-файлах и других корпоративных источниках. Сегодня такой поиск чаще всего реализуется с помощью подхода Retrieval-Augmented Generation (RAG). Суть проста: сначала ассистент находит фрагменты документов, которые кажутся релевантными запросу, и уже на их основе формирует связанный ответ. На первый взгляд схема выглядит логичной. Но на практике у классического RAG есть целый ряд ограничений, которые быстро дают о себе знать при реальных внедрениях. В этой статье мы разберём основные проблемы и покажем, как можно их обойти.
-
Semantic RAG – как научить AI-ассистентов понимать, а не угадывать
Одна из самых распространённых задач для AI-ассистента — поиск ответов на вопросы. Пользователи ожидают, что он сможет находить информацию во внутренних wiki, базах знаний техподдержки, Word-документах, Excel-файлах и других корпоративных источниках. Сегодня такой поиск чаще всего реализуется с помощью подхода Retrieval-Augmented Generation (RAG). Суть проста: сначала ассистент находит фрагменты документов, которые кажутся релевантными запросу, и уже на их основе формирует связанный ответ. На первый взгляд схема выглядит логичной. Но на практике у классического RAG есть целый ряд ограничений, которые быстро дают о себе знать при реальных внедрениях. В этой статье мы разберём основные проблемы и покажем, как можно их обойти.
-
Semantic RAG – как научить AI-ассистентов понимать, а не угадывать
Одна из самых распространённых задач для AI-ассистента — поиск ответов на вопросы. Пользователи ожидают, что он сможет находить информацию во внутренних wiki, базах знаний техподдержки, Word-документах, Excel-файлах и других корпоративных источниках. Сегодня такой поиск чаще всего реализуется с помощью подхода Retrieval-Augmented Generation (RAG). Суть проста: сначала ассистент находит фрагменты документов, которые кажутся релевантными запросу, и уже на их основе формирует связанный ответ. На первый взгляд схема выглядит логичной. Но на практике у классического RAG есть целый ряд ограничений, которые быстро дают о себе знать при реальных внедрениях. В этой статье мы разберём основные проблемы и покажем, как можно их обойти.
-
Немного про SPARQL, или как мы заняли призовое место на Text-To-SPARQL Challenge на ESWC 2025
Привет, Хабр! Мы — Даниил Березин и Роман Авдеев, магистранты кафедры банковских информационных технологий в МФТИ (СберТех). В рамках дипломной работы под руководством кандидата технических наук, научного сотрудника группы «Прикладное NLP» AIRI Олега Сомова мы участвовали в соревновании Text‑To‑SPARQL Challenge на конференции ESWC 2025 (Порторож, Словения). Среди 9 команд из ведущих европейских исследовательских центров мы заняли: 🥉 3-е место в треке DBPedia 🏅 5-е место в треке с корпоративным графом знаний В этой статье расскажем, как проходило соревнование, какие подходы мы пробовали и какие уроки извлекли.
-
Немного про SPARQL, или как мы заняли призовое место на Text-To-SPARQL Challenge на ESWC 2025
Привет, Хабр! Мы — Даниил Березин и Роман Авдеев, магистранты кафедры банковских информационных технологий в МФТИ (СберТех). В рамках дипломной работы под руководством кандидата технических наук, научного сотрудника группы «Прикладное NLP» AIRI Олега Сомова мы участвовали в соревновании Text‑To‑SPARQL Challenge на конференции ESWC 2025 (Порторож, Словения). Среди 9 команд из ведущих европейских исследовательских центров мы заняли: 🥉 3-е место в треке DBPedia 🏅 5-е место в треке с корпоративным графом знаний В этой статье расскажем, как проходило соревнование, какие подходы мы пробовали и какие уроки извлекли.
-
Немного про SPARQL, или как мы заняли призовое место на Text-To-SPARQL Challenge на ESWC 2025
Привет, Хабр! Мы — Даниил Березин и Роман Авдеев, магистранты кафедры банковских информационных технологий в МФТИ (СберТех). В рамках дипломной работы под руководством кандидата технических наук, научного сотрудника группы «Прикладное NLP» AIRI Олега Сомова мы участвовали в соревновании Text‑To‑SPARQL Challenge на конференции ESWC 2025 (Порторож, Словения). Среди 9 команд из ведущих европейских исследовательских центров мы заняли: 🥉 3-е место в треке DBPedia 🏅 5-е место в треке с корпоративным графом знаний В этой статье расскажем, как проходило соревнование, какие подходы мы пробовали и какие уроки извлекли.
-
Немного про SPARQL, или как мы заняли призовое место на Text-To-SPARQL Challenge на ESWC 2025
Привет, Хабр! Мы — Даниил Березин и Роман Авдеев, магистранты кафедры банковских информационных технологий в МФТИ (СберТех). В рамках дипломной работы под руководством кандидата технических наук, научного сотрудника группы «Прикладное NLP» AIRI Олега Сомова мы участвовали в соревновании Text‑To‑SPARQL Challenge на конференции ESWC 2025 (Порторож, Словения). Среди 9 команд из ведущих европейских исследовательских центров мы заняли: 🥉 3-е место в треке DBPedia 🏅 5-е место в треке с корпоративным графом знаний В этой статье расскажем, как проходило соревнование, какие подходы мы пробовали и какие уроки извлекли.
-
[Перевод] О создании системы, преобразующей текст в SQL для аналитиков Pinterest
Написание запросов для решения аналитических задач — это основное занятие тех, кто работает с данными Pinterest. Но подбор подходящих данных и преобразование описания проблемы в корректный и эффективный SQL‑код могут оказаться непростыми делами. Ведь речь идёт о среде, которая быстро меняется, и о значительных объёмах данных, разбросанных по разным местам.
-
[Перевод] О создании системы, преобразующей текст в SQL для аналитиков Pinterest
Написание запросов для решения аналитических задач — это основное занятие тех, кто работает с данными Pinterest. Но подбор подходящих данных и преобразование описания проблемы в корректный и эффективный SQL‑код могут оказаться непростыми делами. Ведь речь идёт о среде, которая быстро меняется, и о значительных объёмах данных, разбросанных по разным местам.
-
[Перевод] О создании системы, преобразующей текст в SQL для аналитиков Pinterest
Написание запросов для решения аналитических задач — это основное занятие тех, кто работает с данными Pinterest. Но подбор подходящих данных и преобразование описания проблемы в корректный и эффективный SQL‑код могут оказаться непростыми делами. Ведь речь идёт о среде, которая быстро меняется, и о значительных объёмах данных, разбросанных по разным местам.
-
text 2 sql项目汇总: 1、Vanna: 首个可视化实时训练Text2SQL的开源项目,采用了RAG的方式训练模型,实现自然语言生成sql语句与数据库类的结构化数据交互 github:https://t.co/LJqzK0krT8 解读详情:https://t.co/pdQ6dK8LxK 2、OpenAgents 可商用的数据分析agent、插件agent、webagent,实现了数据分析、插件自动调用、网页自动化(自动购物) github:https://t.co/u4FkgNLGOP 解读详情:https://t.co/OKRc09pnOk 3、DB-GPT 基于大模型实现用自然语言与各种数据库交互,解决各种BI数据分析场景、公司业绩分析、知识库管理、agent管理、多模型管理、提示词管理等 github:https://t.co/jLHrgksuOz 解读详情:https://t.co/csgVgb5fw2 4、SuperDuperDB 零门槛将任何AI模型(无论是开源、商业模型还是自行开发的)与每个公司的数据库集成、训练和管理,仅需一行Python连接数据库和大模型 github:https://t.co/NxUtQ1mzCg 解读详情:https://t.co/tV6CyXIw4C 5、Supersonic 腾讯发布的新一代基于llm和语义建模完美结合的BI平台,融合了Chat BI和Headless BI,大大提升了text2sql的能力,降低了Chat-BI的幻觉、推理效率低下、多表查询不准确、复杂运算不理想等问题 github:https://t.co/4c2ouS71eQ 解读详情:https://t.co/8Qx0q5XrUl #text2sql #文本转数据 #Vanna #Supersonic #OpenAgents -
text 2 sql项目汇总: 1、Vanna: 首个可视化实时训练Text2SQL的开源项目,采用了RAG的方式训练模型,实现自然语言生成sql语句与数据库类的结构化数据交互 github:https://t.co/LJqzK0krT8 解读详情:https://t.co/pdQ6dK8LxK 2、OpenAgents 可商用的数据分析agent、插件agent、webagent,实现了数据分析、插件自动调用、网页自动化(自动购物) github:https://t.co/u4FkgNLGOP 解读详情:https://t.co/OKRc09pnOk 3、DB-GPT 基于大模型实现用自然语言与各种数据库交互,解决各种BI数据分析场景、公司业绩分析、知识库管理、agent管理、多模型管理、提示词管理等 github:https://t.co/jLHrgksuOz 解读详情:https://t.co/csgVgb5fw2 4、SuperDuperDB 零门槛将任何AI模型(无论是开源、商业模型还是自行开发的)与每个公司的数据库集成、训练和管理,仅需一行Python连接数据库和大模型 github:https://t.co/NxUtQ1mzCg 解读详情:https://t.co/tV6CyXIw4C 5、Supersonic 腾讯发布的新一代基于llm和语义建模完美结合的BI平台,融合了Chat BI和Headless BI,大大提升了text2sql的能力,降低了Chat-BI的幻觉、推理效率低下、多表查询不准确、复杂运算不理想等问题 github:https://t.co/4c2ouS71eQ 解读详情:https://t.co/8Qx0q5XrUl #text2sql #文本转数据 #Vanna #Supersonic #OpenAgents -
Ya está abierto el registro para nuestra reunión de octubre: "🗄️ SQL generado con lenguaje natural y MLFlow para productivización de modelos" este mes en las oficinas de Cepsa
https://www.meetup.com/pydata-madrid/events/296678892/
¡Nos vemos el jueves 19 a las 19:00! Y después, al bar a hacer networking 🍻
#PyDataMadrid #PyData #Python #datascience #machinelearning #text2sql #llms #mlflow
-
Ya está abierto el registro para nuestra reunión de octubre: "🗄️ SQL generado con lenguaje natural y MLFlow para productivización de modelos" este mes en las oficinas de Cepsa
https://www.meetup.com/pydata-madrid/events/296678892/
¡Nos vemos el jueves 19 a las 19:00! Y después, al bar a hacer networking 🍻
#PyDataMadrid #PyData #Python #datascience #machinelearning #text2sql #llms #mlflow
-
Ya está abierto el registro para nuestra reunión de octubre: "🗄️ SQL generado con lenguaje natural y MLFlow para productivización de modelos" este mes en las oficinas de Cepsa
https://www.meetup.com/pydata-madrid/events/296678892/
¡Nos vemos el jueves 19 a las 19:00! Y después, al bar a hacer networking 🍻
#PyDataMadrid #PyData #Python #datascience #machinelearning #text2sql #llms #mlflow
-
Ya está abierto el registro para nuestra reunión de octubre: "🗄️ SQL generado con lenguaje natural y MLFlow para productivización de modelos" este mes en las oficinas de Cepsa
https://www.meetup.com/pydata-madrid/events/296678892/
¡Nos vemos el jueves 19 a las 19:00! Y después, al bar a hacer networking 🍻
#PyDataMadrid #PyData #Python #datascience #machinelearning #text2sql #llms #mlflow
-
Ya está abierto el registro para nuestra reunión de octubre: "🗄️ SQL generado con lenguaje natural y MLFlow para productivización de modelos" este mes en las oficinas de Cepsa
https://www.meetup.com/pydata-madrid/events/296678892/
¡Nos vemos el jueves 19 a las 19:00! Y después, al bar a hacer networking 🍻
#PyDataMadrid #PyData #Python #datascience #machinelearning #text2sql #llms #mlflow