#data_processing — Public Fediverse posts on home.social

Habr @[email protected] · 2026-02-06 · 06:42 UTC

Автоматизация SEO для агросайта: от 134 страниц каталога до 358 SEO-страниц с ИИ. Технический разбор

Claude AI + Python + pandas = экономия 85% времени. Полный разбор архитектуры, кода и подводных камней.

https://habr.com/ru/articles/993412/

#python #claude #seo #автоматизация #pandas #geo #агротех #data_processing #promptengineering

#promptengineering #data_processing #агротех #geo #pandas #автоматизация

Habr @[email protected] · 2026-02-06 · 06:42 UTC

Автоматизация SEO для агросайта: от 134 страниц каталога до 358 SEO-страниц с ИИ. Технический разбор

Claude AI + Python + pandas = экономия 85% времени. Полный разбор архитектуры, кода и подводных камней.

https://habr.com/ru/articles/993412/

#python #claude #seo #автоматизация #pandas #geo #агротех #data_processing #promptengineering

#promptengineering #data_processing #агротех #geo #pandas #автоматизация

Habr @[email protected] · 2026-02-06 · 06:42 UTC

Автоматизация SEO для агросайта: от 134 страниц каталога до 358 SEO-страниц с ИИ. Технический разбор

Claude AI + Python + pandas = экономия 85% времени. Полный разбор архитектуры, кода и подводных камней.

https://habr.com/ru/articles/993412/

#python #claude #seo #автоматизация #pandas #geo #агротех #data_processing #promptengineering

#promptengineering #data_processing #агротех #geo #pandas #автоматизация

Habr @[email protected] · 2026-02-06 · 06:42 UTC

Автоматизация SEO для агросайта: от 134 страниц каталога до 358 SEO-страниц с ИИ. Технический разбор

Claude AI + Python + pandas = экономия 85% времени. Полный разбор архитектуры, кода и подводных камней.

https://habr.com/ru/articles/993412/

#python #claude #seo #автоматизация #pandas #geo #агротех #data_processing #promptengineering

#python #claude #seo #автоматизация #pandas #geo

Habr @[email protected] · 2025-08-04 · 10:52 UTC

VRL — просто, подробно и понятно

Vector Remap Language (VRL) — это мощный и гибкий инструмент, встроенный в Vector, для обработки и трансформации данных, который позволяет разработчикам эффективно манипулировать логами, метриками и событиями в реальном времени

https://habr.com/ru/articles/933762/

#vector #логи #data_processing

#data_processing #логи #vector

Habr @[email protected] · 2025-08-04 · 10:52 UTC

VRL — просто, подробно и понятно

Vector Remap Language (VRL) — это мощный и гибкий инструмент, встроенный в Vector, для обработки и трансформации данных, который позволяет разработчикам эффективно манипулировать логами, метриками и событиями в реальном времени

https://habr.com/ru/articles/933762/

#vector #логи #data_processing

#data_processing #логи #vector

Habr @[email protected] · 2025-08-04 · 10:52 UTC

VRL — просто, подробно и понятно

Vector Remap Language (VRL) — это мощный и гибкий инструмент, встроенный в Vector, для обработки и трансформации данных, который позволяет разработчикам эффективно манипулировать логами, метриками и событиями в реальном времени

https://habr.com/ru/articles/933762/

#vector #логи #data_processing

#data_processing #логи #vector

Habr @[email protected] · 2025-08-04 · 10:52 UTC

VRL — просто, подробно и понятно

Vector Remap Language (VRL) — это мощный и гибкий инструмент, встроенный в Vector, для обработки и трансформации данных, который позволяет разработчикам эффективно манипулировать логами, метриками и событиями в реальном времени

https://habr.com/ru/articles/933762/

#vector #логи #data_processing

Habr @[email protected] · 2024-01-02 · 08:07 UTC

[Перевод] Выборочное удаление столбцов для повышения эффективности хранения в озерах данных

По мере роста Uber объем обрабатываемых данных и количество обращений к ним многократно возросли. Такое быстрое увеличение объема привело к росту затрат на хранение и вычислительные ресурсы. В результате мы столкнулись с различными проблемами, такими как повышенные требования к железу, увеличившееся потребление ресурсов, а также проблемами с производительностью из-за ошибок наподобие OOM (out-of-memory) и длительных пауз на сборку мусора. Для решения проблем было реализовано несколько инициатив, такие как: внедрение TTL (Time to Live) политик для партиций, внедрение многослойного хранилища с стратегиями для перераспределения данных из “hot”/”warm” до “cold” уровней хранения, а также оптимизации форматов хранения данных. В данной статье фокус будет на последней оптимизации - как сократить размер данных в рамках формата Apache Parquet™ за счет удаления не использующихся колонок большого размера.

https://habr.com/ru/articles/784372/

#apache_parquet #data_lake #data_processing #storage

#storage #data_processing #data_lake #apache_parquet

Habr @[email protected] · 2024-01-02 · 08:07 UTC

[Перевод] Выборочное удаление столбцов для повышения эффективности хранения в озерах данных

По мере роста Uber объем обрабатываемых данных и количество обращений к ним многократно возросли. Такое быстрое увеличение объема привело к росту затрат на хранение и вычислительные ресурсы. В результате мы столкнулись с различными проблемами, такими как повышенные требования к железу, увеличившееся потребление ресурсов, а также проблемами с производительностью из-за ошибок наподобие OOM (out-of-memory) и длительных пауз на сборку мусора. Для решения проблем было реализовано несколько инициатив, такие как: внедрение TTL (Time to Live) политик для партиций, внедрение многослойного хранилища с стратегиями для перераспределения данных из “hot”/”warm” до “cold” уровней хранения, а также оптимизации форматов хранения данных. В данной статье фокус будет на последней оптимизации - как сократить размер данных в рамках формата Apache Parquet™ за счет удаления не использующихся колонок большого размера.

https://habr.com/ru/articles/784372/

#apache_parquet #data_lake #data_processing #storage

#storage #data_processing #data_lake #apache_parquet