home.social

#hocon — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #hocon, aggregated by home.social.

  1. Рулим запуском Spark-приложений в Airflow с помощью самописного оператора

    Airflow в Lamoda Tech играет роль оркестратора процессов обработки данных. Ежедневно с его помощью мы запускаем 1 800+ тасок на проде, примерно половина из которых являются Spark-приложениями. Все Spark-приложения сабмитятся из Docker-контейнеров. И здесь сталкиваемся с проблемой: в нашем случае не существует готовых решений для запуска Spark-приложений, позволяющих легко править конфигурацию и следить за количеством потребляемых ресурсов. Меня зовут Андрей Булгаков, я лид команды разработчиков Big Data в Lamoda Tech. Вместе с разработчиком Иваном Васенковым в этой статье мы поделимся историей создания Airflow-оператора для запуска Spark-приложений.

    habr.com/ru/companies/lamoda/a

    #apache_airflow #spark #hocon #docker #data_engineering #big_data #python