home.social

#yandex_data_proc — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #yandex_data_proc, aggregated by home.social.

  1. Яндекс Data Proc для ML: ускоряем Embedding на Spark

    Меня зовут Дмитрий Курганский, я Tech Lead команды MLOps в Банки.ру. Мы работаем над тем, чтобы грамотно организовать и ускорить этапы жизненного цикла ML. В этой статье поделюсь нашим опытом применения Embedding : от запуска Яндекс Data Proc кластера через Airflow до оптимизации этапа применения Embedding с помощью Spark . Материал в целом будет актуален для этапа применения (inference) любых моделей для больших наборов данных, работающих в batch режиме по расписанию.

    habr.com/ru/companies/banki/ar

    #машинное_обучение #yandex_cloud #apache_airflow #python #Yandex_Data_Proc