home.social

#synthetic_data — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #synthetic_data, aggregated by home.social.

  1. Стена данных: почему ИИ упирается не в GPU, а в реальность

    В новой статье наш эксперт Антон Пчелинцев размышляет о причинах дефицита качественных данных, следующем прорыве в области развития ИИ и о том, что делать для получения преимущества.

    habr.com/ru/articles/1016998/

    #искусственный_интеллект #машинное+обучение #bigdata #стена_данных #gpu #gpgpu #данные #качество_данных #synthetic_data #синтетические_данные

  2. Nano Banana Pro. Реальное применение, а не мемные картинки

    Когда данных мало, а домен сильно отличается, предобученные модели перестают работать. Я попробовал вместо сбора и ручной разметки генерировать дорожные дефекты поверх реальных кадров. Что получилось, где работает, где нет и сколько это стоит - в статье.

    habr.com/ru/articles/993968/

    #ai #nano_banana_pro #synthetic_data #computer_vision #segmentation

  3. [Перевод] Humans-in-the-loop vs synthetic data: за что идёт борьба на рынке AaaS

    Scale зарабатывает более $750 млн в год на продаже данных для RLHF. Кто собирается их потеснить? Scale AI — стартап, ранее известный своими контрактами на разметку данных для беспилотных автомобилей и военных проектов, приближается к годовому обороту в $1 млрд благодаря своим дата-сервисам, используемым в техниках вроде reinforcement learning from human feedback (RLHF). Я давно слышал слухи об их масштабах, о том, что они работают буквально со всеми крупными AI-лабораториями — от Meta до OpenAI, но увидеть подтверждение этого в публичных отчетах ощущается совсем иначе.

    habr.com/ru/articles/944768/

    #llm #ai #scale_ai #genai #synthetic_data #finetuning #mlops #rlhf #human_in_the_loop #alignment