home.social

#работа_с_аудио — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #работа_с_аудио, aggregated by home.social.

  1. Meta* возвращается в мир open source с Omnilingual ASR — более мощного конкурента Whisper от OpenAI

    Meta представила новую многоязычную систему автоматического распознавания речи (ASR), поддерживающую свыше 1600 языков. Для сравнения — открытая модель Whisper от OpenAI распознает лишь 99. Более того, архитектура Omnilingual ASR позволяет разработчикам самостоятельно расширять поддержку — фактически до тысяч языков. Благодаря механизму «zero-shot» обучения в контексте (in-context learning) пользователю достаточно предоставить несколько примеров аудио и текста на новом языке во время работы модели, чтобы она смогла распознавать дальнейшие фразы без дополнительного обучения.

    habr.com/ru/companies/technokr

    #asr #meta #ai #whisper #работа_с_аудио #расшифровка_аудио #ии #искусственный_интеллект