#работа_с_аудио — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #работа_с_аудио, aggregated by home.social.
-
Meta* возвращается в мир open source с Omnilingual ASR — более мощного конкурента Whisper от OpenAI
Meta представила новую многоязычную систему автоматического распознавания речи (ASR), поддерживающую свыше 1600 языков. Для сравнения — открытая модель Whisper от OpenAI распознает лишь 99. Более того, архитектура Omnilingual ASR позволяет разработчикам самостоятельно расширять поддержку — фактически до тысяч языков. Благодаря механизму «zero-shot» обучения в контексте (in-context learning) пользователю достаточно предоставить несколько примеров аудио и текста на новом языке во время работы модели, чтобы она смогла распознавать дальнейшие фразы без дополнительного обучения.
https://habr.com/ru/companies/technokratos/articles/965392/
#asr #meta #ai #whisper #работа_с_аудио #расшифровка_аудио #ии #искусственный_интеллект