home.social

#stt — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #stt, aggregated by home.social.

  1. Голосовой агент — это не чатбот с телефоном: 40 часов экономии и $100, сожженные на ботах

    Я однажды примерно за сутки сжег около $100 на голосовом агенте. Не на большом запуске. Не на огромной базе. Не на хитрой рекламной кампании. Просто на небольшом пуле холодных контактов, где агент периодически попадал на voicemail, IVR, секретарей и других ботов. В какой-то момент два не очень умных голосовых процесса могли довольно долго вежливо говорить друг другу что-то в духе:

    habr.com/ru/articles/1031148/

    #голосовые_агенты #voice_agents #LLM #Twilio #ElevenLabs #Retell #OpenClaw #STT #TTS #latency

  2. OpenWebUI är ju bra och så men ibland vill man prata svenska med sin AI och det inbyggda röst-till-text-systemet stödjer inte Kungliga Bibliotekets modeller.

    ... om man inte gör så här: blog.troed.se/posts/swedish-st

    #OpenWebUI #Speech #STT

  3. Почему Cluely и другие плохо слышат русских айтишников: разбор того, как Whisper ломается и что мы сделали с этим

    В январе я купил подписки на Cluely, Final Round AI и Sensei. Хотел посмотреть как они справляются с русским айти-собесами, раз уж все три заявляют о поддержке русского. Подключил по очереди к тестовому звонку в Телемосте (сомневаюсь, что платформа имела роль, но все же), прогнал одну и ту же запись: Senior Python backend разработчик, 45 минут, стек FastAPI + PostgreSQL + Kafka + Kubernetes. Обычный русский спикер, если важно - из Москвы, с речью проблем не было, нормальный микрофон Все три выдали транскрипт и все три провалились, как неожиданно.. "Кафка" в половине случаев становилась "как-то" или "кофта". "Кубернетис" превращался в "губер нет тест". "Сабскрайбер патерн" - в "саб скрайп патерн". "Middleware для CSRF" - "мидл-вер для си эс эр эф" - это еще норм Проблема не в том, что человек говорил по-русски, и не в том, что Whisper не умеет русский (сноска: хорошо не умеет). Whisper умеет русский нормально, около 9.8% WER на Common Voice. Проблема в другом: русскоязычный айтишник не говорит ни на чистом русском, ни на чистом английском. Он говорит на гибриде: русская грамматика плюс английские термины плюс своеобразное произношение этих терминов плюс местами свой жаргон вроде "гошечки" и "крудошлёпа" Этот гибрид ни один из популярных STT не держит. Потому что его в тренировочных данных почти нет Разбираю ниже, как устроена эта проблема, что с ней делают конкуренты (почти ничего), и что сделали мы

    habr.com/ru/articles/1026778/

    #Whisper #STT #speechtotext #finetuning #LoRA #ASR #NLP #распознавание_речи #русский_язык #codeswitching

  4. Texte flüstern mit Speed of Sound

    Mit "Speed of Sound" gibt es eine neue Anwendung, die Gesprochenes in geschriebenen Text umwandelt. Dabei kommt das kleine Whisper-LLM von OpenAI zum Einsatz. Wie gut das funktioniert, lest ihr hier.

    #STT #Whisper #OpenAI #Speech_to_Text #Linux

    gnulinux.ch/texte-fluestern-mi

  5. I'm trying to set up voice control for Home Assistant.... in Esperanto! There's only, as far as I know, one local option for an Esperanto STT model able to run on a Raspberry Pi: vosk. And let me tell you, the set up (especially with dockerized home assistant) is, uh, a labor of love, let's say.
    Mi sukcesos !
    #homeAssistant #esperanto #vosk #stt #docker #languages

  6. Shitshow nimeltään "hallituksen rasisminvastainen koulutus" jatkuu jatkumistaan.

    #STT on tehnyt tietopyynnön koulutuksen sisällöstä. Sitä on kieltäydytty luovuttamasta.

    Kun se oikeasti pitäisi luovuttaa, sanoo proffa.

    yle.fi/a/74-20164739

    EDIT: Hessussa asiasta Yleä pidemmin:

    hs.fi/politiikka/art-200001126

    #hallitus #sinimustahallitus #rasistihallitus #rasismi #politiikka #MePuhummeTeoin #tietopyyntö #avoimuus

  7. 🌟 Excited to share Thorsten-Voice's YouTube channel! 🎥 🗣️🔊 ♿ 💬

    Thorsten presents innovative TTS solutions and a variety of voice technologies, making it an excellent starting point for anyone interested in open-source text-to-speech. Whether you're a developer, accessibility advocate, or tech enthusiast, his channel offers valuable insights and resources. Don't miss out on this fantastic content! 🎬

    follow hem here: @thorstenvoice
    or on YouTube: youtube.com/@ThorstenMueller YouTube channel!

    #Accessibility #FLOSS #TTS #ParlerTTS #OpenSource #VoiceTech #TextToSpeech #AI #CoquiAI #VoiceAssistant #Sprachassistent #MachineLearning #AccessibilityMatters #FLOSS #TTS #OpenSource #Inclusivity #FOSS #Coqui #AI #CoquiAI #VoiceAssistant #Sprachassistent #VoiceTechnology #KünstlicheStimme #MachineLearning #Python #Rhasspy #TextToSpeech #VoiceTech #STT #SpeechSynthesis #SpeechRecognition #Sprachsynthese #ArtificialVoice #VoiceCloning #Spracherkennung #CoquiTTS #voice #a11y #ScreenReader

  8. ibus-speech-to-text will provide voice dictation capabilities to any application supporting IBus input methods in #Fedora Linux 42, using VOSK for local voice recognition.

    🔗 fedoraproject.org/wiki/Changes

    #ibus #STT #SpeechToText #VOSK

  9. Сравнение систем распознавания русского языка 2024

    После значительной паузы, опять пришло время обновить наше исследование ( прошлое , позапрошлое ) качества систем распознавания русского языка. Опять же, мы не думали, что добежим до этого момента и были удивлены результатами. В этот раз ситуация такая: Какая?

    habr.com/ru/articles/849932/

    #распознавание_речи #речевые_технологии #asr #stt #speechtotext #silero #sber #tinkoff #yandex #voice_kit

  10. Сравнение систем распознавания русского языка 2024

    После значительной паузы, опять пришло время обновить наше исследование ( прошлое , позапрошлое ) качества систем распознавания русского языка. Опять же, мы не думали, что добежим до этого момента и были удивлены результатами. В этот раз ситуация такая: Какая?

    habr.com/ru/articles/849932/

    #распознавание_речи #речевые_технологии #asr #stt #speechtotext #silero #sber #tinkoff #yandex #voice_kit

  11. Сравнение систем распознавания русского языка 2024

    После значительной паузы, опять пришло время обновить наше исследование ( прошлое , позапрошлое ) качества систем распознавания русского языка. Опять же, мы не думали, что добежим до этого момента и были удивлены результатами. В этот раз ситуация такая: Какая?

    habr.com/ru/articles/849932/

    #распознавание_речи #речевые_технологии #asr #stt #speechtotext #silero #sber #tinkoff #yandex #voice_kit

  12. Сравнение систем распознавания русского языка 2024

    После значительной паузы, опять пришло время обновить наше исследование ( прошлое , позапрошлое ) качества систем распознавания русского языка. Опять же, мы не думали, что добежим до этого момента и были удивлены результатами. В этот раз ситуация такая: Какая?

    habr.com/ru/articles/849932/

    #распознавание_речи #речевые_технологии #asr #stt #speechtotext #silero #sber #tinkoff #yandex #voice_kit

  13. 1/X Taas esimerkki suomalaisesta #erillisjournalismi sta.

    #Hesari n julkaisema #STT:n juttu, jossa #KansallinenLiittouma sta puhutaan #laitaoikeisto na.

    Samaan aikaan - ja aina - puolueen kotimaassa #Ranska ssa ja pitkin maailmaa siitä puhutaan #äärioikeisto na

    Miten tuo sana on suomalaiselle medialle täysin ylivoimainen?

    Miten kielen ammattilaiset eivät vieläkään ymmärrä, että #sanat ovat tekoja ja luovat todellisuutta?

    #journalismi #eufemismi #RanskanVaalit #kieli

    hs.fi/maailma/art-200001053828

  14. #STT on perannut Teuvo Hakkaraisen puheenvuoroja europarlamentissa läpi.

    Hyvä muistaa tässä kohtaa, ettei #Hakkarainen ole ollut järin aktiivinen, vaan esim. viettänyt paljon aikaa kokonaan toisessa maanosassa silloisen kultunsa kanssa.

    #persut #äärioikeisto #rasismi #salaliittoteoria #paskapuhetta #EU #europarlamentti #mep #meppi #mepit #politiikka #yhteiskunta #hallitus #sinimustahallitus #laitaoikeistohallitus

    yle.fi/a/74-20041945