home.social

#голос — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #голос, aggregated by home.social.

  1. Топ инструментов для перевода голоса в текст: Speech2Text, BotHub, Yandex SpeechKit и другие

    Помните, как мы смотрели фантастику и завидовали Тони Старку с его Джарвисом? Казалось, еще чуть-чуть, и машины заговорят с нами голосами британских дворецких. Но реальность долго била по ушам: ранние синтезаторы речи звучали как робот Вертер с хроническим насморком, а навигаторы ставили такие ударЕния, что хотелось выйти из машины. Но добро пожаловать в 2026 год. Нейросети наконец-то научились дышать, делать драматические паузы и играть интонациями. Теперь искусственные голоса озвучивают аудиокниги, подкасты, YouTube-каналы и даже не пытаются выдать свое машинное происхождение. Кажется, будущее наступило, но везде ли оно одинаково качественное? В этом материале мы собрали 5 сервисов для синтеза речи - от мастодонтов рынка до дерзких новичков - и прогнали их через суровые тесты. Поехали слушать, кто из них уже готов заменить живого диктора, а кому еще учить азбуку!

    habr.com/ru/companies/bothub/a

    #ии #нейросети #ai #синтез_речи #голос #машинное+обучение

  2. Синтез речи ◍ 2025: топ-4 бесплатных нейросетей для озвучки текста

    Искусственный интеллект давно перестал быть набором скучных алгоритмов. Это и художник, который рисует словами, и переводчик, что ломает языковые барьеры, и музыкант, играющий на голосовых нотах. Но есть у него ещё одно дело, в котором он преуспел, — синтез речи. Но всё ли так гладко? Просто тараторить текст — мало. Настоящий голос должен видеть запятые, чувствовать паузы, играть интонациями и уметь погружать. Он должен звучать не как робот, а как рассказчик с характером. С душой — насколько это вообще возможно для машины. Поэтому мы устроим кастинг четырём нейросетям. Послушаем, как они звучат, как держат паузы, как справляются с эмоциями. И главное — попробуем понять: насколько близко они подошли к имитации живого рассказчика. А чтобы было интересно, мы вдохновились атмосферой «Хоббита». Интересно, смогла бы нейросеть рассказать о приключениях лучше самого Бильбо Бэггинса? Сегодня алгоритмы получат Толкина, омографы, арабский язык — и замок, который может быть замком. Готовьте Ваши уши — мы начинаем!

    habr.com/ru/companies/bothub/a

    #нейросети #синтез_речи #озвучка_текста #омографы #ElevenLabs #Voicemaker #Robivox #APIHost #речь #голос

  3. Я не иду по чужим маршрутам. Я проектирую свои.
    Если дорога готова — значит, она не твоя.

    Я не ищу “шаг 1–2–3”. Я слушаю, где отклик. Рисую, пробую, ошибаюсь. Мой путь — как архитекторский чертёж: с поправками, с болью, с верой. Но мой.

    #путь #уникальность #архитектор #маршрут #голос
    t.me/tribute/app?startapp=srfZ
    P.S. Made by a madman — Kirill Bereznev
    t.me/tribute/app?startapp=srfZ

  4. Сексуальная окраска голоса ИИ

    Игорь Ашманов еще десять лет назад сказал , что в результате маркетинговых исследований первых роботов-пылесосов пионеры домашней робототехники буду сфокусированы на эмоциональном взаимодействии между домашним роботом и хозяином. В его примере робот-пылесос формировал эмоциональную привязанность у молодых бабушек. В 50 лет у женщины происходит перестройка организма, и появляется потребность заботиться о внуке – маленьком беспомощном существе. И эту потребность частично закрывает робот-пылесос. На своих семинарах я часто задаю вопрос: «Через 30 лет молодой одинокий обеспеченный мужчина придет покупать домашнего робота в магазин, где будут представлены все возможные образы роботов – от кошки до бабушки. Какой внешний вид робота будет покупать одинокий мужчина больше других?» Чаще всего слушатели отвечают, что это будут образы красивых девушек. При этом очевидно, что пул домашних роботов не может состоять только из красивых девушек, которые общаются таким образом, чтобы влюбить в себя хозяина. Для большинства молодых мужчин красивая женщина рядом – это главное, но далеко не единственное в его жизни. Среди домашних роботов будет много мужчин, бабушек, кошечек, собачек, виртуальных персонажей. Если робот – красивая девушка – будет говорить только в эротическом голосовом режиме, хозяину он быстро надоест, и эмоциональная привязанность не сформируется. Важно чередование положительных и отрицательных эмоций в голосе. Важны эмоции уважения, восхищения, признания ценности хозяина. Важны эмоциональное сближение и дистанцирование с хозяином, в частности, за счет чередования разных голосовых режимов.

    habr.com/ru/articles/875584/

    #искусственный_интеллект #сексуальность #эмоции #голос

  5. Супер-популярные вокалоиды. Кейс Мику Хацунэ

    Речь пойдет о виртуальных артистах, которые собирают стадионы живых поклонников. Ради того, чтобы те на танцполе или с трибун смогли чествовать виртуальное, абсолютно неживое цифровое изображение, которое они видят на сцене. Некорторые "нереальные" поп-исполнители, "вокалоиды" стали популярнее живых поп- и рок-идолов. Vocaloid (от англ. vocals и android)-изначально программное обеспечение от корпорации Yamaha, имитирующее голос поющего человека на основе заданных мелодий и текста, использующее технологию полного синтеза речи с использованием ранее запомненных фрагментов естественного языка. Одним из самых ярких и, несомненно, супер-удачных вокалоидов является японская виртуальная певица Мику Хацунэ. У Мику есть живой прототип, исполнительница-человек Саки Фудзита. В отличие от своей виртуальной коллеги, она известна лишь специалистам, как певица, которая озвучила песни в нескольких японских мультфильмах - анимэ. Профессиональный звездный час закадровой исполнительницы настал, когда она согласилась передать свой вокал в качестве образца прототипа для Хацунэ.

    habr.com/ru/articles/824498/

    #анимация_и_3d_графика #анимация #голос #музыкальный_бизнес #музыка #популярность

  6. Deepvoice = Deep Trouble. Новая схема атаки с помощью генерации голоса знакомых и коллег

    В начале 2024 года в России появилась новая схема атак на людей — в ней злоумышленники вымогают деньги голосами родственников и друзей, а в корпоративных фродах — голосами руководителей. Генерация голоса уже замечена в схеме Fake Boss, схеме с поддельным фото банковской карты и схеме угона аккаунта в соцсетях. Больше всего случаев встречается в Телеграме — мошенники взламывают аккаунт, генерируют голос владельца аккаунта и рассылают по всем чатам короткое голосовое сообщение с просьбой выслать денег. Мы разобрали новую схему по шагам — на примерах рассказываем об атаке на людей, а в конце даем советы, как защитить аккаунты и противостоять новой схеме.

    habr.com/ru/companies/StartX/a

    #дипфейки #аудио #голос #кража_денег #мессенджеры #бизнес #банки #ии #социальная_инженерия #фишинг

  7. @rf Готовы ли вы отказаться от тайны голосования? #голосование #голос