#голосовой_ассистент — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #голосовой_ассистент, aggregated by home.social.
-
Вторая жизнь старого смартфона в качестве домашнего сервера
С появлением нейросетей реализовывать идеи в разработке стало гораздо проще. Идеи практически любого масштаба, надо сказать. Хочу рассказать о довольно крупномасштабной. Дисклеймер: этот пост — про вайб-кодинг, поэтому в нём не будет приведено ни единой строки кода. Я просто показываю идею, не детали реализации. И немного мнения о вайбкодинге в целом — в конце публикации.
-
Вторая жизнь старого смартфона в качестве домашнего сервера
С появлением нейросетей реализовывать идеи в разработке стало гораздо проще. Идеи практически любого масштаба, надо сказать. Хочу рассказать о довольно крупномасштабной. Дисклеймер: этот пост — про вайб-кодинг, поэтому в нём не будет приведено ни единой строки кода. Я просто показываю идею, не детали реализации. И немного мнения о вайбкодинге в целом — в конце публикации.
-
Вторая жизнь старого смартфона в качестве домашнего сервера
С появлением нейросетей реализовывать идеи в разработке стало гораздо проще. Идеи практически любого масштаба, надо сказать. Хочу рассказать о довольно крупномасштабной. Дисклеймер: этот пост — про вайб-кодинг, поэтому в нём не будет приведено ни единой строки кода. Я просто показываю идею, не детали реализации. И немного мнения о вайбкодинге в целом — в конце публикации.
-
Вторая жизнь старого смартфона в качестве домашнего сервера
С появлением нейросетей реализовывать идеи в разработке стало гораздо проще. Идеи практически любого масштаба, надо сказать. Хочу рассказать о довольно крупномасштабной. Дисклеймер: этот пост — про вайб-кодинг, поэтому в нём не будет приведено ни единой строки кода. Я просто показываю идею, не детали реализации. И немного мнения о вайбкодинге в целом — в конце публикации.
-
Умная колонка своими руками
В этой статье я расскажу, как сделать своими руками две умные колонки, полностью поддерживающие русский язык: 1) На микроконтроллере esp32s3, используя XiaoZhi 2) На Raspberry Pi автономную голосовую колонку с камерой, которая будет работать и распознавать всё, что не только слышит, но и видит перед собой, даже при отсутствии Интернета! С локально запущенными моделями ИИ, связка Ollama+Gemma3:1b+Moondream+OpenWakeWord+Whisper.cpp+Silero TTS А также расскажу, как подключить обе эти колонки к Home Assistant для управления устройствами умного дома.
https://habr.com/ru/articles/1005272/
#xiaozhi #esp32s3 #голосовой_ассистент #whisper #silero #ollama #raspberrypi
-
Умная колонка своими руками
В этой статье я расскажу, как сделать своими руками две умные колонки, полностью поддерживающие русский язык: 1) На микроконтроллере esp32s3, используя XiaoZhi 2) На Raspberry Pi автономную голосовую колонку с камерой, которая будет работать и распознавать всё, что не только слышит, но и видит перед собой, даже при отсутствии Интернета! С локально запущенными моделями ИИ, связка Ollama+Gemma3:1b+Moondream+OpenWakeWord+Whisper.cpp+Silero TTS А также расскажу, как подключить обе эти колонки к Home Assistant для управления устройствами умного дома.
https://habr.com/ru/articles/1005272/
#xiaozhi #esp32s3 #голосовой_ассистент #whisper #silero #ollama #raspberrypi
-
Умная колонка своими руками
В этой статье я расскажу, как сделать своими руками две умные колонки, полностью поддерживающие русский язык: 1) На микроконтроллере esp32s3, используя XiaoZhi 2) На Raspberry Pi автономную голосовую колонку с камерой, которая будет работать и распознавать всё, что не только слышит, но и видит перед собой, даже при отсутствии Интернета! С локально запущенными моделями ИИ, связка Ollama+Gemma3:1b+Moondream+OpenWakeWord+Whisper.cpp+Silero TTS А также расскажу, как подключить обе эти колонки к Home Assistant для управления устройствами умного дома.
https://habr.com/ru/articles/1005272/
#xiaozhi #esp32s3 #голосовой_ассистент #whisper #silero #ollama #raspberrypi
-
Умная колонка своими руками
В этой статье я расскажу, как сделать своими руками две умные колонки, полностью поддерживающие русский язык: 1) На микроконтроллере esp32s3, используя XiaoZhi 2) На Raspberry Pi автономную голосовую колонку с камерой, которая будет работать и распознавать всё, что не только слышит, но и видит перед собой, даже при отсутствии Интернета! С локально запущенными моделями ИИ, связка Ollama+Gemma3:1b+Moondream+OpenWakeWord+Whisper.cpp+Silero TTS А также расскажу, как подключить обе эти колонки к Home Assistant для управления устройствами умного дома.
https://habr.com/ru/articles/1005272/
#xiaozhi #esp32s3 #голосовой_ассистент #whisper #silero #ollama #raspberrypi
-
Разрабатываем голосового ассистента на Rockchip. Часть 2
Продолжаю разрабатывать DIY голосового ассистента на SOC-платформе Rockchip. В первой части смы соединили в единый конвейер вызов распознавания речи, локального чат-бота и синтез ответа. Если еще не читали, то вам сюда . Во второй части поговорим об улучшениях работы с синтезом речи. Научим нашего ИИ-помощника произносить текст, содержащий сложные для моделей сущности, а также сделаем его более плавным.
https://habr.com/ru/companies/mts_ai/articles/1004144/
#ai #ml #voice #tts #voice_assistant #ииассистент #голосовой_помощник #голосовой_ассистент #голосовой_интерфейс #искусственный_интеллект
-
Разрабатываем голосового ассистента на Rockchip. Часть 2
Продолжаю разрабатывать DIY голосового ассистента на SOC-платформе Rockchip. В первой части смы соединили в единый конвейер вызов распознавания речи, локального чат-бота и синтез ответа. Если еще не читали, то вам сюда . Во второй части поговорим об улучшениях работы с синтезом речи. Научим нашего ИИ-помощника произносить текст, содержащий сложные для моделей сущности, а также сделаем его более плавным.
https://habr.com/ru/companies/mts_ai/articles/1004144/
#ai #ml #voice #tts #voice_assistant #ииассистент #голосовой_помощник #голосовой_ассистент #голосовой_интерфейс #искусственный_интеллект
-
Разрабатываем голосового ассистента на Rockchip. Часть 2
Продолжаю разрабатывать DIY голосового ассистента на SOC-платформе Rockchip. В первой части смы соединили в единый конвейер вызов распознавания речи, локального чат-бота и синтез ответа. Если еще не читали, то вам сюда . Во второй части поговорим об улучшениях работы с синтезом речи. Научим нашего ИИ-помощника произносить текст, содержащий сложные для моделей сущности, а также сделаем его более плавным.
https://habr.com/ru/companies/mts_ai/articles/1004144/
#ai #ml #voice #tts #voice_assistant #ииассистент #голосовой_помощник #голосовой_ассистент #голосовой_интерфейс #искусственный_интеллект
-
Разрабатываем голосового ассистента на Rockchip. Часть 2
Продолжаю разрабатывать DIY голосового ассистента на SOC-платформе Rockchip. В первой части смы соединили в единый конвейер вызов распознавания речи, локального чат-бота и синтез ответа. Если еще не читали, то вам сюда . Во второй части поговорим об улучшениях работы с синтезом речи. Научим нашего ИИ-помощника произносить текст, содержащий сложные для моделей сущности, а также сделаем его более плавным.
https://habr.com/ru/companies/mts_ai/articles/1004144/
#ai #ml #voice #tts #voice_assistant #ииассистент #голосовой_помощник #голосовой_ассистент #голосовой_интерфейс #искусственный_интеллект
-
Без интернета и шпионов: как мы собрали локального голосового ассистента
Облачные ассистенты вроде Алисы , Google Assistant и Siri давно стали привычными. Но у всех у них одни и те же слабые места: зависимость от быстрого интернета и риск утечки данных. И речь не только о персональной информации — дома нередко обсуждают темы, которые можно отнести к коммерческой или даже военной тайне. Неудивительно, что многим некомфортно говорить в присутствии микрофона, который каждое слово отправляет куда-то «в облако» (один из наших заказчиков прямо сказал: «никаких Алис в доме не будет») . На Хабре уже появлялись статьи про попытки заменить Алису на полностью локальные решения. Но почти всегда все сводилось к стандартной схеме: ESP32-микрофон → Home Assistant → intent recognition . Такая связка работает, но до действительно «умного» ассистента ей далеко. Мы пошли дальше и собрали свой голосовой ассистент, о котором расскажем в статье.
https://habr.com/ru/companies/wirenboard/articles/965856/
#Wiren_Board #BARY #Алиса #голосовой_ассистент #распознавание_речи #vosk #Piper #Embedding #Wake_Word #умный_дом
-
Как я Альфе новый навык делал и что из этого вышло
Привет, Хабр! Время от времени я возвращаюсь к своему pet-проекту голосового ассистента с кодовым именем «Альфа», который разрабатывался как приватный голосовой интерфейс (а-ля «умная колонка») для управления своим «Умным домом». И в этот раз — так сошлись звезды или под влиянием магнитных бурь — мне очень захотелось добавить новый навык. А что из этого вышло, читайте далее.
https://habr.com/ru/companies/timeweb/articles/961484/
#голосовой_ассистент #python #natural_language_processing #timeweb_статьи
-
Как я делал голосового ассистента на NLP и не сошел с ума
Голосовые ассистенты давно перестали быть просто игрушкой — теперь это полноценные цифровые помощники, которые умеют общаться, искать информацию и даже шутить (иногда лучше некоторых людей). В этой статье разберём, как собрать своего кастомного ассистента с нуля на Python, используя современные NLP-инструменты. Без Siri, без Alexa, всё своё, родное.
https://habr.com/ru/articles/897862/
#голосовой_ассистент #python #распознавание_речи #синтез_речи #openai #rasa #whisper #nlp #машинное_обучение
-
Робот Xiaozhi: беседа двух роботов
Дополнение к моей предыдущей мини-статье по роботу Xiaozhi. Я заказал детали и комплектующие, чтобы собрать такого робота самостоятельно. Сборка данного робота не доставляет существенных проблем.
https://habr.com/ru/articles/996420/
#робот #Xiaozhi #esp32cam #esp32s3 #программирование_микроконтроллеров #искусственный_интеллект #голосовой_ассистент
-
Пишем персонального AI-ассистента на Python
Современные голосовые помощники это мощные приложения, сочетающие обработку речи, машинное обучение и интеграцию с внешними API. В этой статье мы разберём, как создать базовый проект персонального ассистента на Python, используя библиотеки whisper, webrtcvad, gTTS и другие. Наш ассистент будет: слушать микрофон; определять начало и конец речи с помощью VAD (Voice Activity Detection); преобразовывать речь в текст через модель Whisper; отправлять запросы на локальный LLM для генерации ответа; читать ответ вслух с помощью gTTS; начинать/останавливать запись по нажатию клавиши. Проект может служить как началом для экспериментов, так и для прототипирования реальных решений.
https://habr.com/ru/articles/919720/
#Python #Питон #Голосовой_ассистент #Распознавание_речи #Text_To_Speech #voice_assistant
-
Без интернета и шпионов: как мы собрали локального голосового ассистента
Облачные ассистенты вроде Алисы , Google Assistant и Siri давно стали привычными. Но у всех у них одни и те же слабые места: зависимость от быстрого интернета и риск утечки данных. И речь не только о персональной информации — дома нередко обсуждают темы, которые можно отнести к коммерческой или даже военной тайне. Неудивительно, что многим некомфортно говорить в присутствии микрофона, который каждое слово отправляет куда-то «в облако» (один из наших заказчиков прямо сказал: «никаких Алис в доме не будет») . На Хабре уже появлялись статьи про попытки заменить Алису на полностью локальные решения. Но почти всегда все сводилось к стандартной схеме: ESP32-микрофон → Home Assistant → intent recognition . Такая связка работает, но до действительно «умного» ассистента ей далеко. Мы пошли дальше и собрали свой голосовой ассистент, о котором расскажем в статье.
https://habr.com/ru/companies/wirenboard/articles/965856/
#Wiren_Board #BARY #Алиса #голосовой_ассистент #распознавание_речи #vosk #Piper #Embedding #Wake_Word #умный_дом
-
Без интернета и шпионов: как мы собрали локального голосового ассистента
Облачные ассистенты вроде Алисы , Google Assistant и Siri давно стали привычными. Но у всех у них одни и те же слабые места: зависимость от быстрого интернета и риск утечки данных. И речь не только о персональной информации — дома нередко обсуждают темы, которые можно отнести к коммерческой или даже военной тайне. Неудивительно, что многим некомфортно говорить в присутствии микрофона, который каждое слово отправляет куда-то «в облако» (один из наших заказчиков прямо сказал: «никаких Алис в доме не будет») . На Хабре уже появлялись статьи про попытки заменить Алису на полностью локальные решения. Но почти всегда все сводилось к стандартной схеме: ESP32-микрофон → Home Assistant → intent recognition . Такая связка работает, но до действительно «умного» ассистента ей далеко. Мы пошли дальше и собрали свой голосовой ассистент, о котором расскажем в статье.
https://habr.com/ru/companies/wirenboard/articles/965856/
#Wiren_Board #BARY #Алиса #голосовой_ассистент #распознавание_речи #vosk #Piper #Embedding #Wake_Word #умный_дом
-
Без интернета и шпионов: как мы собрали локального голосового ассистента
Облачные ассистенты вроде Алисы , Google Assistant и Siri давно стали привычными. Но у всех у них одни и те же слабые места: зависимость от быстрого интернета и риск утечки данных. И речь не только о персональной информации — дома нередко обсуждают темы, которые можно отнести к коммерческой или даже военной тайне. Неудивительно, что многим некомфортно говорить в присутствии микрофона, который каждое слово отправляет куда-то «в облако» (один из наших заказчиков прямо сказал: «никаких Алис в доме не будет») . На Хабре уже появлялись статьи про попытки заменить Алису на полностью локальные решения. Но почти всегда все сводилось к стандартной схеме: ESP32-микрофон → Home Assistant → intent recognition . Такая связка работает, но до действительно «умного» ассистента ей далеко. Мы пошли дальше и собрали свой голосовой ассистент, о котором расскажем в статье.
https://habr.com/ru/companies/wirenboard/articles/965856/
#Wiren_Board #BARY #Алиса #голосовой_ассистент #распознавание_речи #vosk #Piper #Embedding #Wake_Word #умный_дом
-
ТРИЗ в разговорном дизайне: как находить оптимальные решения при проектировании сложных сценариев
Я проектирую сценарии голосовых помощников и периодически сталкиваюсь с нетривиальными проблемами. Их решение часто связано с издержками — то диалог получается слишком длинным, то ответ становится неестественным, то пользователь сваливается в бесконечный цикл уточнений и переспросов. Устранить подобные противоречия помогают приёмы ТРИЗ — теории решения изобретательских задач. Вот только есть проблема: эти приёмы были сформулированы для решения инженерных задач, поэтому их использование в дизайне выглядит неуместным — как можно сделать бота пористым, изменить его агрегатное состояние или привести в колебательное движение? Меня зовут Кирилл Богатов, я дизайнер разговорных продуктов в KODE. В этой статье я на примерах покажу, как адаптировал ТРИЗ для работы над голосовым навыком для Алисы. Материал будет полезен дизайнерам и любителям мозговых штурмов.
https://habr.com/ru/articles/776208/
#голосовое_управление #голосовой_помощник #голосовые_интерфейсы #голосовые_ассистенты #голосовой_ассистент #голосовой_поиск #vui #vuiдизайн #дизайн_интерфейсов
-
Vera — ваш личный десктопный агент
В прошлой статье я описывал свой эксперимент по возможностям маленьких LLM. Эта статья идет как продолжение, в которой я расскажу о проделанной работе по изменению и улучшению функционала голосового агента.
https://habr.com/ru/articles/972260/
#агент #qwen3 #голосовой_ассистент #искусственный_интеллект #пк #python
-
Показалось, что ИИ уже ворвался в нашу жизнь, но нет
Несмотря на популярность темы ИИ в инфопространстве в жизни обычных людей до сих пор нет этого ИИ. Мы наблюдаем самые ранние стадии развития технологии, когда в быту ей пользуются новаторы и ранние последователи, но до массового рынка ещё не дошло. В статье расскажу, как применяю ИИ в своих задачах и как его используют мои коллеги и знакомые разработчики. Разберём, как ИИ повлияет на цифровые сервисы в ближайшем будущем и как это отразится на нашем взаимодействии с ними. Посмотрим на негативную сторону ИИ и ответим на вопрос, стоит ли опасаться его массового распространения.
https://habr.com/ru/companies/alfa/articles/785218/
#искусственный_интеллект #ai #чатбот #web_30 #языковая_модель #chatgpt #голосовой_ассистент #диалоговые_системы #автоматизация_рутины #виртуальный_консультант
-
Встречайте MajorDom: умный дом будущего, который действительно умён
В мире умных домов часто приходится выбирать между удобством и функционалом. Раздумывая над тем, каким может быть идеальный умный дом, мы пришли к идее MajorDom — системе, которая стремится изменить этот баланс и упростить быт без жертв. В этом посте поделимся нашим видением и некоторыми основными принципами новой экосистемы, включая приватность, автономность и широкую поддержку устройств.
https://habr.com/ru/articles/813241/
#голосовой_ассистент #кикстартер #умный_дом #smart_home #voice_assistant #kickstarter #majordom #домашняя_автоматизация #разработка_электроники #разработка_по
-
ElevenLabs открыла голосового ассистента для Shopify. Внутри MCP, WebRTC и полностью открытый стек
ElevenLabs выложила в открытый доступ проект Eleven Shopping - голосового агента, который превращает процесс выбора товаров и оформления заказа в диалог с ИИ. В основе - стек Next.js + React + TypeScript + Tailwind CSS и подключение к Shopify Storefront API через протокол MCP .
https://habr.com/ru/articles/963958/
#ecommerce #artificial_intelligence #webrtc #javascript #reactjs #open_source #голосовой_ассистент #программирование #интернетмагазин
-
Как мы дважды потеряли $500 тысяч на одном стартапе
В начале 2024 года мы нашли отличную идею. По всем признакам, это взорвёт рынок и принесёт сотню миллионов долларов. Это виртуальный ассистент, с которым можно общаться голосом. В отличие от Алексы или Алисы он может искать файлы, ставить созвоны, но не это — главное. Ключевой момент в том, что с ним можно поболтать и он способен человека понимать и сопереживать ему. Короче, как если бы ChatGPT с нормальными пресетами засунули в голосовую колонку. Примерно так оно, собственно, и было. Голосовой режим там, кстати, до сих пор потрясает, а красота проекта была именно в промптах для разных ситуаций. Загорелись. Хотелось ворваться на рынок и оседлать волну, так что мы собрали команду, прикинули бюджет, составили график, сделали отсечки. Стартовали с парой разработчиков, потом по ходу дела подключили дизайнеров, маркетологов и других нужных людей. Выпустили MVP, смотрели метрики и вносили поправки. Тогда казалось, что успех неизбежен. Потратили полгода и примерно 500 тысяч долларов, чтобы понять: наш виртуальный друг или подруга почему-то никому не нужны. Поэтому мы учли ошибки, пересобрали ассистента и закопали ещё полмиллиона. Оказалось, что слить такую сумму — это очень просто. Кажется, что ты за всем следишь, всё расписано, а потом оп — и деньги потрачены, а результата нет.
-
Бесперспективный стартап, собравший миллионы долларов?
Нашумевший стартап, презентация которого собрала миллионы просмотров, а устройство получило десятки обзоров. Но шумиху понимают далеко не все — у устройства много проблем. Сегодня R1 может давать нам неплохую справочную информацию в реальном времени, ориентируясь на AI сервис Perplexity + помогать в поиске документации, бронировать отели, заказывать такси — и всё это голосом. Добавлю, что у гаджета интересный форм-фактор, а концепция напоминает голосового помощника сродни всяким ассистентам по типу Siri. Но самое главное — R1 сможет взаимодействовать с интерфейсом любого приложения. Круто, но насколько реализуемо на практике? Давайте разбираться.
https://habr.com/ru/articles/790614/
#Машинное_обучение #Гаджеты #искусственный_интеллект #Rabbit #r1 #голосовой_ассистент #устройства
-
Секрет внутренней связи: откровения Маруси о том, как она научилась слушать себя
Привет, Хабр! Меня зовут Коля Кремер, уже 4 года я работаю в команде мобильного приложения Маруси, где мы постоянно стараемся сделать так, чтобы с нашим помощником было удобно и интересно общаться. Я несколько раз начинал писать и откладывал этот ретроспективный пост, но потом к нему подключились ребята из нашей команды и помог довести его до публикации. Хочу поблагодарить Влада Голоднюка, старшего программиста, и Пашу Муханова, руководителя мобильной разработки, и рассказать сообществу Хабра о том, как мы отучили Марусю в приложении триггериться на себя и научили правильно слышать и понимать ваши запросы.
https://habr.com/ru/companies/vk/articles/782944/
#шумодав #маруся #триггеры #голосовой_помощник #голосовой_ассистент #мобильные_приложения
-
ТРИЗ в разговорном дизайне: как находить оптимальные решения при проектировании сложных сценариев
Я проектирую сценарии голосовых помощников и периодически сталкиваюсь с нетривиальными проблемами. Их решение часто связано с издержками — то диалог получается слишком длинным, то ответ становится неестественным, то пользователь сваливается в бесконечный цикл уточнений и переспросов. Устранить подобные противоречия помогают приёмы ТРИЗ — теории решения изобретательских задач. Вот только есть проблема: эти приёмы были сформулированы для решения инженерных задач, поэтому их использование в дизайне выглядит неуместным — как можно сделать бота пористым, изменить его агрегатное состояние или привести в колебательное движение? Меня зовут Кирилл Богатов, я дизайнер разговорных продуктов в KODE. В этой статье я на примерах покажу, как адаптировал ТРИЗ для работы над голосовым навыком для Алисы. Материал будет полезен дизайнерам и любителям мозговых штурмов.
https://habr.com/ru/articles/776208/
#голосовое_управление #голосовой_помощник #голосовые_интерфейсы #голосовые_ассистенты #голосовой_ассистент #голосовой_поиск #vui #vuiдизайн #дизайн_интерфейсов
-
Будущее голосовых ассистентов: Когда ваш телефонный звонок примет ИИ
Привет, Хабр! Сегодня мы поговорим о технологии, которая незаметно становится частью нашей повседневности — голосовых ассистентах. Но если вы думаете, что Siri и Алиса уже достигли пика развития, приготовьтесь удивляться. Ближайшее будущее обещает нам ассистентов, которые не просто расскажут о погоде или включат музыку, а полноценно заменят человека в телефонных переговорах.
-
Голосовой ассистент на python
Всем привет, я программист-любитель, изучающий язык python уже многие годы. Не буду долго тянуть с приветствием и сразу перейду к делу. Этот гайд является по сути пошаговой инструкцией для создания базового кода голосового ассистента, который можно будет потом расширять и дополнять. Читать
-
Робот Xiaozhi: беседа двух роботов
Дополнение к моей предыдущей мини-статье по роботу Xiaozhi. Я заказал детали и комплектующие, чтобы собрать такого робота самостоятельно. Сборка данного робота не доставляет существенных проблем.
https://habr.com/ru/articles/996420/
#робот #Xiaozhi #esp32cam #esp32s3 #программирование_микроконтроллеров #искусственный_интеллект #голосовой_ассистент
-
Робот Xiaozhi: беседа двух роботов
Дополнение к моей предыдущей мини-статье по роботу Xiaozhi. Я заказал детали и комплектующие, чтобы собрать такого робота самостоятельно. Сборка данного робота не доставляет существенных проблем.
https://habr.com/ru/articles/996420/
#робот #Xiaozhi #esp32cam #esp32s3 #программирование_микроконтроллеров #искусственный_интеллект #голосовой_ассистент
-
Робот Xiaozhi: беседа двух роботов
Дополнение к моей предыдущей мини-статье по роботу Xiaozhi. Я заказал детали и комплектующие, чтобы собрать такого робота самостоятельно. Сборка данного робота не доставляет существенных проблем.
https://habr.com/ru/articles/996420/
#робот #Xiaozhi #esp32cam #esp32s3 #программирование_микроконтроллеров #искусственный_интеллект #голосовой_ассистент
-
Пишем персонального AI-ассистента на Python
Современные голосовые помощники это мощные приложения, сочетающие обработку речи, машинное обучение и интеграцию с внешними API. В этой статье мы разберём, как создать базовый проект персонального ассистента на Python, используя библиотеки whisper, webrtcvad, gTTS и другие. Наш ассистент будет: слушать микрофон; определять начало и конец речи с помощью VAD (Voice Activity Detection); преобразовывать речь в текст через модель Whisper; отправлять запросы на локальный LLM для генерации ответа; читать ответ вслух с помощью gTTS; начинать/останавливать запись по нажатию клавиши. Проект может служить как началом для экспериментов, так и для прототипирования реальных решений.
https://habr.com/ru/articles/919720/
#Python #Питон #Голосовой_ассистент #Распознавание_речи #Text_To_Speech #voice_assistant
-
Пишем персонального AI-ассистента на Python
Современные голосовые помощники это мощные приложения, сочетающие обработку речи, машинное обучение и интеграцию с внешними API. В этой статье мы разберём, как создать базовый проект персонального ассистента на Python, используя библиотеки whisper, webrtcvad, gTTS и другие. Наш ассистент будет: слушать микрофон; определять начало и конец речи с помощью VAD (Voice Activity Detection); преобразовывать речь в текст через модель Whisper; отправлять запросы на локальный LLM для генерации ответа; читать ответ вслух с помощью gTTS; начинать/останавливать запись по нажатию клавиши. Проект может служить как началом для экспериментов, так и для прототипирования реальных решений.
https://habr.com/ru/articles/919720/
#Python #Питон #Голосовой_ассистент #Распознавание_речи #Text_To_Speech #voice_assistant
-
Пишем персонального AI-ассистента на Python
Современные голосовые помощники это мощные приложения, сочетающие обработку речи, машинное обучение и интеграцию с внешними API. В этой статье мы разберём, как создать базовый проект персонального ассистента на Python, используя библиотеки whisper, webrtcvad, gTTS и другие. Наш ассистент будет: слушать микрофон; определять начало и конец речи с помощью VAD (Voice Activity Detection); преобразовывать речь в текст через модель Whisper; отправлять запросы на локальный LLM для генерации ответа; читать ответ вслух с помощью gTTS; начинать/останавливать запись по нажатию клавиши. Проект может служить как началом для экспериментов, так и для прототипирования реальных решений.
https://habr.com/ru/articles/919720/
#Python #Питон #Голосовой_ассистент #Распознавание_речи #Text_To_Speech #voice_assistant
-
Встречайте MajorDom: умный дом будущего, который действительно умён
В мире умных домов часто приходится выбирать между удобством и функционалом. Раздумывая над тем, каким может быть идеальный умный дом, мы пришли к идее MajorDom — системе, которая стремится изменить этот баланс и упростить быт без жертв. В этом посте поделимся нашим видением и некоторыми основными принципами новой экосистемы, включая приватность, автономность и широкую поддержку устройств.
https://habr.com/ru/articles/813241/
#голосовой_ассистент #кикстартер #умный_дом #smart_home #voice_assistant #kickstarter #majordom #домашняя_автоматизация #разработка_электроники #разработка_по
-
Встречайте MajorDom: умный дом будущего, который действительно умён
В мире умных домов часто приходится выбирать между удобством и функционалом. Раздумывая над тем, каким может быть идеальный умный дом, мы пришли к идее MajorDom — системе, которая стремится изменить этот баланс и упростить быт без жертв. В этом посте поделимся нашим видением и некоторыми основными принципами новой экосистемы, включая приватность, автономность и широкую поддержку устройств.
https://habr.com/ru/articles/813241/
#голосовой_ассистент #кикстартер #умный_дом #smart_home #voice_assistant #kickstarter #majordom #домашняя_автоматизация #разработка_электроники #разработка_по
-
Встречайте MajorDom: умный дом будущего, который действительно умён
В мире умных домов часто приходится выбирать между удобством и функционалом. Раздумывая над тем, каким может быть идеальный умный дом, мы пришли к идее MajorDom — системе, которая стремится изменить этот баланс и упростить быт без жертв. В этом посте поделимся нашим видением и некоторыми основными принципами новой экосистемы, включая приватность, автономность и широкую поддержку устройств.
https://habr.com/ru/articles/813241/
#голосовой_ассистент #кикстартер #умный_дом #smart_home #voice_assistant #kickstarter #majordom #домашняя_автоматизация #разработка_электроники #разработка_по