#голосовой_ввод — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-04 · 13:22 UTC

Govorun PC: переносим офлайн-диктовку с Android на Windows за один вечер (с Claude)

На Android у меня живёт Govorun Lite — офлайн-диктовка на русском. Нажал кнопку, сказал, текст вставился. Никаких облаков, никакой отправки голоса на серверы. Работает через GigaAM v2 от Сбера. Проблема одна: на ПК такого нет. Встроенная Windows-диктовка — онлайн. Whisper — либо медленный, либо требует видеокарту. Сторонние сервисы — снова облако. Я решил портировать Govorun на Windows, и для ускорения взял Claude как пару-программиста. Что из этого вышло — в этой статье.

https://habr.com/ru/articles/1031240/

#python #speechrecognition #onnx #windows #llm #голосовой_ввод

#голосовой_ввод #llm #windows #onnx #speechrecognition #python

Habr @[email protected] · 2026-05-04 · 13:22 UTC

Govorun PC: переносим офлайн-диктовку с Android на Windows за один вечер (с Claude)

На Android у меня живёт Govorun Lite — офлайн-диктовка на русском. Нажал кнопку, сказал, текст вставился. Никаких облаков, никакой отправки голоса на серверы. Работает через GigaAM v2 от Сбера. Проблема одна: на ПК такого нет. Встроенная Windows-диктовка — онлайн. Whisper — либо медленный, либо требует видеокарту. Сторонние сервисы — снова облако. Я решил портировать Govorun на Windows, и для ускорения взял Claude как пару-программиста. Что из этого вышло — в этой статье.

https://habr.com/ru/articles/1031240/

#python #speechrecognition #onnx #windows #llm #голосовой_ввод

#голосовой_ввод #llm #windows #onnx #speechrecognition #python

Habr @[email protected] · 2026-05-04 · 13:22 UTC

Govorun PC: переносим офлайн-диктовку с Android на Windows за один вечер (с Claude)

На Android у меня живёт Govorun Lite — офлайн-диктовка на русском. Нажал кнопку, сказал, текст вставился. Никаких облаков, никакой отправки голоса на серверы. Работает через GigaAM v2 от Сбера. Проблема одна: на ПК такого нет. Встроенная Windows-диктовка — онлайн. Whisper — либо медленный, либо требует видеокарту. Сторонние сервисы — снова облако. Я решил портировать Govorun на Windows, и для ускорения взял Claude как пару-программиста. Что из этого вышло — в этой статье.

https://habr.com/ru/articles/1031240/

#python #speechrecognition #onnx #windows #llm #голосовой_ввод

#голосовой_ввод #llm #windows #onnx #speechrecognition #python

Habr @[email protected] · 2026-05-04 · 13:22 UTC

Govorun PC: переносим офлайн-диктовку с Android на Windows за один вечер (с Claude)

На Android у меня живёт Govorun Lite — офлайн-диктовка на русском. Нажал кнопку, сказал, текст вставился. Никаких облаков, никакой отправки голоса на серверы. Работает через GigaAM v2 от Сбера. Проблема одна: на ПК такого нет. Встроенная Windows-диктовка — онлайн. Whisper — либо медленный, либо требует видеокарту. Сторонние сервисы — снова облако. Я решил портировать Govorun на Windows, и для ускорения взял Claude как пару-программиста. Что из этого вышло — в этой статье.

https://habr.com/ru/articles/1031240/

#python #speechrecognition #onnx #windows #llm #голосовой_ввод

Habr @[email protected] · 2026-02-21 · 16:22 UTC

Как я снизил WER с 33% до 3.3% для русской речи на CPU: сравнение GigaAM, Whisper и Vosk

За два месяца я перепробовал три ASR-движка, шесть моделей Whisper, адаптивное чанкование, T5-коррекцию и ансамблевое голосование — и большая часть идей оказалась тупиком. В статье — подробный разбор шести тупиков и одной находки: почему GigaAM от Сбера на обычном CPU показывает 3.3% WER на русском, обходя Whisper large-v3-turbo на RTX 4090 (7.9%) в 2.4 раза. С бенчмарками, кодом и честными оговорками.

https://habr.com/ru/articles/1002260/

#speechtotext #gigaam #whisper #vosk #onnx #распознавание_речи #WER #голосовой_ввод #ASR #python

#python #asr #голосовой_ввод #wer #распознавание_речи #onnx

Habr @[email protected] · 2026-04-17 · 12:02 UTC

Голосовой ввод на русско-английском в 2026: WisprFlow, Handy, OpenWhispr, GigaAM v3 — для диктовки нейросетям и кода

Голосом мы говорим в 2-3 раза быстрее, чем печатаем — это давно известно. Вопрос только в том, умеет ли голосовой ввод разбираться с русско-английской смесью, на которой мы общаемся с LLM и пишем код: «объясни на русском», «открой в Cursor», «проверь, что deploy прошёл». За полгода я перепробовал 5+ приложений и 5 моделей, чтобы найти те, что умеют. Приложения : WisprFlow, SpeakFlow, Handy, OpenWhispr, SuperWhisper — облачные и локальные, платные и open source. Модели : Whisper Large v3, Turbo, GigaAM v3 от Сбера, Canary 1B v2 от NVIDIA, Parakeet V3. Внутри: — Замена облачного WisprFlow на бесплатный open source без потери качества. — Один текстовый промпт, починивший пропадающую пунктуацию в 99% случаев — без LLM-постпроцессоров и задержек. — Мой бенчмарк Whisper Turbo vs Large v3 на RTX 5070 Ti (Vulkan на Blackwell внезапно быстрее CUDA на 50%). — GigaAM v3 и Canary 1B v2 — где конкурируют с Whisper, а где ломают английские слова в кириллицу («Gemini» → «Jemni»). — Первый в моей жизни принятый в main pull request в open source. Актуально на апрель 2026.

https://habr.com/ru/articles/1024634/

#whisper #голосовой_ввод #транскрибация #gigaam #распознавание_речи #openwhispr #cuda #vulkan #superwhisper #нейросети

#нейросети #superwhisper #vulkan #cuda #openwhispr #распознавание_речи

Habr @[email protected] · 2026-04-25 · 15:12 UTC

Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3

Написал полностью офлайновый голосовой ввод на русском для Android. Никаких серверов, подписок и привязок к аккаунтам. За распознавание отвечает открытая нейросеть GigaAM v3 от Сбера: модель зашита прямо в APK, работает без интернета и отлично расставляет знаки препинания. Главная фишка — не нужно отказываться от любимой клавиатуры со свайпом. Это не замена Gboard, а просто плавающая кнопка, которая появляется поверх любого поля ввода. Работает элементарно: тапнул — говоришь. Как только делаешь естественную паузу в речи, готовый текст тут же влетает в активное окно. Напрямую, минуя буфер обмена. Стек: GigaAM v3 + sherpa-onnx (NNAPI / CPU) + крошечный детектор речи Silero VAD. Требования: Android 13+, ARM64. Исходники открыты (MIT).

https://habr.com/ru/articles/1027884/

#Android #GigaAM #голосовой_ввод #распознавание_речи #sherpaonnx #русский_язык #open_source #говорун

#говорун #open_source #русский_язык #sherpaonnx #распознавание_речи #голосовой_ввод

Habr @[email protected] · 2026-04-16 · 15:02 UTC

Управление агентом с телефона через Telegram теперь в KodaCode

Все популярные агенты движутся в одну сторону: управление ими должно быть максимально удобным и естественным. Голосовой ввод появился в ведущих зарубежных решениях, как и remote control, который несколько недель назад стал доступен в Codex и Claude Code. В этом релизе мы добавили обе возможности в KodaCode . Разберём по порядку.

https://habr.com/ru/companies/koda/articles/1024296/

#AIагент_для_разработчиков #remote_control #голосовой_ввод #KodaCode #AIассистент #автодополнение_кода #Next_Edit_Prediction #Telegramбот #IDEплагин #инструменты_разработчика

#инструменты_разработчика #ideплагин #telegramбот #next_edit_prediction #автодополнение_кода #aiассистент

Habr @[email protected] · 2025-05-27 · 04:42 UTC

Pocupochki: когда лень писать список покупок, но есть 2 часа и доступ к Gemini

Рассказываю, как с помощью Google Stitch за 30 секунд получил готовый дизайн приложения, а потом с Gemini за пару часов превратил его в работающий сервис с голосовым вводом. Посмотреть

https://habr.com/ru/articles/913004/

#gemini_api #google_stitch #голосовой_ввод #список_покупок #вайбкодинг #websocket #nodejs #javascript #gemini_flash #google_io_2025

#google_io_2025 #gemini_flash #javascript #nodejs #websocket #вайбкодинг

Habr @[email protected] · 2026-04-14 · 03:42 UTC

Голосовой ввод в Claude на русском — бесплатно и офлайн за один вечер

Автор: Дмитрий Сосунов совместно с Claude Уровень: для тех кто не программист, но не боится терминала Время: один вечер Результат: иконка в строке меню Mac → нажал Запустить → говоришь в Claude

https://habr.com/ru/articles/1023104/

#голосовой_ввод #бесплатно

#бесплатно #голосовой_ввод

Habr @[email protected] · 2026-03-12 · 15:22 UTC

Локальный голосовой ввод: Whisper + Ollama на Python

Мне нужен был голосовой ввод. Не диктовка в Google Docs, не облачный API — а простая штука: зажал клавишу, сказал, отпустил, текст появился в активном окне. Локально, без отправки аудио куда-либо. Готовых решений, которые бы устроили, сходу не нашёл. Сделал свое. Может, кому будет полезно.

https://habr.com/ru/articles/1009538/

#whisper #ollama #speechtotext #voicetotext #pushtotalk #голосовой_ввод #python #localfirst #privacy

#privacy #localfirst #python #голосовой_ввод #pushtotalk #voicetotext

Habr @[email protected] · 2026-01-24 · 17:22 UTC

Как я экономлю 10+ часов в неделю, заменив клавиатуру на умный голосовой ввод

Каждый день я пишу тысячи слов текста. И долгое время я тратил на это неприлично много времени. Год назад я начал использовать умный голосовой ввод. Теперь я просто наговариваю тексты голосом, а LLM превращает это в грамотно оформленный текст с правильной структурой и пунктуацией. Экономия — минимум 10 часов в неделю. Очевидный лайфхак? Да. Но им пользуется ничтожное меньшинство, даже среди тех, кто работает с ИИ каждый день. В этой статье расскажу про исследования, которые подтверждают эффективность голосового ввода, покажу конкретные сценарии использования и сравню популярные инструменты, которые проверил лично.

https://habr.com/ru/articles/988598/

#голосовой_ввод #продуктивность #wispr_flow #superwhisper #промптинг #AIинструменты #claude_code #автоматизация #вайбкодинг #speechtotext

#speechtotext #вайбкодинг #автоматизация #claude_code #aiинструменты #промптинг

Habr @[email protected] · 2026-04-16 · 15:02 UTC

Управление агентом с телефона через Telegram теперь в KodaCode

Все популярные агенты движутся в одну сторону: управление ими должно быть максимально удобным и естественным. Голосовой ввод появился в ведущих зарубежных решениях, как и remote control, который несколько недель назад стал доступен в Codex и Claude Code. В этом релизе мы добавили обе возможности в KodaCode . Разберём по порядку.

https://habr.com/ru/companies/koda/articles/1024296/

#AIагент_для_разработчиков #remote_control #голосовой_ввод #KodaCode #AIассистент #автодополнение_кода #Next_Edit_Prediction #Telegramбот #IDEплагин #инструменты_разработчика

#инструменты_разработчика #ideплагин #telegramбот #next_edit_prediction #автодополнение_кода #aiассистент

Habr @[email protected] · 2026-04-16 · 15:02 UTC

Управление агентом с телефона через Telegram теперь в KodaCode

Все популярные агенты движутся в одну сторону: управление ими должно быть максимально удобным и естественным. Голосовой ввод появился в ведущих зарубежных решениях, как и remote control, который несколько недель назад стал доступен в Codex и Claude Code. В этом релизе мы добавили обе возможности в KodaCode . Разберём по порядку.

https://habr.com/ru/companies/koda/articles/1024296/

#AIагент_для_разработчиков #remote_control #голосовой_ввод #KodaCode #AIассистент #автодополнение_кода #Next_Edit_Prediction #Telegramбот #IDEплагин #инструменты_разработчика

#инструменты_разработчика #ideплагин #telegramбот #next_edit_prediction #автодополнение_кода #aiассистент

Habr @[email protected] · 2026-04-16 · 15:02 UTC

Управление агентом с телефона через Telegram теперь в KodaCode

Все популярные агенты движутся в одну сторону: управление ими должно быть максимально удобным и естественным. Голосовой ввод появился в ведущих зарубежных решениях, как и remote control, который несколько недель назад стал доступен в Codex и Claude Code. В этом релизе мы добавили обе возможности в KodaCode . Разберём по порядку.

https://habr.com/ru/companies/koda/articles/1024296/

#AIагент_для_разработчиков #remote_control #голосовой_ввод #KodaCode #AIассистент #автодополнение_кода #Next_Edit_Prediction #Telegramбот #IDEплагин #инструменты_разработчика

#aiагент_для_разработчиков #remote_control #голосовой_ввод #kodacode #aiассистент #автодополнение_кода

Habr @[email protected] · 2026-02-21 · 16:22 UTC

Как я снизил WER с 33% до 3.3% для русской речи на CPU: сравнение GigaAM, Whisper и Vosk

За два месяца я перепробовал три ASR-движка, шесть моделей Whisper, адаптивное чанкование, T5-коррекцию и ансамблевое голосование — и большая часть идей оказалась тупиком. В статье — подробный разбор шести тупиков и одной находки: почему GigaAM от Сбера на обычном CPU показывает 3.3% WER на русском, обходя Whisper large-v3-turbo на RTX 4090 (7.9%) в 2.4 раза. С бенчмарками, кодом и честными оговорками.

https://habr.com/ru/articles/1002260/

#speechtotext #gigaam #whisper #vosk #onnx #распознавание_речи #WER #голосовой_ввод #ASR #python

#python #asr #голосовой_ввод #wer #распознавание_речи #onnx

Habr @[email protected] · 2026-02-21 · 16:22 UTC

Как я снизил WER с 33% до 3.3% для русской речи на CPU: сравнение GigaAM, Whisper и Vosk

За два месяца я перепробовал три ASR-движка, шесть моделей Whisper, адаптивное чанкование, T5-коррекцию и ансамблевое голосование — и большая часть идей оказалась тупиком. В статье — подробный разбор шести тупиков и одной находки: почему GigaAM от Сбера на обычном CPU показывает 3.3% WER на русском, обходя Whisper large-v3-turbo на RTX 4090 (7.9%) в 2.4 раза. С бенчмарками, кодом и честными оговорками.

https://habr.com/ru/articles/1002260/

#speechtotext #gigaam #whisper #vosk #onnx #распознавание_речи #WER #голосовой_ввод #ASR #python

#python #asr #голосовой_ввод #wer #распознавание_речи #onnx

Habr @[email protected] · 2026-02-21 · 16:22 UTC

Как я снизил WER с 33% до 3.3% для русской речи на CPU: сравнение GigaAM, Whisper и Vosk

За два месяца я перепробовал три ASR-движка, шесть моделей Whisper, адаптивное чанкование, T5-коррекцию и ансамблевое голосование — и большая часть идей оказалась тупиком. В статье — подробный разбор шести тупиков и одной находки: почему GigaAM от Сбера на обычном CPU показывает 3.3% WER на русском, обходя Whisper large-v3-turbo на RTX 4090 (7.9%) в 2.4 раза. С бенчмарками, кодом и честными оговорками.

https://habr.com/ru/articles/1002260/

#speechtotext #gigaam #whisper #vosk #onnx #распознавание_речи #WER #голосовой_ввод #ASR #python

#speechtotext #gigaam #whisper #vosk #onnx #распознавание_речи

Habr @[email protected] · 2026-04-25 · 15:12 UTC

Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3

Написал полностью офлайновый голосовой ввод на русском для Android. Никаких серверов, подписок и привязок к аккаунтам. За распознавание отвечает открытая нейросеть GigaAM v3 от Сбера: модель зашита прямо в APK, работает без интернета и отлично расставляет знаки препинания. Главная фишка — не нужно отказываться от любимой клавиатуры со свайпом. Это не замена Gboard, а просто плавающая кнопка, которая появляется поверх любого поля ввода. Работает элементарно: тапнул — говоришь. Как только делаешь естественную паузу в речи, готовый текст тут же влетает в активное окно. Напрямую, минуя буфер обмена. Стек: GigaAM v3 + sherpa-onnx (NNAPI / CPU) + крошечный детектор речи Silero VAD. Требования: Android 13+, ARM64. Исходники открыты (MIT).

https://habr.com/ru/articles/1027884/

#Android #GigaAM #голосовой_ввод #распознавание_речи #sherpaonnx #русский_язык #open_source #говорун

#говорун #open_source #русский_язык #sherpaonnx #распознавание_речи #голосовой_ввод

Habr @[email protected] · 2026-04-25 · 15:12 UTC

Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3

Написал полностью офлайновый голосовой ввод на русском для Android. Никаких серверов, подписок и привязок к аккаунтам. За распознавание отвечает открытая нейросеть GigaAM v3 от Сбера: модель зашита прямо в APK, работает без интернета и отлично расставляет знаки препинания. Главная фишка — не нужно отказываться от любимой клавиатуры со свайпом. Это не замена Gboard, а просто плавающая кнопка, которая появляется поверх любого поля ввода. Работает элементарно: тапнул — говоришь. Как только делаешь естественную паузу в речи, готовый текст тут же влетает в активное окно. Напрямую, минуя буфер обмена. Стек: GigaAM v3 + sherpa-onnx (NNAPI / CPU) + крошечный детектор речи Silero VAD. Требования: Android 13+, ARM64. Исходники открыты (MIT).

https://habr.com/ru/articles/1027884/

#Android #GigaAM #голосовой_ввод #распознавание_речи #sherpaonnx #русский_язык #open_source #говорун

#android #gigaam #голосовой_ввод #распознавание_речи #sherpaonnx #русский_язык

Habr @[email protected] · 2026-04-17 · 12:02 UTC

Голосовой ввод на русско-английском в 2026: WisprFlow, Handy, OpenWhispr, GigaAM v3 — для диктовки нейросетям и кода

Голосом мы говорим в 2-3 раза быстрее, чем печатаем — это давно известно. Вопрос только в том, умеет ли голосовой ввод разбираться с русско-английской смесью, на которой мы общаемся с LLM и пишем код: «объясни на русском», «открой в Cursor», «проверь, что deploy прошёл». За полгода я перепробовал 5+ приложений и 5 моделей, чтобы найти те, что умеют. Приложения : WisprFlow, SpeakFlow, Handy, OpenWhispr, SuperWhisper — облачные и локальные, платные и open source. Модели : Whisper Large v3, Turbo, GigaAM v3 от Сбера, Canary 1B v2 от NVIDIA, Parakeet V3. Внутри: — Замена облачного WisprFlow на бесплатный open source без потери качества. — Один текстовый промпт, починивший пропадающую пунктуацию в 99% случаев — без LLM-постпроцессоров и задержек. — Мой бенчмарк Whisper Turbo vs Large v3 на RTX 5070 Ti (Vulkan на Blackwell внезапно быстрее CUDA на 50%). — GigaAM v3 и Canary 1B v2 — где конкурируют с Whisper, а где ломают английские слова в кириллицу («Gemini» → «Jemni»). — Первый в моей жизни принятый в main pull request в open source. Актуально на апрель 2026.

https://habr.com/ru/articles/1024634/

#whisper #голосовой_ввод #транскрибация #gigaam #распознавание_речи #openwhispr #cuda #vulkan #superwhisper #нейросети

#нейросети #superwhisper #vulkan #cuda #openwhispr #распознавание_речи

Habr @[email protected] · 2026-04-17 · 12:02 UTC

Голосовой ввод на русско-английском в 2026: WisprFlow, Handy, OpenWhispr, GigaAM v3 — для диктовки нейросетям и кода

Голосом мы говорим в 2-3 раза быстрее, чем печатаем — это давно известно. Вопрос только в том, умеет ли голосовой ввод разбираться с русско-английской смесью, на которой мы общаемся с LLM и пишем код: «объясни на русском», «открой в Cursor», «проверь, что deploy прошёл». За полгода я перепробовал 5+ приложений и 5 моделей, чтобы найти те, что умеют. Приложения : WisprFlow, SpeakFlow, Handy, OpenWhispr, SuperWhisper — облачные и локальные, платные и open source. Модели : Whisper Large v3, Turbo, GigaAM v3 от Сбера, Canary 1B v2 от NVIDIA, Parakeet V3. Внутри: — Замена облачного WisprFlow на бесплатный open source без потери качества. — Один текстовый промпт, починивший пропадающую пунктуацию в 99% случаев — без LLM-постпроцессоров и задержек. — Мой бенчмарк Whisper Turbo vs Large v3 на RTX 5070 Ti (Vulkan на Blackwell внезапно быстрее CUDA на 50%). — GigaAM v3 и Canary 1B v2 — где конкурируют с Whisper, а где ломают английские слова в кириллицу («Gemini» → «Jemni»). — Первый в моей жизни принятый в main pull request в open source. Актуально на апрель 2026.

https://habr.com/ru/articles/1024634/

#whisper #голосовой_ввод #транскрибация #gigaam #распознавание_речи #openwhispr #cuda #vulkan #superwhisper #нейросети

#whisper #голосовой_ввод #транскрибация #gigaam #распознавание_речи #openwhispr

Habr @[email protected] · 2026-04-17 · 12:02 UTC

Голосовой ввод на русско-английском в 2026: WisprFlow, Handy, OpenWhispr, GigaAM v3 — для диктовки нейросетям и кода

Голосом мы говорим в 2-3 раза быстрее, чем печатаем — это давно известно. Вопрос только в том, умеет ли голосовой ввод разбираться с русско-английской смесью, на которой мы общаемся с LLM и пишем код: «объясни на русском», «открой в Cursor», «проверь, что deploy прошёл». За полгода я перепробовал 5+ приложений и 5 моделей, чтобы найти те, что умеют. Приложения : WisprFlow, SpeakFlow, Handy, OpenWhispr, SuperWhisper — облачные и локальные, платные и open source. Модели : Whisper Large v3, Turbo, GigaAM v3 от Сбера, Canary 1B v2 от NVIDIA, Parakeet V3. Внутри: — Замена облачного WisprFlow на бесплатный open source без потери качества. — Один текстовый промпт, починивший пропадающую пунктуацию в 99% случаев — без LLM-постпроцессоров и задержек. — Мой бенчмарк Whisper Turbo vs Large v3 на RTX 5070 Ti (Vulkan на Blackwell внезапно быстрее CUDA на 50%). — GigaAM v3 и Canary 1B v2 — где конкурируют с Whisper, а где ломают английские слова в кириллицу («Gemini» → «Jemni»). — Первый в моей жизни принятый в main pull request в open source. Актуально на апрель 2026.

https://habr.com/ru/articles/1024634/

#whisper #голосовой_ввод #транскрибация #gigaam #распознавание_речи #openwhispr #cuda #vulkan #superwhisper #нейросети

#нейросети #superwhisper #vulkan #cuda #openwhispr #распознавание_речи

Habr @[email protected] · 2026-01-24 · 17:22 UTC

Как я экономлю 10+ часов в неделю, заменив клавиатуру на умный голосовой ввод

Каждый день я пишу тысячи слов текста. И долгое время я тратил на это неприлично много времени. Год назад я начал использовать умный голосовой ввод. Теперь я просто наговариваю тексты голосом, а LLM превращает это в грамотно оформленный текст с правильной структурой и пунктуацией. Экономия — минимум 10 часов в неделю. Очевидный лайфхак? Да. Но им пользуется ничтожное меньшинство, даже среди тех, кто работает с ИИ каждый день. В этой статье расскажу про исследования, которые подтверждают эффективность голосового ввода, покажу конкретные сценарии использования и сравню популярные инструменты, которые проверил лично.

https://habr.com/ru/articles/988598/

#голосовой_ввод #продуктивность #wispr_flow #superwhisper #промптинг #AIинструменты #claude_code #автоматизация #вайбкодинг #speechtotext

#speechtotext #вайбкодинг #автоматизация #claude_code #aiинструменты #промптинг

Habr @[email protected] · 2026-01-24 · 17:22 UTC

Как я экономлю 10+ часов в неделю, заменив клавиатуру на умный голосовой ввод

Каждый день я пишу тысячи слов текста. И долгое время я тратил на это неприлично много времени. Год назад я начал использовать умный голосовой ввод. Теперь я просто наговариваю тексты голосом, а LLM превращает это в грамотно оформленный текст с правильной структурой и пунктуацией. Экономия — минимум 10 часов в неделю. Очевидный лайфхак? Да. Но им пользуется ничтожное меньшинство, даже среди тех, кто работает с ИИ каждый день. В этой статье расскажу про исследования, которые подтверждают эффективность голосового ввода, покажу конкретные сценарии использования и сравню популярные инструменты, которые проверил лично.

https://habr.com/ru/articles/988598/

#голосовой_ввод #продуктивность #wispr_flow #superwhisper #промптинг #AIинструменты #claude_code #автоматизация #вайбкодинг #speechtotext

#speechtotext #вайбкодинг #автоматизация #claude_code #aiинструменты #промптинг

Habr @[email protected] · 2026-01-24 · 17:22 UTC

Как я экономлю 10+ часов в неделю, заменив клавиатуру на умный голосовой ввод

Каждый день я пишу тысячи слов текста. И долгое время я тратил на это неприлично много времени. Год назад я начал использовать умный голосовой ввод. Теперь я просто наговариваю тексты голосом, а LLM превращает это в грамотно оформленный текст с правильной структурой и пунктуацией. Экономия — минимум 10 часов в неделю. Очевидный лайфхак? Да. Но им пользуется ничтожное меньшинство, даже среди тех, кто работает с ИИ каждый день. В этой статье расскажу про исследования, которые подтверждают эффективность голосового ввода, покажу конкретные сценарии использования и сравню популярные инструменты, которые проверил лично.

https://habr.com/ru/articles/988598/

#голосовой_ввод #продуктивность #wispr_flow #superwhisper #промптинг #AIинструменты #claude_code #автоматизация #вайбкодинг #speechtotext

#голосовой_ввод #продуктивность #wispr_flow #superwhisper #промптинг #aiинструменты