Добавить в корзинуПозвонить
Найти в Дзене

Год диктую вместо того, чтобы печатать. Честно рассказываю, что из этого вышло

Если вы пришли с простым вопросом — «можно ли нормально диктовать текст на русском вместо набора руками» — отвечу сразу: можно. Я так пишу примерно год. Письма, заметки, длинные сообщения, черновики статей, запросы к нейросетям — всё голосом. Клавиатуру держу для правок и кода. Но «можно» с оговоркой. Программ, которые честно разбирают русскую речь и при этом нормально оплачиваются из России, на самом деле немного. Большая часть «топов голосового ввода» в поиске написана людьми, которые эти программы не открывали: там до сих пор советуют сервисы родом из 2012 года. Поэтому расскажу не теорию, а свой год — с граблями, цифрами и тем, на чём в итоге остановился. И сразу честно, чтобы не было осадка в конце: я причастен к одному из инструментов, о которых пойдёт речь, — к Потоку. Поэтому к месту, где я говорю, на чём осел, относитесь с поправкой на это. Промежуточные оценки я старался давать как есть, а не подгонять под удобный вывод, — но всё равно не верьте мне на слово: почти у каждой
Оглавление

Если вы пришли с простым вопросом — «можно ли нормально диктовать текст на русском вместо набора руками» — отвечу сразу: можно. Я так пишу примерно год. Письма, заметки, длинные сообщения, черновики статей, запросы к нейросетям — всё голосом. Клавиатуру держу для правок и кода.

Но «можно» с оговоркой. Программ, которые честно разбирают русскую речь и при этом нормально оплачиваются из России, на самом деле немного. Большая часть «топов голосового ввода» в поиске написана людьми, которые эти программы не открывали: там до сих пор советуют сервисы родом из 2012 года. Поэтому расскажу не теорию, а свой год — с граблями, цифрами и тем, на чём в итоге остановился.

И сразу честно, чтобы не было осадка в конце: я причастен к одному из инструментов, о которых пойдёт речь, — к Потоку. Поэтому к месту, где я говорю, на чём осел, относитесь с поправкой на это. Промежуточные оценки я старался давать как есть, а не подгонять под удобный вывод, — но всё равно не верьте мне на слово: почти у каждой программы из списка есть бесплатный режим, и проще проверить на своей речи, чем на моём опыте.

Почему я вообще перестал печатать

Банально — заболели запястья. Я пишу много, в плотный день набегало несколько тысяч знаков, и однажды к вечеру кисти начали ныть так, что мышку держать было неприятно. Врач сказал умное слово, дал скучный совет («меньше печатайте») и отправил домой.

Меньше печатать я не мог — это работа. Зато мог печатать по-другому. Так я и дорвался до голосового ввода. Первая неделя вышла мучительной: я не привык думать вслух, фразы выходили рваные, программа слышала кашу. А потом что-то щёлкнуло. Сейчас надиктовать абзац мне быстрее, чем его набрать, и руки к вечеру целы.

Цифры, если интересно: обычная речь — это примерно 900 знаков в минуту, набор на клавиатуре — около 200 (оценка из материалов одного из разработчиков). На практике выигрыш меньше, часть времени съедает правка. Но на длинных текстах разница всё равно заметная, а нагрузка на кисти — несравнимая.

Сначала про два разных «голосовых ввода»

Тут многие путаются, и я путался. «Голосовой ввод» бывает двух видов, и это не одно и то же.

Первый — диктовка в потоке (её ещё называют flow): зажал горячую клавишу, проговорил мысль, отпустил — и готовый текст сам встал туда, где стоял курсор. В чат, в письмо, в документ, в поле браузера. Это то, чем я пользуюсь каждый день.

Второй — голосовые команды: «открой папку», «прокрути вниз», «нажми кнопку». Другая задача, другие программы. Дальше речь почти везде про первый тип — про диктовку текста. Но один «командный» инструмент я для честности тоже упомяну.

Что я перепробовал — и таблица на один экран

За год через меня прошло почти всё, что есть под Windows на русском, плюс пара зарубежных эталонов. Свёл в одну таблицу, чтобы не растекаться, а ниже — живые впечатления.

Поток

  • Цена: Free 2500 слов/нед; Pro 690 ₽/мес (500 ₽/мес за год); триал 14 дней — бесплатно
  • Русский: Заточен под русский (собственная модель), держит русский с английским вперемешку
  • Оплата из РФ: Да, в рублях
  • Где данные: Облако, серверы в РФ; on-prem для бизнеса (152-ФЗ)

SpeakFlow

  • Цена: ~690 ₽/мес
  • Русский: Да, российский сервис
  • Оплата из РФ: Да, в рублях
  • Где данные: Облако

Talkpad

  • Цена: Free 2500 слов/нед; Pro ₽720/мес
  • Русский: Мультиязычный, отдельной русской модели нет
  • Оплата из РФ: Нет — оплата в долларах через Stripe
  • Где данные: Облако, серверы в Австралии

Voisty

  • Цена: Free 5 минут; Pro $6.7/мес
  • Русский: Распознаёт русский как один из 90+ языков
  • Оплата из РФ: Зарубежной картой/PayPal (карты РФ не подтв.)
  • Где данные: Локально, на вашем ПК (офлайн)

Win+H (встроенный)

  • Цена: Бесплатно
  • Русский: Win11 — криво, Win10 — русской диктовки нет
  • Оплата из РФ: Не нужна
  • Где данные: Облако Microsoft

SpeechPad

  • Цена: Бесплатно
  • Русский: Через Google
  • Оплата из РФ: Не нужна
  • Где данные: Облако Google

Wispr Flow

  • Цена: Подписка в долларах; на iOS из РФ ~750 ₽/мес
  • Русский: Работает, но английский — профиль
  • Оплата из РФ: Только на iOS через App Store
  • Где данные: Облако (за рубежом)

А теперь по делу — что из этого каково в руках.

Что в итоге понимает русский, а что нет

Win+H, встроенный в Windows. Первое, что я попробовал, — он же бесплатный и уже стоит в системе. На этом хорошие новости кончились. В Windows 10 русской диктовки в нём попросту нет. В Windows 11 русский появился, но обрывается: диктуешь пару минут, потом он молча замолкает. Как аварийная затычка — сойдёт. Как рабочий инструмент — нет.

SpeechPad. Ветеран, который знают все, кто гуглил диктовку лет десять назад. Работает в браузере, бесплатно, через распознавание Google. Беда в том, что это ощущается ровно как 2012 год: текст живёт в отдельном веб-окошке, откуда его надо копировать руками, никакого «вставилось само в любое поле» нет. Упоминаю, чтобы вы не убили на него вечер, наткнувшись в старой подборке.

Wispr Flow. Тот самый зарубежный эталон, по образцу которого сделана половина русских аналогов. На английском он великолепен — быстрый, аккуратный, сам убирает «эээ» и запинки. На русском работает, но это не его профиль: периодически теряет пунктуацию. И главное для нас — оплата. На компьютере подписка только в долларах, картой российского банка её штатно не провести; рабочий путь из России — подписка в приложении на iPhone через App Store, где цена около 750 ₽/мес. Как ориентир качества — отличный. Как повседневный инструмент в России — с оговорками.

Talkpad и Voisty — два сервиса, которые сейчас активно лезут в выдачу по запросу «чем заменить Wispr Flow». Talkpad русский понимает, бесплатно даёт те же 2500 слов в неделю, но оплату гоняет в долларах через Stripe — из России картой не провести, да и серверы у него в Австралии. Voisty берёт другим: он полностью офлайн, звук не уходит с вашего компьютера вообще. Для приватности это весомо — тут он обходит все облачные варианты. Но за офлайн надо платить железом (на слабой машине тормозит), бесплатно дают всего 5 минут на пробу, а кто стоит за сервисом — на сайте толком не написано.

На чём я остановился

Про мою причастность к Потоку я предупредил в начале — так что повторю не оправдание, а практический совет: не верьте моему выбору на слово, поставьте пару инструментов из списка и подиктуйте свою настоящую речь, благо почти везде есть бесплатный режим. На своих словах и именах разница видна за вечер.

В итоге я осел на облачной flow-диктовке, заточенной под русский. У меня 90% текста — русский с английскими терминами вперемешку («задеплой на staging», «скинь в Notion»), и это ровно та ниша, где зарубежные инструменты сыпались, а встроенный Win+H даже не пытался.

Из таких сервисов на нашем рынке два похожих — Поток и SpeakFlow. Оба облачные, оба российские, цена примерно одинаковая. Я какое-то время пользовался обоими параллельно и в итоге остался на Потоке. Решило, по сути, одно: он реально разбирает мою речь с терминами и именами, а в личный словарь можно закинуть свои слова, чтобы не правил каждый раз. Плюс оплата в рублях без плясок с зарубежной картой, есть версии под Windows и macOS (Linux пока нет — так и есть). Ну и данные на серверах в России, с режимом 152-ФЗ и on-prem для бизнеса; мне это не критично, а вот знакомым из банка и клиники было именно тем, без чего такой инструмент вообще не завести.

Минус, без которого нечестно: распознавание облачное, звук уходит на сервер (российский, но всё же сервер). Если ваше требование — «ничего не должно покидать мой компьютер», смотрите офлайн-вариант вроде Voisty. У меня такого требования нет, поэтому облако меня не смущает.

Проверить всё это можно без риска: первые 14 дней дают полный доступ бесплатно, без карты — как раз хватает, чтобы подиктовать свою реальную речь и понять, ваше это вообще или нет. Дальше есть бесплатный тариф на 2500 слов в неделю; мне на безлимит пришлось перейти, потому что диктую много. Скачать и попробовать — на potok.now.

Как выбрать под себя, а не «вообще лучшее»

Лучшей программы «вообще» нет, есть лучшая под вашу задачу. Мой короткий расклад по сценариям:

  • Пишу много на русском, хочу просто работать и платить из РФ. Поток или SpeakFlow. Поставьте оба на бесплатных лимитах, подиктуйте пару дней свою настоящую речь, оставьте тот, что меньше ошибается именно на ваших словах.
  • Звук не должен покидать мой компьютер. Voisty (из коробки, но платно после 5 минут) — при условии, что железо тянет.
  • Работаю в основном на английском, оплата за рубежом не проблема. Wispr Flow.
  • Надо бесплатно и прямо сейчас, качество вторично. Win+H, если у вас Windows 11.
  • Управлять компьютером голосом, а не диктовать. Это отдельная категория программ голосовых команд — не то, о чём весь этот текст.

Что изменилось за год — без пафоса

Запястья перестали ныть к вечеру — ради этого всё и затевалось. Длинные тексты пишутся быстрее, особенно черновики: говоришь, как думаешь, а причёсываешь потом. Сообщения в мессенджерах стали длиннее и человечнее, потому что наговорить два абзаца легче, чем настукать.

Что не идеально. На совещании вслух не подиктуешь — нужна относительная тишина. Сложные таблицы и код всё равно удобнее руками. И первая неделя реально тяжёлая: мозг сопротивляется думать вслух. Если переживёте её — дальше становится привычкой, как слепая печать когда-то.

Частые вопросы

Какой голосовой ввод лучше всего понимает русский? Лучше всего с русским — включая имена, термины и смесь с английским — справляются российские облачные flow-приложения: Поток, у которого заявлена собственная модель под русскую речь, и SpeakFlow с оплатой в рублях. Talkpad и Voisty русский тоже распознают, но на мультиязычных моделях без отдельной русской настройки. Встроенный Win+H на русском заметно слабее. Независимых сравнительных замеров точности нет, так что финально проверяйте на своей речи — у всех есть бесплатный режим.

Есть ли бесплатный голосовой ввод? Да. У Потока и Talkpad бесплатный тариф — 2500 слов в неделю. У Voisty бесплатно только 5 минут на пробу. Win+H и SpeechPad бесплатны полностью, но к качеству распознавания русского есть вопросы.

Куда уходит мой голос при диктовке — это безопасно? Зависит от программы. Voisty обрабатывает звук прямо на вашем компьютере, не отправляя никуда. Поток и SpeakFlow — облачные; у Потока серверы в России и заявлен режим 152-ФЗ. Talkpad — облако с серверами в Австралии, Wispr Flow и Win+H отправляют звук за рубеж. Диктуете чувствительное — выбирайте локальное решение или сервис с хранением в РФ.

Голосовой ввод правда быстрее печати? На длинных текстах — да. Речь это примерно 900 знаков в минуту против ~200 при наборе (оценка из материалов разработчика). В жизни выигрыш меньше из-за правок, но кисти он щадит несравнимо.

Win+H не диктует по-русски — что делать? В Windows 10 русской диктовки в нём нет в принципе. В Windows 11 она есть, но нестабильна — частый обрыв через пару минут. Если встроенный ввод не справляется, это и есть повод поставить стороннюю программу из списка выше.

*Текст основан на личном опыте и открытых данных; цифры по продуктам — из материалов разработчиков.*

<!-- ═══════════════════════════════════════════════════════════════════════════ ВИЗУАЛ-СПЕКА (для Kira/инженера — НЕ ПУБЛИКОВАТЬ как часть текста) Стандарт: docs/content-factory.md §2a. Эталон — POT-28 (VC-листикл). Рецепты — docs/publishing-runbook.md. 🔒 Ни на одной картинке/GIF не показывать название модели/вендора движка и внутренние экраны с ним. Перед отрисовкой Mira даёт референсы, как визуал подают Wispr Flow/Talkpad/SpeakFlow — сделать понятнее их.

ОБЛОЖКА (горизонтальная, 1920×1080, фирменный стиль): Что: человек за ноутбуком, говорит — а текст «сам» набирается на экране; клавиатура отодвинута/в стороне. Крупный посыл темы: «Год диктую вместо печати». Зачем: первый экран Дзена решает дочитывание; ставим эмоцию «освобождение от клавиатуры», а не product shot. Тёплый, человеческий кадр, не корпоративный.

ИН-ЛАЙН 1 — GIF/скрин «как работает» (ОБЯЗАТЕЛЬНЫЙ): Где: заменяет плейсхолдер [SCREENSHOT: рабочий стол…] в разделе «Что в итоге понимает русский, а что нет» (либо сразу после блока «Сначала про два разных…»). Что показывает: реальный флоу — зажал Ctrl+Space → говоришь (индикатор записи) → отпустил → готовый текст встал в поле мессенджера. 3–5 сек, зациклить. Зачем: «диктовка в потоке» — абстракция; GIF за 3 сек объясняет то, на что в тексте уходит абзац. Окно приложения нейтральное, без названий модели на экране.

ИН-ЛАЙН 2 — сравнительная картинка (ОБЯЗАТЕЛЬНАЯ): Где: рядом с таблицей «Что я перепробовал — и таблица на один экран». Что показывает: компактная сетка-сравнение по 3 колонкам, важным для РФ — «Понимает русский / Оплата из РФ / Где данные» — для Поток vs Wispr Flow vs Talkpad vs Voisty vs Win+H. Галочки/крестики/нейтрально, без цифр WER (их нет). Зачем: визуально закрепляет ответ на главный вопрос статьи; легко цитируется и репостится. Поток — одна из строк, без выпячивания; данные строго по BRIEF.md.

ИН-ЛАЙН 3 — инфографика скорости (желательная, если не перегрузит): Где: в разделе «Почему я вообще перестал печатать», к абзацу про 900 vs 200. Что показывает: два столбика — речь ~900 зн/мин против печати ~200 зн/мин; подпись, что в жизни разрыв меньше из-за правок (без вранья «в 4 раза всегда»). Зачем: цифру визуализировать, а не давать текстом — лучше запоминается. ═══════════════════════════════════════════════════════════════════════════ -->