Последние полгода я зарылся в дебри голосовых помощников. Перепробовал, кажется, всё, что существует в природе — от корпоративных монстров до стартапов-однодневок. И знаете что? Большинство из них — полный шлак.
Но есть и те, что реально работают. Без подписок, без "попробуйте бесплатно 7 дней, а потом мы снимем с вас всю зарплату". Делюсь находками, которые спасли мне кучу времени и нервов.
Кстати, мой Телеграмм: https://t.me/n_seti (НЕЙРОСИЛА)
SaluteSpeech — русский язык наконец-то поняли
Помните, как еще пару лет назад все сервисы распознавания речи превращали русский язык в набор иероглифов? Что ж, SaluteSpeech от Сбера наконец-то решил эту проблему.
Точность распознавания — 97% даже с плохой дикцией. Диктую со скоростью пулемета — успевает. Бормочу себе под нос — понимает. Это не просто сервис, а какое-то колдунство.
И да, он полностью бесплатный. Без подвохов типа "первые 10 минут в месяц". Просто работает и всё. Попробовать можно тут с ботом @smartspeech_sber_bot в Telegram.
Google Keep — для тех, кто живет в экосистеме Google
Keep встроен в экосистему Google, синхронизируется со всеми устройствами и не требует отдельной регистрации.
Распознает речь на 44 языках, включая русский. Правда, с нашим великим и могучим бывают косяки — особенно если вы говорите быстро или используете профессиональный сленг.
Главный плюс — мгновенная синхронизация с Google Docs. Надиктовал заметку, нажал пару кнопок — и вот она уже в документе, готовая к редактированию.
Speechlogger — когда нужна транскрипция в реальном времени
Этот сервис — находка для журналистов и студентов. Представьте: идет лекция, а Speechlogger в реальном времени превращает слова преподавателя в текст. Никаких судорожных попыток записать каждое слово — всё уже в вашем телефоне.
Работает в браузере, не требует установки. Поддерживает более 70 языков и диалектов. Русский язык понимает прилично, но иногда путается в падежах.
Бесплатная версия дает 5 часов транскрипции в месяц. Для большинства этого более чем достаточно.
oTranscribe — для тех, кто расшифровывает интервью
Если вы когда-нибудь расшифровывали часовое интервью вручную, вы знаете, что это сущий ад. oTranscribe делает этот процесс в разы быстрее.
Загружаете аудио, сервис распознает речь и выдает текст. Но главная фишка — встроенный текстовый редактор с горячими клавишами для управления воспроизведением. Нажали Esc — пауза, F1 — перемотка на 10 секунд назад.
Интерфейс минималистичный, без лишних наворотов. Просто загрузил файл и работай. Идеально для журналистов, исследователей и всех, кто имеет дело с большим количеством аудиозаписей.
Speechnotes — когда нужно надиктовать длинный текст
Этот сервис создан специально для писателей и блогеров. Главное отличие от других — возможность надиктовывать тексты любой длины без ограничений.
Интерфейс напоминает Google Docs, но с фокусом на голосовой ввод. Есть автосохранение, экспорт в разные форматы и даже функция автоматической пунктуации — вы говорите "точка", "запятая", и они появляются в тексте.
С русским языком дружит неплохо, но иногда путает похожие по звучанию слова. Впрочем, это проблема всех сервисов распознавания речи.
Яндекс Клавиатура — когда всё нужно здесь и сейчас
Не сервис в чистом виде, а приложение для смартфона. Но его возможности распознавания речи заслуживают отдельного упоминания.
Устанавливаете Яндекс Клавиатуру, нажимаете на значок микрофона и диктуете. Текст появляется мгновенно, без задержек. Работает в любом приложении, где есть текстовое поле — от мессенджеров до заметок.
С русским языком дружит идеально, понимает даже сложные конструкции и специфические термины. Единственный минус — для работы требуется подключение к интернету. Ссылку не дам, лень.
А какие сервисы распознавания речи используете вы? Делитесь в комментариях — возможно, я пропустил что-то стоящее. Кстати, залетайте в наш наш TG: https://t.me/n_seti (НЕЙРОСИЛА)