Превратить мысль в письмо или пост для соцсетей не так просто: нужно продумать структуру, написать и отредактировать текст. ИИ-инструменты ускоряют эту работу, однако пользователю все равно приходится прикладывать усилия — формулировать запросы и набирать их вручную. В итоге барьер между идеей и готовым текстом хоть и становится меньше, но сохраняется.
Инновационный продукт «Голосовые Заметки ИИ» от МойОфис позволяет получать результат за пару действий. Достаточно проговорить мысль вслух — в свободной форме, как в живой беседе — и выбрать шаблон (например, письмо, пост или список задач). Технология превращает речь в грамотный текст с корректной пунктуацией и логичной структурой, который соответствует выбранному формату.
В этой статье подробно разбираем новый продукт «Голосовые Заметки ИИ»: как он работает, кому пригодится, что умеет уже сейчас и как будет развиваться дальше.
Что такое «Голосовые Заметки ИИ»
Продукт упрощает рутину: он позволяет фиксировать мысль в момент ее появления — в дороге, между делами, во время прогулки — и переводить в текст.
В отличие от универсальных чат-ботов с ИИ, которые тоже умеют распознавать аудио и преобразовывать его в расшифровку, «Голосовые Заметки ИИ» позволяют получить текст сразу по заданному шаблону. Вам не нужно формулировать и уточнять запрос — продукт позволяет выполнять задачу за пару тапов в интерфейсе. Еще одно отличие «Голосовых Заметок ИИ» от чат-ботов с ИИ — сохранение результатов в редактируемом формате: чтобы подправить текст, его не нужно копировать и вставлять в отдельное поле. Просто нажмите на любой фрагмент и вносите корректировки.
Сейчас «Голосовые Заметки ИИ» представлены как модуль внутри бесплатного мобильного приложения «МойОфис Документы». В планах — отдельное приложение с расширенными возможностями.
Попробуйте «Голосовые Заметки ИИ» в «МойОфис Документы». Новый продукт, как и всю функциональность мобильного приложения, можно использовать бесплатно: вам будут доступны пять расшифровок аудио и десять запросов к ИИ, которые позволяют получать готовые тексты под разные задачи, в сутки, эти лимиты обновляются каждый день. Больше возможностей — в платных тарифах.
Кому пригодятся «Голосовые Заметки ИИ»
«Голосовые Заметки ИИ» созданы для всех, кто стремится эффективно использовать рабочее и личное время. Так, в профессиональной сфере продукт поможет быстро подготовить отчет о встрече, сформулировать суть проекта, написать письмо коллеге или клиенту. А в жизни за пределами работы — набросать пост для соцсетей или составить план на отпуск.
Шаблоны, представленные в приложении, покрывают большинство сценариев, но не все. Чтобы «Голосовые Заметки ИИ» были как можно более гибкими и полезными, мы добавили возможность вводить собственные запросы. Например, вы можете записать голосовую заметку о своих эмоциях в течение дня и попросить приложение сформировать запись для психологического дневника — система справится с задачей.
Что умеют «Голосовые Заметки ИИ»
Выше мы описали функциональность и сценарии использования продукта. Теперь остановимся на конкретных возможностях.
Грамотная расшифровка аудио
Система корректно фиксирует слова даже при быстрой неподготовленной диктовке, сама расставляет знаки препинания, выделяет абзацы, убирает разговорные паузы и повторы. Точность распознавания слов обеспечивает модель Whisper — одно из самых надежных опенсорсных решений для транскрибации.
Редактирование в офлайне
Расшифрованная заметка сохраняется на устройстве, ее можно править без подключения к интернету. В офлайне доступны все возможности встроенного редактора: корректировка и форматирование текста, создание маркированных и нумерованных списков, добавление заголовков. Скопировать заметку можно так же без доступа к сети.
Пересылка расшифровки и результата
Вы можете отправить расшифровку или готовый результат в мессенджер или на почту, для этого нужно нажать кнопку «Поделиться» и выбрать нужный способ отправки. Также текст можно скопировать в буфер обмена и вставить куда угодно.
Безопасное хранение данных
Мошенники не могут использовать ваш голос, чтобы создать дипфейк или синтезировать речь: аудио передается на сервер только для мгновенной транскрибации и сразу удаляется. Расшифровка и готовые тексты остаются только в вашем мобильном устройстве.
Поддержка английского языка
Система поддерживает не только русский язык, но и английский. Это позволяет использовать «Голосовые Заметки ИИ» для практики: проговаривая мысли и превращая их в готовые тексты, вы развиваете навыки говорения и выходите за рамки стандартных упражнений.
Как пользоваться «Голосовыми Заметками ИИ»
Весь путь — от идеи до результата — включает в себя четыре шага:
Шаг 1. Озвучить идею
Нажмите кнопку записи и проговорите мысль — так, как она пришла в голову. Можно поставить запись на паузу или сбросить ее и начать заново.
Шаг 2. Получить расшифровку
Система преобразует завершенную запись в грамотный текст. При необходимости его можно скорректировать во встроенном редакторе.
Шаг 3. Выбрать шаблон
Вам доступно пять готовых шаблонов:
- Письмо,
- Пост,
- Список задач,
- Вывод
- Отчет о встрече.
Если нужен другой формат, используйте собственный запрос — например, «оформи как запись в дневнике эмоций» или «преврати в тезисы для презентации». Ввести запрос можно в поле в нижней части экрана.
Шаг 4. Доработать результат
Готовый текст можно быстро подправить в редакторе — исправить неточности или изменить формулировки. Возможна и доработка при помощи ИИ: чтобы изменить стиль или структуру, достаточно ввести короткий запрос — например, «перепиши в позитивном тоне» или «убери лишние детали».
Как устроены «Голосовые Заметки ИИ»
Разберем ключевые особенности реализации продукта — чтобы было понятно, за счет чего он выполняет свои функции и обеспечивает безопасность данных.
Двухэтапная обработка данных
Сначала речь преобразует модель Whisper — она точно распознает слова, но не всегда корректно расставляет знаки препинания. Затем языковая модель улучшает полученный текст: корректирует пунктуацию, убирает разговорные паузы и повторы, разбивает материал на абзацы. Оба этапа выполняются мгновенно, поэтому для пользователя процесс выглядит как единое действие:
Шаблоны и версии текста
Готовые шаблоны реализованы через ту же языковую модель с заранее подготовленными запросами. Исходная расшифровка при этом никогда не перезаписывается: каждый новый вариант создается как отдельный артефакт, сохраняется возможность вернуться к первоначальному результату.
Закрытая архитектура
Вся обработка информации происходит внутри собственной платформы МойОфис без интеграции со сторонними ИИ-сервисами. Голосовые данные используются только для мгновенной транскрибации и не покидают контур компании, что обеспечивает полный контроль и безопасность пользовательской информации.
Локальная инфраструктура
Масштаб инфраструктуры позволяет МойОфис развернуть ресурсоемкие модели, включая Whisper, локально в собственном бэкенде. Это исключает зависимость от внешних поставщиков, обеспечивает стабильное качество обработки и дает возможность постоянно улучшать точность распознавания.
Заключение
«Голосовые Заметки ИИ» существенно сокращают путь от идеи до готового текста. Вам нужно только проговорить мысль и выбрать формат — остальное выполнит приложение. Инструмент помогает решать как рабочие, так и личные задачи, его можно использовать где угодно.
Сейчас «Голосовые Заметки ИИ» работают внутри мобильного приложения «МойОфис Документы» для устройств на Android и ОС на базе AOSP. В ближайших планах — расширение поддержки платформ: версии для iOS, macOS и Windows находятся в разработке. Позже продукт будет представлен как отдельное самостоятельное приложение для разных платформ.
Функциональность «Голосовых Заметок ИИ» будет расширяться: среди запланированных улучшений — создание пользовательских шаблонов и дозапись заметок (возможность добавлять новые голосовые фрагменты к уже существующим заметкам). Также появятся голосовой ввод для запросов к ИИ и режим диалога по заметке — это избавит от необходимости набирать уточнения вручную и позволит работать с текстом только голосом.
Продукт готовится к выходу на международный рынок — скоро его смогут оценить и пользователи из других стран.