«Яндекс» анонсировал свой первый носимый гаджет с искусственным интеллектом — диктофон с «Алисой Про», который должен поступить в продажу в первой половине 2026 года. Устройство позиционируется как решение для бизнеса и призвано изменить подход к документированию рабочих процессов. Вместе с появлением этого гаджета на рынке формируется новая категория «умных» диктофонов с ИИ.
Дизайн и конструкция выполнены в корпусе из алюминия, а размер устройства сопоставим с банковской картой. Управление осуществляется с помощью физического переключателя для включения и выключения записи и многофункциональной кнопки для отметки ключевых моментов и взаимодействия с «Алисой Про». Аккумулятора хватит на примерно 80 часов непрерывной записи, при этом устройство способно самостоятельно остановить запись, если пользователь забыл это сделать.
Безопасность данных обеспечивается аппаратным шифрованием, а ключ расшифровки хранится на смартфоне пользователя, что защищает информацию при утере самого диктофона. Интеграция будет тесно связана с экосистемой «Яндекс 360», включая загрузку записей на «Яндекс Диск» и сохранение расшифровок в «Яндекс Документах».
Нейросеть берет на себя задачи по автоматической расшифровке аудио в текст, выделению ключевых тезисов и последующему структурированию информации. Например, она может по запросу извлечь из архива конкретные договорённости или цифры с прошлых встреч. Это превращает архив записей из набора файлов в управляемую базу знаний.
В целом ИИ-диктофоны уже формируются как отдельная товарная категория. Аналогичные устройства уже есть на рынке. Например, Plaud Note представляет собой примерно того же размера диктофон, который работает в паре с ИИ-приложением для расшифровки, обобщения и визуализации информации. Другой пример, MedPen – устройство в форме ручки со встроенной памятью 128 ГБ, что позволяет сохранять до 1000 часов аудио. Его ИИ-функции включают транскрибацию на 90 языков, создание кратких изложений и т.п.
Еще один девайс – TicNote, он не только расшифровывает встречи с разбивкой по спикерам, но и способен выполнять синхронный перевод, а также генерировать материал в формате подкаста по заданному шаблону.
Одним словом, это принципиальный шаг вперёд по сравнению с обычным цифровым диктофоном или приложением «дикктофон», которое есть в любом смартфоне: новая товарная категория – это полноценный помощник, цель которого — дать пользователю готовый результат, экономя его время.
Принципиально никакого «рокет-саенса» тут, конечно, нет. Без всякого ИИ-диктофона процесс реализуется уже сегодня, просто требуя намного больше возни – а я уже года полтора активно пользуясь этими способами во время интервью, конференций, и даже со сломанной рукой писал таким образом статьи. Вернее, писал робот под мою диктовку.
Но как это работает сейчас? Сначала включаешь, собственно, диктофон, будь то отдельный гаджет или приложение на смартфоне. Затем берешь записанный файл и отправляешь его ИИ-боту для расшифровки (естественно, эти боты платные). После этого дожидаешься ИИ-расшифровки и правишь там явные ошибки в терминах, аббревиатурах, фамилиях и других важных для смысла словах. Потом копипастишь полученный текст в другого ИИ-ассистента, тому же «Дипсику» или «Алисе» с просьбой составить конспект, выделить важное или найти конкретную информацию. Тот уже структурирует и переносит готовый результат в нужный документ или систему.
А с ИИ-диктофоном нажимаешь одну кнопку для начала записи, отмечая важные моменты другой кнопкой прямо в процессе разговора – это очень важно, потому что в обычном диктофоне такого нет и в его записи потом надо будет отделять фактуру от «воды».
Затем диктофон самостоятельно, без дополнительных команд, расшифровывает аудио, выделяет главное и индексирует содержание. После этого можно будет просто спросить «Алису Про» напрямую: «Напомни, какие были продажи в прошлом квартале, по данным совещания в понедельник», и получить мгновенный ответ. Главное преимущество такого подхода — это сведение многоступенчатого процесса к одному действию и глубокое понимание контекста. «Алиса Про» работает именно как ассистент, который не просто преобразует звук в текст, а понимает суть записанного (насколько это вообще применимо к LLM) и устанавливает смысловые связи между разными событиями.
Главный вопрос в этом всём – это, конечно, цена и модель монетизации. Другие такие диктофоны предсказуемо используют подписную модель для разблокировки ключевых ИИ-функций. Вопросы конфиденциальности для b2b-сегменте также крайне важны, поскольку хотя данные на устройстве зашифрованы, сам факт постоянной записи разговоров, в том числе личных заметок и совещаний, требует абсолютного доверия к производителю – как по части защиты коммерческой тайны, так и, например, по использованию (вернее, неиспользованию) записей для обучения ИИ-моделей в целях их улучшения.
Также заявленные 80 часов работы и качество распознавания — это пока слова из пресс-релиза, нужно дождаться реальной работа в шумных офисах, при наложении речей нескольких людей или с специфической терминологией.
Также не забываем про юридические и этические аспекты: в большинстве стран, включая Россию, запись частных разговоров без уведомления всех участников является нарушением законодательства. Использование такого гаджета в рабочих процессах потребует чётких внутренних регламентов и, вероятно, получения согласия от всех сотрудников. Хотя эта бюрократия того стоит.
Теоретически гаджет обещает решить одну из самых насущных проблем современности — информационную перегрузку, взяв на себя рутину по документированию и систематизации устной информации. Если «Яндексу» удастся реализовать заявленные функции по доступной цене (PLAUD, напомним, стоит около 30 тысяч рублей за сам девайс), обеспечить прозрачность в вопросах конфиденциальности и преодолеть детские болезни первого поколения устройств, если он будут, то диктофон с «Алисой Про» имеет все шансы стать таким же мастхев-аксессуаром для делового человека, как когда-то им стал смартфон.
Пока же рынок замер в ожидании 2026 года, когда станут известны окончательные характеристики, цена и, самое главное, отзывы первых пользователей.