Добавить в корзинуПозвонить
Найти в Дзене

🎧 Whisper прямо в браузере — распознавание речи без интернета и регистрации

Большинство сервисов для распознавания речи устроены просто: вы отправляете аудио, где-то на сервере нейросеть превращает его в текст, и спустя пару секунд получаете результат.
Звучит удобно — пока не задумаешься, что все записи уходят «в облако». Если вы не хотите передавать интервью, личные разговоры или заметки третьим лицам — есть выход.
Теперь распознавание можно делать прямо на своём компьютере, без интернета. Мы создали версию Whisper, которая работает целиком в браузере.
Она использует оригинальные модели OpenAI Whisper, но без единого обращения к серверу. Все вычисления происходят на вашем устройстве — браузер загружает модель один раз, сохраняет её в кэше, и дальше вы можете пользоваться ей даже офлайн.
Фактически, ваш браузер становится мини-нейросетью, которая расшифровывает речь в текст. Технология работает на WebGPU — браузер использует вашу видеокарту, чтобы ускорить процесс.
Если GPU нет, всё равно запустится через WASM, просто чуть медленнее. Браузерная версия не
Оглавление

Большинство сервисов для распознавания речи устроены просто: вы отправляете аудио, где-то на сервере нейросеть превращает его в текст, и спустя пару секунд получаете результат.

Звучит удобно — пока не задумаешься, что все записи уходят «в облако».

Если вы не хотите передавать интервью, личные разговоры или заметки третьим лицам — есть выход.

Теперь распознавание можно делать
прямо на своём компьютере, без интернета.

🧠 Whisper, но локально

Мы создали версию Whisper, которая работает целиком в браузере.

Она использует оригинальные модели OpenAI Whisper, но без единого обращения к серверу.

Все вычисления происходят на вашем устройстве — браузер загружает модель один раз, сохраняет её в кэше, и дальше вы можете пользоваться ей даже офлайн.

Фактически, ваш браузер становится мини-нейросетью, которая расшифровывает речь в текст.

⚙ Что нужно сделать

  1. Загрузите аудиофайл (поддерживаются MP3, WAV, M4A и другие форматы)
  2. Выберите язык и размер модели
  3. Нажмите кнопку «Распознать» и наблюдайте, как текст появляется на экране

Технология работает на WebGPU — браузер использует вашу видеокарту, чтобы ускорить процесс.

Если GPU нет, всё равно запустится через
WASM, просто чуть медленнее.

💡 Технические особенности

  • Whisper-модели (tiny, base, small) работают прямо в браузере
  • Transformers.js обеспечивает совместимость нейросети с JavaScript
  • IndexedDB хранит модель локально, чтобы не скачивать её повторно
  • Данные не передаются в интернет — полная приватность
  • Распознаёт десятки языков, включая русский, английский, испанский, китайский и другие

💻 Бесплатно и без ограничений

Браузерная версия не требует регистрации, подписки и не ограничивает по времени.

Можно пользоваться сколько угодно и где угодно.

👉 Открыть бесплатную версию

⚡ Нужно быстрее и точнее?

Если вы работаете с длинными записями или большими объёмами, подойдёт серверная версия.

Она использует более крупные модели и мощные GPU — распознавание выполняется заметно быстрее и точнее.

Этот вариант платный, но подходит для профессионального использования.

👉
Подробнее о серверной версии

📋 Преимущества

🔒 Конфиденциально — файлы не покидают ваш компьютер

📶 Работает даже без интернета

🧠 Та же нейросеть, что у OpenAI Whisper

🆓 Бесплатно, без ограничений

⚙ Возможен апгрейд до профессиональной версии

🧾 Вывод

Whisper в браузере — это наглядный пример того, как современные технологии вроде WebGPU и Transformers.js делают нейросети ближе к пользователю.

Больше не нужно устанавливать программы, регистрироваться или передавать аудио в интернет — достаточно просто открыть страницу и начать работать.

Если же вам нужна максимальная точность и скорость — всегда можно перейти на серверную версию.