Найти в Дзене
Hi-Tech Mail

Google выпустила бесплатный ИИ-переводчик: можно запустить без интернета

Google открыла публичный доступ к TranslateGemma — семейству компактных языковых моделей, которые специализируются исключительно на переводе. В отличие от универсальных ассистентов, эта система заточена под одну задачу и делает ее хорошо: 55 языков, работа офлайн, поддержка текста и изображений одновременно. Публичный Google Translate — это облачный сервис. Каждый запрос уходит на серверы компании, там обрабатывается и возвращается обратно. Для частного использования это нормально. Но для бизнеса, медицины, юриспруденции или госсектора такая схема неприемлема: данные не должны покидать контур компании. TranslateGemma решает эту проблему, так как модель живет целиком на вашем железе. Кроме того, облачные API стоят денег при больших объемах, а локальная модель — это разовая загрузка и никаких лимитов. В основе лежит архитектура Gemma 3 — та же, что Google использует в своих мультимодальных моделях. TranslateGemma дообучили на 4,3 миллиарда токенов параллельных текстов: это пары «оригинал

Google открыла публичный доступ к TranslateGemma — семейству компактных языковых моделей, которые специализируются исключительно на переводе. В отличие от универсальных ассистентов, эта система заточена под одну задачу и делает ее хорошо: 55 языков, работа офлайн, поддержка текста и изображений одновременно.

Публичный Google Translate — это облачный сервис. Каждый запрос уходит на серверы компании, там обрабатывается и возвращается обратно. Для частного использования это нормально. Но для бизнеса, медицины, юриспруденции или госсектора такая схема неприемлема: данные не должны покидать контур компании. TranslateGemma решает эту проблему, так как модель живет целиком на вашем железе. Кроме того, облачные API стоят денег при больших объемах, а локальная модель — это разовая загрузка и никаких лимитов.

В основе лежит архитектура Gemma 3 — та же, что Google использует в своих мультимодальных моделях. TranslateGemma дообучили на 4,3 миллиарда токенов параллельных текстов: это пары «оригинал — перевод» на десятках языковых пар. Дополнительно модель прошла этап обучения с подкреплением на 10,2 миллиона токенов — это улучшает точность и естественность перевода.

Весит модель 4 миллиарда параметров, для сравнения: GPT-4 — это примерно 1,8 триллиона параметров. TranslateGemma в 450 раз меньше, при этом в своей нише показывает результаты, сопоставимые с куда более тяжелыми системами. Контекстное окно — 2000 токенов. Это примерно 1500 слов за один запрос, чего хватит для большинства документов и сообщений.

Модель реально умеет читать текст с изображений и сразу его переводить. Технически это работает так: изображение нормализуется до разрешения 896×896 пикселей и кодируется в 256 токенов, дальше модель обрабатывает его наравне с текстом. На практике: сфотографировали меню в зарубежном ресторане, дорожный знак, иностранный контракт или интерфейс программы — получили перевод без промежуточного шага с распознаванием текста вручную.

Запустить можно локально через Python-библиотеку Transformers. Нужна видеокарта с поддержкой CUDA (подойдет большинство современных Nvidia) и несколько гигабайт VRAM. Или прямо в браузере через WebGPU и Transformers.js v4. Это значит, что модель можно встроить в веб-приложение и она будет работать на устройстве пользователя, без сервера.

Для разработчиков модель доступна на HuggingFace. Лицензия Google позволяет коммерческое использование при соблюдении условий Gemma Terms of Use. Такой переводчик полезна, прежде всего, командам, которые работают с конфиденциальными текстами и не могут отправлять их в облако. Разработчикам, которые встраивают перевод в собственные продукты и хотят избежать зависимости от внешних API. Исследователям, которым нужен контроль над инфраструктурой. И всем, кто хочет работать с документами на 55 языках без ежемесячной подписки.

Также недавно рассказывали о новой системе управления ИИ-агентами. Подробности о Perplexity Computer в статье.