1730 подписчиков

Перевести книгу целиком через ИИ: гайд без обрезанного текста

16 марта16 мар

270

4 мин

Один Python-скрипт, Calibre и Claude API - на выходе EPUB, DOCX и PDF на нужном языке.

Если вы хотя бы раз пробовали перевести техническую книгу через ChatGPT, вы знаете, чем это заканчивается. Вставляешь главу - получаешь половину. Вставляешь следующий кусок - модель «забыла» контекст из начала. К 50-й странице перевод превращается в лоскутное одеяло, которое ещё и нужно вручную склеивать в

Один Python-скрипт, Calibre и Claude API - на выходе EPUB, DOCX и PDF на нужном языке.

Оглавление

Что понадобится перед запуском
Установка и первый запуск
Что делать, если что-то пошло не так

Один Python-скрипт, Calibre и Claude API - на выходе EPUB, DOCX и PDF на нужном языке.

Проблема не в модели - в архитектуре подхода. Контекстное окно конечно, и при переводе длинного текста в одной сессии оно рано или поздно переполняется. Rainman Translate Book решает это иначе: книга режется на чанки по ~6000 символов, каждый чанк уходит в отдельный субагент с чистым контекстом, 8 субагентов работают параллельно. Никакого накопления контекста - никакого обрезанного вывода.

Что понадобится перед запуском

Инструмент работает поверх нескольких компонентов, и это честно стоит сказать сразу: установка разовая, но не мгновенная.

Claude Code CLI - движок перевода. Платный: стоимость зависит от объёма книги и тарифа API. Для книги на 300 страниц это будет заметно дешевле, чем специализированные сервисы вроде DeepL Pro или PDF-переводчиков за $20-50 за файл, - но бесплатным не назову. Данные при этом не оседают на серверах посредника, что для технической документации может быть важнее цены.

Calibre - конвертирует PDF, DOCX или EPUB в промежуточный формат HTMLZ, из которого скрипт вытаскивает чистый Markdown. Скачать можно с calibre-ebook.com, команда ebook-convert должна быть доступна в PATH.

Pandoc - собирает финальный HTML из переведённых чанков. Установка стандартная, pandoc.org.

Python 3 с зависимостями:

pip install pypandoc beautifulsoup4

pypandoc обязателен, beautifulsoup4 - опционально, но с ним оглавление генерируется лучше.

Установка и первый запуск

Скилл ставится одной командой через npx - это рекомендованный способ:

npx skills add deusyu/translate-book -a claude-code -g

Альтернатива - клонировать репозиторий напрямую:

git clone https://github.com/deusyu/translate-book.git ~/.claude/skills/translate-book

После установки открываете Claude Code и говорите буквально:

translate /path/to/book.pdf to Russian

Или через слэш-команду:

/translate-book translate /path/to/book.pdf to Russian

Дальше скилл работает сам. Пайплайн выглядит так: Calibre конвертирует файл в HTMLZ → скрипт извлекает HTML и переводит в Markdown → нарезает на чанки → запускает 8 параллельных субагентов → каждый субагент читает один чанк, переводит, пишет результат в output_chunk*.md → после завершения всех чанков скрипт валидирует результаты через SHA-256 хеши из manifest.json → Pandoc собирает финальный HTML → Calibre генерирует DOCX, EPUB и PDF.

Все файлы оказываются в папке {book_name}_temp/. Там будет output.md (сырой Markdown), book.html с плавающим оглавлением, book.docx, book.epub и book.pdf.

Что делать, если что-то пошло не так

Самое ценное в архитектуре этого инструмента - resumable-переводы. Если сессия прервалась на середине (упал интернет, кончились токены на счету, просто закрыли терминал) - повторный запуск той же команды пропустит уже переведённые чанки и продолжит с места остановки. SHA-256 хеши в manifest.json гарантируют, что устаревшие или повреждённые чанки не попадут в финальный файл.

Несколько ситуаций, которые встречаются чаще остальных:

Calibre ebook-convert not found - Calibre не в PATH. На macOS после установки нужно добавить /Applications/calibre.app/Contents/MacOS/ в PATH вручную.

Manifest validation failed - исходные чанки изменились после первой нарезки. Решение: перезапустить convert.py с нуля.

Если поменяли заголовок книги, шаблон или добавили изображения - старые финальные файлы нужно удалить из temp-папки перед повторным запуском, иначе merge_and_build.py возьмёт кешированный результат.

Неполный перевод (некоторые чанки не обработаны) - просто перезапустите скилл. Провалившиеся чанки автоматически уходят на повтор.

Честно о подводных камнях

Репозиторий создан в середине марта 2026 года - буквально несколько дней назад на момент написания. Релизов нет, боевой обкатки на реальных книгах в публичном пространстве почти нет. Код открыт (MIT), зависимости известные и проверенные, архитектура читается - это не чёрный ящик. Но баги в молодом проекте неизбежны.

Есть мнение, что платить за Claude API - это «просто другой способ заплатить». Спорить не буду. Разница в том, что здесь вы платите за токены напрямую, без маржи посредника, ваши файлы не хранятся на чужих серверах, а стоимость одной книги при регулярном использовании оказывается ниже месячной подписки на специализированный сервис. Если нужен один перевод раз в год - да, проще заплатить сервису и не настраивать окружение.

Поддерживаемые языки вывода в README перечислены явно: zh, en, ja, ko, fr, de, es. Русского в списке нет, но авторы указывают, что список расширяемый. Судя по архитектуре, язык передаётся как параметр в промпт субагента - добавить ru технически несложно, но нужно проверять на практике.

Если вы регулярно работаете с англоязычной технической литературой и устали от ручного копипаста или сломанного форматирования после Google Translate - этот инструмент стоит попробовать. Порог входа реальный, но разовый.

Сколько страниц в вашей типичной технической книге - и во сколько, по-вашему, обойдётся её перевод через Claude API?

Источник: Rainman Translate Book

🔔 Если нужны инструменты, которые реально работают, а не просто красиво выглядят в обзорах - подписывайтесь на КликХак.

Гаджеты и электроника

5,73 млн интересуются