Найти в Дзене
Semёnov

Open NotebookLM: зато бесплатно!

Оглавление
NotebookLM – хайповая нейронка от Google, способная любой текст превратить в увлекательный подкаст. Вот только с российскими IP-адресами запустить её вам не дадут, а раз так, пора искать открытые альтернативы.
Meet Open NotebookLM: An Open Source Alternative to Google's NotebookLM

Open NotebookLM: открытая альтернатива NotebookLM от Google

NotebookLM – одно из главных достижений Google в области искусственного интеллекта. Штука ведь действительно удобная: разве вы, наткнувшись на длиннющую статью, не сохраняете её в дальний ящик, пока окончательно про неё не забудете? А тут вы тупо закидываете в NotebookLM найденный документ, а нейросеть превращает его в подкаст или лекцию. Никакой воды, никакой траты времени.

Но есть нюансы: во-первых, далеко не все доверяют Google, а во-вторых, Google наверняка сделает успешный проект платным. Но, к счастью, недавно я наткнулся на открытую альтернативу – Open NotebookLM.

Что ещё за Open NotebookLM?

Open NotebookLM превращает PDF-файлы в подкасты. За генерацию текста в нём отвечает Llama 3.1, а за преобразование текста в речь – MeloTTS. И в отличие от традиционных читалок NotebookLM превращает скучный текст в живой разговор между несколькими участниками.

Языковая модель может обработать до 100 тыс. символов, а говорилка может подобрать интонацию (от весёлой до официальной). Протестировать Open NotebookLM можно через Hugging Face, а чтобы установить нейронку на свой ПК, стоит посетить GitHub.

Ключевые особенности:

  • превращает скучный PDF-документ в захватывающий подкаст
  • диалог кажется живым и правдоподобным
  • работает даже в вебе

Запуск и использование

Если вы пока только присматриваетесь к нейросетям, вам стоит начать со страницы Open NotebookLM на Hugging Face. Весь базовый функционал будет доступен вам и в вебе. Если же предпочитаете работать локально, понадобится ряд консольных команд.

1. Клонируем GitHub-репозиторий:

git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
-2

2. Создаём виртуальную среду Python:

python -m venv .venv
source .venv/bin/activate
-3
  • python -m venv .venv создаёт виртуальное окружение в директории .venv и изолирует зависимости проекта от глобальных настроек Python
  • source .venv/bin/activate активирует виртуальную среду, чтобы использовались команды и пакеты Python только из .venv

3. Устанавливаем зависимости из файла requirements.txt (это довольно долго)

pip install -r requirements.txt
-4

4. Запускаем приложение:

python app.py
-5

Перед запуском убедитесь, что выбрали свой API-ключ в качестве FIREWORKS_API_KEY. Я вот про это забыл, поэтому и столкнулся с кучей ошибок.

Производительность

Если будете работать через Hugging Face, готовьтесь ждать. Прям долго. Я простоял в очереди больше 30 минут, а потом столкнулся с несколькими ошибками, которые в первый заход так и не смог исправить.

К счастью, я всё записывал, так что у вас есть возможность посмотреть, с какими проблемами вы можете столкнуться.

Open NotebookLM Document Processing into a Podcast

Я специально выбрал весёлый тон, чтобы проверить, действительно ли ИИ сумеет адаптироваться. В итоге получилась действительно смешная история о создании Linux, рассказанная самим Линусом Торвальдсом и почему-то женским голосом.

Нейросеть не только придумала адекватный диалог, но и нормально его озвучила. Итоговый результат можно было скачать в формате MP3 или в виде текста.

Сравнение Open NotebookLM с аналогичным инструментом от Google

Пока обе нейросети можно использовать совершенно бесплатно. Из-за открытого кода Open NotebookLM кажется более надёжным, а NotebookLM от Google – более функциональным: в нём можно сгенерировать не только подкаст, но и кучу других форматов. Да и работает он почти с любыми документами, а не только с PDF.

Но Google есть Google. На чём они будут зарабатывать? Как они будут монетизировать не самый дешёвый проект? Скорее всего, совсем скоро они либо введут платную подписку, либо начнут торговать вашими данными, либо на ваших же документах будут учить другие свои нейросети. К тому же из РФ нейронка от Google уже не запускается.

Open NotebookLM не такой функциональный, но зато и за свои данные вы можете не переживать. Если вам важен открытый код, выбор тут очевиден.

Вместо выводов

Мне кажется у Open NotebookLM есть потенциал. Пользоваться им через Hungging не особо удобно, но попробуйте относиться к веб-версии как к бесплатной демке: работает – устанавливайте на свой ПК и не парьтесь по поводу очередей и вылетов.

Да и сама идея превращать скучный текст в понятный для восприятия диалог мне тоже нравится. Просто представьте, сколько времени вы сумеете сэкономить. Так что штука в любом случае получилась жутко полезная.

И наоборот: нейронка от Google хоть и кажется более отшлифованной, потенциально может оказаться непонятно чем с непонятно какой политикой конфиденциальности.

Я бы сказал, что у обоих нейронок есть и свои преимущества, и свои перспективы. Так что в конечном счёте всё зависит от ваших предпочтений и взглядов на мир.

GitHub - gabrielchua/open-notebooklm: Convert any PDF into a podcast episode!

Абхишек Кумар,
It's FOSS
7 октября 2024

Meet Open NotebookLM: An Open Source Alternative to Google's NotebookLM