Найти в Дзене
Сам себе Data Scientist

Устанавливаем PyTorch, transformers и запускаем RuBERT

RuBERT был натренирован на русской части Википедии и новостных данных. Эти обучающие данные были использованы для создания словаря русских токенов. В качестве инициализации для RuBERT была взята многоязычная версия BERT-базы.
Оглавление

RuBERT был натренирован на русской части Википедии и новостных данных. Эти обучающие данные были использованы для создания словаря русских токенов. В качестве инициализации для RuBERT была взята многоязычная версия BERT-базы.

Подробнее можно почитать на сайте DeepPavlov команды.

В данной статье предполагается, что у вас уже установлена Anaconda или miniconda.

Шаг 1. Создаём чистую среду

Чтобы не вызывать конфликты версий библиотек, создаём новую среду.

-2

Переходим в созданную среду

-3

Если нужно выйти из среды, используйте эту команду

-4

Шаг 2. Устанавливаем PyTorch

Заходим на официальный сайт, немного пролистываем вниз до секции установки.

-5

Выбираем для себя подходящие параметры. В моём случае это Windows, Python и без CUDA, так как устанавливаю на свой ноутбук.

Копируем команду для установки и выполняем её в нашей созданной среде (Шаг 1. Убедитесь, что выполнили перед этим conda activate env_name).

-6

Я добавил к команде -y, чтобы он не спрашивал нужно ли установить дополнительные пакеты.

Вы должны увидеть результат наподобие этого:

-7

Шаг 3. Устанавливаем transformers

-8

Подробнее про эту библиотеку можно почитать в официальном репозитории Github.

Согласно их описанию перед установкой необходимо установить PyTorch или Tensorflow, в зависимости от того, что вы используете. Мы сделали это вторым шагом.

Устанавливаем библиотеку через pip:

-9

Шаг 4. Подключаем модель RuBERT

Теперь можно подключить натренерованную модель и использовать с русским языком:

-10
P.S. Если вы используете TensorFlow, то на втором шаге нужно будет установить его вместо PyTorch. И в последнем шаге вместо AutoModel импортировать TFAutoModel и поменять return_tensors="tf".

На этом всё :) Ставьте лайк, если статья понравилась и подписывайтесь на канал. Впереди ещё много интересного!