Цель: взять базу знаний в виде текстовых файлов и векторизовать ее для нахождения подходящего контекста по пользовательскому запросу и синтеза ответа нейросетью. Алгоритм действий:
Устанавливаем ollama для запросов к локальной нейросети
yay -S ollama
sudo systemctl start ollama.service
Скачиваем модели для ollama:
ollama pull mxbai-embed-large
ollama pull llama3:8b Создаем каталог, в котором будет хранится векторная база chromadb
mkdir /home/username/persistent/store -p Создаем каталог, в котором будут текстовые файлы с базой знаний mkdir /home/username/dataset Для теста будем использовать файл main.txt с абсурдным содержанием, чтобы
убедится, что контекст точно берется из векторной базы cd ~/dataset
nano main.txt
Вставляем тестовый текст:
Название компании - "Рога и копыта"
Год основания - 666 до нашей эры
Создадим каталог для двух скриптов - один будет строить векторную базу, другой отвечать на запрос пользователя согласно найденным контекстам. Одновременно сделаем виртуальное