Как это было. Взяли для участия на хакатоне сервер от Selectel с GPU CUDA Tesla T4, начали ставить на него Mistral 7b, словили кучу ошибок, что видеоресурсы не найдены. В результате работы на хакатоне изобрели целый мануал, как настраивать сервак на Ubuntu 22 под Mistral 7b. Нейросетевой разработчик в это же время на локалке все очень быстро сделал, поставили на сервак Jupyter Notebook. Туда подгрузили ipynb-файл. Ну подробнее – это уже коммерческая тайна, что мы там химичили. Файл с моделью, в итоге, не ругался сначала на импорты, а потом на все остальные строчки кода в нем. Fast API, Get-запрос, импорт модели. Вот такое простое решение, в итоге, получилось. Содержание такого сервера сегодня стоит 39000 рублей, поэтому мы быстренькое записали мануал, а проект приостановили до лучших времен. Но что же делает, в итоге, проект? Все довольно круто. Решение с накатана мы оформили на отдельной страничке http://rustore.genervis.ru/chat.php, доступ с использованием сервера-бека, разумеется,