В прошлом выпуске я писал про LM Studio — это красивый графический интерфейс для знакомства с локальными нейросетями, то Ollama — это профессиональный инструмент для разработчика и инженера. Это open-source платформа (лицензия MIT ), которая позволяет поднять полноценный AI-сервер на вашей машине за считанные минуты. Сегодня мы не будем обсуждать "как просто поболтать с ИИ". Мы поговорим о том, как поднять API-совместимый с OpenAI бэкенд (bckend) и фронтенд (frontend), писать код для интеграции и использовать готовые решения из экосистемы. llama.cpp — это гениальный инженерный подвиг, но работать с ним в лоб — это как писать сайты на чистом JS когда уже все есть. Ollama же предлагает абстракцию и экосистему:
Так как мы говорим об искуственном интелекте, мы затрагиваем сложные слова, оно из которых - это "квантование". Все сложное буду пояснять и расширять ваши знания. Представьте, что нейросеть — это огромная библиотека знаний. Каждое знание (вес нейрона) в оригинале записано с фантас