Экспансия ИИ ботов

RAG и GraphRAG без боли: как правильно готовить документы

Про GraphRAG, RAG, LLM и «умные базы знаний» сейчас говорят много. Но почти всегда разговор начинается не с того места. Люди обсуждают модели, эмбеддинги, графы, вектора — и напрочь забывают про самое важное. Про документы. А потом начинается классика: модель отвечает криво, путает разделы, не находит очевидные вещи, выдумывает. И виноват, конечно, GraphRAG, RAG или «эта ваша нейросеть». Спойлер: в большинстве случаев проблема вообще не в них. RAG — это не магия. Он не понимает документы так, как человек...

4 месяца назад

Как распознать текст из отсканированных PDF: DeepSeek OCR.

DeepSeek OCR: Как запустить мощную модель распознавания текста на своем сервере Отсканированные документы, PDF-файлы без текстового слоя, изображения с текстом — все это можно распознать с помощью искусственного интеллекта. Сегодня расскажу про DeepSeek OCR — одну из самых мощных vision-моделей для распознавания текста, которая показывает отличные результаты, особенно на русском языке. Что такое DeepSeek OCR и почему он хорош? DeepSeek OCR — это vision-language модель от компании DeepSeek с 3 миллиардами параметров...

5 месяцев назад

Введение в RAG агентов. Как создать эффективного ИИ помошника в 2025 году.

В последние годы мы стали свидетелями настоящей революции в области искусственного интеллекта. Генеративные языковые модели, такие как GPT, Claude и другие, показали невероятные возможности в понимании и генерации текста. Однако у них есть существенное ограничение: они работают только с информацией, на которой были обучены, и не имеют доступа к актуальным данным или корпоративным знаниям. Именно здесь на сцену выходят RAG-агенты — технология, которая объединяет мощь больших языковых моделей с возможностью работы с реальными данными...

6 месяцев назад

Как установить n8n в docker c возможностью запуска локальных ИИ моделей.

В этой статье мы установим локально n8n + платформу Ollama которая позволит нам запускать ИИ модели локально и также встанет Qdrant это система управления векторными базами данных. Это позволит одной установкой закрыть все вопросы для начинающих энтузиастов n8n. Все это хозяйство сейчас в состоянии покоя кушает около 920Мб оперативной памяти. Моя тестовая машина, на которой это все крутиться, состоит из: Самое тяжелое, что я делал, и делаю постоянно это транскрибация разговора двух людей длительностью в час...

1710 читали · 1 год назад

Установка n8n на свой сервер без docker.

n8n будет работать даже на 1GB RAM и 1 ядре. Но обычно такие слабые серверы идут с малым количеством места на диске (около 20Gb) и покрутить на них локальные модели не получится. Но для первого знакомства отлично подойдет минималка. Вторым важным параметром является локация. Вы спросите почему ? А потому, что вашему серверу прийдется взаимодействовать с различными сервисами по API и по большей части эти сервисы не в РФ, и возможна блокировка. Хотя по большей части эти сервисы блокируют только доступ на сайт, а доступ к API нет...

1199 читали · 1 год назад