RAG — один из самых прагматичных выборов. План рассчитан на 2–3 месяца при занятиях 10–15 часов в неделю. После этого ты сможешь выполнять коммерческие заказы на фрилансе или устроиться junior RAG-инженером.
Этап 0. Подготовка (1–2 дня)
Установи минимальный инструментарий:
- VS Code или PyCharm
- Git и GitHub аккаунт
- Создай отдельную папку rag_learning
Этап 1. Освоить базу, без которой RAG не работает (неделя 1)
Действия:
- Пойми архитектуру RAG — посмотри 2 видео на YouTube: «RAG from scratch» (Andrej Karpathy или LangChain tutorial). Главное: retrieval (поиск) + generation (генерация).
- Научись работать с текстовыми эмбеддингами — прочитай, что такое векторное представление, cosine similarity. Не углубляйся в математику, просто запусти пример:pythonfrom sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
emb = model.encode("Привет, мир") - Установи и запусти локальную векторную БД — начни с ChromaDB (самая простая). Запусти их пример из документации: добавь 3 документа, сделай поиск.
Результат недели 1: Ты можешь руками на Python разбить текст на чанки, превратить в векторы, сохранить в Chroma и найти похожий кусок по запросу.
Этап 2. Первый рабочий RAG-пайплайн (неделя 2)
Действия:
- Возьми простую LLM — для старта используй API OpenAI (gpt-3.5-turbo), если есть доступ. Если нет — скачай локально llama-cpp-python с моделью Qwen2-1.5B-Instruct (легкая).
- Собери классический RAG без фреймворков (руками):
Загрузи PDF-файл (например, любую инструкцию или выдержку из Википедии).
Разбей на чанки по 500 символов с перекрытием 50.
Сделай эмбеддинги каждого чанка.
На запрос пользователя найди top-3 чанка.
Склей их в промпт: "Ответь на вопрос, используя только эти документы: ... Вопрос: ..."
Отправь в LLM, получи ответ. - Обработай ошибки — что делать, если ничего не нашлось? Если ответ не по документам?
Результат недели 2: Скрипт, который отвечает на вопросы по твоему PDF. Ты понимаешь каждый шаг.
Этап 3. Переход на профессиональные инструменты (неделя 3)
Действия:
- Изучи LangChain — сделай то же самое, но с Chroma, OpenAIEmbeddings, RetrievalQAchain. Понимай, что каждый модуль делает.
- Добавь диалоговость — реализуй историю сообщений (chat memory) через ConversationBufferMemory.
- Научись менять параметры — chunk size, overlap, количество возвращаемых чанков, температура модели.
Результат недели 3: У тебя есть шаблон RAG-бота в Jupyter Notebook, который можно переиспользовать.
Этап 4. Первый самостоятельный проект для портфолио (недели 4–5)
Проект: Чат-бот в Telegram, который отвечает по вашему конспекту/книге/набору статей.
Конкретные действия:
- Зарегистрируй бота у @BotFather в ТГ, получи токен.
- Напиши скрипт на python-telegram-bot или aiogram, который принимает сообщение и возвращает ответ от твоего RAG.
- Задеплой бота на бесплатный сервис (Railway.app или Render). Используй OpenAI API (или локальную модель, если хватит ресурсов).
- Сделай красивое README на GitHub: скриншоты, описание архитектуры, инструкцию по запуску.
- Запусти бота, пригласи 2-3 друзей потестировать — это твой первый пользовательский фидбек.
Результат: Работающий публичный бот + GitHub-репозиторий. Это уже сильное портфолио.
Этап 5. Продвинутые техники RAG (неделя 6–7)
Чтобы выделяться среди новичков и получать хорошие заказы, освой:
- Переранжирование (reranking) — после того как Chroma вернул 10 чанков, пропусти их через cross-encoder (например, BAAI/bge-reranker-base), оставь 3 самых релевантных. Это резко повышает качество.
- Гибридный поиск — combine векторный поиск + BM25 (ключевые слова). Библиотека rank_bm25 + Chroma.
- Оценка качества RAG — метрики: hit rate, MRR, faithfulness (с помощью ragas библиотеки).
- Обработка сложных форматов — извлекать текст не только из PDF, но и из PPTX, Docx, таблиц Excel, изображений (OCR).
Практика: Возьми любой датасет вопрос-ответ по открытым документам (например, Russian SuperGLUE) и улучшай свою метрику.
Этап 6. Выход на доход (с 8-й недели)
У тебя уже есть:
- Понимание RAG изнутри
- Рабочий бот в ТГ
- Код на GitHub
Конкретные каналы для денег:
- Фриланс-биржи:
Найди на Kwork, Upwork, Habr Freelance запросы «RAG», «чат-бот по документам», «AI для базы знаний».
Цена: от 300$ за простого бота, от 1000$ за интеграцию с CRM/сайтом. - Прямые продажи малому бизнесу:
Напиши 10 компаниям (юридические фирмы, медцентры, учебные центры) с большим количеством внутренних документов.
Предложи: «Сделаю вам за 500$ бота, который ответит на любой вопрос по вашим инструкциям за 3 секунды». - Устройство на работу:
Резюме: «Junior RAG Engineer / ML Engineer (RAG)».
Покажи бота на собеседовании.
Зарплата в РФ/СНГ удаленно: от 80к рублей на старте. - Продажа шаблонов:
Сделай универсальный RAG-пайплайн с настройками (размер чанка, reranking, выбор БД) и продавай на Gumroad за $49.
Что учить дальше после получения первых денег
- Мониторинг и логирование — чтобы видеть, почему бот ошибся.
- Асинхронность (asyncio в Python) — для обработки многих запросов.
- Контейнеризация (Docker) — чтобы заказчик легко развернул у себя.
- Fine-tuning эмбеддингов под узкую область (редкий язык, специфическая терминология).
Твой конкретный первый шаг завтра утром
- Установи Python, VS Code.
- Открой гугл-колаб (если не хочешь возиться локально).
- Запусти код:python!pip install chromadb sentence-transformers
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
emb = model.encode("Кошка сидит на коврике")
print(len(emb)) # 384 — размерность вектора
ИИ сейчас один из самых высокооплачиваемых направлений. На деле есть конкретные ниши, где можно начать зарабатывать быстрее, без PhD.
Вот 5 конкретных сфер внутри ИИ с разным входным порогом и скоростью выхода на доход. Выбери по своему типу мышления.
1. RAG-инжиниринг (самый быстрый выход на деньги)
Что это: Делать так, чтобы ИИ (ChatGPT, локальные модели) отвечал на основе вашихдокументов (база знаний, договоры, инструкции компании).
Зачем платят: Бизнесу нужно, чтобы бот знал их внутренние правила и не галлюцинировал.
Технологии: Python, LangChain/LlamaIndex, векторные БД (Chroma, Qdrant).
Доход: Junior RAG-инженер (6 мес обучения) — от 1500–2500$ на фрилансе/удаленке.
Твой путь: Научись за 2-3 месяца делать чат-бота для ТГ по своим личным заметкам → портфолио → заказы на Kwork/Upwork.
2. Fine-tuning (настройка) open-source моделей
Что это: Берете Llama 3 или Mistral и дообучаете под конкретную узкую задачу (генерация техдокументации, написание юридических писем, код на специфическом фреймворке).
Зачем платят: Это в 10 раз дешевле, чем GPT-4 на больших объемах. Компании хотят свою дешевую модель.
Нюанс: Нужны GPU (можно арендовать на RunPod за $0.5/час). Доход выше, но вход чуть сложнее.
Доход: Один проект fine-tune под стартап — от 2000–5000$.
3. AI-автоматизация бизнес-процессов (низкий код, высокий доход)
Что это: Связывать ИИ с CRM, почтой, Google Sheets, телеграм-ботами через сервисы вроде n8n (self-hosted), Make или писать простые скрипты.
Зачем платят: Сотрудник тратит 2 часа в день на ответы клиентам — вы ставите AI-агента, который делает это за 2 минуты.
Технологии: Базовый Python + API OpenAI/Anthropic + HTTP-запросы.
Доход: Такие решения стоят от 1000$ за внедрение + ежемесячная поддержка. Самые востребованные фрилансеры в этой нише имеют очередь.
Пример: AI-менеджер, который читает входящие письма, классифицирует их и создает задачи в Trello.
4. Компьютерное зрение для малого бизнеса (недооцененная ниша)
Что это: Не распознавание лиц (там монстры), а мелкие задачи: подсчет товаров на полке по фото, контроль техники безопасности на стройке через обычную камеру, определение дефектов на конвейере.
Зачем платят: В отличие от LLM, здесь мало хайпа, но много реальных денег от заводов и складов.
Технологии: YOLO (последняя версия), Roboflow, OpenCV.
Доход: Один проект для автосервиса (распознавать номера авто и состояние шин) — от 3000$.
5. Создание и продажа AI-воркфлоу на Template-площадках
Что это: Вы делаете сложную связку (например: аудио → транскрипция → суммаризация → создание карточек в Notion) и продаете как шаблон в Gumroad или PromptBase.
Подходит: Тем, кто не хочет работать с клиентами, а хочет пассивный доход.
Реалистично: 500-1500$ в месяц, если выпускать 1-2 качественных воркфлоу в неделю и продвигать их в LinkedIn/Twitter.
Как конкретно определиться за 30 минут
Ответь себе на 3 вопроса:
- Что тебе не ленится делать часами?
Ковыряться в документации и писать код → RAG или Fine-tuning.
Собирать конструкторы из кубиков (Make/n8n) → Автоматизация.
Работать с изображениями и видео → Компьютерное зрение.
Упаковывать и продавать → Шаблоны. - Сколько времени готов учиться до первых денег?
1-2 месяца → автоматизация (Make + API).
3-4 месяца → RAG.
6+ месяцев → fine-tuning или CV. - Какая ставка тебя устроит на старте?
$20-30/час → автоматизация, RAG.
$50+/час → fine-tuning (но заказов меньше).
Мой конкретный совет
Если ты хочешь быстро и надежно:
RAG-инжиниринг + AI-автоматизация как смежная тема.
Сделай за месяц один пет-проект: «Чат-бот для ТГ, который отвечает на вопросы по моей папке с PDF-инструкциями». Выложи код на GitHub, напиши пост на Habr/VC. После этого ты уже ценнее 90% джунов, и тебя начнут находить заказчики.
Если Вас привлекает RAG
RAG — один из самых прагматичных выборов. План рассчитан на 2–3 месяца при занятиях 10–15 часов в неделю. После этого ты сможешь выполнять коммерческие заказы на фрилансе или устроиться junior RAG-инженером.
Этап 0. Подготовка (1–2 дня)
Установи минимальный инструментарий:
- VS Code или PyCharm
- Git и GitHub аккаунт
- Создай отдельную папку rag_learning
Этап 1. Освоить базу, без которой RAG не работает (неделя 1)
Действия:
- Пойми архитектуру RAG — посмотри 2 видео на YouTube: «RAG from scratch» (Andrej Karpathy или LangChain tutorial). Главное: retrieval (поиск) + generation (генерация).
- Научись работать с текстовыми эмбеддингами — прочитай, что такое векторное представление, cosine similarity. Не углубляйся в математику, просто запусти пример:pythonfrom sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
emb = model.encode("Привет, мир") - Установи и запусти локальную векторную БД — начни с ChromaDB (самая простая). Запусти их пример из документации: добавь 3 документа, сделай поиск.
Результат недели 1: Ты можешь руками на Python разбить текст на чанки, превратить в векторы, сохранить в Chroma и найти похожий кусок по запросу.
Этап 2. Первый рабочий RAG-пайплайн (неделя 2)
Действия:
- Возьми простую LLM — для старта используй API OpenAI (gpt-3.5-turbo), если есть доступ. Если нет — скачай локально llama-cpp-python с моделью Qwen2-1.5B-Instruct (легкая).
- Собери классический RAG без фреймворков (руками):
Загрузи PDF-файл (например, любую инструкцию или выдержку из Википедии).
Разбей на чанки по 500 символов с перекрытием 50.
Сделай эмбеддинги каждого чанка.
На запрос пользователя найди top-3 чанка.
Склей их в промпт: "Ответь на вопрос, используя только эти документы: ... Вопрос: ..."
Отправь в LLM, получи ответ. - Обработай ошибки — что делать, если ничего не нашлось? Если ответ не по документам?
Результат недели 2: Скрипт, который отвечает на вопросы по твоему PDF. Ты понимаешь каждый шаг.
Этап 3. Переход на профессиональные инструменты (неделя 3)
Действия:
- Изучи LangChain — сделай то же самое, но с Chroma, OpenAIEmbeddings, RetrievalQAchain. Понимай, что каждый модуль делает.
- Добавь диалоговость — реализуй историю сообщений (chat memory) через ConversationBufferMemory.
- Научись менять параметры — chunk size, overlap, количество возвращаемых чанков, температура модели.
Результат недели 3: У тебя есть шаблон RAG-бота в Jupyter Notebook, который можно переиспользовать.
Этап 4. Первый самостоятельный проект для портфолио (недели 4–5)
Проект: Чат-бот в Telegram, который отвечает по вашему конспекту/книге/набору статей.
Конкретные действия:
- Зарегистрируй бота у @BotFather в ТГ, получи токен.
- Напиши скрипт на python-telegram-bot или aiogram, который принимает сообщение и возвращает ответ от твоего RAG.
- Задеплой бота на бесплатный сервис (Railway.app или Render). Используй OpenAI API (или локальную модель, если хватит ресурсов).
- Сделай красивое README на GitHub: скриншоты, описание архитектуры, инструкцию по запуску.
- Запусти бота, пригласи 2-3 друзей потестировать — это твой первый пользовательский фидбек.
Результат: Работающий публичный бот + GitHub-репозиторий. Это уже сильное портфолио.
Этап 5. Продвинутые техники RAG (неделя 6–7)
Чтобы выделяться среди новичков и получать хорошие заказы, освой:
- Переранжирование (reranking) — после того как Chroma вернул 10 чанков, пропусти их через cross-encoder (например, BAAI/bge-reranker-base), оставь 3 самых релевантных. Это резко повышает качество.
- Гибридный поиск — combine векторный поиск + BM25 (ключевые слова). Библиотека rank_bm25 + Chroma.
- Оценка качества RAG — метрики: hit rate, MRR, faithfulness (с помощью ragas библиотеки).
- Обработка сложных форматов — извлекать текст не только из PDF, но и из PPTX, Docx, таблиц Excel, изображений (OCR).
Практика: Возьми любой датасет вопрос-ответ по открытым документам (например, Russian SuperGLUE) и улучшай свою метрику.
Этап 6. Выход на доход (с 8-й недели)
У тебя уже есть:
- Понимание RAG изнутри
- Рабочий бот в ТГ
- Код на GitHub
Конкретные каналы для денег:
- Фриланс-биржи:
Найди на Kwork, Upwork, Habr Freelance запросы «RAG», «чат-бот по документам», «AI для базы знаний».
Цена: от 300$ за простого бота, от 1000$ за интеграцию с CRM/сайтом. - Прямые продажи малому бизнесу:
Напиши 10 компаниям (юридические фирмы, медцентры, учебные центры) с большим количеством внутренних документов.
Предложи: «Сделаю вам за 500$ бота, который ответит на любой вопрос по вашим инструкциям за 3 секунды». - Устройство на работу:
Резюме: «Junior RAG Engineer / ML Engineer (RAG)».
Покажи бота на собеседовании.
Зарплата в РФ/СНГ удаленно: от 80к рублей на старте. - Продажа шаблонов:
Сделай универсальный RAG-пайплайн с настройками (размер чанка, reranking, выбор БД) и продавай на Gumroad за $49.
Что учить дальше после получения первых денег
- Мониторинг и логирование — чтобы видеть, почему бот ошибся.
- Асинхронность (asyncio в Python) — для обработки многих запросов.
- Контейнеризация (Docker) — чтобы заказчик легко развернул у себя.
- Fine-tuning эмбеддингов под узкую область (редкий язык, специфическая терминология).
Твой конкретный первый шаг завтра утром
- Установи Python, VS Code.
- Открой гугл-колаб (если не хочешь возиться локально).
- Запусти код: python!pip install chromadb sentence-transformers
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
emb = model.encode("Кошка сидит на коврике")
print(len(emb)) # 384 — размерность вектора