Найти в Дзене

Как из чужого GitHub-проекта и 100 Telegram-каналов получилась база знаний по AI

На GitHub каждую неделю появляются десятки open-source проектов с AI-агентами. Большинство из них решают чужую задачу, не вашу. Но идею можно забрать и адаптировать. Разбираем на примере. !!! Больше кейсов на канале “AI для продакта” Один такой проект набрал больше 400 звёзд за несколько дней. Называется My-Brain-Is-Full-Crew. Автор, PhD-исследователь, устал терять информацию и собрал команду из 8 AI-агентов, которые управляют его хранилищем знаний в Obsidian. Каждый агент отвечает за своё: один собирает заметки, другой раскладывает по категориям, третий находит связи между темами, четвёртый ищет по всей базе, пятый следит за порядком и качеством. По сути, персональный библиотекарь с командой помощников, только цифровой. Идея зацепила. Захотелось сделать такую же базу знаний, только не по личным заметкам, а по AI-контенту. И не вручную, а автоматически. А источник данных для этого уже был. Несколько месяцев работал бот «Детокс контента». Подписчики добавляют в него Telegram-каналы, кот
Оглавление

На GitHub каждую неделю появляются десятки open-source проектов с AI-агентами. Большинство из них решают чужую задачу, не вашу. Но идею можно забрать и адаптировать. Разбираем на примере.

!!! Больше кейсов на канале “AI для продакта”

Чужой проект как отправная точка

Один такой проект набрал больше 400 звёзд за несколько дней. Называется My-Brain-Is-Full-Crew. Автор, PhD-исследователь, устал терять информацию и собрал команду из 8 AI-агентов, которые управляют его хранилищем знаний в Obsidian. Каждый агент отвечает за своё: один собирает заметки, другой раскладывает по категориям, третий находит связи между темами, четвёртый ищет по всей базе, пятый следит за порядком и качеством.

По сути, персональный библиотекарь с командой помощников, только цифровой.

А если не заметки, а каналы?

Идея зацепила. Захотелось сделать такую же базу знаний, только не по личным заметкам, а по AI-контенту. И не вручную, а автоматически. А источник данных для этого уже был.

Несколько месяцев работал бот «Детокс контента». Подписчики добавляют в него Telegram-каналы, которые хотят читать, а бот собирает из них персональный дайджест. По теме AI пользователи накидали больше сотни каналов. За один только март бот собрал в базу почти 4 000 постов. Генерация видео, промптинг, новые модели, AI-агенты, робототехника, AI в бизнесе и тд. Огромный массив знаний по самым разным направлениям, который просто лежал в базе.

Как это собрали

Каждый пост в базе бота уже имел краткое содержание и числовой «слепок» смысла (embedding), по которому можно находить похожие тексты. Оставалось добавить поверх этого слой, который превратит россыпь постов в структурированное знание.

Задачу отдали в Claude Code. За основу взяли архитектуру из GitHub-проекта, но адаптировали: вместо файлов в Obsidian всё хранится в базе данных, вместо восьми агентов хватило трёх.

Синтезатор берёт посты по теме и пишет аналитическую статью. Не пересказывает каждый пост, а ищет закономерности и выделяет главное. Коннектор строит связи между темами: генерация видео связана с промптингом, RAG-системы зависят от качества моделей.
Библиотекарь следит за порядком: убирает дубликаты, помечает устаревшее, оценивает качество.

Claude Code собрал проект и статьи за три часа, израсходовав почти два пятичасовых лимита подписки.

Две попытки найти правильный подход

Не всё сработало с первого раза.

Первая попытка: отдать кластеризацию автоматике. Пусть система сама сгруппирует похожие посты и назовёт темы. Результат: десятки микро-кластеров по 2-3 поста. «Модель Uni-1 от Luma», «Увеличение штата в OpenAI». Темы привязывались к конкретным новостям, а не к направлениям знаний. Не база знаний, а лента новостей.

Вторая попытка: задать структуру вручную. 14 широких категорий (генерация видео, промптинг, AI и общество, RAG, робототехника...), внутри каждой подтемы. Посты привязываются к ближайшей категории автоматически. Это сработало.

Вывод оказался неожиданным. Иногда человеческая структура «сверху» работает лучше, чем любая автоматическая кластеризация «снизу».

Посмотреть и попробовать

-2

Сейчас в базе 44 аналитические статьи по 14 направлениям AI. Каждая собрана не из одного источника, а из десятков постов. 72 связи между темами. Почти 4 000 обработанных постов из 108 каналов за один месяц.

Результат можно посмотреть здесь: https://detoxoff.ru/kb/

Там статьи по генерации видео, промптингу, AI-агентам, робототехнике и другим направлениям. Каждая собрана не из одного источника, а из десятков постов разных каналов. Получается такая народная база знаний. Есть поиск, связи между темами, тренды.

База растёт каждый день, потому что бот «Детокс контента» продолжает собирать посты. Чем больше каналов добавляют подписчики для своих дайджестов, тем полнее становится каталог.

Заходите и вы. Добавляйте свои проверенные каналы из Telegram или VK, и будем собирать народную базу знаний по AI с помощью AI.

!!! Больше кейсов на канале “AI для продакта”