Найти в Дзене
🚀 ollama-web-proxy даёт Obsidian Copilot доступ к веб-поиску через локальный Ollama без подписки
Ваш локальный Ollama в Obsidian Copilot «слеп» к свежей информации из интернета — в итоге приходится вручную гуглить и вставлять факты в чат. ollama-web-proxy решает это как Python-прокси на Flask: между Obsidian Copilot и Ollama он подмешивает результаты веб-поиска в каждый запрос к модели. Автор потратил время на обратную инженерию формата промптов плагина: из цепочки внутренних вызовов прокси достаёт реальный вопрос пользователя и добавляет веб-контекст так, чтобы свежие результаты опережали заметки...
8 минут назад
Открытые модели за 3 дня
В подборке — свежие модели для поиска навыков, веб-исследований, диалектного перевода и ускорения Gemma через draft-модель.
4 часа назад
🧠 ThakiCloud/SKILLRET-Embedding-8B
🧠 ThakiCloud/SKILLRET-Embedding-8B Эмбеддинговая модель для поиска нужного навыка по текстовому запросу пользователя. Дообучена на SkillRet для agent skill retrieval: по запросу находит релевантный skill из большой библиотеки. На тесте SkillRet completeness@15 у неё 0.884 — это значит, что в топе чаще оказываются все нужные навыки, а не один случайный. 🧠 AIDC-AI/Marco-DeepResearch-8B 8B-агент для глубокого веб-исследования с поиском, проверкой фактов и многошаговым выводом. Работает в контексте 128K и в их тестах под бюджетом 600 tool calls обходит другие 8B-агенты, а на xBench-DS-2505 набирает 82...
4 часа назад
🛠 OmniSVG1.1-4B превращает SVG-команды и координаты в токены и генерирует сложные SVG из текста или картинки
OmniSVG генерирует масштабируемые цветные SVG (векторные графики) из текста или изображений и работает с персонажами в стиле референса. OmniSVG (vision-language model — модель, связывающая картинку и текст) не пытается выдавать SVG как XML-код. Вместо этого команды move/line/curve/arc/close и координаты превращаются в токены, а модель выдаёт последовательность, из которой уже собирается валидный вектор. В датасете MMSVG-2M 2 млн SVG-ассетов: 1.1M иконок, 0.5M иллюстраций и 0.4M персонажей (часть персонажей сгенерирована для пар изображение–SVG)...
4 часа назад
🛠 AGiXT объединяет интеграции AI-агента и локальную память, чтобы один бот вел задачи и в Slack, и в умном доме
Вы устали от того, что один AI-бот только отвечает в чате, а другой — только собирает аналитику, и между ними вручную клейте интеграции? AGiXT нацелена на единый агентский стек для таких сценариев. В основе — локальная память: эмбеддинги считают через ONNX и хранят в ChromaDB, чтобы быстрее искать прошлые факты и не платить за каждый запрос на эмбеддинги. Поверх этого — оркестрация цепочек (Chains): шаги могут вызывать агентов, запускать команды, переключаться на другие цепочки и брать параметры из базы. Платформа масштабируется за счёт расширений: заявлено 80+ плагинов для разных направлений — от провайдеров LLM до соцсетей, платежей и умного дома...
5 часов назад
🚀 9Router: локальный роутер для AI-кода, который переключает провайдеры и режет токены на git/grep
У AI-ассистента в Cursor или Claude Code одна боль: лимиты и рост счета за API. 9Router ставится локально и даёт единый OpenAI-совместимый API для инструментов программирования — дальше запросы идут через цепочку провайдеров платный → дешёвый → бесплатный. Главная экономия идёт от RTK (Reduce Token Kilobytes): сжатие вывода команд вроде git diff, ls, grep, чтобы не отправлять в модель лишний «мусор» токенов. По заявлению авторов это даёт 20–40% экономии на запрос. Цифры пока не убеждают без замеров на вашем наборе команд, но сам подход выглядит логично...
6 часов назад
🛠 Milvus помогает хранить и искать по миллиардам эмбеддингов в продакшене благодаря cloud-native архитектуре
Если вам нужно хранить и искать по миллиардам векторов в продакшене, вы наверняка слышали про Milvus — давайте разберёмся, как он устроен изнутри и что нового в последних релизах. Какую проблему решает: раньше приходилось городить отдельные сервисы для ANN-поиска, хранения эмбеддингов и фильтрации по метаданным; Milvus берёт это на себя как векторную БД, заточенную под Approximate Nearest Neighbor (приближённый поиск ближайших соседей). Что можно построить: RAG-систему, где эмбеддинг вопроса находит...
7 часов назад
📝 TabEmbed — универсальные эмбеддинги для таблиц, и версия 0.6B почти вдвое обгоняет текстовые в поиске
Суть открытия в одном предложении: TabEmbed научили превращать строки таблиц в векторы, которые подходят и для поиска, и для классификации, как будто это единая “карта смысла” для данных. Если сравнить, как модели работают с таблицами “как с текстом” (через текстовые эмбеддинги), то идея TabEmbed ближе к тому, чтобы листать оглавление книги по разделам: модель учитывает числовые значения и связи между колонками, а не просто слова. В самом заметном месте — retrieval — TabEmbed-0.6B даёт MRR@10 = 71.72%, тогда как лучшие текстовые эмбеддинги (8B) держатся около 40.06%: почти двукратный разрыв при той же задаче поиска...
12 часов назад
📝 PaperGuru с lifecycle-памятью воспроизвёл код из статей лучше человека-эксперта на 25 п
п. AI-агент с новой архитектурой памяти впервые превзошёл человека-эксперта в воспроизведении кода из научных статей: 66.05% против 41% (Code-Dev). Ключевая идея — Lifecycle-Aware Memory (память понимает жизненный цикл данных): агент помнит версии, умеет распознавать устаревание и формирует ответы так, чтобы каждое утверждение имело происхождение до верифицируемого артефакта. Внутри PaperGuru использует Capital Chunk Memory (CCM): два слоя, где компактные chunk heads держат маршрутизацию, а содержимое подтягивается лениво по запросу...
14 часов назад
🚀 Opik (open-source) добавляет трассировку, оценку и автоматическую оптимизацию промптов — как в LangSmith, но бесплатно
В мире LLM-разработки часто приходится вручную: собирать логи вызовов, придумывать метрики качества, запускать пайплайны тестов и затем точечно править промпты, чтобы добиться стабильности. Opik — это open-source платформа от Comet для наблюдаемости, оценки и оптимизации LLM-приложений: трассировки разговоров и ответов (Trace/Span), датасеты и тест-сюиты, интеграции с популярными фреймворками и модели метрик. Впечатляет наличие Agent Optimizer с пятью алгоритмами (включая генетический и байесовский) — можно улучшать инструкции автоматически, а результаты прогонять через метрику. Отдельная сила...
19 часов назад
🚀 Dify добавил коллаборативное редактирование воркфлоу и подходит для продакшн-сценариев с RAG и агентами
Устали вручную собирать пайплайны для RAG (retrieval-augmented generation: ответ с подтягиванием контекста из базы) и агентные цепочки, а потом ещё писать код интеграций и мониторинга? Dify — open-source low-code платформа с визуальным редактором воркфлоу, которая закрывает весь путь от идеи до деплоя. В обновлении v1.14 появился коллаборативный режим: несколько пользователей могут одновременно редактировать один и тот же сценарий, видеть присутствие и синхронизированные изменения — как в Figma/Google Docs для ML-логики...
20 часов назад
🛠 OpenCode навыками автоматизирует Obsidian: сортирует заметки, ищет связи и делает недельные синтезы
Представь: ты накидал кучу заметок в Obsidian, а через месяц не можешь найти ничего полезного — знакомо? Авторы собрали систему из 7 AI-навыков, чтобы архив превращался в нарастающую базу знаний. Главная идея — границы ответственности. Каждый навык делает свою работу: inbox-triage сортирует входящие, connection-review связывает недавно изменённые заметки, weekly-synthesis извлекает “смысл недели” (теза, противоречия, один вопрос/один шаг), а “повышение качества” идёт только для действительно полезных черновиков. Ключевая оптимизация — многослойное чтение: сначала берут метаданные и структуру, а полный текст открывают точечно...
21 час назад