Добавить в корзинуПозвонить
Найти в Дзене
PythonTalk

💥 Alibaba показала, как надо делать AI-агентов

💥 Alibaba показала, как надо делать AI-агентов. И выложила всё в опенсорс. Подразделение Alibaba Tongyi Lab выкатило опенсорс не просто модель-агента, а целый завод по их производству — Tongyi DeepResearch. Кроме того, что по метрикам их решение не уступает закрытым аналогам, они ещё показали новую парадигму работы агента, которая решает фундаментальную проблему всех существующих систем. Большинство агентов сегодня работают по принципу ReAct (Мысль → Действие → Наблюдение). Весь контекст — удачные и неудачные шаги, найденная инфа, мусор — сваливается в одну кучу. Рано или поздно модель тонет в своём контексте. Разработчики это назвали "когнитивным удушьем" и "шумовым загрязнением". 🧠 Что сделали в Alibaba? Придумали свой подход — IterResearch. Вместо одного бесконечного потока мыслей агент работает короткими "исследовательскими раундами". В конце каждого раунда он "убирает со стола" 🧹 всё лишнее, оставляя только краткую сводку и план на следующий шаг. Это позволяет ему сохранять

💥 Alibaba показала, как надо делать AI-агентов. И выложила всё в опенсорс.

Подразделение Alibaba Tongyi Lab выкатило опенсорс не просто модель-агента, а целый завод по их производству — Tongyi DeepResearch.

Кроме того, что по метрикам их решение не уступает закрытым аналогам, они ещё показали новую парадигму работы агента, которая решает фундаментальную проблему всех существующих систем.

Большинство агентов сегодня работают по принципу ReAct (Мысль → Действие → Наблюдение). Весь контекст — удачные и неудачные шаги, найденная инфа, мусор — сваливается в одну кучу.

Рано или поздно модель тонет в своём контексте. Разработчики это назвали "когнитивным удушьем" и "шумовым загрязнением".

🧠 Что сделали в Alibaba? Придумали свой подход — IterResearch.

Вместо одного бесконечного потока мыслей агент работает короткими "исследовательскими раундами". В конце каждого раунда он "убирает со стола" 🧹 всё лишнее, оставляя только краткую сводку и план на следующий шаг. Это позволяет ему сохранять ясность мысли на протяжении решения очень длинных и запутанных задач.

Главный тезис команды: "Данные — это основной драйвер улучшения возможностей модели; их важность даже превосходит важность алгоритма". Для этого они построили целую машину по генерации синтетических данных нужной сложности.

В итоге у сообщества теперь есть не просто SOTA-модель, а полный чертеж "завода" для производства собственных агентов под любые задачи.

Разобрал их архитектуру и подход подробнее в статье, читайте:

https://olegtalks.ru/tpost/rv7dibj091-tongyi-deepresearch-ai-agenta-ot-alibaba ◀️◀️

#годный_опенсорс