Найти в Дзене
SkyNet | Новости ИИ

Google AI представляет PaperBanana: агентную систему для автоматизации создания методологических диаграмм и статистических графиков, готовых

к публикации Создание иллюстраций, готовых к публикации, — это трудоёмкий этап в исследовательском процессе. Хотя учёные, работающие с искусственным интеллектом, могут теперь заниматься обзорами литературы и кодом, им сложно визуально представить сложные открытия. Исследовательская группа из Google и Пекинского университета представляет новую систему под названием PaperBanana, которая меняет ситуацию, используя мультиагентную систему для автоматизации создания высококачественных академических диаграмм и графиков. Архитектура из пяти специализированных агентов PaperBanana не полагается на единый запрос. Она объединяет усилия команды из пяти агентов, чтобы преобразовать необработанный текст в профессиональные визуальные элементы. Этап 1: линейное планирование * Агент-поисковик: определяет 10 наиболее релевантных примеров из базы данных, чтобы задать стиль и структуру. * Агент-планировщик: переводит технический текст методологии в подробное текстовое описание целевой фигуры. * Агент

Google AI представляет PaperBanana: агентную систему для автоматизации создания методологических диаграмм и статистических графиков, готовых к публикации

Создание иллюстраций, готовых к публикации, — это трудоёмкий этап в исследовательском процессе. Хотя учёные, работающие с искусственным интеллектом, могут теперь заниматься обзорами литературы и кодом, им сложно визуально представить сложные открытия.

Исследовательская группа из Google и Пекинского университета представляет новую систему под названием PaperBanana, которая меняет ситуацию, используя мультиагентную систему для автоматизации создания высококачественных академических диаграмм и графиков.

Архитектура из пяти специализированных агентов

PaperBanana не полагается на единый запрос. Она объединяет усилия команды из пяти агентов, чтобы преобразовать необработанный текст в профессиональные визуальные элементы.

Этап 1: линейное планирование

* Агент-поисковик: определяет 10 наиболее релевантных примеров из базы данных, чтобы задать стиль и структуру.

* Агент-планировщик: переводит технический текст методологии в подробное текстовое описание целевой фигуры.

* Агент-стилист: выступает в роли консультанта по дизайну, чтобы убедиться, что результат соответствует «стилю NeurIPS», используя определённые цветовые палитры и макеты.

Этап 2: итеративное уточнение

* Агент-визуализатор: преобразует описание в визуальный результат. Для диаграмм он использует такие модели изображений, как Nano-Banana-Pro. Для статистических графиков он пишет исполняемый код Python Matplotlib.

* Агент-критик: проверяет сгенерированное изображение на соответствие исходному тексту, чтобы найти фактические ошибки или визуальные сбои. Он даёт обратную связь в течение трёх раундов уточнения.

Преодоление рубежа NeurIPS 2025

Исследовательская группа представила PaperBananaBench — набор из 292 тестовых случаев, составленный на основе реальных публикаций NeurIPS 2025. Используя подход VLM-as-a-Judge, они сравнили PaperBanana с ведущими базовыми моделями.

Метрики и улучшения по сравнению с базовым уровнем:

* Общий балл: +17,0%

* Кратковременность: +37,2%

* Читаемость: +12,9%

* Эстетика: +6,6%

* Точность: +2,8%

Система превосходит в диаграммах «Агент и Рассуждения», достигая общего балла 69,9%. Она также предоставляет автоматизированные «Эстетические рекомендации», отдавая предпочтение «мягким техническим пастельным» цветам вместо резких основных цветов.

Статистические графики: код против изображения

Статистические графики требуют числовой точности, которой часто не хватает стандартным моделям изображений. PaperBanana решает эту проблему, заставляя агента-визуализатора писать код вместо рисования пикселей.

Генерация изображений: отличается эстетикой, но часто страдает от «числовых галлюцинаций» или повторяющихся элементов.

Генерация на основе кода: обеспечивает 100% точность данных, используя библиотеку Matplotlib для рендеринга окончательного графика.

Доменные специфические эстетические предпочтения в исследованиях ИИ

Согласно руководству по стилю PaperBanana, эстетический выбор часто меняется в зависимости от области исследования, чтобы соответствовать ожиданиям раз...

Читать далее