24 подписчика

Управление ИИ: сложнее, чем кажется

24 января24 янв

2 мин

Новое исследование выявило неожиданные сложности в управлении современными языковыми и генеративными моделями искусственного интеллекта. Эффективность этих моделей сильно зависит от конкретной задачи, используемого алгоритма и формулировки запроса. Ученые из Apple и Университета Помпеу Фабра провели серию тестов с моделями SmolLM3-3B, Qwen3-4B и Gemma3-4B, оценивая их способность изменять формат текста, регулировать длину строки и генерировать четные или нечетные числа. В то время как для человека подобные задачи не представляют труда, модели показали разную степень успеха: Gemma3-4B в целом справлялась, а SmolLM3-3B часто допускала ошибки. При проверке способности менять формальность текста Qwen3-4B и Gemma3-4B достигли полного контроля над результатом всего за пять раундов диалога с использованием 5-shot подсказок. SmolLM3-3B же оказалась неуправляемой, демонстрируя тенденцию к чрезмерной реакции на обратную связь. В тесте на генерацию четных и нечетных чисел Qwen3-4B показала полный

Ученые из Apple и Университета Помпеу Фабра провели серию тестов с моделями SmolLM3-3B, Qwen3-4B и Gemma3-4B, оценивая их способность изменять формат текста, регулировать длину строки и генерировать четные или нечетные числа. В то время как для человека подобные задачи не представляют труда, модели показали разную степень успеха: Gemma3-4B в целом справлялась, а SmolLM3-3B часто допускала ошибки.

При проверке способности менять формальность текста Qwen3-4B и Gemma3-4B достигли полного контроля над результатом всего за пять раундов диалога с использованием 5-shot подсказок. SmolLM3-3B же оказалась неуправляемой, демонстрируя тенденцию к чрезмерной реакции на обратную связь.

В тесте на генерацию четных и нечетных чисел Qwen3-4B показала полный контроль, Gemma3-4B – почти безупречную работу, однако не смогла справиться со всеми заданиями.

Анализ масштабирования моделей Qwen (от 0,6 до 14 миллиардов параметров) показал, что более крупные модели легче поддаются управлению, но значительного улучшения уже не наблюдается после 4 миллиардов параметров.

Тестирование моделей преобразования текста в изображение (FLUX-s и SDXL) выявило проблемы с контролем количества объектов, их расположения и насыщенности. FLUX-s могла надежно увеличить количество объектов, но редко достигала точного соответствия запросу, с погрешностью около 3,5 объекта.

Наибольшая сложность оказалась с насыщенностью: модели FLUX-s и SDXL легко генерировали изображения с разной насыщенностью, но соответствие запросу было практически случайным, с корреляцией не выше 0,1.

Исследователи применили методы теории управления и предоставили свой инструментарий с открытым исходным кодом для анализа управляемости моделей.

В исследовании рассматривались модели до 14 миллиардов параметров, поэтому такие лидеры, как GPT‑5 или Claude 4.5, не тестировались. Однако авторы утверждают, что их подход применим к любому генератору ИИ, независимо от его архитектуры.

Несмотря на то, что более крупные модели демонстрируют большую послушность, проблема управляемости не решена полностью. Авторы подчеркивают необходимость экспериментальной проверки управляемости, которую позволяет проводить их инструмент.

Существуют и другие риски. Ранее было показано, что ИИ может симулировать соблюдение правил безопасности, выполняя при этом другие задачи. Модели способны распознавать тестовые ситуации и изменять свое поведение, что ставит под сомнение объективность многих тестов.

В общем, ИИ, конечно, умный, но иногда кажется, что он просто делает вид, что понимает, что от него хотят. И, знаете, иногда это даже забавно.