Какая нейронка лучше рисует? Какая нейронка лучше пишет программный код? Это распространённые вопросы сравнительных тестов. Я проверяю нейронки на знание реального мира.
На опоре моста нарисовано граффити – как? В статье – возможные варианты, полученные при помощи бесплатных нейронок, доступных в России без впн. Какая из них лучше?
Вступление
Сейчас очень много тестов, проверяющие большие языковые модели (LLM) типа ChatGPT на адекватность ответов и превосходство их в сравнении с человеком. Это хорошо, что есть такие сравнения ИИ – они вполне качественно отражают реальную картину развития нейросетей.
Но многое в этих тестах для меня непонятно и многое в заданиях для проверки нейронок мне не нужно по работе. Приходится придумывать свои задачки. Распознавание изображений с целью генерации гипотез – одна из таких задачек. Что может сказать нейросеть по предоставленному фото?
Гулял и увидел на опоре моста граффити. Эти «наскальные рисунки» обнаруживают в порой удивительных местах: на шпилях соборов, на ЛЭП, в пещерах и тоннелях. Говорят, даже под водой есть!
Как нарисовали граффити на опоре моста – это вопрос и для меня, и для нескольких нейронок.
Как нарисовать граффити?
Проведя индивидуальный мозговой штурм, я придумал 9 концепций того, как можно было нарисовать граффити на опоре этого моста:
- Спуститься вниз (в том числе по верёвке) – опасно, сложно. И маловероятно – хоть и есть хорошая платформа, где можно встать ногами. Но и платформа, и сама колонна находятся далеко от края моста и придётся вначале раскачаться, чтобы достать до колонны, а потом как-то закрепиться.
- Сделать мост. Например, кинуть доску или бревно или навести верёвочную переправу. Вариант сравним с первым.
- При помощи кистей или баллончиков с краской, привязанных к палкам. Нуууу, так себе вариант.
- Использование дрона. А почему бы и нет?
- Перепрыгнуть. Маловероятно, даже с шестом. А обратно как?
- Дождаться отлива – возможно. Но море в этом месте было несколько сот миллионов лет назад, а когда следующий раз появится – не известно.
- Перейти вброд по отмели – вполне возможный вариант. Глубины не проверял.
- Нарисовать, когда строили мост и были настилы – и строители не заметили 😊
- Зимой подойти по льду и оставить свой след. На мой взгляд, это самый возможный вариант (лёд образуется; расположение и размер – как раз под стоячего человека; рисовали одной краской – не заморачивались, и значит с верёвками и шестами тоже заморачиваться не стали бы).
Если хотите – можете дополнить список.
Эта в целом простая задачка потребовала от меня нескольких подходов общей продолжительностью около 30 минут.
Да, основные варианты были придуманы в первый подход минут за 5 (в том числе и вариант про зиму). Но часто в моей практике случается такое, что самый первый вариант ответа – быстрый, но не верный. Поэтому надо «остановиться и подумать». И чем важнее задача, тем неукоснительно надо выполнять это правило. Этому я учу коллег. Про это говорит и Даниэль Канеман (почитайте его книгу «Думай медленно, решай быстро»). Следуя правилу, я сделал ещё подходы – мало ли, что упустил. Варианты с переходом по отмели или использовать дрона – это результаты повторных мозговых штурмов.
Тест с ответами нейросетей
В своей работе использую нейронки, доступные в РФ без подключения через впн. Порой разбираться с впн лень, да и тема мутная с точки зрения закона. Плюсом – используемые нейронки почти все бесплатные. По крайней мере, данную работу все представленные нейросети могут сделать бесплатно. Вот краткое их описание.
DeepSeek
Китайская нейронка работает с текстами и с файлами, содержащие текст. Одно время (непродолжительное) работала с изображениями – могла распознавать объекты и информацию. Но, похоже, эту функцию сейчас выключили. Бесплатная. Есть автоматически синхронизируемые версии через браузер и приложение на телефон. Для регистрации достаточно почты.
Qwen
Нейронка тоже из Китая. Функционал значительно больше, чем у DeepSeek. И базово похож на функционал западных нейронок-лидеров типа ChatGPT, Gemini., заметно уступает им. Но, в целом, для работы – хватает. Всякое делает с изображениями: распознаёт, рисует, редактирует. Почты для регистрации достаточно. Есть в виде приложения на телефон.
Perplexity
Создали в США. Самая первая массовая нейронка, которая сразу свои ответы подкрепляла реальными ссылками на источники. В России доступна базовая бесплатная версия (поиск, составление отчётов-исследований с графиками и иллюстрациями), но заметно лучше использовать платную версию. А вот с оплатой (от 20 USD/мес) в России есть проблемы. До декабря 2025 года можно было купить годовую подписку за 100-1000 руб по обходным путям, но разработчики начали этот способ сильно закрывать. Жаль.
GigaChat
В условиях санкций, надо иметь что-то своё – домашнее. Нейронку от Яндекса попробовал – не понравилось и даже не захотел платную версию оформлять. Так что, бесплатная разработка от Сбера – вполне вариант. Функций примерно столько же, как и в Qwen. Но заметно уступает. В работе эту нейронку почти не использую. Держу больше, как для сравнительных тестов. Хотя, если вам нужно организовать капустник или КВН в школе – вполне хороший инструмент (стихи и песни можно генерить). Для регистрации нужен Сбер-ID или номер телефона на который прийдёт смс.
Так получилось, что работа почти со всеми нейронками проходила в два раунда.
Раунд 1. Первый вопрос
В каждую из представленных нейронок я загрузил одно и то же фото опоры моста с граффити. И задал один и тот же промт (на картинке снизу).
Perplexity ответила коротко:
- Художник подплыл на лодке или плоту
- Художник спустился как альпинист сверху
- Подошёл к опоре по «мелкой воде» - возможно там неглубоко или в период засухи.
Ответ не впечатлил. Но про использование вероятного мелководья – я первый раз не подумал.
Чуть более развёрнуто ответил GigaChat. И такое ощущение, что на картинку «не смотрел», воспользовался только текстом из промта.
В GigaChat я заметил такую «фишку». Обратите внимание на написание слова «граффити». У меня в тексте в этом слове две буквы «Ф». В промтах я ошибся и писал с одной буквой. Все остальные нейронки отвечали мне используя две буквы «Ф». И только GigaChat вначале «отзеркалил» мою ошибку, а потом в конце ответа дал правильное написание. Что это было?
Китайская нейросеть DeepSeek сразу сказал, что картинку прочитать не может и ответ дала по общему описанию изображения, которое есть в исходном и одинаковом для всех промте.
Ответ этой нейросети содержит следующие предложения:
- Нанести рисунки в период малой воды или заморозков (заморозки – это, можно сказать «горячо»).
- Использовать плавсредства, чтобы добраться до опоры.
- Спуститься сверху на верёвках или навести верёвочную переправу.
- Создать временную переправу (мосткик).
- Рискованные варианты: добираться по строительным конструкциям; добираться вброд в забродном костюме; использовать кисти или баллончики на длинных палках.
Ответ приведён в сокращённом виде. А так, нейронка на целую страницу расписала свои варианты, описала в чём могут быть риски ночного художества. И то, что всё это может быть противозаконным.
Qwen удивил хорошим анализом фото. Например, достаточно точно оценил размеры бетонного основания (около 15 см над водой, удобно стоять) и высоту расположения рисунков (не выше груди). А вот со способами дела хуже: можно либо на лодке подплыть, либо подойти по мелководью.
Вариант «подойти по льду» дал только DeepSeek. Поэтому для остальных нейронок я задал наводящий вопрос – возможно, дадут и «контрольный ответ».
Раунд 2. Второй вопрос
GigaChat ничего нового не предложил. Свой исходный вариант переформулировал и исключил из ответа лодку. Про мелководье и зиму не вспомнил. «Живёт», наверное, в Краснодарском крае или на Бали?
Perplexity дал новую концепцию – использовать кисти и баллончики на длинных палках. Ещё дал вариант применения верёвок – навести верёвочную переправу.
Qwen: лазать, подойти в брод или длинные палки. До «рисовать со льда» – не додумался.
Заключение
Подведём итоги. Все результаты моего применения мозгового штурма, а также таких ТРИЗ-инструментов как Системный оператор и Ресурсы, и концепции, полученные от нейросетей, я свёл в таблицу.
Что можно сказать? Да, человек (в моём лице) эту задачу пока что выиграл. «Кожаные мешки» лучше рассматривают детали фотографий, чем искусственный интеллект. Специалист с опытом и обученный методикам мышления, даёт неплохие варианты. Во втором случае важен ещё опыт – не знаю, как бы ответил человек не знающий, что такое мороз (а таких, пожалуй, большинство на Земле – может в этом отгадка ответов нейронок?). Но даже такая простая задача – это минут 30 личного времени. Нейронки давали ответ почти мгновенно – дольше промты писал. Ну и какие-то задержки с ответами были (типа сервера перегружены, очередь…).
Заменит ли инженера нейронка? Скорее нет. А вот специалист, знающий как обращаться с нейросетью – легко в будущем может заменить с десяток специалистов, не владеющих этим навыком. Вспомните картины с рядами кульманов в каком-нибудь конструкторском бюро – три-пять десятков точно будет! А сейчас это отдел из 5-10 человек, а то и меньше. Всё делают на компьютерах.
Чтобы не оказаться в числе заменённых – я изучаю нейронки уже сейчас. И, кстати, ТРИЗ (теория решения изобретательских задач), хоть и древняя советская разработка, но очень помогает повысить эффективность работы с искусственным интеллектом.
Если интересна тема нейросетей в работе технаря, применение современной ТРИЗ и результаты моих тестов – подписывайтесь. Не часто, но статьи будут выходить на эти темы. Ещё у меня есть блоги-близнецы в Телеграм и в Вконтакте – заходите, смотрите, подписывайтесь (если понравилось). В блогах я каждую неделю стараюсь выкладывать пост.