Периодические мои попытки работы с нейросетями, по генерации программного кода или обработке картинок, навевают на грустные размышления. Время идет, все кричат, что нейросети захватят мир, вот-вот, еще чуть-чуть, пару-тройку лет..., НО! Как всегда есть большое "НО".
Приведу пару примеров, которые показывают, что нейросети все еще глупы, даже на вроде бы простых задачах. То есть их еще надо дорабатывать и дорабатывать, чтобы результат их "творчества" соответствовал поставленной задаче, а не создавался просто ВАУ-эффект (когда результат слишком поражает своими эффектами, хоть и не соответствует заданию).
Широко распиаренный мессенджер MAX, обзавелся GigaChat ботом еще несколько месяцев назад.
Ах да, пару слов про МАХ, поставил его себе на комп, чтобы посмотреть, как он работает и какие возможности по созданию ботов имеет.
И вот уже длительное время, на запрос создания бота, он мне отвечает:
И тут у меня вопрос, к владельцам или создателям: функционал мессенджера зависит от статуса пользователя? Есть определенные пользователи, которые имеют возможность создавать ботов, а об этом свидетельствует реклама, когда говорят определенные известные комментаторы, что их можно теперь читать на Махе. Им значит разрешили зарегистрировать бота, чтобы с его помощью создать канал, ну а мне предлагают "попробовать позже" ... и позже... и позже...
вопрос открытый, может кто-то знает причину такого разделения пользователей на своих, и каких-то других?
Но вернемся к нейросети. В некоторых ситуациях, при программировании, я обращаюcь к нейросетям, причем стараюсь давать им небольшие задачи. Если ответ одной сети меня не в полной мере устраивает, то обращаюсь к другой. И зачастую ответы нейросеток бывают очень разные, ответы по уровню отличаются. Ну, что-то вроде, одна сеть написала код как Джун, а вторая как Сеньор. Можно было бы списать это на некорректность промпта/запроса, но в том то и дело, что запрос одинаковый.
Ладно, посмотрим простой запрос на написание кода, к боту GigaChat:
А вот результат отображаемый в браузере, после загрузки кода на сервер:
Звезда? Ну, с натяжкой наверное 🤩.
Уточним задачу:
Бот написал, что задачу он понял верно, но вот результат:
А результат скорее всего уровня Джун, т.к. звезда не вписана в окружность, нижние углы вылезают за границы окружности. То есть, помимо двух итераций запроса, понадобится еще и вникать в код, вносить корректировки вручную, чтобы привести результат к требуемому.
Получается, что бот просто поставщик некоторого близкого решения, которое требуется дорабатывать под задачу. Раньше лазил за шаблонными решения на Stack Overflow, которые потом корректировал и адаптировал под себя, теперь эту функцию выполняет бот. На мой взгляд, ситуация ухудшилась, нет комментариев других разработчиков, их замечаний и других вариантов решений. Бот самоуверенно утверждает, что "код с идеально симметрично расположенной звездой", и ведь кто-то ему поверит 😲. Снова утверждается нереальная реальность!
И еще, совсем недавно в бот GigaChat пришло сообщение:
Радость то какая, удобно наверное, все под рукой, в мессенджере то бишь.
У моего приятеля день рождения, и я решил его порадовать сгенерированной в боте картинкой. Сделал запрос и получил неплохую картинку:
Текст поздравления конечно вызвал некоторое недоумение (см. слова "бедь счастьи..."). Немного подумав, попросил бота заменить слова на придуманные мной. И вот тут начались чудесатые чудеса:
Сначала бот отказался рисовать, то что его попросили. А затем выдал совершенно другую картинку с исковерканным текстом. Причем опять самоуверенно утверждая, что выдал то, что у него просили. 🤮
А вот и заключительная часть нашего диалога с ботом, после которой стала понятна вся его бестолковость:
Что могу сказать, после такого - теперь совсем по-другому смотрю на результаты творчества нейросетей демонстрируемые на различных Дзен-каналах. Авторы выкладывают красивые получившиеся картинки (а в последнее время и анимации), но это просто так получилось у нейросети и понравилось пользователю/автору. Так и природа может узоры рисовать, к примеру ледяные на окне, которые красивы сами по себе, но не имеют практического смысла:
Как только встает задача нарисовать что-то конкретное, так у нейросети сразу начинаются проблемы тупизны. И не факт, что за пару-тройку лет эту тупизну разработчики преодолеют, финансирование этого направления уже под вопросом.
Ну, а что с поздравительной картинкой моему приятелю? Конечно я ее поправил ручками в редакторе: