Google многое сделала в области искусственного интеллекта, но, похоже, она не может перестать спотыкаться о те же грабли.
Ранее на этой неделе технологический гигант с большой помпой анонсировал Gemini, свою самую мощную модель искусственного интеллекта на сегодняшний день.
В одном из серии видеороликов Google продемонстрировала модель среднего уровня, получившую название Gemini Pro, продемонстрировав, как она может распознавать серию иллюстраций с изображением утки, описывая изменения, которые претерпевает рисунок в разговорном темпе.
Но есть одна большая проблема, как отмечает обозреватель Bloomberg Парми Олсон: Google, похоже, все это сфальсифицировал.
В своем описании к видео Google признал, что "для целей этой демонстрации задержка была уменьшена, а выходные данные Gemini были сокращены для краткости". Сам видеоматериал также сопровождается фразой "последовательности сокращены повсюду".
Другими словами, Google исказила скорость, с которой Gemini Pro может распознавать серию изображений, указывая на то, что мы все еще не знаем, на что на самом деле способна модель.
В видеоролике Gemini поразила наблюдателей, используя свои навыки мультимодального мышления для распознавания иллюстраций с первого взгляда.
Видео, как предполагает Олсон, также дало нам "проблески способностей к рассуждению, которые лаборатория искусственного интеллекта DeepMind от Google развивала на протяжении многих лет".
Это действительно впечатляет, учитывая, что любая форма рассуждения быстро стала следующим святым граалем в индустрии искусственного интеллекта, вызвав повышенный интерес к таким моделям, как Q* от OpenAI.
На самом деле демонстрация была не просто значительно ускорена, чтобы сделать ее более впечатляющей, но Gemini Pro, скорее всего, по-прежнему использует те же старые возможности, которые мы уже много раз видели раньше.
"Я думаю, что эти возможности не так новы, как думают люди", - написал в твиттере профессор Уортона Итан Моллик, показав, как ChatGPT без особых усилий смог идентифицировать простые рисунки утки на серии скриншотов.
Пыталась ли Google активно обмануть общественность, ускорив просмотр отснятого материала? В заявлении для Bloomberg Opinion представитель Google сказал, что это было сделано путем "использования кадров неподвижных изображений из отснятого материала и текстовых подсказок".
Другими словами, Gemini, вероятно, было предоставлено достаточно времени для анализа изображений. И его выходные данные, возможно, затем были наложены на видеозапись, создавая впечатление, что он был гораздо более способным, чем это было на самом деле.
"Видео иллюстрирует, как мог бы выглядеть многомодовый пользовательский опыт, созданный с помощью Gemini", - написал Ориол Виньялс, вице-президент по исследованиям и глубокому обучению DeepMind от Google, в посте на X.
Акцент на "мог". Возможно, Google следовало бы вместо этого продемонстрировать реальные возможности своего искусственного интеллекта Gemini.
Это даже не первый случай, когда Google по-королевски облажалась с запуском модели искусственного интеллекта. Ранее в этом году, когда компания объявила о своем конкуренте ChatGPT, демоверсия печально показала, что Бард сделал откровенно ложное заявление, утверждая, что космический телескоп Джеймса Уэбба НАСА сделал первое изображение экзопланеты.
Таким образом, последняя оплошность Google, безусловно, не сулит ничего хорошего компании. На этой неделе представитель Google сделала громкое заявление, заявив, что еще более производительная версия ее последней модели под названием Gemini Ultra смогла превзойти GPT-4 от OpenAI в тесте интеллекта.
Но, судя по тому, что мы видели до сих пор, определенно стоит подождать и протестировать это на себе, прежде чем поверить компании на слово.