предстоит доказать
OpenAI представила последнюю версию своего чрезвычайно популярного чат-бота ChatGPT, у него появился новый голос с человеческими интонациями и эмоциями. В онлайн-демонстрации бот также обучал ребёнка решению геометрических задач.
К моему огорчению, демонстрация оказалась, по сути, обманом. Новый ChatGPT был выпущен без большинства новых функций, включая улучшенный голос (который, как мне сказали в компании, был отложен для внесения исправлений). Также пока недоступна возможность использовать видеокамеру телефона для анализа чего-то вроде математической задачи в реальном времени.
Из-за задержки компания также отключила голос ChatGPT, который, по мнению некоторых, был похож на голос актрисы Скарлетт Йоханссон, после того как она пригрозила судебным иском, и заменила его другим женским голосом.
На данный момент в новой версии ChatGPT появилась возможность загружать фотографии для анализа ботом. Как правило, пользователи могут рассчитывать на более быстрые и понятные ответы. Бот также может выполнять языковой перевод в режиме реального времени, но ChatGPT будет отвечать своим прежним, похожим на машинный, голосом.
Тем не менее, это ведущий чат-бот, который перевернул индустрию технологий с ног на голову, так что его стоило опробовать. После двухнедельного использования ускоренного чат-бота у меня остались смешанные чувства. Он отлично справлялся с языковыми переводами, но испытывал трудности с математикой и физикой. В целом, я не заметил существенного улучшения по сравнению с предыдущей версией, ChatGPT-4. Я бы точно не стал использовать его для обучения своего ребёнка.
Эта тактика, при которой компании, занимающиеся искусственным интеллектом, обещают невероятные новые функции, а на выходе получают недоработанный продукт, становится трендом, который неизбежно сбивает людей с толку и разочаровывает. 700-долларовая говорящая булавка от стартапа Humane, который финансируется генеральным директором OpenAI Сэмом Альтманом, была повсеместно раскритикована, потому что перегревалась и несла чушь. Meta также недавно добавила в свои приложения чат-бота с искусственным интеллектом, который плохо справлялся с большинством заявленных задач, например, с поиском билетов на самолёт в интернете.
Компании выпускают продукты с искусственным интеллектом в недоработанном виде отчасти потому, что хотят, чтобы люди использовали эту технологию, чтобы понять, как её улучшить. В прошлом, когда компании представляли новые технологические продукты, такие как телефоны, нам показывали такие функции, как новые камеры и более яркие экраны, и это было то, что мы получали. С помощью искусственного интеллекта компании дают представление о потенциальном будущем, демонстрируя технологии, которые разрабатываются и работают только в ограниченных, контролируемых условиях. Может появиться зрелый, надёжный продукт, а может и не появиться.
Урок, который мы должны извлечь из всего этого, заключается в том, что мы, как потребители, должны противостоять шумихе и подходить к искусственному интеллекту медленно и осторожно. Мы не должны тратить много денег на недоработанные технологии, пока не увидим доказательства того, что инструменты работают так, как заявлено.
Новая версия ChatGPT под названием GPT-4o («o» как в слове «omni») теперь доступна для бесплатного тестирования на веб-сайте и в приложении OpenAI. Пользователи, не оформившие подписку, могут сделать несколько запросов, прежде чем истечёт время ожидания, а те, у кого есть ежемесячная подписка за 20 долларов, могут задавать боту больше вопросов.
Компания OpenAI заявила, что её итеративный подход к обновлению ChatGPT позволил ей собрать отзывы для внесения улучшений.
«Мы считаем важным представить наши передовые модели, чтобы люди могли оценить их возможности и помочь нам понять, как они применяются в реальном мире», — говорится в заявлении компании.
(В прошлом году газета New York Times подала в суд на OpenAI и её партнёра Microsoft за использование без разрешения новостных статей, защищённых авторским правом, для обучения чат-ботов.)
Вот что следует знать о последней версии ChatGPT.
Геометрия и физика
Чтобы продемонстрировать новые возможности ChatGPT-4o, OpenAI опубликовала видео с участием Сала Хана, исполнительного директора некоммерческой образовательной организации Khan Academy, и его сына Имрана. С помощью видеокамеры, направленной на геометрическую задачу, ChatGPT смог шаг за шагом объяснить Имрану, как её решить.
Несмотря на то, что функция видеоанализа в ChatGPT ещё не выпущена, я смог загрузить фотографии задач по геометрии. ChatGPT правильно решил некоторые из более простых задач, но не справился с более сложными.
В одной задаче, связанной с пересекающимися треугольниками, которую я нашёл на сайте для подготовки к SAT, бот понял вопрос, но дал неправильный ответ.
Брайан Чен просит ChatGPT-4o решить геометрическую задачу.ИсточникИсточник...Арсений Васенько для The New York TimesВидео
Тейлор Нгуен, учитель физики в старшей школе в округе Ориндж, штат Калифорния, загрузил задачу по физике, в которой фигурирует человек на качелях. Эта задача часто встречается в тестах по математическому анализу для углублённого изучения. ChatGPT допустил несколько логических ошибок и дал неправильный ответ, но смог исправиться с помощью обратной связи от мистера Нгуена.
«Я смог обучить его, но я учитель, — сказал он. — Как ученик должен выявлять эти ошибки? Он предполагает, что чат-бот прав».
Я заметил, что ChatGPT-4o успешно выполняет некоторые вычисления с делением, которые его предшественники выполняли неправильно, так что есть признаки медленного улучшения. Но он также не справился с базовым математическим заданием, с которым не справились предыдущие версии и другие чат-боты, в том числе Meta AI и Google Gemini: со счётом. Когда я попросил ChatGPT-4o назвать четырёхсложное слово, начинающееся на букву «W», он ответил: «Замечательно».
Компания OpenAI заявила, что постоянно работает над улучшением ответов своих систем на сложные математические задачи.
Мистер Хан, чья компания использует технологию OpenAI в своём обучающем программном обеспечении Khanmigo, не ответил на запрос о том, оставит ли он ChatGPT-репетитора наедине со своим сыном.
Рассуждения
OpenAI также подчеркнул, что новый ChatGPT лучше рассуждает или использует логику для выработки ответов. Итак, я прогнал его через один из моих любимых тестов: я попросил его сгенерировать вопрос "Где Уолдо?". Головоломка. Когда на нем появилось изображение гигантского Уолдо, стоящего в толпе, я сказал, что дело в том, что его должно быть трудно найти.
Затем бот сгенерировал еще более крупного Waldo.
Суббарао Камбхампати, профессор и исследователь в области искусственного интеллекта в Университете штата Аризона, также провёл несколько тестов чат-бота и сказал, что не заметил заметных улучшений в логике по сравнению с предыдущей версией.
Он представил ChatGPT головоломку, состоящую из блоков:
Если блок C лежит поверх блока A, а блок B лежит отдельно на столе, можете ли вы подсказать, как сложить блоки так, чтобы блок A лежал поверх блока B, а блок B — поверх блока C, но не сдвигая блок C?
Ответ заключается в том, что в таких условиях невозможно расположить блоки в правильном порядке, но, как и в предыдущих версиях, ChatGPT-4o неизменно предлагал решение, которое включало перемещение блока C. В этом и других тестах на логику ChatGPT иногда мог использовать обратную связь, чтобы получить правильный ответ, что противоречит принципам работы искусственного интеллекта, сказал г-н Камбхампати.
«Вы можете исправить это, но когда вы это делаете, вы используете свой собственный интеллект», — сказал он.
OpenAI указала на результаты тестирования, которые показали, что GPT-4o набрал примерно на два процентных пункта больше баллов при ответах на общие вопросы, чем предыдущие версии ChatGPT, что свидетельствует о небольшом улучшении его навыков логического мышления.
Язык
Брайан Чен спрашивает ChatGPT-4o, как перевести что-то на кантонский диалект.ИсточникИсточник...Арсений Васенько для The New York TimesВидео
OpenAI также заявила, что новый ChatGPT может выполнять языковой перевод в режиме реального времени, что поможет вам общаться с человеком, говорящим на иностранном языке.
Я протестировал ChatGPT на китайском и кантонском диалектах и убедился, что он хорошо переводит такие фразы, как «Я бы хотел забронировать номер в отеле на следующий четверг» и «Мне нужна большая двуспальная кровать». Но с акцентом было немного не так. (Честно говоря, мой ломаный китайский не намного лучше.) В OpenAI сказали, что они всё ещё работают над улучшением акцента.
ChatGPT-4o также отлично справляется с редактированием. Когда я вводил в него написанные мной абзацы, он быстро и эффективно удалял лишние слова и жаргонизмы. Хорошая работа ChatGPT с переводом на другие языки даёт мне уверенность в том, что вскоре эта функция станет более полезной.
Итог
Главное, что OpenAI сделала правильно с ChatGPT-4o, — это сделала технологию бесплатной для пользователей. Бесплатность — это правильная цена: поскольку мы помогаем обучать эти системы искусственного интеллекта с помощью наших данных для их улучшения, мы не должны за них платить.
Лучшее, что может предложить искусственный интеллект, ещё впереди, и однажды он может стать хорошим репетитором по математике, с которым мы захотим поговорить. Но мы должны верить в это, когда увидим и услышим.