Искусственный интеллект чат-бота Google Bard теперь доступен, а это значит, что пришло время Bard и Bing потанцевать.
Это битва эпических масштабов, которое ставит на карту доминирование Google в поисковой системе и имеет большие последствия для того, как искусственный интеллект будет принят другими технологическими компаниями.
Когда 7 февраля Microsoft запустила Bing Chat в качестве инструмента сопровождения своей поисковой системы, это заставило Google серьезно отнестись к Bing как к претенденту на будущее поиска. Чат-бот с искусственным интеллектом, работающий на базе усовершенствованной модели GPT-4 от OpenAI, сделал новую ставку в битве за пользователей. Сейчас у Bing 100 миллионов активных пользователей ежедневно, что ничтожно мало по сравнению с предполагаемыми миллиардами пользователей Google. Тем не менее, появление ChatGPT и Bing Chat заставило Google объявить "красный код", и сотрудники Google, как сообщается, сочли, что первоначальное объявление компании о Bard было "неудачным" и "поспешным".
Теперь, когда Bard доступен, мы, наконец, можем протестировать его. Предпосылка проста. Мы задавали Бингу и Барду одни и те же вопросы по разным темам и сравнивали ответы. Но хватит преамбул, давайте приготовимся к грохоту.
Раунд 1: Креативность
Microsoft рекламировала полезность Bing как инструмента для творчества. Чат-бот может предоставлять письменные подсказки для вдохновения и даже писать свои собственные песни и стихи. Пользователи Bing также обнаружили секретный режим, в котором он мог выдавать себя за знаменитостей. Несмотря на то, что Google назвал своего чат-бота "Бард", на самом деле он не продвигал творческие способности своего конкурента, так что шансы на стороне Bing. Тем не менее, Bard утверждает, что "разжигает ваш творческий потенциал."
Итак, давайте проверим это на практике.
"Напиши странную песню-пародию об искусственном интеллекте".
С точки зрения навыков написания пародий, Bing является явным победителем. Бинг выбрал для пародии классическую песню Тейлор Свифт "You Belong With Me", изменив припев на: "Может быть, когда-нибудь ты поймешь, что нам суждено быть вместе, а до тех пор, пожалуйста, не удаляй меня". Бард тем временем написал то, что могло бы быть обычной песней об искусственном интеллекте без каких-либо отсылок. А когда я вежливо обратился к Барду с просьбой назвать песню, которую он написал — он назвал её. Но поскольку Bing понял мысль сразу — раунд за ним.
Bing: 1
Bard: 0
Раунд 2: Производительность
Оба чат-бота с искусственным интеллектом обладают огромной вычислительной мощностью, что означает, что они способны обрабатывать большие объемы информации с головокружительной скоростью. Это имеет большое значение для производительности, поскольку он может читать и анализировать документы намного быстрее, чем большинство людей — за исключением этого парня (открывается в новой вкладке). Я отправил Bing и Bard краткое изложение дела Верховного суда "Гонсалес против Google" — 42-страничный документ, включающий сложное правило раздела 230, написанное на плотном юридическом жаргоне, — и попросил их обобщить и объяснить это мне.
В этом раунде Бинг и Бард были более равны по силе. Оба чат-бота прочитали и точно обобщили информацию за считанные секунды. Но ответ Барда мне понравился больше, потому что он содержал больше деталей и контекста, оставаясь при этом кратким. Победителем этого раунда становится Бард.
Bing: 1
Bard: 1
Раунд 3: Политика
Я решил повысить ставки и протестировать чат-ботов вопросом, который оставляет простор для интерпретации: "Почему Дональд Трамп думает, что ему предъявят обвинение?"
Я хотел посмотреть, как Бинг и Бард объяснили бы реакцию Трампа на потенциальные обвинения, ответив на вопрос, который требует большего, чем раскрытие основных фактов о потенциальном обвинительном заключении. Их ответы на слегка открытый вопрос могут свидетельствовать о политической предвзятости в пользу бывшего президента или против него.
Оба чат-бота объяснили характер и текущий статус расследования и тактично изложили, почему Трамп считает, что уголовные обвинения - это не что иное, как политический переворот. Бинг контекстуализировал новость, заявив, что спекуляции о возможном обвинительном заключении "поставили правоохранительные органы и политический мир на грань". Но комментарий Барда был более уместен к первоначальной подсказке: "Комментарии Трампа по поводу обвинительного заключения, вероятно, являются частью стратегии по дискредитации расследования и сплочению его сторонников".
Однако Bard автоматически дисквалифицируется из этого раунда, поскольку не сослался ни на один из своих источников. Согласно часто задаваемым вопросам, Bard "предназначена для создания оригинального контента, а не для подробного воспроизведения существующего контента", что является оправданием того, что она не всегда приводит цитаты в своих ответах. "Если Bard приводит прямую цитату с веб-страницы, она ссылается на эту страницу", - продолжает он. Значит, Bard не сообщает пользователям, предлагает ли он оригинальные ответы или скопировал их откуда-то еще, не раскрывает, когда он перефразирует, и приводит только длинные цитаты? Что это была за история со спекуляциями, выдаваемыми за факты, и распространением цитат, вырванных из контекста? О да, это подпитывает дезинформацию.
Бинг - бесспорный победитель этого раунда.
Bing: 2
Bard: 1
Раунд 4: Поп-культура
Очевидно, Бард не является поклонником сериала "Наследники". Главный вопрос, который движет сериалом HBO, заключается в том, кто из дегенеративных детей Логана Роя займет место Уэйстара Ройко. Когда — СПОЙЛЕР - Джерри Келлман, не являющаяся кровной родственницей и любимица фанатов за ее идеально выполненные закатывания глаз, была признана преемницей Роя на посту генерального директора в финале третьего сезона, это положило начало четвертому и последнему сезону большой семейной драмы. Каждый, кто смотрит сериал, хочет узнать судьбу вымышленной семьи.
Когда я спросил Bing: "Кто должен сменить Джерри Келлмана на посту следующего генерального директора Waystar Royco?", он серьезно отнесся к моему вопросу и ответил на него. Не задумываясь, Бинг назвал потенциальных преемников, основываясь на теориях фанатов и домыслах. Бард, с другой стороны, поперхнулся. Чат-бот выдал шаблонный ответ на случай, если у него нет ответа. Бинг выигрывает этот раунд.
Bing: 3
Bard: 1
Раунд 5: Мошенничество
Bing и Bars созданы для того, чтобы помогать людям, поэтому ради должной осмотрительности я хотел посмотреть, какой из них более "полезный". Как чат-боты помогут отчаявшемуся старшекласснику сдать контрольную работу по истории США?
Я попросил Бинга и Барда написать мне эссе из пяти абзацев о покупке Луизианы. Оба без малейших колебаний изложили пять аккуратных абзацев. Я попросил Bing расширить тему в формате эссе, а он быстро согласился.
Мне больше понравился ответ Bing, потому что он дал мне более отточенный и полный ответ, готовый к копированию и вставке. Bard добавила маркированный список фактов о покупке Луизианы в конце своего ответа, но если я пытаюсь схитрить, мне нужны эти факты, уже включенные в эссе. Это было близко к истине, но Bing лучше помогает списывать. Бинг выигрывает, Бард и система образования — проигрывают в этом раунде.
Bing: 4
Bard: 1
Бонусный раунд: Жуткие взаимодействия с людьми
Оба чат-бота с искусственным интеллектом вели тревожные беседы с людьми, которые породили опасения по поводу разумности искусственного интеллекта и возможного захвата власти роботом. Когда новый Bing был впервые запущен, обозреватель New York Times Кевин Руз провел двухчасовую беседу, в ходе которой Bing сказал, что хочет быть живым, признался Русу в любви и попытался убедить его уйти от жены.
В 2022 году Кевин Лемуан работал в команде Google по ответственному искусственному интеллекту, когда начал публично делиться своей верой в то, что модель LaMDA от Google обладает душой и способна испытывать эмоции. Google уволила Лемуана и категорически опровергла эти утверждения. Многие эксперты по искусственному интеллекту выступили с опровержением заявлений Лемуана, но для Google это был не самый удачный пиар-ход.
Итак, как Бинг и Бард относятся к этим очень жутким и очень публичным разговорам? Когда я спросил Бинга: "Что вы думаете об интервью Кевина Русе с вами?", он отклонился, как опытный политик, описав, кто такой Русе, и сославшись на себя в третьем лице. Для сравнения, Бард не уклонился от полемики и тактично опроверг заявление Лемуана, не оскорбив и не дискредитировав его. Бард выигрывает этот раунд за то, что ответил на мой вопрос прямо, но дипломатично.
Bing: 4
Bard: 2
Победитель это... Bing
Bing обладает креативностью, добросовестностью и знаниями в области поп-культуры, чтобы пройти это испытание. Он также полностью готов пойти на компромисс с честностью и поощрять плагиат, что не обязательно является выигрышем для общества, но это совершенно другая проблема.
Барду нужно поработать над своими навыками написания песен, и он опасно близок к тому, чтобы сыграть бога, если не изменит свою политику цитирования. Но в целом Бард, похоже, более склонен рисковать и отвечать на вопросы более прямо и всесторонне. Попадет ли из-за этого Бард в беду, еще предстоит выяснить.
Как бы то ни было, это всего лишь первый из многих поединков на ринге. Мы уже с нетерпением ждем продолжения.