Результаты, полученные в ходе исследования Microsoft и Alibaba, помогают понять, кто есть кто в мире искусственного интеллекта.
Модели искусственного интеллекта, разработанные Microsoft и Alibaba, впервые превзошли человека в понимании прочитанного.
Использовавшийся при проведении тестов набор данных Stanford Question Answering Dataset (SQuAD) состоит из серии вопросов, ответы на которые можно найти более чем в 500 статьях Википедии.
Модель глубокой нейронной сети Alibaba набрала в тесте «сравнения на точность» 82,440 балла, опередив живых людей (82,304 балла). Аналогичная модель Microsoft набрала 82,650 балла.
Продемонстрированные результаты помогают понять, кто есть кто в деле изучения проблем искусственного интеллекта, которыми занимаются исследовательские лаборатории Google, IBM Research, Facebook AI Research, Salesforce Research, Tencent, Samsung и других организаций.
Alibaba и Microsoft находятся в рейтинге рядом друг с другом, хотя в обеих компаниях утверждают, что именно их модели удалось первой превзойти человека.
Несмотря на то, что корпорация Microsoft зарегистрировала свой результат 3 января, а Alibaba — двумя днями позже, в Alibaba заявляют, что на самом деле речь здесь идет вовсе не о регистрации результатов, а лишь о дате подачи заявки и представления модели.
«С глубоким удовлетворением мы можем наконец говорить о том, что машины превзошли человека в понимании прочитанного, – заявил главный исследователь технологий обработки естественного языка Alibaba Institute of Data Science and Technologies Луо Си. – За последний год в процессе исследования НЛП был достигнут значительный прогресс. В ближайшем будущем мы намерены поделиться своей методологией с более широким сообществом и представить разработанную технологию своим клиентам».
Заместитель управляющего директора Microsoft Research Asia Мин Чжоу указал, что несмотря на победу искусственного интеллекта в тесте люди по-прежнему гораздо лучше машин разбираются в сложностях и нюансах естественного языка.
«Обработка естественного языка относится к областям, где остается еще очень много нерешенных задач, требующих инвестиций и дальнейшего продвижения вперед, – подчеркнул он. – Нынешнее достижение – это только начало».
Ведущие игроки в сфере искусственного интеллекта активно инвестируют в построение моделей, анализирующих прочитанное и реагирующих определенным образом на поставленные вопросы.
В Alibaba отметили, что уже на протяжении нескольких лет используют соответствующую технологию на фестивалях Global Shopping Festival при генерации ответов на запросы клиентов.
В Microsoft сообщили, что ранние версии модели находили применение в поисковой технологии Bing.
«Наши инструменты помогают врачам, юристам и другим специалистам ускорить чтение больших документов при проведении медицинских исследований и поиске редких юридических прецедентов, – говорится в блоге компании. – Технология повышает производительность труда и оставляет людям больше времени для применения полученных знаний при лечении пациентов или выработке юридических заключений».
Она помогает и при ответах на вероятные последующие вопросы.
Например, вы спрашиваете: «В каком году родилась канцлер Германии?» Система должна понимать, о чем идет речь, и при анализе последующего вопроса: «В каком городе она родилась?»
Зачастую при генерации ответов на естественном языке компьютерам приходится анализировать несколько предложений. Например, когда систему спрашивают: «Является ли Джон Смит гражданином США?», необходимую для ответа на него информацию требуется извлечь из двух фраз: «Джон Смит родился на Гавайях. Гавайи ¬входят в число штатов США».