Найти в Дзене
XX2 ВЕК

Этот ИИ думает, что сейчас 1800-е годы

Что произойдёт, если обучить большую языковую модель только на ограниченных исторических данных? Вот что интересно касательно современных моделей искусственного интеллекта, особенно больших языковых моделей (БЯМ): они могут выдавать текст только на основании того, что есть в обучающем их датасете. Модели, включая ChatGPT и Claude, «обучаются» на больших датасетах текста. Когда этим моделям задают вопрос, они статистическим образом выдают ответ путём пословного вычисления того, каким будет следующее слово. Вследствие этого, БЯМы не могут выдать текст о предстоящих научных открытиях, поскольку об этих прорывах не существует литературы. Самое лучшее, что может сделать ИИ, это повторять прогнозы исследователей или синтезировать такие прогнозы. Адам Мастроянни, в своей новостной рассылке Experimental History, излагает это элегантным образом: если бы вы запустили сверхумный ИИ в древней Греции, скормили ему все знания человечества и спросили его как высадиться на Луну, он бы ответил: «На Лун

Что произойдёт, если обучить большую языковую модель только на ограниченных исторических данных?

Трафальгарская площадь в Лондоне в 1839 году. Изображение: M de St Croix, Public Domain
Трафальгарская площадь в Лондоне в 1839 году. Изображение: M de St Croix, Public Domain

Вот что интересно касательно современных моделей искусственного интеллекта, особенно больших языковых моделей (БЯМ): они могут выдавать текст только на основании того, что есть в обучающем их датасете. Модели, включая ChatGPT и Claude, «обучаются» на больших датасетах текста. Когда этим моделям задают вопрос, они статистическим образом выдают ответ путём пословного вычисления того, каким будет следующее слово. Вследствие этого, БЯМы не могут выдать текст о предстоящих научных открытиях, поскольку об этих прорывах не существует литературы. Самое лучшее, что может сделать ИИ, это повторять прогнозы исследователей или синтезировать такие прогнозы.

Адам Мастроянни, в своей новостной рассылке Experimental History, излагает это элегантным образом: если бы вы запустили сверхумный ИИ в древней Греции, скормили ему все знания человечества и спросили его как высадиться на Луну, он бы ответил: «На Луну высадиться нельзя. Луна — это парящий по небу бог».

Это интересный мысленный эксперимент. Что будет, если намеренно ограничить обучающие данные? Можно создать систему ИИ, реагирующую так, будто она из другого периода в прошлом? Что бы это рассказало о психологии или повседневных переживаниях людей этой эры?

Именно об этом думал студент Муленбергского колледжа в Аллентауне (Пенсильвания), когда создавал TimeCapsuleLLM. Эта экспериментальная система ИИ обучалась только на текстах Лондона 19-го века. Сегодняшняя версия основана на 90 гигабайтах текстовых файлов, опубликованных в городе Лондоне между 1800 и 1875 гг.

Чтобы внести ясность: это, по большому счёту, любительский проект. Сгенерированный на GitHub текст не отличается полной связностью, хотя Ars Technica сообщает, что в нём правильно отражены имена и события 1800-х годов. Когда модель попросили продолжить предложение «В год Господа нашего 1834», она привела упоминание о протестах: «улицы Лондона были полны протестующими», и далее говорилось о политике лорда Пальмерстона, который занимал тогда пост министра иностранных дел.

Это интересный эксперимент, но может ли это на самом деле принести пользу? Потенциально — да. Статья-мнение, опубликованная в Proceedings of the National Academy of Sciences of the United States of America (PNAS) группой соавторов, включая Майкла Варнума, профессора психологии департамента психологии Университета штата Аризона — интересное чтиво. В ней выдвигается предположение, что такого рода модели могут послужить инструментом для изучения психологии за рамками современного контекста. В статье такие модели называются Историческими Большими Языковыми Моделями (ИБЯМ) и утверждается, что исследователи психологии могут использовать их, чтобы изучать мышление людей цивилизаций ушедших времён.

«В принципе, ответ таких искусственных персонажей может отражать психологию общества ушедших времён, позволяя проводить более надёжные и междисциплинарные исследования природы человека», — говорится в статье. «Учёные, например, могут сравнивать коллективные тенденции викингов, древних римлян и ранних современных японцев в контексте экономических игр. Или они могут исследовать отношение к ролям полов, типичные для древних персов или средневековых европейцев».

Идея интересная, хотя авторы статьи признают, что её реализация может стать проблематичной.

«Все БЯМы — продукт их обучающего корпуса, и ИБЯМы стоят перед проблемой, касающейся выборки, учитывая, что уцелевшие исторические тексты, вероятно, не являются репрезентативными образцами людей, проживавших в определённый период», — признают авторы, утверждая, что исторические тексты, как правило, пишут представители элиты, а не рядовые граждане. — В результате делать обобщения на основании этих моделей может быть проблематично».

Также следует иметь в виду другие моменты. Результаты исследования Гентского университета в Бельгии показывают, что идеология людей, работающих над БЯМ, проявляется в генерируемых этими моделями текстах. Есть все основания подозревать, что та же самая проблема будет применима к БЯМ, разработанным с целью отражения культур прошлых времён.

Так что есть проблемы. Только время покажет, будут ли эти модели использоваться в психологических исследованиях, или же останутся уделом энтузиастов.

Автор статьи — Джастин Пот (JUSTIN POT).

Перевод — Андрей Прокипчук, «XX2 ВЕК».

Вам также может быть интересно: