22 подписчика

Может ли ИИ, не зная вкуса яблока, понять нашу тоску по детству?

10 апреля10 апр

2 мин

Мы уже привыкли к мысли, что нейросети умеют писать как люди. Иногда лучше, иногда хуже. Но вот вопрос, которым задались ученые: роботы думают словами так же, как мы? Или нейросети просто красиво жонглируют символами, не подозревая, что за ними стоит мир, боль, запах кофе и странная тоска по детству? «Яблоко» как вектор: нейросеть против человеческого опыта

Что мы с вами думаем о слове «яблоко»? Вспоминая его кисло-сладкий вкус, вес в ладони, восковой отблеск на кожуре. У нас вполне может возникнуть воспоминание из детства: яблоня у бабушки, каникулы, теплый летний воздух, мечты… Для большой языковой модели слово «яблоко» — это вектор, точка в многомерном пространстве, соседствующая с «грушей», «плодом» и, с некоторой вероятностью, с Ньютоном и айфоном. Учёные из Университета Осаки решили проверить это через цифры. Они взяли 695 слов, которые дети осваивают в раннем возрасте.

Примеры: «Мяч». «Мама». «Бежать».

И попросили людей и языковые модели оценить их по параметрам вроде: конкретн

Примеры: «Мяч». «Мама». «Бежать».

И попросили людей и языковые модели оценить их по параметрам вроде: конкретн

Мы уже привыкли к мысли, что нейросети умеют писать как люди. Иногда лучше, иногда хуже. Но вот вопрос, которым задались ученые: роботы думают словами так же, как мы?

Или нейросети просто красиво жонглируют символами, не подозревая, что за ними стоит мир, боль, запах кофе и странная тоска по детству?

«Яблоко» как вектор: нейросеть против человеческого опыта

Для большой языковой модели слово «яблоко» — это вектор, точка в многомерном пространстве, соседствующая с «грушей», «плодом» и, с некоторой вероятностью, с Ньютоном и айфоном.

Учёные из Университета Осаки решили проверить это через цифры. Они взяли 695 слов, которые дети осваивают в раннем возрасте.
Примеры: «Мяч». «Мама». «Бежать».
И попросили людей и языковые модели оценить их по параметрам вроде: конкретность, образность, социальность, уровень восприятия, ощущения.

Результат? В целом — похоже. Модели угадывают, что яблоко — предмет, любовь — абстракция.

Да, ИИ, анализируя терабайты текста, может выявить, что слово «жужжать» часто соседствует с «пчела», «колебания», «приборы», он установит корреляцию.
Но ИИ недоступна магия образности и символичности. Для человека «жужжание» может вызвать целую палитру образов и чувств: вязкий зной, сонное марево над лугом, сладкая тяжесть в воздухе. Мы тонем в этом звуке, узнаём его, как тёплую густоту лета, как мёд, ещё не собранный, но уже сладкий в горле.

Пропасть в деталях: как ИИ не чувствует «но»

Но дальше ещё интереснее. Нейросети всегда ставят «низкую оценку» предлогам и союзам.

Для нас, людей, «из-за» — это целая драма, обида, причина неудачи. Для ИИ это служебный токен с низкой конкретностью, механика связи, лишенная травматического опыта.

Казалось бы, мелочь. Но какая огромная разница между «я люблю тебя» и «я люблю тебя, но»?

Почему ИИ всё равно похож на нас? Ответ в нашем языке

Да, нейросеть может: правильно оценить «яблоко» как конкретное, встроить в красивый абзац, и даже написать про детство в деревне у бабушки. Но она не знает, что яблоко бывает тёплым от солнца. Что иногда оно пахнет осенью. Что иногда — это первое, что ты съел после суток апатии и отчаяния.

Но даже без тела, ощущений и опыта, модели всё равно воспроизводят значительную часть человеческих семантических интуиций.

Почему?

Мы веками кодировали в язык телесность, социальность, страх, удовольствие, власть и любовь. ИИ, читая этот многотысячелетний «дневник человечества», учится не миру, а его отражению в наших словах.
Он блестяще воспроизводит карту, но не чувствует территории. И в этом — главная граница между искусственным интеллектом и живым разумом.

Связь со мной: kamila_nt@mail.ru