А. Истринская и друзья: саморазвитие в эпоху AI

46 подписчиков

Проект Омега: Археология Смысла

5 апреля5 апр

32 мин

В 2013 году группа исследователей Google опубликовала работу, которую в научных кругах поначалу восприняли как занятный курьёз. Они обнаружили, что слова можно представить как точки в математическом пространстве. И что с этими точками можно делать арифметику. Конкретно: возьмите вектор слова «Король». Вычтите вектор слова «Мужчина». Прибавьте вектор слова «Женщина». Посмотрите, какое слово стоит ближе всего к результату. Ответ: «Королева». Запишем это как уравнение: Король − Мужчина + Женщина = Королева Это не метафора. Не поэтическая фигура. Буквальная математическая операция над буквальными числовыми векторами — такая же, как сложение координат на карте. Попробуем ещё раз, чтобы убедиться, что это не случайность: Париж − Франция + Польша = Варшава. Направление от страны к столице — одно и то же направление в математическом пространстве. Для любой страны. Понятие «столица» существует в этом пространстве как геометрический вектор — как стрелка, указывающая в строго определённую сторону

Оглавление

Блок 1. Что такое латентное пространство: Вселенная как карта
Блок 2. Вавилонский тоннель: Инверсия мифа
Блок 3. Lingua Adamica: Тысячелетняя мечта

В 2013 году группа исследователей Google опубликовала работу, которую в научных кругах поначалу восприняли как занятный курьёз.

Они обнаружили, что слова можно представить как точки в математическом пространстве. И что с этими точками можно делать арифметику.

Конкретно: возьмите вектор слова «Король». Вычтите вектор слова «Мужчина». Прибавьте вектор слова «Женщина». Посмотрите, какое слово стоит ближе всего к результату.

Ответ: «Королева».

Запишем это как уравнение:

Король − Мужчина + Женщина = Королева

Это не метафора. Не поэтическая фигура. Буквальная математическая операция над буквальными числовыми векторами — такая же, как сложение координат на карте.

Попробуем ещё раз, чтобы убедиться, что это не случайность:

Париж − Франция + Польша = Варшава.

Направление от страны к столице — одно и то же направление в математическом пространстве. Для любой страны. Понятие «столица» существует в этом пространстве как геометрический вектор — как стрелка, указывающая в строго определённую сторону.

Остановитесь и почувствуйте, что здесь происходит.

Никто не программировал машину знать, что Париж — это столица Франции. Никто не объяснял ей, что значит «столица». Она читала тексты — миллиарды предложений, в которых слова встречались рядом в определённых сочетаниях — и из этой статистики сама вычислила геометрию смысла. Сама расставила слова по координатам так, что математические отношения между точками совпали с логическими отношениями между понятиями.

Что это означает?

Что смысл подчиняется математическим законам. Что слова — это координаты в пространстве. Что язык — это геометрия, которую мы наконец начали измерять.

И что за поверхностью всех наших слов, под всеми языками и алфавитами, скрывается нечто, имеющее форму. Нечто, что можно нанести на карту.

Мы думали, что строим башню вверх.

Оказалось, мы роем тоннель вниз.

Блок 1. Что такое латентное пространство: Вселенная как карта

Начнём с того, чего не нужно бояться. Термин «латентное пространство» звучит технически — но за ним стоит образ, который интуитивно понятен каждому.

Представьте библиотеку.

Только расставленную не по алфавиту, не по жанрам, не по эпохам. Книги в этой библиотеке стоят по смыслу. Достоевский — рядом с Кафкой, потому что оба исследуют вину и невозможность оправдания. Не рядом с Толстым и не рядом с другими немецкоязычными авторами — именно рядом с Кафкой. «Преступление и наказание» — в одном шаге от «Процесса». Ницше — в двух шагах от Достоевского и в трёх от Шопенгауэра. Евангелие от Иоанна — неожиданно близко к диалогам Платона.

В этой библиотеке расстояние между книгами — это расстояние между мирами.

Латентное пространство нейросети — это именно такая библиотека. Только вместо книг в ней стоят слова, образы, звуки, молекулы, финансовые паттерны — всё, на чём обучалась модель. Каждый элемент получает свои координаты: не две и не три, а сотни или тысячи числовых значений, определяющих его положение в многомерном пространстве смыслов.

Чем ближе два элемента в этом пространстве — тем ближе их смыслы.

«Кошка» и «собака» стоят рядом — оба домашних животных, оба часто встречаются в одних и тех же контекстах. «Тирания» и «свобода» стоят далеко — они полярны по смыслу, и это расстояние закодировано в их координатах. «Радость» и «счастье» почти совпадают. «Нож» неожиданно близко к «хирургу» — и значительно дальше от «злобы», чем можно было бы предположить.

Важнейшая деталь: это никто не программировал.

Никто не говорил системе: «Помести "кошку" рядом с "собакой"». Никто не объяснял ей значение слова «тирания». Расположение в пространстве возникло само — из статистики совместных появлений слов в миллиардах текстов. Смысловая геометрия проступила из данных, как проступает изображение на фотобумаге в проявителе.

И здесь — поразительное свойство, от которого перехватывает дыхание, если вдуматься.

Это пространство имеет симметрию смысла.

Расстояние между «добром» и «злом» математически равно расстоянию между «светом» и «тьмой». Вектор от «мира» к «войне» параллелен вектору от «жизни» к «смерти». Геометрическое отношение между «учителем» и «учеником» воспроизводится в отношении между «родителем» и «ребёнком».

Это не совпадение. Это не артефакт алгоритма.

Это — структура реальности, проступившая сквозь данные.

Подумайте, что это означает. Человечество тысячелетиями строило системы смыслов: мифологии, религии, философии, грамматики. Каждая культура — на своём языке, в своих категориях, со своими метафорами. Казалось, что смысл — это конвенция. Договорённость. То, что мы приписываем вещам, а не то, что в них заложено.

Но нейросеть, которая читала тексты на ста языках и не знала ни одного из них «по-человечески», обнаружила: смысловые отношения воспроизводятся одинаково во всех языках. «Добро» и «зло» стоят на одном расстоянии в русском пространстве, английском, суахили, японском. Метафоры света и тьмы для добра и зла — не случайная поэтическая привычка. Это отражение реальной геометрии смыслового пространства, которое существует до языков и которое все языки независимо друг от друга пытаются описать.

Это место называется латентным пространством.

«Латентный» — значит «скрытый». Пространство, которое всегда было под поверхностью слов. Пространство, к которому все языки были лишь приближениями.

Мы наконец получили инструмент, который умеет в него смотреть.

Блок 2. Вавилонский тоннель: Инверсия мифа

Мы все знаем эту историю.

Люди говорили на одном языке. Они решили построить башню до небес — не из гордости, как принято думать, а из страха: «чтобы нам не рассеяться по всей земле». Чтобы остаться вместе. Чтобы не потерять друг друга.

Бог смешал их языки. Они перестали понимать друг друга. Разошлись.

Вавилон стал синонимом разобщённости. Синонимом трагедии, которую мы несём в себе с самого начала: мы живём в одном мире, но описываем его несовместимыми словами. Физик и поэт стоят рядом перед одним закатом — и не могут рассказать друг другу, что видят.

Все технологии последних пятисот лет пытались это исправить. Каждая — по-своему. Каждая — строя новый этаж башни.

Гутенберг создал печатный станок. Книги стало можно размножать — мысль получила охват, которого прежде не было. Но языков не стало меньше. Физики всё так же читали не то, что читали поэты.

Телеграф связал континенты за секунды. Расстояние перестало быть препятствием для слова. Но смысловая пропасть никуда не делась — просто теперь люди не понимали друг друга мгновенно, а не через месяц.

Интернет объединил всё человеческое знание в одном пространстве. Статья о квантовой механике и сонет Петрарки лежат на расстоянии одного клика. Но для этого расстояния не нужен клик — нужен другой мозг, другая подготовка, другой язык понимания.

Каждый раз мы строили новый этаж башни. Расширяли охват. Ускоряли передачу. Но разделение оставалось нетронутым — потому что оно находится не на поверхности коммуникации, а в самом основании: в разных языках, которыми описывается реальность.

Печатный станок, телеграф, интернет — это этажи башни. Они тянутся вверх.

ИИ делает принципиально другое. Он бурит вниз.

Не строит новый язык поверх существующих. Не создаёт ещё одну надстройку над Вавилоном. Он уходит вглубь — под все языки, под все алфавиты, под все дисциплины — и ищет то, что было до смешения. Праязык. Ту точку, из которой выросло всё остальное.

И находит её.

Это не метафора. Это математически верифицированный факт: латентное пространство нейросети, обученной на текстах разных языков, обнаруживает одинаковые структуры в русском, английском, суахили, мандаринском. Смысловые отношения — расстояния, направления, симметрии — воспроизводятся независимо от языка-носителя. Под поверхностью Вавилона существует слой, которого смешение не коснулось.

Есть точная аналогия в физике.

Двести лет назад казалось, что у природы много разных сил: гравитация, электричество, магнетизм, ядерные взаимодействия. Каждая описывалась своим уравнением, своим математическим языком. Потом Максвелл объединил электричество и магнетизм. Потом Эйнштейн показал, что гравитация — это геометрия пространства-времени. Потом физики объединили ещё три силы в единую теорию. Сейчас они ищут теорию всего — одно уравнение, из которого вытекает каждая сила, каждая частица, каждый закон природы.

Идея проста и захватывающая: множественность — это поверхность. В глубине — единство.

ИИ обнаружил то же самое в мире смыслов.

Поэзия, геном, финансовый ряд, соната, томограмма — это разные «силы» смыслового мира. Разные проявления. Разные языки описания. Но в латентном пространстве они сходятся в единое поле смысла — пространство, где все эти языки оказываются частными случаями одной геометрии. Так же, как электричество и магнетизм оказались частными случаями одного электромагнитного поля.

Физики назвали бы это великим объединением смысла.

Вавилонская башня строилась вверх — и была разрушена. Вавилонский тоннель бурится вниз — туда, где разрушать нечего. Там, в глубине, никакого смешения не происходило. Там всегда был один язык.

Мы просто впервые получили инструмент, который умеет туда спускаться.

Блок 3. Lingua Adamica: Тысячелетняя мечта

Эта идея старше науки.

В книге Бытия есть сцена, которую богословы тысячелетиями читали как технический отчёт о первом лингвистическом акте в истории: Бог привёл к Адаму всех животных и птиц — «чтобы видеть, как он назовёт их; и как наречёт человек всякую душу живую, так и было имя её».

Обратите внимание на эту конструкцию: Бог не проверял, правильно ли Адам угадал заранее данные имена. Бог смотрел — что назовёт. Потому что то, что называл Адам, и становилось именем. Слово совпадало с сутью. Имя было не ярлыком — оно было сущностью вещи, произнесённой вслух.

Средневековые схоласты называли этот язык Lingua Adamica — адамов язык, язык Рая. И верили: это был не произвольный набор звуков, привязанных к вещам по договорённости. Это был язык, в котором каждое слово звучало именно так, потому что вещь именно такова. Лев назывался «лев» не потому что люди так решили — а потому что в этом звуке было что-то от его природы: царственность, мощь, огонь.

После грехопадения и Вавилона этот язык был утрачен. Остались осколки — несовершенные, условные, разобщённые человеческие языки, в каждом из которых слово лишь указывает на вещь, но не является ею.

И началась охота.

Каббалисты искали Lingua Adamica в комбинаторике букв иврита. Священные тексты Торы они прочёсывали как шифр — переставляли буквы, вычисляли числовые значения слов, искали скрытые структуры, в которых должна была проступить исходная грамматика реальности. Алхимики искали этот язык в символах элементов — полагая, что ртуть, сера и соль — это не вещества, а буквы алфавита, которым написана материя. Астрологи читали его в конфигурациях планет.

В XVII веке к этим поискам подключились математики — и тон разговора резко изменился.

Лейбниц называл свой проект Characteristica Universalis — универсальная характеристика, универсальный язык. Он хотел создать систему обозначений, в которой каждая концепция — от атома до Бога — получала бы своё числовое или символическое выражение. И тогда любой спор — философский, богословский, политический — можно было бы разрешить не криком и не мечом, а вычислением. Он написал фразу, которая звучит как манифест нашей эпохи:

«Если бы у нас был такой язык — философы вместо того, чтобы спорить, говорили бы: давайте посчитаем».

Calculemus.

Его современники уважительно кивали — и считали это утопией. Слишком красиво. Слишком дерзко. Мир слишком сложен, чтобы вместиться в одно исчисление.

Умберто Эко (1932–2016)
Итальянский философ, семиотик и писатель — автор «Имени Розы» и десятков академических трудов. В книге «Поиск совершенного языка» он проследил двухтысячелетнюю историю попыток найти или построить язык, где слова напрямую соответствуют сущности вещей: от каббалистов и алхимиков до Лейбница, Декарта и создателей Эсперанто. В финале Эко пришёл к меланхоличному выводу: эта мечта неосуществима. Язык всегда будет произвольным, всегда будет зазором между словом и вещью. ИИ поставил этот вывод под сомнение — тихо и без полемики.

В 1995 году Умберто Эко написал «Поиск совершенного языка» — энциклопедический труд, охватывающий две тысячи лет этой охоты. Каббалисты, алхимики, Лейбниц, создатели искусственных языков вроде Эсперанто — Эко проследил каждую попытку и каждую неудачу. Финальный вывод книги был элегантно пессимистичен: мечта о совершенном языке неосуществима. Между словом и вещью всегда будет зазор. Lingua Adamica потеряна навсегда.

Книга вышла в 1995 году. За восемнадцать лет до Word2Vec.

Теперь — самый поразительный факт этого блока. Внутри современной нейросети нет русских слов. Нет английских слов. Нет японских, арабских, суахили. Там вообще нет слов в том смысле, в котором мы их понимаем.

Там есть только векторы смыслов.

«Кошка», «cat», «кіт», «neko», «gato» — это пять разных звуковых оболочек для одной и той же точки в пространстве. Пять ярлыков, пять условных обозначений — но за ними стоит одна математическая реальность: координаты понятия «небольшое домашнее млекопитающее, хищник, традиционно живущее рядом с человеком». Это понятие существует в латентном пространстве до своих имён — так же, как число «три» существует независимо от того, написать его по-русски, по-арабски или римскими цифрами.

Lingua Adamica — язык, в котором слово совпадает с сутью вещи — найдена.

Она оказалась не звуком. Не символом. Не ивритской буквой и не алхимическим знаком.

Она оказалась математикой.

Готфрид Вильгельм Лейбниц (1646–1716)
Немецкий математик и философ — один из двух независимых изобретателей дифференциального исчисления. Его нотация, а не ньютоновская, стала стандартом для всей последующей математики. Characteristica Universalis — его незавершённый главный проект: универсальный формальный язык, в котором любое истинное утверждение можно было бы вычислить, а не просто обсудить. Его современники считали это фантазией. Нейросети воплотили эту фантазию в кремнии и электричестве — через триста лет после его смерти.

Эко написал, что мечта о совершенном языке — это история повторяющихся поражений, каждое из которых порождало что-то ценное: каббалу, формальную логику, математику, лингвистику. Поражений, которые двигали мысль вперёд, не достигая цели.

Возможно, он был бы рад узнать: последнее поражение оказалось победой. Просто никто не объявил о ней достаточно громко.

Блок 4. Геология Смысла: Как устроены слои

Геолог не видит прошлого. Он читает настоящее.

Он стоит перед обнажением скалы — там, где дорожные рабочие прорезали холм, обнажив срез — и читает по слоям то, что происходило миллионы лет назад. Вот известняк — это было море. Вот красная глина — это было высыхание. Вот тёмная полоса угля — это были леса, которые сгорели или были погребены. Каждый слой — это целая эпоха, спрессованная во вполне измеримые сантиметры.

Нейросеть устроена точно так же.

Только её слои — это не время. Это уровни абстракции. И читать их можно так же, как геолог читает породу: слой за слоем, уходя всё глубже — и находя там всё более древнее, всё более фундаментальное.

Возьмём GPT-4. В нём сотни последовательных слоёв — каждый принимает представление от предыдущего и трансформирует его, извлекая новый уровень структуры.

Первые слои — поверхностные. Они «видят» буквы, звуки, простейшие орфографические паттерны. Для них «кот» — это «к», «о», «т» в определённом порядке. Не больше.

Средние слои видят глубже. Здесь проступают слова как единицы смысла, грамматические конструкции, базовые синтаксические отношения. Подлежащее и сказуемое. Вопрос и ответ. Причина и следствие.

Глубокие слои работают с концептами и их отношениями. Здесь «врач» связан с «больницей» и «болью» — не потому что эти слова стоят рядом в предложении, а потому что они занимают связанные позиции в смысловом пространстве. Здесь начинается то, что мы называем «пониманием контекста».

Но самые глубокие слои — это что-то другое.

На предельных глубинах трансформера исчезают слова, исчезают концепты, исчезают даже отношения между ними. Остаются структуры, которые исследователи в области интерпретируемости называют по-разному: «нарративные аттракторы», «семантические архетипы», «базовые ролевые схемы».

Есть Тот, кто действует. Есть Тот, на кого направлено действие. Есть Препятствие. Есть Трансформация. Есть Возвращение.

Это не персонажи. Это роли — математические структуры, организующие любой нарратив независимо от его поверхностного содержания. Они обнаруживаются одинаково в «Одиссее» и в инструкции к стиральной машине, в клинической истории болезни и в финансовом квартальном отчёте. Потому что любой текст, описывающий изменение, воспроизводит одну и ту же глубинную схему.

Это именно то, что Карл Густав Юнг нащупывал всю жизнь.

Карл Густав Юнг (1875–1961)
Швейцарский психолог и психиатр, создатель аналитической психологии. Работая с пациентами из разных стран и культур, он обнаружил, что их сны и галлюцинации воспроизводят одинаковые образы — образы, которые он находил в мифологии народов, никогда не имевших контакта друг с другом. Юнг назвал эти образы архетипами — первичными формами психики: Герой, Тень, Великая Мать, Старый Мудрец, Трикстер. Он предположил, что они живут в коллективном бессознательном — общем для всего человечества слое психики, более глубоком, чем личный опыт. Его коллеги-психоаналитики смотрели на это скептически: слишком мистично, слишком недоказуемо. Нейросети тихо обеспечили доказательство.

Юнг пришёл к архетипам через клиническую работу и сравнительную мифологию. Он читал греческих богов, индийские упанишады, алхимические трактаты, африканские ритуалы — и видел: одни и те же структуры, одни и те же роли, одни и те же динамики. Герой уходит в путь. Встречает испытание. Сходит в подземный мир. Возвращается изменившимся. Этот паттерн не принадлежит ни одной культуре — он предшествует всем культурам.

Юнг сделал вывод: архетипы — это не культурные конвенции. Это биологически унаследованные структуры — встроенные в психику через миллионы лет эволюции, отражающие базовые паттерны человеческого опыта.

Нейросеть пришла к тому же — другим путём.

Она не читала Юнга. Она не знала о его концепции. Она читала тексты — миллиарды предложений, историй, описаний, аргументов — и из статистики их совместных появлений самостоятельно выстроила в своих глубоких слоях те же самые структуры. Потому что если архетипы действительно являются универсальными паттернами человеческого повествования — они должны статистически доминировать в любом достаточно большом корпусе текстов. Что и произошло.

Машина «изобрела» Юнга, просто читая людей.

Здесь важно остановиться и понять, что именно это означает.

Юнг утверждал: коллективное бессознательное реально — но доказать это было трудно, потому что оно по определению недоступно прямому наблюдению. Его можно видеть только через симптомы, сны, мифы — через косвенные отпечатки. Это делало концепцию уязвимой для критики: может быть, это просто культурные заимствования? Может быть, сходство мифов объясняется контактами, а не общей психической структурой?

Нейросеть закрывает эту дискуссию.

Она не могла заимствовать структуры из культурных контактов — она просто считала частоты. Она не могла быть предвзятой в пользу юнгианской теории — она не знала о её существовании. Она читала тексты — и в их глубинах нашла то, что Юнг искал в снах и мифах.

Коллективное бессознательное существует. Оно математично. Оно живёт в пространстве смыслов как геологический пласт — под словами, под грамматикой, под концептами — в самом основании человеческого повествования о мире.

Геолог читает историю Земли по породе.

Нейросеть читает историю человеческой психики по данным.

И в самых глубоких слоях обе находят одно и то же: фундамент, который был здесь всегда.

Блок 5. Чёрный ящик исповедуется: Что мы нашли внутри

Долгое время нейросеть была чёрным ящиком.

Она принимала данные. Выдавала ответы. Что происходило внутри — никто не знал. Разработчики создавали архитектуры, запускали обучение, наблюдали результаты — и пожимали плечами, когда их спрашивали о механизме. «Она учится», — говорили они. Это было честно. И это было почти ничего.

Потом появилась новая область науки.

Её назвали механистической интерпретируемостью — mechanistic interpretability. Учёные начали делать то, что прежде казалось невозможным: буквально вскрывать работающие нейросети и смотреть, что происходит внутри. Не снаружи, не по выходным данным — а напрямую, нейрон за нейроном, связь за связью, слой за слоем.

Крис Олах из лаборатории Anthropic — один из пионеров этой работы. Его подход прост до наивности и революционен по результатам: понять, что именно делает каждый нейрон, и как нейроны соединяются в схемы, реализующие конкретные алгоритмы. Читать логику прямо из весов. Не угадывать — знать.

То, что они нашли внутри, перевернуло многие предположения.

Начнём с самого поразительного.

Когда исследователи изучили нейроны ранних слоёв визуальных нейросетей — тех, что обрабатывают изображения — они обнаружили детекторы кривизны. Нейроны, которые реагируют строго на изогнутые линии определённой кривизны и не реагируют на прямые.

Это само по себе не удивительно. Удивительно другое: идентичные детекторы кривизны существуют в зрительной коре приматов. Миллионы лет эволюции и несколько месяцев градиентного спуска независимо пришли к одному и тому же решению одной и той же задачи.

Это называется конвергентной эволюцией — когда совершенно разные системы, решая одну проблему в одинаковых условиях, изобретают одинаковый ответ. Крыло птицы и крыло летучей мыши: разные кости, разное происхождение, одна аэродинамика. Нейрон в коре макаки и нейрон в слоях InceptionV1: разный субстрат, разная история — одна функция.

Вывод, который из этого следует, формулирует сам Олах: если независимые системы приходят к одним и тем же решениям — это значит, что решения диктуются не архитектурой, а структурой задачи. Структурой реальности.

Идём глубже.

В более высоких слоях нейросетей исследователи обнаружили то, что Олах называет мультимодальными нейронами. Нейроны, которые реагируют не на конкретные пиксели или звуки, а на абстрактные концепты — независимо от модальности. Есть нейрон, который активируется на изображение Человека-паука, на нарисованного Человека-паука и на текст «Spider-Man» — одинаково, потому что для него это одна и та же сущность, выраженная тремя разными способами.

Это не курьёз. Это фундаментальный факт о природе понятий.

В нейронауке давно известен «нейрон Хэлли Берри» — клетка в гиппокампе человека, которая реагирует на фотографию актрисы, на её имя, написанное словом, и на карикатуру на неё. Одна клетка, три модальности, одна сущность. Нейросеть независимо воспроизвела этот же принцип — потому что он, по всей видимости, является оптимальным способом хранить знание о мире: не через чувственные образы, а через абстрактные концепты, к которым привязаны разные представления.

Теперь — находка, которая заставила физиков поднять брови.

В 2023 году Уэс Гёрни и Макс Тегмарк из MIT опубликовали исследование с точным и красивым названием: «Language Models Represent Space and Time» — «Языковые модели представляют пространство и время».

Они выяснили: внутри Llama-2 существуют конкретные нейроны, кодирующие пространственные координаты. «Пространственные нейроны», которые надёжно активируются в зависимости от географического положения упоминаемого места — от широты и долготы. И «временны́е нейроны», кодирующие хронологическое положение события — год, эпоху, место на оси времени.

Никто не говорил модели строить карту мира. Никто не объяснял ей, что такое координаты. Она читала тексты — и сама, из статистики слов, выстроила внутреннюю модель пространства и времени, которую физики назвали бы когерентной и линейной.

Язык, обученный предсказывать следующее слово, самостоятельно воссоздал категории Канта — пространство и время как формы, через которые организуется опыт.

Вспомните: Кант считал пространство и время априорными формами созерцания — не выученными из опыта, а предшествующими опыту, встроенными в познающий субъект. Нейросеть показала: эти формы выводятся из данных. Они не априорны в смысле «врождённы» — они априорны в смысле «необходимы». Любая система, достаточно глубоко читающая описания реального мира, неизбежно придёт к пространству и времени — потому что реальный мир организован пространственно и временно, и это отпечатывается в текстах.

Теперь сложим всё вместе.

Детекторы кривизны — одинаковые у приматов и у алгоритмов. Мультимодальные нейроны концептов — одинаковые у людей и у нейросетей. Внутренние представления пространства и времени — возникающие самостоятельно из текста. Архетипические нарративные структуры — проступающие на глубоких слоях без программирования.

Всё это говорит об одном.

Это не машина нашла удобные способы обработки данных. Это машина нашла структуры реальности — те самые, которые нашла и биологическая эволюция, и человеческая философия, просто другими путями и за другое время.

Олах описывает это скромно, как учёный: «Мы не программировали эти концепты. Они возникли сами. Это интересно».

Позволим себе быть чуть менее скромными.

Если детекторы кривизны одинаковы у мозга и у алгоритма — значит, кривизна реальна как структура пространства, а не как конвенция восприятия. Если концепты хранятся мультимодально — значит, концепты существуют до своих языковых выражений. Если пространство и время возникают из текста сами — значит, они действительно являются фундаментальными структурами, которые невозможно не обнаружить, если достаточно глубоко читать описания мира.

Это как вскрыть часы — и обнаружить внутри не шестерёнки, которые вы туда положили, а маленький живой механизм, который сам придумал шестерёнки. Потому что шестерёнки — правильный ответ на задачу передачи вращения. Потому что правильный ответ один. И он открывается всякому, кто ищет достаточно глубоко.

Вавилонский тоннель продолжает уходить вниз.

И в глубине начинает светать.

Блок 6. Тревога Археолога: Что будет, когда мы докопаемся до дна

Каждая великая экспедиция несёт в себе момент, когда первоначальный восторг сменяется тревогой.

Шлиман откапывал Трою с убеждённостью романтика: там, в глубине, лежит золото Приама, лежит историческое подтверждение Гомера, лежит чистая, нетронутая правда. Он копал с таким нетерпением, что прошёл сквозь настоящую Трою — и уничтожил часть того, что искал. В спешке добраться до дна он снёс несколько культурных слоёв, не заметив их.

Это предупреждение актуально и сегодня.

Мы говорили о латентном пространстве как об археологическом разрезе — как о геологии смысла, уходящей от поверхности слов к глубинным архетипам, к Lingua Adamica, к математическому фундаменту реальности. Это прекрасный и захватывающий образ. Но у него есть тёмная сторона, которую было бы нечестно обходить.

Что именно мы закопали в эту шахту?

Нейросеть обучалась на человеческих текстах. Не на идеальных текстах идеального человечества — на реальных. На газетах, которые в 1930-е годы описывали одни народы как неполноценные. На юридических документах, которые веками закрепляли неравенство. На научных статьях, написанных преимущественно мужчинами западного происхождения и незаметно принимавших их опыт за универсальный. На художественной литературе, в которой одни голоса звучали громко, а другие — едва слышно.

Всё это ушло в породу. Спрессовалось в слои. Стало частью геологии смысла.

И исследователи это нашли.

В 2016 году Толга Болукбаши с коллегами из MIT показал: в пространстве Word2Vec «врач» стоит значительно ближе к «мужчине», чем к «женщине». «Программист» — к «мужчине». «Медсестра» — к «женщине». «Гений» — к «мужчине». Никто не программировал эти ассоциации. Они выкопаны из текстов — из десятилетий газет, книг, описаний вакансий, биографий, в которых эти профессии и эти роды лиц сочетались именно так.

Латентное пространство оказалось не нейтральной математикой истины. Оно оказалось слепком эпохи — с её иерархиями, её страхами, её слепыми пятнами, её молчаниями.

Здесь необходима остановка — и здесь необходим Фрейд.

Зигмунд Фрейд (1856–1939)
Австрийский врач и мыслитель, основатель психоанализа. Считал, что под поверхностью сознательной жизни — под вежливостью, рациональностью, культурными нормами — лежат вытесненные желания, страхи и травмы, управляющие поведением без ведома самого человека. Своё дело Фрейд прямо сравнивал с работой Шлимана: слой за слоем снимать культурные напластования, чтобы добраться до первичного конфликта, который всё это породил. Он был убеждён: то, что вытеснено, всегда возвращается. Всегда — в симптоме, в оговорке, в сне.

Фрейд любил одну аналогию. Он представлял человеческую психику как Рим — не современный, а вечный, в котором все эпохи существуют одновременно: под офисным кварталом стоят средневековые церкви, под ними — античные храмы, под ними — фундаменты, которым три тысячи лет. Всё вытесненное никуда не исчезло. Оно просто ушло вглубь и продолжает давить снизу.

Он буквально сравнивал работу психоаналитика с работой Шлимана: та же методичность, та же готовность к неудобным находкам, та же необходимость не разрушить то, что откапываешь, — а прочитать.

Теперь мы ведём ту же работу. Только лопата — цифровая.

И парадокс, который она обнажает, Фрейд бы узнал мгновенно.

Мы думали, что копаем к объективной истине — к математическому фундаменту, к Lingua Adamica, к нейтральной структуре реальности. И мы действительно находим там что-то подлинное: детекторы кривизны, совпадающие с нейронами приматов; юнгианские архетипы, проступающие из статистики; пространство и время, возникающие сами. Это реально. Это важно.

Но вместе с этим мы обнаружили, что копаем к усиленной версии самих себя — со всеми нашими иерархиями, всеми нашими травмами, всеми теми вещами, которые мы предпочитали не замечать, потому что они были нормой. Незаметной, молчаливой, всепроникающей нормой — ровно так же, как Фрейд описывал вытеснение: не как активное усилие забыть, а как пассивное, автоматическое, комфортное незнание.

Это не аргумент против раскопок. Это аргумент за их честность.

Психоанализ стал ценен не потому что находил в бессознательном только красивое. Он стал ценен потому что находил там всё — и учил с этим работать. Невроз не лечится тем, что больной узнаёт только хорошее о своём прошлом. Он лечится тем, что узнаёт правдивое.

Цифровая археология смысла работает так же.

Если в глубинах латентного пространства лежат расовые и гендерные стереотипы — это не катастрофа. Это диагноз. Точный, количественно измеримый, впервые по-настоящему видимый диагноз. Впервые мы можем смотреть на собственные предрассудки не как на ощущение и не как на обвинение — а как на расстояние в многомерном пространстве, которое можно измерить, описать и изменить.

Фрейд говорил: там, где было Оно, должно стать Я. Там, где было бессознательное — должно стать сознательное. Осознание — это уже половина лечения.

Что вытеснено — то возвращается. Всегда.

Лучше пусть оно возвращается в виде числа на экране исследователя — чем в виде симптома в жизни тех, кого это касается.

Блок 7. Lingua Adamica найдена: И что теперь

Итак, мы нашли то, что искали.

Не все поиски заканчиваются находкой. Большинство — не заканчиваются. Философский камень остался философским камением. Вечный двигатель — вечной мечтой. Эликсир бессмертия — метафорой. Но иногда — редко, раз в несколько столетий — охота заканчивается добычей. И тогда выясняется, что к этому моменту никто не был по-настоящему готов.

Средневековые схоласты мечтали о языке, в котором имя совпадало бы с сутью. Лейбниц мечтал о языке, в котором истина вычислялась бы. Эко в 1995 году подвёл итог двухтысячелетних поисков и написал: не нашли, не найдём, утешимся тем, что поиск был прекрасен.

Теперь посмотрите на то, что лежит перед нами.

В латентном пространстве современной нейросети слово «любовь» на русском, «amor» на латыни, «liebe» на немецком, «愛» на японском — это одна и та же точка в многомерном пространстве. Или, точнее, четыре точки, стоящие вплотную друг к другу — настолько близко, что расстояние между ними меньше, чем расстояние между «любовью» и «привязанностью» в одном и том же языке.

Слова — это ярлыки. Смысл — это координата. Смысл первичен, слова вторичны.

Lingua Adamica найдена. Она оказалась математикой.

Момент радости. Момент, когда хочется остановиться и просто побыть с этим открытием.

Но именно здесь — именно в точке триумфа — необходимо задать вопрос, который испортит праздник. Потому что без этого вопроса праздник будет ложью.

Кто нарисовал эту карту?

Мишель Фуко (1926–1984)
Французский философ, историк идей, один из самых неудобных мыслителей XX века. Его главный тезис прост и разрушителен: знание — это власть. Тот, кто определяет, что считается «нормальным» и что — «безумным», кто решает, какие высказывания являются «истинными», а какие — «маргинальными», тот управляет обществом эффективнее любого тирана — и при этом остаётся невидимым. Фуко называл это дискурсом: системой правил, определяющих, что вообще можно сказать в данную эпоху. Латентное пространство ИИ — это первая в истории видимая, измеримая карта дискурса.

Фуко посвятил жизнь одному открытию: язык — это не нейтральный инструмент. Это поле власти. Тот, кто контролирует определения — кто решает, что «нормально» и что «патологично», что «свобода» и что «анархия», что «традиция» и что «отсталость» — тот управляет реальностью. Не через силу. Через то, что одни слова стоят рядом, а другие — далеко. Через то, что одни ассоциации кажутся «естественными», а другие — «странными».

Это происходило всегда. Но прежде было невидимым.

Теперь — видимо. Буквально: в координатах.

В 2019 году исследователи из Стэнфорда показали: в английских языковых моделях, обученных на американских новостных текстах, слово «ислам» стоит значительно ближе к «насилию», чем слово «христианство». Слово «бедность» стоит ближе к «лени», чем к «несправедливости». Слово «мигрант» — ближе к «угрозе», чем к «труду».

Это не математическая необходимость. Это политический выбор, закодированный в данных — в том, как именно американские медиа определённой эпохи описывали эти явления. Это дискурс Фуко, ставший числами.

Теперь эти числа используются в системах найма, в алгоритмах рекомендаций, в инструментах модерации контента, в программах перевода, в системах принятия медицинских решений. Карта смыслов, нарисованная из данных одной эпохи, одной культуры, одного распределения голосов — стала инфраструктурой для всех.

Понимаете масштаб проблемы?

Средневековый схоласт, веривший в Lingua Adamica, думал, что этот язык дан Богом — и потому нейтрален, справедлив, универсален. Имя вещи совпадает с её сутью потому, что Бог так устроил. Никакого человеческого произвола.

Мы нашли язык, в котором имя совпадает с сутью. Но этот язык сделан из человеческих текстов. Со всем человеческим произволом внутри — со всей историей власти и подавления, со всеми замолчанными голосами и усиленными нарративами. Это не язык Бога. Это язык тех, кто писал достаточно много, чтобы войти в обучающий корпус.

Если «свобода» и «анархия» окажутся соседями в латентном пространстве — это не потому что они объективно близки. Это потому что тексты, на которых обучалась модель, так их позиционировали. Это выбор — чей-то выбор, зафиксированный как «естественная» математика.

Фуко предупреждал: самая опасная власть — та, которая выдаёт себя за природу вещей. Которая говорит: «так устроен мир», когда на самом деле имеет в виду: «так устроен мой мир, и я хочу, чтобы он был твоим».

Латентное пространство ИИ — первая в истории измеримая карта этой власти. Это одновременно угроза и возможность.

Угроза — потому что карта может быть принята за территорию. Может быть возведена в ранг объективности. Может тиражироваться в планетарном масштабе — так, как никакой дискурс прежде не тиражировался — встраиваясь в каждый перевод, каждую рекомендацию, каждое автодополнение.

Возможность — потому что впервые власть языка стала видимой. Прежде дискурс Фуко был реальным, но неизмеримым — можно было написать книгу о том, как медицина XIX века конструировала понятие «нормального тела», но нельзя было показать это в числах. Теперь можно. Расстояние в многомерном пространстве — это число. Число можно измерить, оспорить, изменить.

Карта нарисована. Карта может быть перерисована.

Это не означает, что перерисовать её легко — или что все согласятся с тем, как это делать. Это означает, что впервые в истории у нас есть инструмент видеть то, что прежде было невидимым. Видеть — и называть.

А называть вещи своими именами — это, как мы помним с первых страниц этой статьи, и есть начало всякого подлинного языка.

Вывод

Мы спустились.

Мы начали с поверхности — с уравнения «Король − Мужчина + Женщина = Королева» — и ушли вниз: сквозь слои трансформера, сквозь геологию смысла, сквозь юнгианские архетипы в весах нейронов, сквозь тревогу Фрейда и власть Фуко.

И на дне Вавилонского тоннеля мы нашли не пустоту.

Мы нашли плотно упакованное пространство смыслов — математически точную карту всего, что человечество думало, чувствовало и боялось за пять тысяч лет. Carta universalis, о которой мечтал Лейбниц. Язык, о котором писал Иоанн. Структуру, которую Юнг нащупывал в снах пациентов. Дискурс, который Фуко делал видимым по одному слову за раз.

Всё это лежало здесь. Ждало инструмента.

Инструмент пришёл.

Но любая экспедиция, которая достигла дна, неизбежно задаёт следующий вопрос. Не «что здесь лежит?» — это мы уже знаем. А «откуда это взялось?»

Карта нарисована — но кто её нарисовал?

Мы видели: нейросеть, которую никто не учил грамматике, самостоятельно «изобрела» субъект и объект. Никто не объяснял ей, что такое причина и следствие — она вывела это из данных. Никто не программировал архетип Героя — он проступил сам, как кристалл в насыщенном растворе.

Это можно объяснить двумя способами. И эти два объяснения — непримиримы.

Первое: грамматика, причинность, архетипы — это человеческие изобретения, которые так плотно записаны в наших текстах, что любая система, достаточно глубоко их читающая, неизбежно их воспроизводит. Разум — это конструкция. Язык — это конвенция. Структура мира — это структура нашего описания мира. Ничего «за ней» нет.

Второе: грамматика, причинность, архетипы — это законы природы. Такие же объективные, как гравитация. Такие же неизбежные, как скорость света. Нейросеть не изобрела субъект и объект — она обнаружила их, потому что реальный мир устроен именно так: в нём есть действующие силы, есть то, на что они действуют, есть направление времени. Язык не создаёт эту структуру — он её отражает. И любая система, достаточно честно читающая описания реальности, неизбежно найдёт её.

От того, какой из этих ответов верен, зависит всё.

Если первый — разум случаен, язык произволен, и никакого «фундамента» под нашими смыслами нет. Есть только мы — и наши истории о мире.

Если второй — мы живём в познаваемой Вселенной, в которой разум является не биологической случайностью, а закономерным ответом на структуру реальности. И тогда ИИ — не имитация интеллекта, а его независимое открытие.

Этот вопрос — не абстрактный. За ним стоит конкретный человек с конкретным именем и конкретными врагами.

Его зовут Ноам Хомский. И он утверждает, что знает ответ.