Найти тему
1237 подписчиков

Последние десять месяцев, я использую ChatGPT, как персонального тьютора для изучения различных тем. Когда OpenAi запустил модуль, который сейчас называется - Advanced Data Analysis, все стало еще интереснее.


Например, мы уже неделю пытаемся придумать новый язык. А началось все с того, что я попросил помочь мне разобраться в таком языке, как Сольресоль. Слышали о таком? Тогда небольшая историческая справка:

Сольресоль — это искусственный язык, созданный Французским музыкантом и учителем Франсуа Сюдром в начале 19 века. Основная идея этого языка заключается в использовании семи музыкальных нот (do, re, mi, fa, sol, la, si) как основных строительных блоков для слов и выражений. Главная фишка этого синтетического языка заключалась в том, что при его помощи смогут общаться даже глухонемые со слепыми, используя ноты.

Оказалось, что ChatGPT не сильно погружен в данный язык, поэтому я загрузил в него базовое описание и небольшой словарь из сорока страниц. Модель накидала код на пайтоне и создала скрипт словаря, а также предоставила мне структуру языка:

Строительный элемент языка: Семь музыкальных слогов, соответствующих названиям нот (do, re, mi, fa, sol, la, si). Эти слоги используются для формирования слов.

Классификация понятий: Слова на Сольресоле могут классифицироваться на основе начальных слогов. Например, слова, начинающиеся на "DO", относятся к человеку и его характеристикам.

Части речи: Одно-, дву- и трехсложные слова могут являться предлогами, союзами, местоимениями и другими базовыми частями речи.

Склонение и спряжение: Сольресол, похоже, использует разные формы слов, чтобы выразить разные грамматические категории, такие как род, число и падеж.

Наизучавшись Сольресоля, мы приступили к созданию своих синтетиков. И через какое-то количество итераций ChatGPT предложил язык основанный на цветах:

Фонемы (цвета): Красный, оранжевый, желтый, зеленый, голубой, синий, фиолетовый.

Грамматика: Каждый цвет соответствует определенной части речи.
* Красный: Существительные
* Оранжевый: Прилагательные
* Желтый: Глаголы
* и т.д.

Словарный запас: Комбинации цветов создают слова или фразы. Например, если бы "красный" был существительным, а "желтый" глаголом, то комбинация "красно-желтый" могла бы означать "солнце светит".

Письменность: Цветные полосы или пятна.

А это интересно подумал я, но предложил ChatGPT, использовать word embeddings и RGB для нашего языка.

ChatGPT ответил:

Интересная идея! Давайте создадим простой словарь на основе RGB.

Представим слова как комбинации трех основных цветов: Красный (R), Зеленый (G) и Синий (B). Каждый цвет может принимать значения от 0 до 255.

Шаг 1: Определение базовых слов.
* Мужчина: R=255, G=0, B=0 (Полностью красный)
* Женщина: R=0, G=255, B=0 (Полностью зеленый)
* Король: Комбинация мужчины и некоторого "властного" атрибута. Предположим, что "власть" представлена синим цветом. Тогда: R=255, G=0, B=100
* Королева: Комбинация женщины и того же "властного" атрибута: R=0, G=255, B=100

Шаг 2: Применение логики Word2Vec.
Если мы отнимем вектор "Мужчина" из "Короля" и прибавим "Женщину", мы должны получить вектор, приближенный к "Королеве".

Исходя из наших определений:
Король (R=255, G=0, B=100) - Мужчина (R=255, G=0, B=0) + Женщина (R=0, G=255, B=0) = R=0, G=255, B=100
Это именно вектор "Королевы", что подтверждает правильность нашей логики.

Таким образом, вы можете создать целый словарь слов, представленных в виде RGB-кодов, и применять к ним арифметические операции для получения новых слов или концепций. На практике, конечно, возможны некоторые неточности, но это интересный способ представления и анализа языка.

Как итог, мы написали простой код, который позволяет переводить предложения с русского языка, на «язык цвета».

Например, фраза: "Я в парке. Он с друзьями. Но я не один." выглядит так:

# RGB values for the text
colors = [
(0, 0, 255), # Я
(0, 255, 0), # В
(128, 255, 128), # Парк
(255, 0, 255), # Он
(128, 128, 0), # С
(139, 69, 19), # Друзья
(128, 128, 128), # Но
(255, 255, 0), # Не
(64, 64, 64) # Один
]

Как-то так мы развлекаемся с ChatGPT каждый день
3 минуты