1237 подписчиков
Последние десять месяцев, я использую ChatGPT, как персонального тьютора для изучения различных тем. Когда OpenAi запустил модуль, который сейчас называется - Advanced Data Analysis, все стало еще интереснее.
Например, мы уже неделю пытаемся придумать новый язык. А началось все с того, что я попросил помочь мне разобраться в таком языке, как Сольресоль. Слышали о таком? Тогда небольшая историческая справка:
Сольресоль — это искусственный язык, созданный Французским музыкантом и учителем Франсуа Сюдром в начале 19 века. Основная идея этого языка заключается в использовании семи музыкальных нот (do, re, mi, fa, sol, la, si) как основных строительных блоков для слов и выражений. Главная фишка этого синтетического языка заключалась в том, что при его помощи смогут общаться даже глухонемые со слепыми, используя ноты.
Оказалось, что ChatGPT не сильно погружен в данный язык, поэтому я загрузил в него базовое описание и небольшой словарь из сорока страниц. Модель накидала код на пайтоне и создала скрипт словаря, а также предоставила мне структуру языка:
Строительный элемент языка: Семь музыкальных слогов, соответствующих названиям нот (do, re, mi, fa, sol, la, si). Эти слоги используются для формирования слов.
Классификация понятий: Слова на Сольресоле могут классифицироваться на основе начальных слогов. Например, слова, начинающиеся на "DO", относятся к человеку и его характеристикам.
Части речи: Одно-, дву- и трехсложные слова могут являться предлогами, союзами, местоимениями и другими базовыми частями речи.
Склонение и спряжение: Сольресол, похоже, использует разные формы слов, чтобы выразить разные грамматические категории, такие как род, число и падеж.
Наизучавшись Сольресоля, мы приступили к созданию своих синтетиков. И через какое-то количество итераций ChatGPT предложил язык основанный на цветах:
Фонемы (цвета): Красный, оранжевый, желтый, зеленый, голубой, синий, фиолетовый.
Грамматика: Каждый цвет соответствует определенной части речи.
* Красный: Существительные
* Оранжевый: Прилагательные
* Желтый: Глаголы
* и т.д.
Словарный запас: Комбинации цветов создают слова или фразы. Например, если бы "красный" был существительным, а "желтый" глаголом, то комбинация "красно-желтый" могла бы означать "солнце светит".
Письменность: Цветные полосы или пятна.
А это интересно подумал я, но предложил ChatGPT, использовать word embeddings и RGB для нашего языка.
ChatGPT ответил:
Интересная идея! Давайте создадим простой словарь на основе RGB.
Представим слова как комбинации трех основных цветов: Красный (R), Зеленый (G) и Синий (B). Каждый цвет может принимать значения от 0 до 255.
Шаг 1: Определение базовых слов.
* Мужчина: R=255, G=0, B=0 (Полностью красный)
* Женщина: R=0, G=255, B=0 (Полностью зеленый)
* Король: Комбинация мужчины и некоторого "властного" атрибута. Предположим, что "власть" представлена синим цветом. Тогда: R=255, G=0, B=100
* Королева: Комбинация женщины и того же "властного" атрибута: R=0, G=255, B=100
Шаг 2: Применение логики Word2Vec.
Если мы отнимем вектор "Мужчина" из "Короля" и прибавим "Женщину", мы должны получить вектор, приближенный к "Королеве".
Исходя из наших определений:
Король (R=255, G=0, B=100) - Мужчина (R=255, G=0, B=0) + Женщина (R=0, G=255, B=0) = R=0, G=255, B=100
Это именно вектор "Королевы", что подтверждает правильность нашей логики.
Таким образом, вы можете создать целый словарь слов, представленных в виде RGB-кодов, и применять к ним арифметические операции для получения новых слов или концепций. На практике, конечно, возможны некоторые неточности, но это интересный способ представления и анализа языка.
Как итог, мы написали простой код, который позволяет переводить предложения с русского языка, на «язык цвета».
Например, фраза: "Я в парке. Он с друзьями. Но я не один." выглядит так:
# RGB values for the text
colors = [
(0, 0, 255), # Я
(0, 255, 0), # В
(128, 255, 128), # Парк
(255, 0, 255), # Он
(128, 128, 0), # С
(139, 69, 19), # Друзья
(128, 128, 128), # Но
(255, 255, 0), # Не
(64, 64, 64) # Один
]
Как-то так мы развлекаемся с ChatGPT каждый день
3 минуты
19 сентября 2023