История классификации свойств человека, а именно его психологических особенностей насчитывает не одну сотню лет. Попытки разделить людей по темпераментам, типам личности, особенностям реакций принимались много раз и добивались определенного мирового признания. С точки зрения наиболее фундаментальной основы и практического применения можно выделить труды К. Юнга, последователи, которого задают основной исторический тренд в процессах психодиагностики. 8 индикаторов, которые выделял Юнг послужили основой для многих последующих исследователей. К сожалению, в современной психологии, как и в медицине нет единой системы, единого подхода, общей парадигмы в области оценки свойств личности человека. Тем не менее, по словам И. Ньютона, чтобы видеть дальше, необходимо стоять на плечах гигантов. В нашем исследовании К. Юнг и выступит в роли такого “гиганта” в области психодиагностики.
Рассуждая о признаках человека в современном обществе, его данных, которые становятся общедоступными, но в то же время, позволяют начать процесс идентификации, мы пришли к выводу, что коммуникация во всех странах и на всех языках строится приблизительно одинаково. Если вспомнить школьный курс Английского языка, то мы сразу на первых занятиях знакомились с одноклассником, называя свое имя “Hello, my name is Artem Amentes” свой возраст “I am 14 years old” и место “I am from Russia”. Так же, проходило изучения немецкого и французского языков. Таким образом, логично, что первичная самоидентификация человека идет именно через эти данные. Первое, что мы спрашиваем, и первое, что хотим знать, чтобы начать общаться с собеседником.
Во время общения, или начала общения, собеседники также используют невербальные методы, чтобы уловить симпатию, настроение, встревоженность, агрессию, иными словами, определить для себя внутреннее состояние собеседника. Но, что если общение происходит онлайн, а настроение собеседника, его внутренние качества нам нужны для определенных целей. Например, мы хотим что-то продать, или нанять собеседника на работу - в этих случаях нам очень важно знать его внутренние качества и свойства. В данном случае нам помогают системы, которые находят корреляции в условиях многомерной неопределенности. Так, многие используют алгоритмы машинного обучения для того, чтобы в большом количестве данных найти те тренды, и прослеживающиеся тенденции, которые позволят решить определенную задачу.
В исследованиях Социального кода основная задача это поиск тех данных, по которым возможно прогнозировать поведение, реакции людей на внешние факторы и раздражители, понять как пользователи систем принимают решение и другие задачи. В первоначальных датафреймах использовались любые данные, доступные в социальных сетях, а для контроля использовались результаты психологических опросников MBTI, Кейрси и Big5. Постепенно уменьшая датафрейм X (на основании которого проводилась настройка алгоритма) сохранялась предсказательная точность по Y (группа индикаторов К. Юнга в 4-х буквенном значении). Всего в обучающий датафрейм вошло свыше 1000 респондентов из различных регионов России, зарегистрировавшихся на платформе cvcode.ru Наиболее предсказуемым индикатором определена логика. С точностью 83% логика определялась на основании лишь 4х параметров профиля социальной сети ВКонтакте. Так, имя, фамилия, возраст и геопозиция составили тот минимальный набор данных для обучающего датафрейма, чтобы прогнозировать уровень логики с hit rate 83%. Минимальное прогнозное значение составило 62% по иррациональности. Результат в точности такой системы не является применимым для практики управленческих решений, но дает научный задел для дальнейшего развития системы.