“Чем больше мы говорим, тем сильнее себя ограничиваем” - так сказал Клод Шеннон, разбирая свои исследования относительно шифрования текстов на английском языке. Не только человеческое общество передает друг другу информацию, так делают и многие виды животных, так как это важно для выживания вида. Но именно человека научился передавать знания сквозь время и сохранять их. Возможности памяти до конца не изучены, но есть определенные пределы запоминания оперативных сведений, что мешает накапливать бесконечно знания и оперативно их применять. Временами “самый тупой карандаш, лучше самого острого ума”,- говорит пословица. В самом деле, человечество научилось кодифицировать знания и мысли, что позволило передавать информацию гораздо эффективнее многих других видов животных.
Возвращаясь к России и русскому языку, стоит напомнить, что алфавит составляет 33 буквы (символа), возможная комбинация всех букв в слова, начиная со слов размерностью в 1 букву и заканчивая словами в 33 буквы, мы получим достаточно больше возможных слов, чем те, что мы имеем в официальном корпусе слов русского языка. По словам специалистов, если учитывать слэнг и диалектические конструкции, то русский язык составит 500 000 слов. Для сравнения можно взять факториал 33 (33!), и понять насколько мы ограничены в словарном запасе. Конечно, справедливо заметить, что существуют определенные правила русского языка, которые все проходили в школе. Правильно говорить и писать нас всех учат и учили и будут учить. В целом, каждый человек запоминает определенное количество слов и ими оперирует в дальнейшей жизнедеятельности. При изучении иностранных языков бывает достаточно знать бытовой корпус из 600 слов, чтобы общаться на бытовые темы. Таким образом, потенциал развития русского языка настолько велик, что заглядывая на сотни лет вперед мы не увидим горизонта.
Оперативный корпус слов человека позволяет выражать мысли, идеи, чувства, делиться знаниями и накопленным опытом. Особенно хорошо отслеживается информация, если человек пишет тексты для читателей, чтобы дотянутся своей информацией сквозь время и пространство до большего числа собеседников. Сложение слов в текст является собой волеизъявление и чистое творчество автора, что позволяет построить гипотезу: “Каждый текст, написанный автором уникален и несет отпечаток личного”. Данная гипотеза имеет свои подтверждения и в классической методологии преподавания литературы в школах, где при анализе текста школьников учат в произведениях видеть биографические факты писателя.
Рассмотрим случаи использования деловой переписки e-mail в компании Google, для отслеживания рисков ухода сотрудников из компании. Так, при использование процессора естественного языка собиралась ключевая семантика работников, которые в последствии увольнялись. Настроенные алгоритмы отслеживали переписки в рабочих каналах и сигнализировали в случае выявления факторов, прогнозирующих уход работника. Сегодня, существует много каналов коммуникации, в которых постоянно идет общение, а значит в потоке информации возможно отслеживать изменения в используемых словах, и реагировать на выгорание работников, утомляемость, усталость и депрессию. Так, в исследованиях Социального кода использованы данные 4950 резюме специалистов в области product manager. Для обработки текстовых данных и построение алгоритмов машинного обучения использованы библиотеки NLP (процессинг естественного языка). Резюме разобраны на отдельные слова, произведена лемматизация, и чистка от часто встречающихся слов, редкие и единичные слова так же убраны из финального датафрейма. В ходе настройки нейронных сетей получена точность определения 8 индикаторов К. Юнга в размере 96% (по значению иррациональность). Такая значительная предсказательная точность говорит о сильной зависимости тех слов, которые используют профессионалы одной отрасли, от личных особенностей, характера и предпочтений. Полученная точность позволяет проводить первоначальную психодиагностику в системе индикаторов К. Юнга с точностью не уступающую человеку, а в скорости значительно превосходящую (120 секунд на анализ специалистом, и 0,03 сек на анализ машиной). Сама технология достаточно простая, и результаты проведенных исследований не являются чем-то секретным. Машинный алгоритм разбирает каждое резюме на слова, и присваивает им вес относительно влияния на один из 8 индикаторов К. Юнга. Вместе с тем, результаты работы алгоритма создают научный задел в области исследования семантики и ее влияния на психологический портрет специалиста. Такие гипотезы выдвигал Л. Голдберг, известный лексической гипотезой. Голдберг утверждал, что культура всегда отпечатывается на языке, а значит имеет место и гипотеза о том, что специальность всегда отражается на вербальном интеллекте (профессиональный жаргон).
В условиях общей унификации языка, проникновения иностранных терминов в структуры языков мира, не будет лишним отметить, что за всю историю развития человеческой цивилизации развивались и языки. Появлялись новые термины и определения, новые знания. К. Юнг считал, что коллективное бессознательное имеет значительное влияние на личное бессознательное, что в итоге приводило к формированию собственного я. Данных взглядов и тенденций, слегка изменяя терминологию придерживался и Р. Кеттел. В целом, взаимодействие в социуме, единой группе обладающей и использующей для взаимодействия определенную форму языка и корпус слов, не оставляет сомнений, что так или иначе формирование личности внутри социума происходит под влиянием этого языка. Справедливо заметить, что использование семантических конструкций в связке с психодиагностическими методиками позволит наиболее глубоко проникать в процессы межличностного общения. Практическая значимость таких исследований должна учитываться и всячески способствовать быстрой имплементации в бизнес процессы.