Прогуливаясь по просторам интернета, я тут обнаружил одно занимательное исследование (ссылка) американских ученых из Рочестерского университета, которые посчитали, что английский язык занимает примерно 1,5 мегабайта памяти в мозге носителя языка. Мне стало интересно, а сколько занимает места русский язык. Я вооружился калькулятором и на основе их расчетов сделал свой. Хочу теперь этим с вами поделиться.
В этой статье я для начала расскажу вам, как они это считали для английского языка, опустив все формулы. А потом покажу свой результат для русского языка.
Результаты исследования про английский язык.
По мнению ученых, которые провели это исследование, место занимаемое языком в нашем мозге можно поделить на 5 сегментов: фонемы (звуки), словоформы, лексические значения, частота слов и синтаксис. Давайте посмотрим, что это все значит и сколько это занимает места.
Фонемы. Тут все просто. Они посчитали количество звуков в английском языке и умножили на количество битов, необходимых для каждого звука. В английском языке 50 фонем, каждая занимает по 15 битов. Итого 750 бит на звуки.
Словоформы. Под этим пунктом ученые подразумевают то, сколько слов может распознать человек. При этом, разные формы слова считаются за одно. Они вывели, что в среднем на одно слово требуется 10 бит места, а среднестатистический американец знает 40000 слов. Итого: 400000 бит требуется на словоформы.
Лексические значения. Этот сегмент занимает наибольшее место, так как он отвечает за то, как некое слово превращается в образ. Тут ученые подсчитали, что на каждый образ приходится около 300 различных характеристик, которые наш мозг обрабатывает, чтобы составить образ. Каждая характеристика занимает один бит. А значит лексическое значение одного слова занимает около 300 бит. 40000 слов на 300 бит получается 12000000 бит на лексические значения.
Частота слов. Эта характеристика определяет в мозгу как часто надо использовать то или иное слово. Она помогает доставать редко используемые слова только нужный момент и не копаться в них когда не надо. Ученые предположили, что мозг делит частоту слов на 4 категории, что значит по 2 бита на слова. Итого 80000 бит на частоту слов.
Синтаксис. Чтобы слова вставали в предложения нужен синтаксис. И сюда входит и порядок слов в предложении, и всевозможные формы слов. В этой части довольно сложные расчеты, поэтому просто скажу, что на синтаксис в английском языке уходит всего 697 бита.
Итого, сложив все эти расчеты, мы получаем, что английский язык занимает в голове носителя языка 12, 481, 447 бит информации или примерно 1,5 Мегабайта, что сопоставимо с весом одной песни на телефоне.
А сколько занимает русский язык?
На основе расчетов американских исследователей, я провел такие же расчеты для русского языка. Давайте посмотрим, что получилось.
Фонемы. В русском языке мы используем 42 фонемы. 42 фонемы по 15 битов, получаем 630 битов на звуки.
Словоформы. Согласно данным российской газеты, среднестатистический россиянин имеет словарный запас в 32 тысячи слов. На одно слово - 10 бит, итого 320000 бит на словоформы.
Лексические значения. Не думаю, что наш русский мозг обрабатывает больше или меньше характеристик объектов, чем американский. Поэтому возьмем всё то же число 300 бит на слово. Получим 9600000 бит на лексические значения.
Частота слов. Все те же 2 бита на частоту каждого слова даст нам 64000 бит на частоту слов.
Синтаксис. А вот тут все сложнее. Русский синтаксис намного сложнее, чем английский. Все таки, в русском языке на каждое слово приходится около 12 форм. Порядок слов в предложении может менять смысл. И многое другое. Но так или иначе, в русском языке выделяется около 3725 бит под синтаксис.
Итого, сложив все эти числа, мы получаем, что русский язык занимает 9988355 бита в мозге русского человека или примерно 1,2 Мегабайта.
И что? Русский занимает меньше места, чем английский?
По расчетам получается, что да. Но такая разница получилась лишь из-за того, что по подсчетам русских у русских словарный запас меньше, чем у американцев по расчетам американцев. Если сравнять эти два показателя, то разница между занимаемым местом русским и английским языком окажется несущественной. А результат в 1,5 Мегабайта можно будет считать универсальным для большинства языков развитых стран.
Остались вопросы? Напишите их в комментариях, я обязательно на все отвечу. А еще вы можете почитать про то, зачем придумывают искусственные языки.
Если вам понравилось, не забудьте поставить лайк и подписаться на канал. Помните, что для Вас это один клик, а для автора это плюс к развитию канала и мотивация писать больше и интереснее.
Спасибо за прочтение!
С уважением,
SonoRusso