У каждого человека есть определённый словарный запас. У кого-то он больше, у кого-то меньше. Есть активный словарный запас, слова которого мы используем повседневно, а есть пассивный — это слова, что мы знаем, но обычно не используем, а вспоминаем, только когда услышим или встретим в тексте. И у каждого народа есть такие запасы. И тоже по объёму они разные. Можно ли определить самый «языкастый» народ, то есть тот, в словаре которого больше всего слов?
Данные статистики
Самое интересное, что точных статистических данных о количестве слов даже в самых распространённых языках нет. Можно найти совершенно разные цифры. Например, вот такие данные:
- Английский —1 млн слов
- Китайский — 500 тыс.
- Японский — 232 тыс.
- Испанский —225 тыс.
- Русский —195 тыс.
- Немецкий — 185 тыс.
- Хинди — 120 тыс.
- Французский — 100 тыс.
Откуда взяты такие данные? Явно с потолка, скажете вы. И частично будете правы. Посчитать количество слов,в том или ином языке очень непросто. На самом деле, не ходить же специальным люди по улицам и магазином, чтобы записывать слова. Это несерьёзно. Да и из книг все слова выбирать сложно. Поэтому чаще всего для такой статистики используются словари — вполне официальные документы, где фиксируются новые слова, появившиеся в языке.
Миллион слов в английском языке насчитали сотрудники организации Global Language Monitor, которая была образована специально для фиксации и изучения развития английского языка. В самых авторитетных английских словарях Merriam-Webster и Oxford English Dictionary насчитывается, по разным данным, от 450 000 до 600 000 слов. Разница, как видите, существенная. Но тоже много.
Если обратиться к справочным интернет-порталам, то узнаем, что в 17-томном Большом Академическом словаре русского языка насчитывается 131 257 слов. Но вышел-то последний том этого словаря в 1970 году. И понятно, что он не включает слова, появившиеся за последние 50 лет. А с другой стороны, многие слова исчезают из речи.
Но почему-то упоминание о том, что Большой Академический словарь не единственный, встречается редко. В 1994 году вышло дополненное издание, в котором уже 150 000 слов. С 2004 года идёт активная работа над расширением словаря, и в 2021 году был издан 27 том, а планируется всего 30 томов. И там будет явно не меньше 200 000 слов.
Как подсчитываются слова
В том-то и дело, что не только языки разные, но и считают слова по-разному. Например, в русском языке много словоформ, связанных с падежами, они в словарях не фиксируются. Сложно образованные слова типа "недоперепил" тоже в словари не попадают. Можно ли включать в словарь аббревиатуры, типа CNN или IBM, КПСС? В наших словарях их нет. А сотрудники Global Language Monitor, основанной энтузиастом английского языка Полом Пэяком, фиксируют всё, в том числе технические термины, жаргонизмы, профессиональный сленг. Даже Web 2.0 зафиксировано как отдельное слово. Да, прямо с цифрой, а Web 1.0 – это совсем другое слово.
В списках этой организации не только слова литературного языка, но и разные сленги, жаргонизмы, междометия типа Jai Ho!, заимствованного из хинди. А также национальные варианты английского, то есть слова пиджин-инглиш (смеси с китайским, мексиканским, индийским, корейским и т. д.) Не удивительно, что количество английских слов по версии Global Language Monitor, перевалило за миллион. Кстати, миллионным английским словом могло стать и заимствованное из китайского языка слово chengguan, обозначающее, как пишет Пол Пэяк, класс городских начальников — мэров, шерифов и т. п. Но юбиляром, то есть миллионным словом стал тот самый Web 2.0.
А вот французский язык с его богатой литературой серьёзно отстаёт от английского по той причине, что Академия французского языка (Academie Francais) очень строго следит за тем, чтобы в словари попадали только слова литературного языка без примеси жаргонных и простонародных. Поэтому и насчитывают французские словари 150-200 тыс. слов.
Как считают лингвисты, реальный словарный запас и русского, и английского языка порядка 300 тыс. слов. Но русский словарь можно увеличить за счёт включения специальных терминов, типа, драйвер, штангенциркуль, конъюнкция, гибридизация, солипсизм и т. д. Сюда же добавить профессиональный и молодёжный сленг, криминальный жаргон, модные интернет-словечки. То есть таким образом словарь русского языка вполне можно «раздуть» и до миллиона. Но стоит ли?
Если вы хотите узнать больше об индивидуальном активном и пассивном словарном запасе человека, то почитайте статью на другом моём канале «Словарный запас карман не тянет».