Это один из тех вопросов, которые только на первый взгляд кажутся простыми, а на деле ведут нас в самую гущу лингвистических баталий, философских споров и даже детективных расследований. Представьте себе, что вы пытаетесь сосчитать звезды на небе: можно пересчитать самые яркие, можно зафиксировать те, что видны в телескоп, а можно начать спорить о том, считать ли туманности и далекие галактики отдельными объектами.
Так и здесь. Запрос «сколько слов в русском языке» — это ловушка для наивного реалиста. Потому что ответ зависит не столько от языка, сколько от того, что именно мы решим называть словом.
Попробуем разобраться в этом захватывающем хаосе.
---
Введение: Охота за неуловимым
Представьте себе гигантский айсберг. То, что мы видим над водой — это наша повседневная речь, та самая «активная лексика», которой пользуется большинство. Это около 20–30 тысяч слов. Под водой — огромная глыба теней: диалектизмы, профессиональные жаргоны, устаревшие формы, термины, которые знают лишь специалисты, и, конечно, бесконечное поле новообразований, которые язык порождает каждую минуту.
Когда мы говорим о «количестве слов», мы на самом деле спрашиваем о границах русского мира. И у этих границ нет и не может быть четкой линии. Почему? Потому что язык — это не музейный экспонат с инвентарным списком, а живой, дышащий, мутирующий организм.
---
Основная часть: Пять взглядов на одну бездну
Попробуем рассмотреть эту проблему через призму нескольких ключевых гипотез, каждая из которых по-своему права и по-своему уязвима.
Гипотеза первая: Словарная — «Большой академический подсчет»
Самый очевидный путь — обратиться к авторитетным словарям. Если язык — это дом, то словари — его генеральная опись имущества.
· «За»: Это самая осязаемая цифра. Мы можем взять «Большой академический словарь русского языка» (БАС) в 30 томах. Его издание завершилось в 2015 году, и он фиксирует около 150 000 слов. Если же вспомнить классический «Толковый словарь живого великорусского языка» Владимира Даля, то там собрано около 200 000 слов (хотя Даль включал не только литературную норму, но и огромный пласт диалектов, многие из которых сегодня исчезли или «уснули»).
· «Против»: 150 тысяч — это мгновенный снимок. Но это лишь то, что составители сочли достойным фиксации. Критики этого подхода справедливо замечают: словарь всегда отстает от языка. Слово, которое вчера придумал блогер, попадет в академическое издание только через 10–15 лет, пройдя проверку временем. Кроме того, БАС ориентирован на литературную норму. Куда деваются слова вроде «чепец» (деталь подшипника) в устах инженера или «башли» (деньги) в устах носителя сленга? Они остаются за бортом «официальной описи».
Гипотеза вторая: Корпусная — «Слежка за реальностью»
Лингвисты давно поняли, что словари врут, когда речь идет о реальном использовании языка. На помощь приходит корпусная лингвистика. Национальный корпус русского языка (НКРЯ) — это гигантская база данных текстов (художественных, публицистических, научных, разговорных), где каждое слово подсчитано.
· «За»: НКРЯ дает динамику. Сейчас корпус содержит миллиарды словоупотреблений, а общее количество словоформ (уникальных написаний) в нем перевалило за миллион. Но это уже совсем другая математика. Сюда входят и «карасик», и «карасика», и «карасищем» как разные единицы.
· «Против»: Если мы попытаемся вычесть из этого миллиона все грамматические формы (падежи, спряжения), чтобы получить леммы (словарные единицы), мы снова упремся в субъективность. Что делать с опечатками? С авторскими неологизмами, которые встречаются один раз за всю историю литературы (так называемые «гапаксы»)? У Набокова в «Лолите» есть слово «нимфетка» — оно уже навсегда в языке. А слово «дымнокругло» у Андрея Белого? Это слово или случайная поэтическая аберрация? Корпус фиксирует всё, но не ранжирует это по степени «настоящести».
Гипотеза третья: Профессиональная и территориальная — «Вавилонские башни»
Русский язык — это не монолит. Это созвездие языков. Врач, программист, железнодорожник и рыбак говорят на русском, но их профессиональные языки содержат тысячи слов, которые непонятны остальным.
· «За»: Если сложить всю терминологию всех отраслей знаний, цифра улетит в космос. Например, в «Большом медицинском словаре»» сотни тысяч терминов. Многие из них образованы от греческих и латинских корней, но живут именно в русском контексте («ангиопластика»*, «краниотомия»). То же самое касается диалектов. В архангельских говорах может быть 30 слов для обозначения разных видов мха или состояния снега. Если добавить их к литературной норме, мы легко преодолеем отметку в 400–500 тысяч лексем.
· «Против»: А является ли медицинский термин, которым пользуются 0,001% населения, «словом русского языка» в бытовом смысле? Сторонники «чистоты» подсчета часто отсекают узкую терминологию, заявляя, что это не язык, а «язык для специальных целей». Если мы включим всё, то под одним зонтиком окажутся и древнерусские берестяные грамоты, и современный сленг айтишников, и жаргон уголовного мира. Граница «свой/чужой» становится размытой.
Гипотеза четвертая: Динамическая — «Язык как река»
В русском языке, как и в любом другом, нет паузы. Каждый день появляются новые слова. Интернет и социальные сети стали мощнейшим инкубатором лексики.
· «За»: Мы наблюдаем взрывной рост. Только за последние 10 лет в язык вошли тысячи слов: «зашквар», «кринж», «вайб», «скуф», «понаехавшие» (как существительное), «загуглить». Лингвисты, изучающие интернет-лексику, утверждают, что скорость появления неологизмов такова, что ежегодно прирост составляет десятки тысяч единиц, если учитывать все форумы и паблики. Это похоже на попытку измерить длину береговой линии Британии: чем точнее ваш измерительный прибор (чем больше вы вчитываетесь в чаты), тем длиннее становится линия.
· «Против»: 99% этих новообразований умрут, не успев родиться. Они — однодневки. Включить «плойка» (игровая приставка PlayStation) в словарь можно, но слово «сисяндрий» (придуманное в 2000-х для обозначения хаотичного набора объектов) выжило? Большинство интернет-слов исчезают так же быстро, как мемы. Подсчет «живых» слов требует жесткого критерия: слово должно просуществовать в активном употреблении хотя бы 5–10 лет и выйти за пределы узкой субкультуры.
Гипотеза пятая: Философская — «Мертвые души и бесконечность»
Существует и радикальный взгляд: количество слов в русском языке бесконечно. Потому что правила русского словообразования (приставки, суффиксы) позволяют нам создавать новые слова на ходу.
· «За»: Вспомните приставку «раз-» (или «рас-»). Теоретически, от любого глагола движения можно образовать десятки новых: бежать — разбежаться — разбегаться — разбегиваться... А глаголы с частицей -ся? А степени сравнения? Язык дает нам фабрику. Писатель может сказать «глазища» (большие глаза), а может «глазищищи» (огромные глазищи). В русском языке нет формального ограничения на длину словообразовательной цепочки. Поэтому в грамматиках иногда шутят, что количество слов стремится к бесконечности.
· «Против»: Это софизм. Если мы начнем считать все потенциально возможные слова (которые можно образовать по модели, но которые никто никогда не произносил), мы уйдем в чистую математику, потеряв связь с реальной коммуникацией. «Столоватость» — грамматически корректное слово, но существует ли оно? Лингвистика — наука о речи, а не о логических конструкциях. Поэтому большинство исследователей отказываются учитывать «потенциальные» слова.
---
Синтез и выводы: Где же истина?
Если попытаться подвести итог этой гонке за цифрами, мы окажемся в ситуации, напоминающей суд, где каждый эксперт приводит свою правоту.
Что мы знаем точно?
1. Литературный стандарт. Если мы говорим о ядре языка — том самом русском языке, на котором пишут книги, ведут новости и учат в школе, — его лексикон составляет примерно 130 000 – 200 000 слов. Это зона «Большого академического словаря» и словаря Даля (с поправкой на архаику).
2. Реальное многообразие. Если мы учитываем всю фиксируемую лексику: термины, диалекты, просторечия, сленг, устаревшие слова, а также все, что уже собрано в Национальном корпусе и отраслевых словарях, — мы говорим о диапазоне от 500 000 до 800 000 единиц.
3. Активный запас. Средний носитель языка (даже с высшим образованием) активно использует в речи не более 20 000 – 40 000 слов. Пассивный запас (понимает, но не использует) может достигать 100 000. Это как в айсберге: основная масса остается под водой.
Зоны неизвестного и главный спор
Главная проблема кроется в определении «слово».
· Считать ли разные падежи за одно слово? Лингвисты обычно считают (лемматизация), но для рядового читателя это неочевидно.
· Считать ли сложные термины из 15 букв, которые использует только узкий круг специалистов? Если да, то добавляем сотни тысяч.
· Считать ли неологизмы, которые родились вчера? Если да, то цифра становится подвижной, как песок в бархане.
Если бы сегодня потребовалось назвать одну цифру, которая была бы честной попыткой объять необъятное, исследователи склоняются к 400–450 тысячам слов (включая всю зафиксированную в письменных источниках специальную и диалектную лексику). Но это лишь догадка, потому что нет организации, которая бы профинансировала создание «Словаря всего русского языка», объединив медицинский, технический, кулинарный и арготический лексиконы.
---
Открытый финал: Ваше личное измерение
Итак, мы выяснили, что точного ответа не существует. И это, пожалуй, самое прекрасное свойство языка. Он сопротивляется учету так же, как человеческая мысль сопротивляется попытке измерить ее в гигабайтах.
Вместо заключения я предлагаю вам провести маленький эксперимент. Загляните в толковый словарь Даля. Откройте любую страницу. Вы увидите там слова, которые умерли, слова, которые спят и ждут своего часа, и слова, которые вдруг окажутся невероятно точными для ситуации, в которой вы оказались сегодня.
Если каждый русскоговорящий человек владеет в среднем 30 000 слов, а общее число носителей — около 250 миллионов, то совокупный «языковой капитал» человечества исчисляется миллиардами уникальных связей и смыслов.
А теперь вопрос, который ставит в тупик любого лингвиста: считаются ли те слова, которые вы знаете, но никогда не произносите вслух? Или те, которые уже вышли из употребления, но живут на страницах книг, которые мы читаем? Если мы прибавим к официальному словарю все наши внутренние монологи, сны и черновики, может быть, язык окажется еще огромнее, чем нам кажется?
И последнее: если завтра вы придумаете новое слово, добавит ли это лишнюю единицу к счетчику русского языка? Или она появится там только тогда, когда его услышит и повторит другой человек?
Как вы думаете, сколько слов в вашем личном русском языке?