Ежедневно статистика анализирует массу сведений, ранжирует данные, составляет графики тех или иных событий. В Интернете на сайтах аналитических организаций можно найти любую статистику, вплоть до ответа на вопрос, например, сколько моцареллы приходится на душу населения в разных странах, или каково число некоммерческих запусков космических аппаратов в мире.
В России также постоянно ведется статистика: учитывается число туристов, выехавших за рубеж, молочные ресурсы и использование молока и другие жизненно важные показатели.
С помощью статистики уже определены самые популярные слова, которые можно встретить на страницах прессы. Так, портал «Словари XXI века» выяснил, что в 2018 г. чаще всего употреблялись слова «пенсионный», «мундиаль» и «highly likely», что переводится с английского, как «крайне вероятно».
Слово «пенсионный» замелькало в прессе после внесения изменений в пенсионное законодательство, которое задело интересы большей части россиян. После старта чемпионата мира по футболу 2018 г. в разговорную русскую речь попало слово «мундиаль». Выражение «хайли лайкли» получило широкое распространение после отравления в Солсбери, когда премьер-министр Великобритании Тереза Мей, комментируя ситуацию, выразилась, что Москва «крайне вероятно» причастна к убийству Сергея Скрипаля и его дочери.
Наряду с остальными исследованиями, можно встретить статистику самых употребляемых слов в русском языке. Исследователи отобрали множество отрывков, состоящих из 1 000 000 слов, из различных по тематике текстов и проанализировали их. В результате они получили рейтинг из 5 000 самых часто употребляемых слов, при этом анализ проводился в разное время несколькими группами. Если бы иностранец знал эти 5 000 слов, он бы понял 80 % всех российских текстов.
Итак, средняя длина современного русского слова составляет 5,28 буквы, предложения — 10,38 слова.
Для ознакомления с частотой употребления из разных источников отобрано по 20 самых популярных слов.
Издательство «Раутледж» в 2013 г. опубликовало следующий список:
Специалисты «Национального корпуса русского языка» в 2009 г. обнародовали следующий результат:
Видно, что чаще употребляются вспомогательные части речи, которые используются для связки слов, и самостоятельная часть речи местоимение, которая позволяет избежать тавтологии и сумбура в тексте. Самое часто употребляемое существительное в одном из рейтингов стоит лишь на 35 месте, и это слово — «человек». Согласно статистике, первые 100 слов из списка заполняют текстовое полотно на 37 % .