Давно на канале не было околоязыковых статей. Пришло время уделить этой теме немного внимания.
На картах, представленных ниже, отображены самые распространённые униграммы, биграммы и триграммы в крупнейших европейских языках. Частота встречаемости вычислялась по текстам Википедии.
самые часто втречаемые в основных языках буквы
На основе этой статистики можно сделать несколько ключевых выводов.
Наиболее часто встречаемые в европейских словах буквы - гласные. Европа делится на три основных дивизиона. Самый крупный представлен странами, в чьих языках чаще всего можно встретить букву "e". Во втором по численности дивизионе предпочтение отдаётся букве "a". В третьей группе, к которой принадлежит и русский в почёте буква "o".
Исключение составляет лишь литовский язык, он со своей популярной буквой "i", находится в одиночестве.
Можно заметить, что германские и романские языки более солидарны, чем славянские. Удивительно, но в крайне родственном русскому и украинскому языкам белорусском чаще можно встретить букву "a", но не "о". Действительно, многие известные нам слова здесь пишутся иначе, например, русское "молоко" в белорусском языке будет выглядеть как "малако", "олово" как "волава", а "болото" как "балота" и таких примеров множество.
наиболее расространённая в языке последовательность из двух букв
Здесь тоже можно объединить языки на кое-какие группы, но разнообразие биграмм куда шире. Как правило, сочетания представляют из себя две разные фонемы, но встречются и диграфы, как английское "th".
Компанию русскому языку на этот раз составил чешский и эстонский. Но если в первом случае это можно объяснить родством языков, то во втором - просто совпадение.
Интересен валлийский язык, где самая распространённая пара образована двумя согласными "dd". Кельтские языки вообще известны своей любовью к длинным сочетаниям из согласных и даже словам полностью из них состоящим.
самые частые триграммы
В этом случае, обособленная группа всего одна, её образуют несколько романских языков, где чаще всего в словах присутствует триграмма "ent". Например, самым популярным французским словом имеющим в себе такое сочетание является "entre" - между, а испанским - слово "entonces" - то, тогда.
У славян триграммы, как правило, являются составными частями слов, а в германских языках самые частотные представлены артиклями и предлогами.
Наиболее частые символы и сочетания в русском языке
Как видно, наиболее распространённые в европейских языках буквы "о", "а" и "е" стоят на первых трёх позициях и в русском.
--------
Не забывайте нажимать кнопку "нравится", если материал был интересен.