При разработке сайтов часто возникает необходимость показывать читателям примерное время, которое потребуется на изучение материала. Это улучшает пользовательский опыт и повышает вовлечённость. Однако стандартные средства PHP для подсчёта слов не всегда корректно работают с многобайтовыми кодировками, такими как кириллица, арабское письмо или иероглифы. В этой статье мы разберём универсальное решение, которое учитывает особенности разных алфавитов и даёт точный результат. Встроенная функция str_word_count() ориентирована на латиницу и опирается на текущую локаль. Даже после установки локали она может неправильно распознавать символы Unicode, особенно если текст содержит смесь языков или специальные знаки. Поэтому для надёжного подсчёта слов в интернациональных проектах лучше использовать регулярные выражения с поддержкой Unicode. Вместо привязки к локали применим шаблон \p{L}, который обозначает любую букву любого языка. Модификатор u включает режим Unicode. Предварительно очистим текс