Евгения Онегина подробно изучал русский математик Андрей Андреевич Марков. Интересовался он, правда, романом в стихах на уровне букв – изучал чередование гласных и согласных. В начале 1913 года он представил результаты своей работы в докладе Петербургской Академии наук. И рассказывал он не об изяществе пушкинского слога, а о новом подходе к случайным величинам – к тому, что мы сейчас называем марковскими цепями.
До этого предметом изучения теории вероятностей были последовательности независимых событий – таких как бросание монеты. Упадет она орлом или решкой, никак не зависит от того, каким был результат предыдущего бросания.
Марков изучал последовательности событий, каждое из которых было связано с предыдущим. Так, например, после гласной буквы в тексте скорее встретится согласная, чем гласная. И не потому, что согласных просто больше, чем гласных. Дело в том, что пары гласная-гласная встречаются гораздо реже, чем гласная-согласная. (Можно проверить прямо в этой статье.)
Интересна история этого открытия.
Надо сказать, характером Андрей Андреевич Марков был ершист и непокладист. Если мог поднять свой профессорский голос против чего-нибудь, то непременно поднимал. Когда Льва Толстого отлучили от церкви, Марков потребовал, чтобы и его заодно тоже отлучили. Церковное начальство потянуло резину, надеясь, что рассосется, но потом согласилось. Когда царь запретил избрать Максима Горького в академики, Марков объявил, что откажется от всех будущих царских наград. (Но из Академии не вышел.) А во время празднования 300-летия дома Романовых организовал празднование совсем другого события – 200-летия закона больших чисел.
А если речь шла не о царской фамилии, а собрате-математике, Марков себя и вовсе не стеснял. Особенно известно противостояние с Павлом Алексеевичем Некрасовым, тоже специалистом по теории вероятностей, ректором МГУ и одно время президентом московского математического общества. Некрасов начинал свое обучение в семинарии, и можно сказать, что конфликт был не только математическим, но еще и идеологическим: безбожник-либерал Марков против клерикала- монархиста Некрасова.
В одной из своих работ Некрасов доказывал, что для выполнения закона больших чисел требуется, чтобы он применялся только к независимым случайным величинам. Марков же считал, что требование независимости излишне. Чтобы посрамить своего оппонента, он должен был доказать это строго.
Закон больших чисел в простейшем виде говорит нам, что частота события стремится к его вероятности (на самом деле форм закона больших чисел много разных). Например, если мы будем бросать симметричную монетку, то частота гербов, как и частота решек, стремится к 1/2 с ростом числа бросаний. при этом результаты бросаний не зависят друг от друга: монетка не помнит, как она падала раньше.
Марков собрался показать, что и зависимые случайные величины при некоторых условиях подчиняются закону больших чисел. Начал Марков с простейшего примера – монетки с очень очень короткой памятью: она помнит результат одного предыдущего бросания. У этой монетки две стороны 1 и 2; когда её подбрасывают, она падает не как попало. Скажем, после 1 выпадает 2 с вероятностью π₁₂ или опять 1 с дополнительной вероятностью π₁₁=1-π₁₂. Тогда, как доказал Марков, рано или поздно монетка достигнет стабильных частот для 1 и 2 -- вне зависимости от начальных данных.
Модель марковской цепи часто используют для различных прогнозов, от погоды до продаж. В лингвистике их применяют для определения авторства текста. А Ларри Пейдж и Сергей Брин с использованием марковской цепи построили алгоритм PageRank для гугла в 1998 году.