На первый взгляд, у языков R и Python много общего: два языка с открытым исходным кодом, появившиеся на свет в ранних 90-х и обладающие широкими возможностями для решения задач data science.
Ключевое различие: R был разработан специально для статистического анализа — довольно продолжительное время все аналитики использовали его; Python изначально задумывался как универсальный язык программирования и бешеную популярность среди дата-сайентистов приобрёл только в последние годы.
Разумеется, нет никакого универсального «правильного» языка для начинающих аналитиков: всё зависит от ваших целей, планов и исходных данных.
Python или R: с чего лучше начать?
● В теории R позволяет решать сложные статистические задачи в несколько строчек кода — но, само собой, для этого в нём нужно основательно разобраться. Относительно айтишников-новичков здесь есть две проблемы.
Во-первых, нехватка методических материалов. Во-вторых, слишком узкая направленность: если в процессе освоения R вы разочаруетесь в аналитике, накопленные знания едва ли получится перенести на смежные сферы.
● А вот Python, наоборот, известен довольно низким порогом вхождения и считается чуть ли не лучшим другом начинающего программиста: и из-за лёгкого синтаксиса, и из-за огромного количества мануалов. Бонус: если data science надоест, язык точно пригодится в других отраслях IT.
Для каких задач подходят R и Python?Какие задачи вы собираетесь решать?
● R может похвастаться изобилием встроенных функций и пакетов, заточенных под глубокие статистические исследования. А ещё он идеально подходит для визуализаций.
● Python рассчитан на более общий подход: здесь куда больше возможностей для интеграции, например, с веб-приложениями, но пока меньше специализированных инструментов для работы с данными. Правда, ситуация скоро может измениться: новые библиотеки появляются постоянно.
В какой среде вы планируете работать?
● R востребован в академической статистике. Преимущественно на нём пишут учёные и инженеры — часто далёкие от программирования люди. Синтаксис R и правила написания кода, принятые в комьюнити, местами непривычны для айтишников.
● Python, напротив, язык утилитарный. Можно сказать, на сегодняшний день это стандарт индустрии. Надо оговориться, что речь преимущественно о России: за рубежом позиции R в области прикладного анализа куда крепче. Учитывайте это, если смотрите в сторону западных рынков.
P.S. На своих курсах мы преимущественно готовим людей к быстрому старту карьеры в анализе данных для бизнеса — поэтому выбираем Python. Ведь если вы хоть раз изучали вакансии на любой российской бирже, то знаете, что в подавляющем большинстве случаев от дата-сайентистов ждут навыков работы именно с ним.