Новичку в data science стоит начать с изучения (или повторения) математики и программирования. Самые популярные и полезные книги по математике для Data science:
- «Пределы» - небольшой задачник, в котором есть наглядные решения с объяснением теоретических аспектов. Если вы подзабыли что такое производная или предел - лучший выбор.
- «Математический анализ с человеческим лицом» (Пантаев) - лучший выбор, если вы не любите нудные книги. В ней есть не только понятно расписанная математическая теория, но и интересная история математики, которую вы могли не знать.
- «Calculus Early Transcendentals» 10-е издание - учебник для первых курсов университетов, без лишней лирики рассказывающий весь необходимый материал по высшей математике от азов до сложных концептов и теорем.
- «Матричный анализ и линейная алгебра» - книга Евгения Тыртышникова, ученого с мировым именем, преподающего в МГУ и МФТИ. Что удивительно для книги такого уровня, она читается легко.
Важно знать статистику и теорию вероятности. В них не нужно углубляться, хватит «Голой статистики» в качестве ликбеза по статистике и «Введения в теорию вероятностей» (Колмогоров, Журбенко, Прохоров).
Для изучения программирования подойдет «A byte of Python» - лучшее пособие для новичков. Любой новичок найдет для себя полезной «Машинное обучение без лишних слов», написанную Андреем Бурковым. Ее хвалят многие зарубежные и отечественные эксперты.
Если вы новичок, но уже немного разбираетесь в data science, то не время останавливаться. Нужно постоянно следить за новинками. Обычно все прорывные работы публикуются на arXiv, также можно следить за блогами “локомотивов Data Science” таких как Google, IBM, Яндекс.
Кроме книг новичкам могут помочь курсы по Data Science из нашего каталога. Это - отличный выход для тех, кто лучше воспринимает информацию из видео, а не из текста.