1 год назад
4 аспекта, упущенных в большинстве программ по науке о данных.
Источник: Nuances of Programming Возможно, вы слышали или сталкивались с правилом 80/20 в науке о данных: Лишь 20% времени дата-сайентистов уходит на анализ данных. Большая часть времени  —  80%  —  тратится на подготовку данных. Думаю, в моем случае это соотношение составляет 90/10. Таковы реалии моей работы  —  мы имеем дело с очень сложными массивами данных. Однако большинство программ, тренингов и курсов по науке о данных готовят совсем не к этому. Скорее всего, вы учились использовать сложные прогностические модели, группировать неструктурированные данные и анализировать временные ряды...
610 читали · 2 года назад
Полное собрание шпаргалок по машинному обучению, статистике, Python и R — часть 1
Коллекция шпаргалок, которые помогут вам подготовиться к техническому собеседованию, тестам, презентациям по ds и помогут вам изучить основные концепции науки о данных. Данные шпаргалки помогут вам изучить концепции статистики, синтаксиса языков программирования, инструменты анализа данных и алгоритмы машинного обучения. Они также могут помочь вам пройти технические собеседования и решить мл тесты . Я использую эти шпаргалки для подготовки к техническим собеседованиям, поскольку рекрутеры хотят оценить знания предмета и понимание плгоритмов...