Найти в Дзене
Вечный джун

Машинное обучение за 3 месяца(ну или не совсем)

0 неделя, 1 неделя, 2 неделя, 3 неделя, 4 неделя, 5 неделя, 6 неделя...

На днях я наткнулся на замечательную статью. В связи с тем, что я увлекаюсь машинным обучением она мне показалась довольно занимательной, ведь 3 месяца это вполне небольшой срок для того чтобы стать «профи в машинном обучении». Пройдёмся по планам на каждый месяц данного курса:

  1. Мат. анализ и матан
  2. Машинное обучение
  3. Глубокое обучение

Темы на месяц очень похожи на темы остальных курсов по данной тематике, помимо того, что обычно в курсы по машинному обучению перед этим самым машинным обучением ставят обработку данных(которая как говорят занимает 90% времени). Или предполагается, что люди и так знают как работать с таблицами через pandas или Siraj Raval(а судя по всему именно он автор этого курса) всегда получал идеально чистые данные которые сразу можно было пускать в бой. Но довольно критики, зачем критиковать курс которых даже не начал проходить (не зря же он на гите собрал(на момент написания этой статьи) целых 6791 звёзд).

Вернёмся к курсу.

Подход с тем, что сначала надо рассмотреть вакансии на рынке труда, понять что больше всего(из навыков) нужно рынку, а потом это изучать, до меня не сразу дошёл во время изучения программирования, бесцельные блуждания и изучение «того что нравится» имели место быть(как скорее всего и у большинства остальных программистов). Пройдёмся по вакансиям на hh. Как правило в них помимо знания языка(ну и естественно опыта работы) требуют знание алгоритмов и библиотек. Ну с алгоритмами понятно, на них месяц, а вот библиотеками не особо о них конечно опоминается, но к сожалению далеко не обо всех, но для начала я думаю и этого будет не мало. Распределение знаний:

35% – линейная алгебра

25% – теория вероятности и математическая статистика

15% – математический анализ

15% – алгоритмы

10% – подготовка данных

Примерное распределение необходимых знаний
Примерное распределение необходимых знаний

Как оказалось зря я гнал на обработку данных, она указана и скорее всего мы уже должны её знать, учтём.

Далее рекомендуют различные каналы которые связанны с тематикой машинного обучения(по желанию), рекомендуют не бросать обучаться(что вроде как должно быть и так понятно) и самое полезное на мой скромный взгляд - совет про cheat sheet(для тех кто как и я не слышал до этого про такую вещь поясню, это сборник материала по теме на паре страницах в основном чтобы вспомнить тему(в простонародье «шпаргалки»)).