Найти в Дзене
IT Еxtra

Урок 2. Настраиваем инструменты и обучаем первую модель

Предыдущий урок: Урок 1. Что такое машинное обучение и зачем оно нужно В прошлый раз мы разобрались, что такое машинное обучение и как оно “думает”. Мы поняли, что это не магия, а всего лишь способ компьютера находить закономерности в данных. Сегодня мы переходим от теории к практике. Самое время открыть Python, установить нужные библиотеки и написать первые строчки кода, с которых начинается любой ML-проект. 🎁 Кстати, мы отмечаем 1000 подписчиков на канале и дарим вам скидку 50% на курс по System Design. Промокод: IT_EXTRA1000 Почему Python — лучший язык для машинного обучения Программисты шутят, что если бы машинное обучение было городом, Python был бы его официальным языком. Он прост, читается почти как английский, и для него существует огромное количество библиотек, облегчающих жизнь: numpy — для работы с числами, pandas — для таблиц и данных, matplotlib — для графиков, scikit-learn — для машинного обучения. Python словно собран специально для тех, кто хочет быстро перейти от иде
Оглавление

Предыдущий урок: Урок 1. Что такое машинное обучение и зачем оно нужно

В прошлый раз мы разобрались, что такое машинное обучение и как оно “думает”. Мы поняли, что это не магия, а всего лишь способ компьютера находить закономерности в данных.

Сегодня мы переходим от теории к практике. Самое время открыть Python, установить нужные библиотеки и написать первые строчки кода, с которых начинается любой ML-проект.

🎁 Кстати, мы отмечаем 1000 подписчиков на канале и дарим вам скидку 50% на курс по System Design. Промокод: IT_EXTRA1000

Почему Python — лучший язык для машинного обучения

Программисты шутят, что если бы машинное обучение было городом, Python был бы его официальным языком. Он прост, читается почти как английский, и для него существует огромное количество библиотек, облегчающих жизнь:

  • numpy — для работы с числами,
  • pandas — для таблиц и данных,
  • matplotlib — для графиков,
  • scikit-learn — для машинного обучения.

Python словно собран специально для тех, кто хочет быстро перейти от идеи к результату. А ещё он отлично подходит новичкам. Здесь не нужно знать алгоритмы в глубину — достаточно уметь немного читать код и не бояться экспериментов. На нашем канале есть подборка Python за 10 уроков!. Смело переходи и изучи этот удивительный язык, который точно тебе еще не раз пригодится.

-2

Устанавливаем Python

Если у тебя ещё нет Python — начни с установки. Перейди на официальный сайт python.org и скачай последнюю стабильную версию (на момент написания — Python 3.14).

Установщик прост: просто следуй инструкциям, но обязательно поставь галочку “Add Python to PATH” — она позволит запускать Python из любой папки.

После установки открой стандартную среду IDLE, которая идёт вместе с Python. Это простое окно, где можно писать код и сразу видеть результат.

IDLE не выглядит модно, но для начала — идеальный вариант: всё под рукой, ничего лишнего. Потом в IDLE выбери File и New File. У тебя откроется документ для написания кода. Результат будет выводиться в IDLE Shell <номер версии>

-3

Проверяем, что всё работает

Чтобы убедиться, что Python установлен правильно, запусти IDLE и набери:

-4

Нажми Enter — и если ты увидишь вывод:

-5

значит, всё отлично. Поздравляю, твой первый шаг в мир программирования и ML сделан!

IT Extra

Немного о структуре будущих программ

Почти каждая программа, связанная с машинным обучением, будет состоять из четырёх шагов:

1. Подготовить данные. Загрузить таблицу, выбрать нужные столбцы, почистить.

2. Выбрать и обучить модель. Например, линейную регрессию или классификатор.

3. Проверить качество. Посмотреть, насколько хорошо модель предсказывает.

4. Сделать предсказание. Применить модель к новым данным.

Сегодня мы подготовим инструменты для всех этих шагов и напишем простую программу, которая с ними познакомит.

Устанавливаем библиотеки для ML

Python сам по себе мощный, но для машинного обучения нужны дополнительные модули.

Напомним, мы будем использовать:

  • NumPy — для работы с числами и матрицами;
  • Pandas — для таблиц и обработки данных;
  • Matplotlib — для визуализации;
  • Scikit-learn (sklearn) — для моделей машинного обучения.

Чтобы установить всё это, открой командную строку (на Windows — просто напиши "cmd" в поиске, на macOS набери в поиске "Терминал") и по очереди введи команды:

-6

После установки можно проверить, всё ли работает.

Открой IDLE и попробуй импортировать библиотеки:

-7

Результат:

-8

Если ошибок нет — отлично, ты готов к первому мини-эксперименту.

Наш первый опыт: данные и их визуализация

Чтобы научиться машинному обучению, нужно подружиться с данными. Данные — это как глина, из которой мы лепим модель. Без них алгоритм просто не знает, чему учиться.

Создадим небольшой пример прямо в коде.

Пусть у нас есть список площадей квартир и их цены (пример из прошлого урока, но теперь — практический):

-9

После запуска появится график: точки, аккуратно лежащие на диагонали.

-10

Ты только что сделал свою первую визуализацию данных. Это важный навык, который поможет “увидеть” закономерности, прежде чем строить модели.

Мини-модель: линейная регрессия в действии

Теперь добавим к графику нашу первую модель машинного обучения.

Она будет пытаться найти линию, которая “лучше всего описывает” зависимость между площадью и ценой.

-11

Когда запустишь этот код, появится график с красной линией — это и есть “знание”, которое извлекла модель.

-12
-13

Теперь она может предсказывать цены для новых квартир.

Поздравляю — ты только что обучил свою первую модель машинного обучения!

Что только что произошло

На самом деле ты сделал всё, что делает любой инженер по машинному обучению, только в миниатюре:

  • Подготовил данные (X, y);
  • Создал модель (LinearRegression());
  • Обучил её (fit());
  • Сделал предсказание (predict());
  • Визуализировал результат (plot()).

Это основа всех будущих проектов, будь то прогноз погоды, распознавание лиц или рекомендации фильмов.

Ты уже понимаешь, как “думает” модель — она ищет зависимости в данных, чтобы потом делать предположения.

Немного философии

Машинное обучение — это не про компьютеры, а про внимание к данным. Модель лишь отражает то, что в них есть. Если данные честные — прогнозы будут точными. Если данные хаотичны — алгоритм запутается.

Так что настоящий навык инженера ML — это умение понимать данные, а не просто вызывать готовые функции.

Что дальше

Теперь у нас всё готово для настоящих экспериментов. На следующем уроке мы научимся работать с реальными данными: загружать их из файлов, чистить, удалять пропуски и подготавливать для моделей.

Ты поймёшь, что умение обращаться с данными — половина успеха в машинном обучении. Мы начнём смотреть на таблицы не как на скучные цифры, а как на истории, которые можно рассказать машине — и она поймёт.

Ставьте лайки 👍, если хотите отдельные серии уроков по библиотекам numpy, pandas, matplotlib 🎉

Следующий урок: Урок 3. Данные — топливо машинного обучения

👍 Ставьте лайки если хотите разбор других интересных тем.

👉 Подписывайся на IT Extra на Дзен чтобы не пропустить следующие статьи

Если вам интересно копать глубже, разбирать реальные кейсы и получать знания, которых нет в открытом доступе — вам в IT Extra Premium.

Что внутри?
Закрытые публикации: Детальные руководства, разборы сложных тем (например, архитектура высоконагруженных систем, глубокий анализ уязвимостей, оптимизация кода, полезные инструменты и объяснения сложных тем простым и понятным языком).
Конкретные инструкции: Пошаговые мануалы, которые вы сможете применить на практике уже сегодня.
Без рекламы и воды: Только суть, только концентрат полезной информации.
Ранний доступ: Читайте новые материалы первыми.

Это — ваш личный доступ к экспертизе, упакованной в понятный формат. Не просто теория, а инструменты для роста.

👉 Переходите на Premium и начните читать то, о чем другие только догадываются.

👇
Понравилась статья? В нашем Telegram-канале ITextra мы каждый день делимся такими же понятными объяснениями, а также свежими новостями и полезными инструментами. Подписывайтесь, чтобы прокачивать свои IT-знания всего за 2 минуты в день!

IT Extra