Предыдущий урок: Урок 1. Что такое машинное обучение и зачем оно нужно
В прошлый раз мы разобрались, что такое машинное обучение и как оно “думает”. Мы поняли, что это не магия, а всего лишь способ компьютера находить закономерности в данных.
Сегодня мы переходим от теории к практике. Самое время открыть Python, установить нужные библиотеки и написать первые строчки кода, с которых начинается любой ML-проект.
🎁 Кстати, мы отмечаем 1000 подписчиков на канале и дарим вам скидку 50% на курс по System Design. Промокод: IT_EXTRA1000
Почему Python — лучший язык для машинного обучения
Программисты шутят, что если бы машинное обучение было городом, Python был бы его официальным языком. Он прост, читается почти как английский, и для него существует огромное количество библиотек, облегчающих жизнь:
- numpy — для работы с числами,
- pandas — для таблиц и данных,
- matplotlib — для графиков,
- scikit-learn — для машинного обучения.
Python словно собран специально для тех, кто хочет быстро перейти от идеи к результату. А ещё он отлично подходит новичкам. Здесь не нужно знать алгоритмы в глубину — достаточно уметь немного читать код и не бояться экспериментов. На нашем канале есть подборка Python за 10 уроков!. Смело переходи и изучи этот удивительный язык, который точно тебе еще не раз пригодится.
Устанавливаем Python
Если у тебя ещё нет Python — начни с установки. Перейди на официальный сайт python.org и скачай последнюю стабильную версию (на момент написания — Python 3.14).
Установщик прост: просто следуй инструкциям, но обязательно поставь галочку “Add Python to PATH” — она позволит запускать Python из любой папки.
После установки открой стандартную среду IDLE, которая идёт вместе с Python. Это простое окно, где можно писать код и сразу видеть результат.
IDLE не выглядит модно, но для начала — идеальный вариант: всё под рукой, ничего лишнего. Потом в IDLE выбери File и New File. У тебя откроется документ для написания кода. Результат будет выводиться в IDLE Shell <номер версии>
Проверяем, что всё работает
Чтобы убедиться, что Python установлен правильно, запусти IDLE и набери:
Нажми Enter — и если ты увидишь вывод:
значит, всё отлично. Поздравляю, твой первый шаг в мир программирования и ML сделан!
Немного о структуре будущих программ
Почти каждая программа, связанная с машинным обучением, будет состоять из четырёх шагов:
1. Подготовить данные. Загрузить таблицу, выбрать нужные столбцы, почистить.
2. Выбрать и обучить модель. Например, линейную регрессию или классификатор.
3. Проверить качество. Посмотреть, насколько хорошо модель предсказывает.
4. Сделать предсказание. Применить модель к новым данным.
Сегодня мы подготовим инструменты для всех этих шагов и напишем простую программу, которая с ними познакомит.
Устанавливаем библиотеки для ML
Python сам по себе мощный, но для машинного обучения нужны дополнительные модули.
Напомним, мы будем использовать:
- NumPy — для работы с числами и матрицами;
- Pandas — для таблиц и обработки данных;
- Matplotlib — для визуализации;
- Scikit-learn (sklearn) — для моделей машинного обучения.
Чтобы установить всё это, открой командную строку (на Windows — просто напиши "cmd" в поиске, на macOS набери в поиске "Терминал") и по очереди введи команды:
После установки можно проверить, всё ли работает.
Открой IDLE и попробуй импортировать библиотеки:
Результат:
Если ошибок нет — отлично, ты готов к первому мини-эксперименту.
Наш первый опыт: данные и их визуализация
Чтобы научиться машинному обучению, нужно подружиться с данными. Данные — это как глина, из которой мы лепим модель. Без них алгоритм просто не знает, чему учиться.
Создадим небольшой пример прямо в коде.
Пусть у нас есть список площадей квартир и их цены (пример из прошлого урока, но теперь — практический):
После запуска появится график: точки, аккуратно лежащие на диагонали.
Ты только что сделал свою первую визуализацию данных. Это важный навык, который поможет “увидеть” закономерности, прежде чем строить модели.
Мини-модель: линейная регрессия в действии
Теперь добавим к графику нашу первую модель машинного обучения.
Она будет пытаться найти линию, которая “лучше всего описывает” зависимость между площадью и ценой.
Когда запустишь этот код, появится график с красной линией — это и есть “знание”, которое извлекла модель.
Теперь она может предсказывать цены для новых квартир.
Поздравляю — ты только что обучил свою первую модель машинного обучения!
Что только что произошло
На самом деле ты сделал всё, что делает любой инженер по машинному обучению, только в миниатюре:
- Подготовил данные (X, y);
- Создал модель (LinearRegression());
- Обучил её (fit());
- Сделал предсказание (predict());
- Визуализировал результат (plot()).
Это основа всех будущих проектов, будь то прогноз погоды, распознавание лиц или рекомендации фильмов.
Ты уже понимаешь, как “думает” модель — она ищет зависимости в данных, чтобы потом делать предположения.
Немного философии
Машинное обучение — это не про компьютеры, а про внимание к данным. Модель лишь отражает то, что в них есть. Если данные честные — прогнозы будут точными. Если данные хаотичны — алгоритм запутается.
Так что настоящий навык инженера ML — это умение понимать данные, а не просто вызывать готовые функции.
Что дальше
Теперь у нас всё готово для настоящих экспериментов. На следующем уроке мы научимся работать с реальными данными: загружать их из файлов, чистить, удалять пропуски и подготавливать для моделей.
Ты поймёшь, что умение обращаться с данными — половина успеха в машинном обучении. Мы начнём смотреть на таблицы не как на скучные цифры, а как на истории, которые можно рассказать машине — и она поймёт.
Ставьте лайки 👍, если хотите отдельные серии уроков по библиотекам numpy, pandas, matplotlib 🎉
Следующий урок: Урок 3. Данные — топливо машинного обучения
👍 Ставьте лайки если хотите разбор других интересных тем.
👉 Подписывайся на IT Extra на Дзен чтобы не пропустить следующие статьи
Если вам интересно копать глубже, разбирать реальные кейсы и получать знания, которых нет в открытом доступе — вам в IT Extra Premium.
Что внутри?
✅ Закрытые публикации: Детальные руководства, разборы сложных тем (например, архитектура высоконагруженных систем, глубокий анализ уязвимостей, оптимизация кода, полезные инструменты и объяснения сложных тем простым и понятным языком).
✅ Конкретные инструкции: Пошаговые мануалы, которые вы сможете применить на практике уже сегодня.
✅ Без рекламы и воды: Только суть, только концентрат полезной информации.
✅ Ранний доступ: Читайте новые материалы первыми.
Это — ваш личный доступ к экспертизе, упакованной в понятный формат. Не просто теория, а инструменты для роста.
👉 Переходите на Premium и начните читать то, о чем другие только догадываются.
👇
Понравилась статья? В нашем Telegram-канале ITextra мы каждый день делимся такими же понятными объяснениями, а также свежими новостями и полезными инструментами. Подписывайтесь, чтобы прокачивать свои IT-знания всего за 2 минуты в день!