Неделя 1 и 2: Основы компьютерных наук 💻
Темы:
Представление данных: Биты и байты, хранение текста и чисел, двоичная система счисления.
система.
Основы компьютерных сетей, IP-адреса, протокол маршрутизации в Интернете.
UDP, TCP, HTTP и Всемирная паутина.
Основы программирования: переменные, строки и числа, условие if, циклы.
Основы алгоритмов
Неделя 3 и 4: Python для начинающих
Темы:
Переменные, числа, строки
Списки, словари, множества, кортежи
Условие If, цикл for
Функции, лямбда-функции
Модули (pip install)
Чтение, запись файлов
Обработка исключений
Классы, объекты
Неделя 5 и 6: Структуры данных и алгоритмы в Python
Темы:
Основы структур данных, нотация Big O
Структуры данных: Массивы, Связанный список, Хеш-таблица, Стек, Очередь
Структуры данных: Дерево, Граф
Алгоритмы: Бинарный поиск, пузырьковая сортировка, быстрая сортировка, сортировка слиянием
Рекурсия
Неделя 7, 8: Продвинутый Python
Темы:
Наследование, генераторы, итераторы
Постижение списков, декораторы
Многопоточность, многопроцессорность
Неделя 9: Контроль версий (Git, Github)
Темы:
Что такое система контроля версий? Что такое Git и GitHub?
Основные команды: add, commit, push.
Ветви, отмена изменений, HEAD, Diff и Merge.
Pull requests.
Неделя 10, 11: SQL
Темы:
Основы реляционных баз данных.
Основные запросы: SELECT, WHERE LIKE, DISTINCT, BETWEEN, GROUP BY, ORDER
BY
Расширенные запросы: CTE, подзапросы, оконные функции
Объединения: Левое, Правое, Внутреннее, Полное
Создание базы данных, индексы, хранимые процедуры.
Неделя 12: Numpy, Pandas, визуализация данных
Технические навыки:
Numpy
Pandas, Matplotlib, Seaborn
Неделя 13, 14, 15, 16: Математика и статистика для ИИ
Темы для изучения:
Основы: Описательная и выводная статистика, непрерывные и дискретные данные,
номинальные и порядковые данные
Линейная алгебра: Векторы, матрицы, собственные значения и собственные векторы
Калькуляция: основы интегрального и дифференциального исчисления
Основные графики: Гистограммы, круговые диаграммы, столбчатые диаграммы, диаграммы рассеяния и т.д.
Меры центральной тенденции: среднее значение, медиана, мода
Меры дисперсии: дисперсия, стандартное отклонение
Основы теории вероятностей
Распределения: Нормальное распределение
Корреляция и ковариация
Центральная предельная теорема
Проверка гипотез: значение p, доверительный интервал, ошибки первого и второго типа,
Z-тест
Неделя 17, 18, 19, 20, 21: Машинное обучение
Машинное обучение: Предварительная обработка
Обработка значений NA, обработка выбросов, нормализация данных
Горячее кодирование, кодирование меток
Разработка признаков
Обучение тестирование разделение
Перекрестная валидация
Машинное обучение: Построение моделей
Типы ОД: контролируемый, неконтролируемый
Контролируемый: Регрессия и классификация
Линейные модели
Линейная регрессия, логистическая регрессия
Градиентный спуск
Нелинейные модели (модели на основе деревьев)Дерево решений
Случайный лес
XGBoost
Оценка моделей
Регрессия: Средняя квадратичная ошибка, Средняя абсолютная ошибка, MAPE
Классификация: Точность, точность-отдача, F1 Score, ROC-кривая,
матрица смешения
Настройка гиперпараметров: GridSearchCV, RandomSearchCV
Неконтролируемые: K-средние, иерархическая кластеризация, снижение размерности
(PCA)
Неделя 22: ML Ops ⚙️
Темы:
o Что такое API? FastAPI для разработки серверов на Python
o Основы DevOps: CI/CD конвейеры, контейнеризация (Docker, Kubernetes)
o Знакомство хотя бы с одной облачной платформой (AWS, Azure и т.д.)
Неделя 23, 24: Проекты машинного обучения с развертыванием
Вам нужно завершить два сквозных ML-проекта. Один по регрессии, другой по
Классификации
Неделя 25, 26, 27: Глубокое обучение
Темы:
Что такое нейронная сеть? Прямое распространение, обратное распространение
Построение многослойного перцептрона
Специальные архитектуры нейронных сетей
Конволюционная нейронная сеть (CNN)
Модели последовательностей: RNN, LSTM
Неделя 28, 29, 30: NLP или компьютерное зрение и GenAI 📃
Многие инженеры по искусственному интеллекту выбирают специализированное направление - NLP или компьютерное зрение.
Не обязательно изучать и то, и другое.
Обработка естественного языка (NLP)
Темы:
Регекс
Представление текста: Векторизатор графов, TF-IDF, BOW, Word2Vec,
Embeddings
Классификация текста: Naïve Bayes
Основы работы с библиотекой Spacy & NLTP
Один законченный проект
Неделя 31, 32: LLM и Langchain 📃
Темы:
Что такое LLM, векторная база данных, вкрапления?
RAG (Retrieval Augmented Generation)
Фреймворк Langchain