Найти в Дзене
SoDeepData

AI Road Map 2024 (Full Guide) by weeks | Путь к инженеру ИИ 2024.

Оглавление
So Deep Data

Неделя 1 и 2: Основы компьютерных наук 💻

Темы:

Представление данных: Биты и байты, хранение текста и чисел, двоичная система счисления.

система.

Основы компьютерных сетей, IP-адреса, протокол маршрутизации в Интернете.

UDP, TCP, HTTP и Всемирная паутина.

Основы программирования: переменные, строки и числа, условие if, циклы.

Основы алгоритмов

Неделя 3 и 4: Python для начинающих

Темы:

Переменные, числа, строки

Списки, словари, множества, кортежи

Условие If, цикл for

Функции, лямбда-функции

Модули (pip install)

Чтение, запись файлов

Обработка исключений

Классы, объекты

Неделя 5 и 6: Структуры данных и алгоритмы в Python

Темы:

Основы структур данных, нотация Big O

Структуры данных: Массивы, Связанный список, Хеш-таблица, Стек, Очередь

Структуры данных: Дерево, Граф

Алгоритмы: Бинарный поиск, пузырьковая сортировка, быстрая сортировка, сортировка слиянием

Рекурсия

Неделя 7, 8: Продвинутый Python

Темы:

Наследование, генераторы, итераторы

Постижение списков, декораторы

Многопоточность, многопроцессорность

Неделя 9: Контроль версий (Git, Github)

Темы:

Что такое система контроля версий? Что такое Git и GitHub?

Основные команды: add, commit, push.

Ветви, отмена изменений, HEAD, Diff и Merge.

Pull requests.

Неделя 10, 11: SQL

Темы:

Основы реляционных баз данных.

Основные запросы: SELECT, WHERE LIKE, DISTINCT, BETWEEN, GROUP BY, ORDER

BY

Расширенные запросы: CTE, подзапросы, оконные функции

Объединения: Левое, Правое, Внутреннее, Полное

Создание базы данных, индексы, хранимые процедуры.

Неделя 12: Numpy, Pandas, визуализация данных

Технические навыки:

Numpy

Pandas, Matplotlib, Seaborn

Неделя 13, 14, 15, 16: Математика и статистика для ИИ

Темы для изучения:

Основы: Описательная и выводная статистика, непрерывные и дискретные данные,

номинальные и порядковые данные

Линейная алгебра: Векторы, матрицы, собственные значения и собственные векторы

Калькуляция: основы интегрального и дифференциального исчисления

Основные графики: Гистограммы, круговые диаграммы, столбчатые диаграммы, диаграммы рассеяния и т.д.

Меры центральной тенденции: среднее значение, медиана, мода

Меры дисперсии: дисперсия, стандартное отклонение

Основы теории вероятностей

Распределения: Нормальное распределение

Корреляция и ковариация

Центральная предельная теорема

Проверка гипотез: значение p, доверительный интервал, ошибки первого и второго типа,

Z-тест

Неделя 17, 18, 19, 20, 21: Машинное обучение

Машинное обучение: Предварительная обработка

Обработка значений NA, обработка выбросов, нормализация данных

Горячее кодирование, кодирование меток

Разработка признаков

Обучение тестирование разделение

Перекрестная валидация

Машинное обучение: Построение моделей

Типы ОД: контролируемый, неконтролируемый

Контролируемый: Регрессия и классификация

Линейные модели

Линейная регрессия, логистическая регрессия

Градиентный спуск

Нелинейные модели (модели на основе деревьев)Дерево решений

Случайный лес

XGBoost

Оценка моделей

Регрессия: Средняя квадратичная ошибка, Средняя абсолютная ошибка, MAPE

Классификация: Точность, точность-отдача, F1 Score, ROC-кривая,

матрица смешения

Настройка гиперпараметров: GridSearchCV, RandomSearchCV

Неконтролируемые: K-средние, иерархическая кластеризация, снижение размерности

(PCA)

Неделя 22: ML Ops ⚙️

Темы:

o Что такое API? FastAPI для разработки серверов на Python

o Основы DevOps: CI/CD конвейеры, контейнеризация (Docker, Kubernetes)

o Знакомство хотя бы с одной облачной платформой (AWS, Azure и т.д.)

Неделя 23, 24: Проекты машинного обучения с развертыванием

Вам нужно завершить два сквозных ML-проекта. Один по регрессии, другой по

Классификации

Неделя 25, 26, 27: Глубокое обучение

Темы:

Что такое нейронная сеть? Прямое распространение, обратное распространение

Построение многослойного перцептрона

Специальные архитектуры нейронных сетей

Конволюционная нейронная сеть (CNN)

Модели последовательностей: RNN, LSTM

Неделя 28, 29, 30: NLP или компьютерное зрение и GenAI 📃

Многие инженеры по искусственному интеллекту выбирают специализированное направление - NLP или компьютерное зрение.

Не обязательно изучать и то, и другое.

Обработка естественного языка (NLP)

Темы:

Регекс

Представление текста: Векторизатор графов, TF-IDF, BOW, Word2Vec,

Embeddings

Классификация текста: Naïve Bayes

Основы работы с библиотекой Spacy & NLTP

Один законченный проект

Неделя 31, 32: LLM и Langchain 📃

Темы:

Что такое LLM, векторная база данных, вкрапления?

RAG (Retrieval Augmented Generation)

Фреймворк Langchain

https://t.me/sodeepdata