Найти в Дзене
CodeLab

Как Работает Искусственный Интеллект: От Простой Линейной Регрессии до Сложных Языковых Моделей

Друзья, привет! ИИ уже успел достаточно нашуметь — о нейросетях сейчас знают и в научной среде, и в бизнесе, даже мамочки не заморачиваются со сказками на ночь, за них все придумает ChatGPT. И вы, я уверен, слышали о глубоких нейронных сетях и глубоком обучении. Сейчас мы попробуем понять, для кого и для чего это все нужно. А начнем мы с диаграммы. После прочтения данной статьи, она вам станет очень даже понятна. На ней выделено три основные области, которые являются основой работы с данными и построения моделей машинного обучения: Машина использует алгоритмы для анализа данных и извлечения из них полезных закономерностей. Это направление включает: Кластеризацию (разделение данных на группы), ассоциативные правила (например, "если человек купил продукт A, он купит продукт B"), аномальный анализ (поиск редких и необычных событий в данных). Вот вам пример: в большом наборе транзакций банка выделяются подозрительные операции для проверки на мошенничество. Подписывайтесь на мой телегам-ка

Друзья, привет! ИИ уже успел достаточно нашуметь — о нейросетях сейчас знают и в научной среде, и в бизнесе, даже мамочки не заморачиваются со сказками на ночь, за них все придумает ChatGPT. И вы, я уверен, слышали о глубоких нейронных сетях и глубоком обучении. Сейчас мы попробуем понять, для кого и для чего это все нужно.

-2

А начнем мы с диаграммы. После прочтения данной статьи, она вам станет очень даже понятна. На ней выделено три основные области, которые являются основой работы с данными и построения моделей машинного обучения:

  1. Основа любого проект это данные. Пусть это и сырая информация, но это информация, а это как раз то, что нам и нужно, чтобы обучить модель. Примеры данных есть самые разные: это могут быть числовые данные (цены на жилье, мы как раз разбираем подобные задачи в телеграмм канале https://t.me/pywithCodeLab), текстовые данные (комментарии под видео), изображения, видео и много другое. Большие компании собирают данные по-разному. Вспомним ReCaptcha, где нам нужно было отмечать светофоры и гидранты, чем вам не размеченные данные?)
  2. Далее, мы подходим к такой области как Features — это преобразованные данные (признаки), которые будут переданы в алгоритм. Возьмем пример с моего телеграмм канала. В нашей задаче, если мы хотим предсказать цену на жилье, в роли признаков выступает число комнат для дома, возраст дома, плотность населения, географическое положение и т.д. Обе эти области образуют такую науку, как Data Science. Это набор конкретных дисциплин из разных направлений, отвечающих за анализ данных и поиск оптимальных решений на их основе. Раньше этим занималась только математическая статистика, затем начали использовать машинное обучение и искусственный интеллект.
  3. Что касается алгоритмов? Алгоритмы — это математические и вычислительные методы, которые используют данные и признаки для обучения модели. Они отвечают за выявление закономерностей и создание предсказательной способности. Примеров тому куча: любимые рекомендации на всех существующих платформах, независимо от того, что мы ищем: машину, фильм или любимый трек. Что насчет Data Mining?

Машина использует алгоритмы для анализа данных и извлечения из них полезных закономерностей. Это направление включает: Кластеризацию (разделение данных на группы), ассоциативные правила (например, "если человек купил продукт A, он купит продукт B"), аномальный анализ (поиск редких и необычных событий в данных). Вот вам пример: в большом наборе транзакций банка выделяются подозрительные операции для проверки на мошенничество.

-3
  • Искусственный интеллект — название всей области, как биология или химия.
  • Машинное обучение — это раздел искусственного интеллекта. Важный, но не единственный.
  • Нейросети — один из видов машинного обучения. Популярный, но есть и другие, не хуже.
  • Глубокое обучение — архитектура нейросетей, один из подходов к их построению и обучению. На практике сегодня мало кто отличает, где глубокие нейросети, а где не очень. Говорят название конкретной сети и всё.

Подписывайтесь на мой телегам-канал, все самое интересное только там — https://t.me/pywithCodeLab