18 подписчиков

Второй мозг+GPT. Урок 3. Нейросети и Искусственный Интеллект (ИИ)

10 сентября 202410 сен 2024

5 мин

Эта статья к урокам которые проходят в этой открытой для всех группе Telegram, где я делюсь о том, как строить свое пространство в привычном мессенджере по методике Тьяго Форте. Я усовершенствовала его метод для себя и добавила еще GPT. Я не 100% следую всем канонам книги и подстроила их под себя. Вы можете сделать так, как удобнее именно вам.

Давайте разберемся с терминами, чтобы мы легко могли двигаться дальше.

Искусственный интеллект (ИИ) и нейросети — это связанные, но не идентичные понятия. Давайте разберемся в их различиях:

Искусственный интеллект* (ИИ) — это более широкое понятие, которое охватывает все технологии и методы, позволяющие компьютерам выполнять задачи, требующие человеческого интеллекта.

Это могут быть:

- Машинное обучение (обучение компьютеров на основе данных),

- Экспертные системы (программы, которые имитируют решение задач в узких областях знаний),

- Распознавание речи и изображений,

- Робототехника и многое другое.

Вы также могли сталкиваться с английской аббревиатурой AI:

AI (Artificial Intelligence) переводится как искусственный интеллект (ИИ). Это одно и то же понятие, просто на разных языках

На самом деле, ИИ существует уже давно. Примеры:

Голосовой помощник - программа, которая понимает ваши голосовые команды и отвечает на них (например, когда вы спрашиваете "Какая погода сегодня?" и голосовой помощник Siri или Алиса, отвечает вам). ИИ в данном случае анализирует вашу речь, ищет информацию о погоде в интернете и озвучивает ответ.

Другой пример - рекомендации на YouTube - система, которая предлагает видео на основе ваших предыдущих просмотров. ИИ анализирует какие видео вы смотрели, и на основе этого предлагает похожие.

Нейросети (или искусственные нейронные сети) — это один из методов, используемых в ИИ, особенно в машинном обучении. Они вдохновлены работой человеческого мозга и состоят из множества взаимосвязанных "нейронов".

Нейросети могут обучаться на больших объемах данных и использоваться для решения сложных задач, таких как:

- Распознавание образов (например, лица на фотографиях),

- Обработка естественного языка (например, перевод текста или чат-боты),

- Прогнозирование (например, предсказание погоды или финансовых рынков).

Например, распознавание лиц на фотографиях - технология, которая определяет, кто изображен на фотографии.Нейросеть обучена на миллионах фотографий и может распознать лица, сравнивая их с базой данных.

Или еще один пример - автономные автомобили - машины, которые могут ехать без водителя. Автомобиль Tesla может самостоятельно ехать по дороге, избегая препятствий. Нейросеть анализирует данные с камер и датчиков автомобиля, чтобы понимать, где находятся другие машины, пешеходы и препятствия.

Самые популярные ИИ для нашего с вами пользования на данный момент:

🟠 Чат GPT от компании Open AI

GPT предназначен для генерации текста и ответов на вопросы.

Версии которые есть на данный момент:

GPT-3

Выпущен в 2020 году
Стал значительным прорывом в развитии языковых моделей
Способен генерировать связные тексты на основе контекста

GPT-4

Последняя версия, представленная в марте 2023 года
Превосходит GPT-3 по точности решения сложных задач благодаря более широким знаниям и способностям к рассуждению
Поддерживает мультимодальный ввод (текст и изображения)

GPT-4o

Новая версия, представленная в мае 2024 года
Умеет работать с текстом, изображениями и аудио
Доступна на более чем 50 языках, включая русский

GPT-4o mini

Упрощенная и более дешевая версия GPT-4o, представленная в июле 2024 года
Немного меньше использует серверных ресурсов, но сохраняет основные возможности
Поддерживает работу с текстом и изображениями, в ближайшее время добавится распознавание видео и аудио

🟠 Gigachat от компании Сбербанк

GigaChat — это продвинутый чат-бот на основе искусственного интеллекта, разработанный российским банком Сбер и запущенный в апреле 2023 года. Он позиционируется как российская альтернатива ChatGPT от OpenAI. Пока у него только одна версия.

🟠 Claude от компании Anthropic

Она предназначена для генерации текстов, обработки запросов и выполнения сложных задач. На данный момент доступны три модели Claude в порядке возрастания возможностей:

Haiku — самая быстрая модель для легких задач

Sonnet — лучший баланс производительности и скорости для эффективных задач с высокой пропускной способностью

Opus — модель с наивысшей производительностью для сложного анализа, задач с многошаговыми инструкциями, математики и генерации кода

🟠 DALL·E от компании Open AI

DALL·E — это нейросеть, способная генерировать высококачественные изображения на основе текстовых описаний. На данный момент выпущено три версии DALL·E:

DALL·E

Первая версия DALL·E была представлена в январе 2021 года. Она продемонстрировала способность создавать реалистичные и художественные изображения, комбинируя различные концепции, атрибуты и стили

DALL·E 2

Улучшенная версия DALL·E 2 была выпущена в 2022 году. Она значительно повысила качество и разрешение изображений, а также улучшила соответствие запросам пользователей

DALL·E 3

Последняя версия DALL·E 3 была анонсирована в сентябре 2023 года. Основные нововведения включают

Лучшее понимание нюансов и деталей в текстовых запросах, что позволяет создавать изображения, более точно соответствующие описаниям
Интеграция с ChatGPT, позволяющая пользователям получать помощь в формулировке запросов
Повышенная точность, в том числе в изображении мелких деталей, таких как человеческие руки
Возможность точно отображать сцены с конкретными объектами и анализировать их взаимосвязи
Этические гарантии, ограничивающие генерацию нежелательного контента

Midjourney Дэвида Хольца

Миджорни — это нейросеть, предназначенная для генерации изображений на основе текстовых описаний.

Версии Midjourney:

Midjourney v1: Первая версия, которая заложила основы работы нейросети.
Midjourney v2: Улучшения в качестве генерации изображений и обработке текстовых запросов.
Midjourney v3: Эта версия значительно улучшила понимание сложных подсказок и детализацию изображений.
Midjourney v4: Полностью переработанная модель с новой архитектурой, которая лучше справляется с мелкими деталями и сложными запросами. Включает два варианта отрисовки — 4a и 4b, которые предлагают разные стилистические настройк
Midjourney v5: Эта версия добавила новые возможности, такие как улучшенная генерация изображений и возможность более точного контроля над стилем и деталями
Midjourney v5.2: Обновление, которое включает новые инструменты, такие как Zoom Out, и улучшения в генерации изображений, включая лучшее воспроизведение человеческих ру
Midjourney v6: Последняя версия, разработанная с нуля, с улучшенной архитектурой и новыми функциями, которая продолжает эволюцию нейросеть

Маленький вывод из всего прочитанного или то, что важно знать:

Чем выше версия нейросети, тем лучше она генерит. Из всех представленных принято на данный момент (осень 2024 г) считать, что лучшая текстовая модель - GPT4o, лучшая графическая модель - для создания картинок - Midjourney v6.

Но все очень быстро меняется. И кто победит в гонке за лучший ИИ неизвестно.

Я назвала это обучение Второй мозг+GPT - так как сейчас это самая популярная аббревиатура текстового ИИ, но вы то, теперь понимаете, что речь не только о GPT.

Подписаться на мой канал можно здесь: @shkuricheva