Эта статья к урокам которые проходят в этой открытой для всех группе Telegram, где я делюсь о том, как строить свое пространство в привычном мессенджере по методике Тьяго Форте. Я усовершенствовала его метод для себя и добавила еще GPT. Я не 100% следую всем канонам книги и подстроила их под себя. Вы можете сделать так, как удобнее именно вам.
Давайте разберемся с терминами, чтобы мы легко могли двигаться дальше.
Искусственный интеллект (ИИ) и нейросети — это связанные, но не идентичные понятия. Давайте разберемся в их различиях:
Искусственный интеллект* (ИИ) — это более широкое понятие, которое охватывает все технологии и методы, позволяющие компьютерам выполнять задачи, требующие человеческого интеллекта.
Это могут быть:
- Машинное обучение (обучение компьютеров на основе данных),
- Экспертные системы (программы, которые имитируют решение задач в узких областях знаний),
- Распознавание речи и изображений,
- Робототехника и многое другое.
Вы также могли сталкиваться с английской аббревиатурой AI:
AI (Artificial Intelligence) переводится как искусственный интеллект (ИИ). Это одно и то же понятие, просто на разных языках
На самом деле, ИИ существует уже давно. Примеры:
Голосовой помощник - программа, которая понимает ваши голосовые команды и отвечает на них (например, когда вы спрашиваете "Какая погода сегодня?" и голосовой помощник Siri или Алиса, отвечает вам). ИИ в данном случае анализирует вашу речь, ищет информацию о погоде в интернете и озвучивает ответ.
Другой пример - рекомендации на YouTube - система, которая предлагает видео на основе ваших предыдущих просмотров. ИИ анализирует какие видео вы смотрели, и на основе этого предлагает похожие.
Нейросети (или искусственные нейронные сети) — это один из методов, используемых в ИИ, особенно в машинном обучении. Они вдохновлены работой человеческого мозга и состоят из множества взаимосвязанных "нейронов".
Нейросети могут обучаться на больших объемах данных и использоваться для решения сложных задач, таких как:
- Распознавание образов (например, лица на фотографиях),
- Обработка естественного языка (например, перевод текста или чат-боты),
- Прогнозирование (например, предсказание погоды или финансовых рынков).
Например, распознавание лиц на фотографиях - технология, которая определяет, кто изображен на фотографии.Нейросеть обучена на миллионах фотографий и может распознать лица, сравнивая их с базой данных.
Или еще один пример - автономные автомобили - машины, которые могут ехать без водителя. Автомобиль Tesla может самостоятельно ехать по дороге, избегая препятствий. Нейросеть анализирует данные с камер и датчиков автомобиля, чтобы понимать, где находятся другие машины, пешеходы и препятствия.
Самые популярные ИИ для нашего с вами пользования на данный момент:
🟠 Чат GPT от компании Open AI
GPT предназначен для генерации текста и ответов на вопросы.
Версии которые есть на данный момент:
GPT-3
- Выпущен в 2020 году
- Стал значительным прорывом в развитии языковых моделей
- Способен генерировать связные тексты на основе контекста
GPT-4
- Последняя версия, представленная в марте 2023 года
- Превосходит GPT-3 по точности решения сложных задач благодаря более широким знаниям и способностям к рассуждению
- Поддерживает мультимодальный ввод (текст и изображения)
GPT-4o
- Новая версия, представленная в мае 2024 года
- Умеет работать с текстом, изображениями и аудио
- Доступна на более чем 50 языках, включая русский
GPT-4o mini
- Упрощенная и более дешевая версия GPT-4o, представленная в июле 2024 года
- Немного меньше использует серверных ресурсов, но сохраняет основные возможности
- Поддерживает работу с текстом и изображениями, в ближайшее время добавится распознавание видео и аудио
🟠 Gigachat от компании Сбербанк
GigaChat — это продвинутый чат-бот на основе искусственного интеллекта, разработанный российским банком Сбер и запущенный в апреле 2023 года. Он позиционируется как российская альтернатива ChatGPT от OpenAI. Пока у него только одна версия.
🟠 Claude от компании Anthropic
Она предназначена для генерации текстов, обработки запросов и выполнения сложных задач. На данный момент доступны три модели Claude в порядке возрастания возможностей:
Haiku — самая быстрая модель для легких задач
Sonnet — лучший баланс производительности и скорости для эффективных задач с высокой пропускной способностью
Opus — модель с наивысшей производительностью для сложного анализа, задач с многошаговыми инструкциями, математики и генерации кода
🟠 DALL·E от компании Open AI
DALL·E — это нейросеть, способная генерировать высококачественные изображения на основе текстовых описаний. На данный момент выпущено три версии DALL·E:
DALL·E
Первая версия DALL·E была представлена в январе 2021 года. Она продемонстрировала способность создавать реалистичные и художественные изображения, комбинируя различные концепции, атрибуты и стили
DALL·E 2
Улучшенная версия DALL·E 2 была выпущена в 2022 году. Она значительно повысила качество и разрешение изображений, а также улучшила соответствие запросам пользователей
DALL·E 3
Последняя версия DALL·E 3 была анонсирована в сентябре 2023 года. Основные нововведения включают
- Лучшее понимание нюансов и деталей в текстовых запросах, что позволяет создавать изображения, более точно соответствующие описаниям
- Интеграция с ChatGPT, позволяющая пользователям получать помощь в формулировке запросов
- Повышенная точность, в том числе в изображении мелких деталей, таких как человеческие руки
- Возможность точно отображать сцены с конкретными объектами и анализировать их взаимосвязи
- Этические гарантии, ограничивающие генерацию нежелательного контента
Midjourney Дэвида Хольца
Миджорни — это нейросеть, предназначенная для генерации изображений на основе текстовых описаний.
Версии Midjourney:
- Midjourney v1: Первая версия, которая заложила основы работы нейросети.
- Midjourney v2: Улучшения в качестве генерации изображений и обработке текстовых запросов.
- Midjourney v3: Эта версия значительно улучшила понимание сложных подсказок и детализацию изображений.
- Midjourney v4: Полностью переработанная модель с новой архитектурой, которая лучше справляется с мелкими деталями и сложными запросами. Включает два варианта отрисовки — 4a и 4b, которые предлагают разные стилистические настройк
- Midjourney v5: Эта версия добавила новые возможности, такие как улучшенная генерация изображений и возможность более точного контроля над стилем и деталями
- Midjourney v5.2: Обновление, которое включает новые инструменты, такие как Zoom Out, и улучшения в генерации изображений, включая лучшее воспроизведение человеческих ру
- Midjourney v6: Последняя версия, разработанная с нуля, с улучшенной архитектурой и новыми функциями, которая продолжает эволюцию нейросеть
Маленький вывод из всего прочитанного или то, что важно знать:
Чем выше версия нейросети, тем лучше она генерит. Из всех представленных принято на данный момент (осень 2024 г) считать, что лучшая текстовая модель - GPT4o, лучшая графическая модель - для создания картинок - Midjourney v6.
Но все очень быстро меняется. И кто победит в гонке за лучший ИИ неизвестно.
Я назвала это обучение Второй мозг+GPT - так как сейчас это самая популярная аббревиатура текстового ИИ, но вы то, теперь понимаете, что речь не только о GPT.
Подписаться на мой канал можно здесь: @shkuricheva