Найти в Дзене

Карта местности: что умеют нейросети

Возможно, эта тема звучит как «капитан очевидность». Но для «прогулок» важно хоть как-то представлять территорию. Мне нужна была моя личная карта. Я взяла за основу простой вопрос: «что нейросеть умеет делать». Так обозначилось несколько направлений. Можно задать другой вопрос и получить другую классификацию — например, «где мы можем использовать нейросеть?». Но для начала я остановлюсь на этой. Чтобы составить классификацию, я пользовалась помощью ChatGPT. Но мне пришлось долго с ним переписываться, задавать дополнительные вопросы, вносить поправки, пока мы не убрали лишние пункты, не собрали похожие навыки под одной крышей и добились более-менее человеческих формулировок. Работать с текстом Работать с изображениями Работать с видео Работать со звуком Анализировать данные — Работают с таблицами и числами (DataRobot — анализирует данные и строит модели) Создавать генеративные миры и системы — Создают среды и пространства с правилами (OpenAI Gym — среды для обучения и поведения нейро

Возможно, эта тема звучит как «капитан очевидность». Но для «прогулок» важно хоть как-то представлять территорию.

Мне нужна была моя личная карта. Я взяла за основу простой вопрос: «что нейросеть умеет делать». Так обозначилось несколько направлений. Можно задать другой вопрос и получить другую классификацию — например, «где мы можем использовать нейросеть?». Но для начала я остановлюсь на этой.

Нейросети. Выбор направления
Нейросети. Выбор направления
Чтобы составить классификацию, я пользовалась помощью ChatGPT. Но мне пришлось долго с ним переписываться, задавать дополнительные вопросы, вносить поправки, пока мы не убрали лишние пункты, не собрали похожие навыки под одной крышей и добились более-менее человеческих формулировок.

Итак. Нейросети могут:

Работать с текстом

  1. Создают тексты (ChatGPT — пишет письма, посты, статьи)
  2. Ведут диалог и помогают думать (DeepSeek — обсуждает идеи, помогает разобраться)
  3. Пишут и понимают код (GitHub Copilot — помогает писать программы)

Работать с изображениями

  1. Распознают изображения (Google Vision AI — понимает, что изображено на фото)
  2. Создают изображения с нуля (Midjourney — делает картинки по описанию)
  3. Редактируют изображения (Adobe Firefly — меняет и дорисовывает изображения)

Работать с видео

  1. Создают видео по тексту (Runway — видео из описания)
  2. Создают видео из изображения (Pika — «оживляет» картинку)
  3. Делают визуальные эффекты и фоны (Kaiber — движущиеся фоны и эффекты)

Работать со звуком

  1. Озвучивают текст (ElevenLabs — превращает текст в голос)
  2. Создают музыку (Suno — сочиняет музыку)
  3. Клонируют голос (Resemble AI — копирует голос человека)
  4. Создают звуки и атмосферу (Soundraw — фоны, настроение, атмосфера)

Анализировать данные

— Работают с таблицами и числами (DataRobot — анализирует данные и строит модели)

Создавать генеративные миры и системы

— Создают среды и пространства с правилами (OpenAI Gym — среды для обучения и поведения нейросетей)


Это кстати самый загадочный раздел. Я его так и не поняла, но ChatGPT настаивал, что это отдельный нейросетевой навык.

Нейросети, которые умеют много всего

— ChatGPT (текст, диалог, изображения, анализ данных, код)

— Claude (текст, диалог, анализ документов)

— Runway (видео, изображения, эффекты)

Все эти пункты нужны, чтобы потом совершить отдельную экскурсию в каждый раздел.
Внутри каждой категории мы осмотримся, чтобы охватить всё разнообразие, а затем попробовать самые распространённые, найти нишевые и малоизвестные, разобраться, за что стоить заплатить, а что можно получить бесплатно. Отдельно уделим внимание нейросетям доступным в России.