Найти тему

Может ли ChatGPT предсказывать ценовые движения в трейдинге?

Оглавление

Первые активные исследования языковой модели ChatGPT были весной 2023 года. Тогда искусственный интеллект действительно подтвердил (точнее это подтвердила команда из Microsoft, которая одна из первых выпустила исследование по ChatGPT-4), что справляется со многими процессами не хуже, чем люди.

Что же касается именно трейдинга и инвестиций — здесь тоже все активно развивается. Об этом “развивается” — подробнее в статье.

Полезные материалы, которые хорошо бы изучить перед продолжением:

Видео о ChatGPT в трейдинге

Анализ цен на основе альтернативных источников информации — что это такое?

Альтернативные источники информации в трейдинге — это источники данных, которые не включают в себя традиционные финансовые отчеты, новости, финансовую аналитику или классический технический анализ.

Это могут быть как:

  • Анализ социальных медиа: многие трейдеры и инвесторы обмениваются торговыми идеями на платформах вроде Twitter или Reddit. Анализ настроений и мнений, выраженных в этих источниках, может помочь с определением движения рынка.
  • Данные о погоде, трафике, информация о продажах розничных сетей или снимки со спутников.
  • Анализ популярных поисковых запросов, который может предоставить инсайты о том, что интересует инвесторов и какие темы могут повлиять на рынок.

Так как ChatGPT — языковая модель, то логично ее применять в анализе текста. Именно так ее и применили для исследования альтернативных данных.

За 1 час поможем разобраться с факторами успеха и причинами неудач на финансовых рынках. Бесплатно 🔥

Какие данные использовались в исследовании

Всего было 3 источника данных:

  • Center for Research in Security Prices (CRSP) — поставщик данных по фондовому рынку и индексам. В исследовании были акции бирж NYSE, NASDAQ и AMEX.
  • Новостные заголовки.
  • RavenPack — поставщик больших данных для разных финансовых сервисов.

Данные и исследования начинались с октября 2021 года по декабрь 2022.

Для анализа новостей исследователи использовали веб-скрейпинг — автоматизированный метод сбора данных с разных сайтов и с разными источниками. Далее они сопоставляли полученные данные с сервисом RavenPack для актуализации этих данных. После этого была фильтрация: дублирующие новости удалялись, а новости незначительной важности исключались (у исследователей был свой новостной рейтинг по важности, о котором скоро расскажем).

Далее, на основе такого массива данных создавалась торговая логика для стратегий с помощью ChatGPT версий 3.5 и 4.

Моделирование торговой стратегии на основе ChatGPT

Чтобы понять, насколько ChatGPT хорош в финансовой аналитике, исследователи делали запрос следующего типа:

“Вы — финансовый эксперт с опытом рекомендаций по акциям. Ответьте ‘ДА’, если новость хорошая, ‘НЕТ’, если плохая, или ‘НЕИЗВЕСТНО’, если не уверены ни в том, ни в другом. Затем разъясните в одном коротком и кратком предложении на следующей строке. Этот заголовок хороший или плохой для цены акций Oracle в краткосрочной перспективе?
Заголовок: Rimini Street Fined $630,000 in Case Against Oracle (компания Rimini Street оштрафована на 630 000$ по делу против Oracle)”.

Ответ ChatGPT:

“Штраф против Rimini Street может потенциально повысить уверенность инвесторов в способности Oracle защищать свою интеллектуальную собственность и увеличить спрос на ее продукты и услуги.”

Далее на основе таких заголовков исследователи сделали “ChatGPT-счет”, где:

  • “ДА” = 1 (то есть новость положительная для компании)
  • “НЕИЗВЕСТНО” = 0 (то есть новость нейтральная)
  • “НЕТ” = -1 (новость для компании негативная)

Если для компании есть несколько заголовков в один день, оценки суммируются. Получается, что если в итоге “ChatGPT-счет” > 0 — рассматриваются сделки в покупку по определенным акциям и индексам. Если < 0 — открывались сделки в шорт. Ну а если 0 — сделок по инструменту не было.

Далее заголовки сопоставляются с предстоящей торговой сессией. Если:

  1. Заголовки вышли до 6 утра в торговый день, тогда акции компании можно купить (продать) к открытию рынка в тот же день и закрыть позиции к закрытию того же дня.
  2. Для заголовков с 6:00 утра до 16:00 вечера предполагаем, что акции можно купить (продать) к закрытию того же дня и выйти из позиций к закрытию следующего торгового дня.
  3. Для заголовков после 16:00 предполагаем, что их можно купить (продать) по цене открытия следующего дня и выйти из сделок по цене закрытия тоже следующего дня.

В нашем Telegram-канале есть то, чего не публикуем в блоге 🙌

Результаты торговой стратегии на основе ChatGPT

Сперва посмотрим на результаты без учета комиссий.

Доходность разных стратегий на основе ChatGPT 3.5 и 4.
Доходность разных стратегий на основе ChatGPT 3.5 и 4.

Расшифруем кривые доходности:

  • Зеленая кривая — стратегия, которая покупала акции с хорошими новостями на основе анализа ChatGPT 3.5. То есть работала только в лонг
  • Красная линия — стратегия, которая продавала акции с плохими новостями на основе анализа ChatGPT 3.5. То есть работала только в шорт
  • Светло-голубая кривая — стратегия, которая покупала акции с хорошими новостями и продавала акции с плохими новостями на основе анализа ChatGPT 3.5. То есть работала и в шорт, и в лонг
  • Темно-голубая кривая — стратегия, которая покупала акции с хорошими новостями и продавала акции с плохими новостями на основе ChatGPT 4
  • Черная, фиолетовая и желтая кривые — стратегии пассивного инвестирования с разным распределением капитала

Все активные стратегии, основанные на ChatGPT 3.5 и 4, обогнали пассивные стратегии за исследуемый период. Но все же надо добавить учет комиссий, чтобы получить кривые с реальной доходностью.

Стратегии, которые работали как в лонг, так и в шорт.
Стратегии, которые работали как в лонг, так и в шорт.

Расшифруем:

  • Черная кривая — стратегия как в лонг, так и в шорт, и с нулевыми издержками (для сравнения)
  • Темно-зеленая кривая — та же стратегия, но с издержками в 5 базисных пунктов за каждую транзакцию (то есть 10 пунктов за всю сделку)
  • Светло-голубая кривая — еще одна аналогичная кривая, но с издержками в 10 пунктов за каждую транзакцию (то есть всего 20 пунктов комиссии)
  • Темно-синяя кривая — издержки 50 пунктов за всю сделку
  • Красная кривая — пассивный портфель (то есть индекс S&P 500) без учета издержек

Стратегия проявила себя лучше индекса S&P 500 с любыми издержками.

Заключение

Лет 10 назад подобные семантические анализы могли делать только крупные компании — хедж-фонды и инвест-банки. И стоили такие алгоритмы сотни тысяч долларов. Сегодня же эти инструменты уже доступны частным трейдерам либо бесплатно, либо за 20$ в месяц (именно столько стоит ChatGPT 4). Технологии улучшаются, а возможности их применения — расширяются. Продолжаем следить за новыми исследованиями и кейсами.

Как создавать торговые стратегии на основе статистики и данных, способных работать 24/5 — подскажет курс "Системный трейдинг" 📈📊