Найти тему
Мир Финансов

Наука о финансовых данных

Рождение новой парадигмы финансовых исследований, которые дополняют эконометрику?

"Хорошо с цифрами? Очарован данными? Звук, который ты слышишь, – это возможность постучать".

Наука о финансовых данных и эконометрика дополняют друг друга. Их объединяет эквивалентный исследовательский процесс, при котором отправной точкой для первого является статистический вывод, а для второго – сами наборы данных. Однако переход на цифровое вещание сопряжен с двумя вызовами.

Во-первых, постоянно растущая вычислительная мощность позволяет исследователям экспериментировать с чрезвычайно большим количеством сгенерированных испытуемых. Мы утверждаем, что p-hacking может быть смягчено корректировками для проверки множества гипотез, где это уместно. Однако по-настоящему решить эту проблему можно только уделяя пристальное внимание добросовестности (например, предварительная регистрация, фактические периоды, не включённые в выборку).

Во-вторых, чрезвычайно большое количество наблюдений, имеющихся в большом массиве данных, обеспечивает величины статистической мощи, при которых общие уровни статистической значимости едва ли являются актуальными. Эту проблему можно решить двумя способами.

Во-первых, исследователи могут использовать более строгие уровни статистической значимости, такие как 0,1% и 0,5% вместо 1% и 5% соответственно.

Во-вторых, и это более важно, исследователи могут использовать такие критерии, как экономическая значимость, экономическая значимость и статистическая значимость для оценки надежности статистически значимых коэффициентов.

Особенно важное значение имеет статистическая значимость, поскольку представляется, что невозможно считать статистически значимым отдельный коэффициент, когда его фактическая статистическая значимость (т.е. дополнительные пояснительные возможности) крайне мала.

-2

Согласно отчёту Data Never Sleeps, в настоящее время для публикации 1 миллиона твитов требуется менее 3 минут, менее 20 секунд для 1 миллиона поисков в Google и менее 4 секунд для канала The Weather Channel для получения 1 миллиона запросов прогноза погоды.

Как эконометристы реагируют на это новое изобилие данных? Некоторые отмечают "триумф эмпириков" и объявляют о "рождении науки финансовых данных" в то время, как другие предупреждают, что p-hacking – процесс получения поверхностно привлекательных и селективных p-значений путём проверки множества гипотез, в результате чего множественное число может означать миллионы и более.

Хотя такая добыча данных, вероятно, всегда происходила в научных и профессиональных финансовых исследованиях и всегда находила свою критику, она стала намного более привлекательной, более полезной и также намного более опасной в век больших данных. Даже сам Гарри Марковиц недавно прокомментировал вопрос о добыче данных в век больших данных, заявив вместе со своими соавторами Арноттом и Харви:

"Мы все рабы данных, хотя бы потому, что живём в определённой истории, которая формирует наши убеждения".

Эконометрика – это измерения в экономике, следовательно финансовая эконометрика будет определена как применение статистических методов к проблемам в финансах.

Наука о финансовых данных отличается от эконометрики своей интеллектуальной точкой отсчёта, своим процессом и амбициями. В то время как интеллектуальной отправной точкой эконометрики является статистический вывод, то есть процесс, специалисты по финансовым данным разделяют общий интерес к наборам данных, изучение и объяснение которых может способствовать принятию финансовых решений, то есть ингредиенты.

Несмотря на неуклонный переход к большим массивам данных, доступность высококачественных достоверных наборов данных остаётся ключевым практическим ограничением для эмпирического исследователя.

-3

Следовательно, желание объяснить поведение человека путём изучения и критической оценки новых наборов данных является общим интеллектуальным желанием, объединяющим учёных, занимающихся финансовыми данными, чьи статистические методы могут варьироваться от вероятностных регрессионных моделей экономистов до моделей классификации на основе нейронных сетей компьютерных учёных.

Рассмотрение добычи данных подразумевает проведение гораздо более глубоких научных исследований аналитических возможностей измерения, статистических методов и новых финансовых продуктов, возникающих в эпоху больших данных, а также исследовательского процесса и честности исследователей, необходимых для получения надёжных выводов.

Кроме того, исследования больших массивов данных в области финансов должны быть связаны со всеми имеющимися знаниями, особенно в области финансовой эконометрики.

В дальнейших статьях мы будем исследовать степень, в которой новая финансовая версия научного исследования больших массивов данных дополняет эконометрику, и обсуждим возможности и проблемы, возникающие при рождении этой новой парадигмы исследования, которую мы называем "наука о финансовых данных".

Продолжение следует...