Найти тему
World of Opportunities

Как стать охотником за планетами!

Оглавление

Введение

Что такое экзопланета? Как мы их находим? Самое главное, почему мы хотим их найти? Экзопланеты — это планеты за пределами нашей Солнечной системы — они вращаются вокруг любой звезды, кроме нашего Солнца. Мы можем найти эти экзопланеты с помощью нескольких методов: радиальная скорость, транзиты, прямое изображение и микролинзирование. Самый популярный метод, который я использовал для поиска планет, — это транзитный метод.

Поиск экзопланет

«Транзитный метод» поиска экзопланет был не первым методом их обнаружения, но он оказался самым плодотворным: было обнаружено более 4000 планет 1 . Когда мы строим зависимость яркости звезды от времени, мы называем это кривой блеска . Если бы планета проходила перед звездой с нашей точки зрения, свет, который мы видим, был бы тусклым, и на нашей кривой блеска был бы провал — событие транзита. Если это происходит периодически, это признак того, что вокруг этой звезды может быть планета.
Демонстрация планетарного транзита. Когда планета проходит перед своей звездой-хозяином. Свет, который мы получаем от звезды, тускнеет, принимая характерную форму.
Было много телескопов, предназначенных для поиска планет с использованием этого метода, как наземных, так и космических. К ним относятся WASP 2 , космический телескоп NASA Kepler , его вторая миссия под названием K2 3 и его преемник TESS 4 . Эти телескопы постоянно указывают на части неба, чтобы одновременно наблюдать за тысячами звезд. Чем дольше они наблюдают, тем больше планет могут найти!

Поскольку эти телескопы смотрят на очень много звезд, в данных также могут быть ложноположительные сигналы, такие как затмение двойных звезд, другие астрофизические явления или инструментальный шум. Я специально использовал данные K2 для своей нейронной сети, и поскольку телескоп стал нестабильным, в моих данных было много дополнительного шума, который действовал как убедительные кандидаты на планеты.

Кеплер не наблюдал несколько звезд во время своей второй миссии; он наблюдал тысячи. Для человека-астронома достаточно сложно просмотреть небольшой набор данных и последовательно найти планеты-кандидаты, но чрезвычайно сложно просмотреть 200 000 сигналов и быть последовательным, своевременным и беспристрастным в идентификации планет по сравнению с ложными положительными сигналами. Это требует автоматического, беспристрастного метода идентификации планет-кандидатов.
«Транзитный метод» поиска экзопланет был не первым методом их обнаружения, но он оказался самым плодотворным: было обнаружено более 4000 планет 1 . Когда мы строим зависимость яркости звезды от времени, мы называем это кривой блеска . Если бы планета проходила перед звездой с нашей точки зрения, свет, который мы видим, был бы тусклым, и на нашей кривой блеска был бы провал — событие транзита. Если это происходит периодически, это признак того, что вокруг этой звезды может быть планета. Демонстрация планетарного транзита. Когда планета проходит перед своей звездой-хозяином. Свет, который мы получаем от звезды, тускнеет, принимая характерную форму. Было много телескопов, предназначенных для поиска планет с использованием этого метода, как наземных, так и космических. К ним относятся WASP 2 , космический телескоп NASA Kepler , его вторая миссия под названием K2 3 и его преемник TESS 4 . Эти телескопы постоянно указывают на части неба, чтобы одновременно наблюдать за тысячами звезд. Чем дольше они наблюдают, тем больше планет могут найти! Поскольку эти телескопы смотрят на очень много звезд, в данных также могут быть ложноположительные сигналы, такие как затмение двойных звезд, другие астрофизические явления или инструментальный шум. Я специально использовал данные K2 для своей нейронной сети, и поскольку телескоп стал нестабильным, в моих данных было много дополнительного шума, который действовал как убедительные кандидаты на планеты. Кеплер не наблюдал несколько звезд во время своей второй миссии; он наблюдал тысячи. Для человека-астронома достаточно сложно просмотреть небольшой набор данных и последовательно найти планеты-кандидаты, но чрезвычайно сложно просмотреть 200 000 сигналов и быть последовательным, своевременным и беспристрастным в идентификации планет по сравнению с ложными положительными сигналами. Это требует автоматического, беспристрастного метода идентификации планет-кандидатов.

Нейронные сети

Мои коллеги Крис Шаллью и Эндрю Вандербург уже показали, что планеты могут быть обнаружены с помощью CNN, которые открыли многопланетные системы в исходных данных Кеплера 5 . Предыдущая модель также была построена с помощью TensorFlow, и для тех, кто никогда не занимался машинным обучением, было легко изучить и построить ее с нуля.

Я использовал CNN, чтобы найти планеты в данных K2. Моя CNN была основана на работе Шаллуэ и Вандербурга и изменена для работы с моими гораздо более зашумленными данными. Я использовал кампании K2 1-16, исключая кампании 9 и 11, потому что они в основном были ориентированы на цели микролинзирования. Извлеченные кривые блеска для этих кампаний можно найти здесь .. Затем эти кривые блеска были подвергнуты поиску периодических событий в соответствии с методами, описанными Вандербургом 2016 6 . В результате этого процесса было получено 51 711 сигналов, 31 575 из которых были вручную классифицированы по трем категориям для создания обучающей выборки для нейронной сети.

CNN работает лучше всего, когда данные имеют одинаковую форму и размер, но кривые блеска с фазовой сверткой могут иметь разные формы и размеры в зависимости от характеристик планетной системы. Период обращения планет различается, как и глубина их прохождения.

Я обработал свои данные в две функции изображения: локальное представление и глобальное представление. «Глобальный вид» — это вся кривая блеска с фазовой сверткой с транзитным событием в центре, разделенная на группы, так что каждый глобальный вид имеет одинаковую длину. «Локальное представление» — это увеличенное изображение транзитного события, только с двумя длительностями по обе стороны от события вместо всего периода (также разбитого на группы, так что каждое локальное представление имеет одинаковую длину). Эти функции нормализованы, так что глубина перехода всегда равна -1. Теперь у нас есть два взгляда на возможные планеты одинаковой формы и размера!
Рисунок взят из Dattilo et al 20197, демонстрирующий разницу между глобальным и локальным представлением.Я обучил CNN на 27 634 сигналах, которые были помечены одной из трех категорий:
Мои коллеги Крис Шаллью и Эндрю Вандербург уже показали, что планеты могут быть обнаружены с помощью CNN, которые открыли многопланетные системы в исходных данных Кеплера 5 . Предыдущая модель также была построена с помощью TensorFlow, и для тех, кто никогда не занимался машинным обучением, было легко изучить и построить ее с нуля. Я использовал CNN, чтобы найти планеты в данных K2. Моя CNN была основана на работе Шаллуэ и Вандербурга и изменена для работы с моими гораздо более зашумленными данными. Я использовал кампании K2 1-16, исключая кампании 9 и 11, потому что они в основном были ориентированы на цели микролинзирования. Извлеченные кривые блеска для этих кампаний можно найти здесь .. Затем эти кривые блеска были подвергнуты поиску периодических событий в соответствии с методами, описанными Вандербургом 2016 6 . В результате этого процесса было получено 51 711 сигналов, 31 575 из которых были вручную классифицированы по трем категориям для создания обучающей выборки для нейронной сети. CNN работает лучше всего, когда данные имеют одинаковую форму и размер, но кривые блеска с фазовой сверткой могут иметь разные формы и размеры в зависимости от характеристик планетной системы. Период обращения планет различается, как и глубина их прохождения. Я обработал свои данные в две функции изображения: локальное представление и глобальное представление. «Глобальный вид» — это вся кривая блеска с фазовой сверткой с транзитным событием в центре, разделенная на группы, так что каждый глобальный вид имеет одинаковую длину. «Локальное представление» — это увеличенное изображение транзитного события, только с двумя длительностями по обе стороны от события вместо всего периода (также разбитого на группы, так что каждое локальное представление имеет одинаковую длину). Эти функции нормализованы, так что глубина перехода всегда равна -1. Теперь у нас есть два взгляда на возможные планеты одинаковой формы и размера! Рисунок взят из Dattilo et al 20197, демонстрирующий разницу между глобальным и локальным представлением.Я обучил CNN на 27 634 сигналах, которые были помечены одной из трех категорий:
  • «E» для затменно-двойной системы
  • «J» для хлама/инструментального артефакта
  • «C» для кандидата на планету
Падение сигналов для окончательного обучающего набора было связано с некоторым «сбоем» на этапе предварительной обработки, описанным выше. Мы обучили CNN на 80% сигналов, оставив 10% для проверки и 10% для нашего окончательного набора тестов. Мы тренировались с помощью оптимизатора Adam 8 и выполнили 4000 итераций.
Архитектура окончательного CNN
Падение сигналов для окончательного обучающего набора было связано с некоторым «сбоем» на этапе предварительной обработки, описанным выше. Мы обучили CNN на 80% сигналов, оставив 10% для проверки и 10% для нашего окончательного набора тестов. Мы тренировались с помощью оптимизатора Adam 8 и выполнили 4000 итераций. Архитектура окончательного CNN

Заключение

После обучения у нас есть тестовый набор, с помощью которого мы можем узнать показатели того, насколько хорошо модель изучила, что такое планета, на основе прогнозов для каждого сигнала. Эту модель можно использовать на новом наборе данных для поиска новых планет. Моя модель была успешной после обучения, достигнув точности 98% по сравнению с тестовым набором. Настолько успешно, что я смог использовать его для идентификации и проверки двух новых экзопланет!

Во введении я спросил, почему мы хотим найти экзопланеты, и причин много. Мы открыли планеты за пределами нашей Солнечной системы только около 30 лет назад, так что область очень молода. Нам нужно увеличить размер нашей выборки планет, чтобы узнать, как формируются планеты, насколько они распространены и как в деталях различаются популяции планет. Чтобы найти планеты, подобные нашей Земле, нам нужно повысить чувствительность наших методов обнаружения, и использование такой техники может помочь.

Если вы хотите узнать больше, полное описание моих методов можно найти
здесь , а мой код — здесь . Обратите внимание, что этот код был написан с использованием более старой версии TensorFlow, и если вы изучаете его сегодня, вам следует начать с версии 2.0. Вы можете найти учебники здесь. Если вы хотите начать тестирование своей собственной нейронной сети на данных о планетах, полный прогон Криса Шаллью можно найти здесь . Этот код модели был написан в более ранней версии TensorFlow, но недавно была выпущена версия 2.0, и она проще, чем раньше. Чтобы начать работу со всеми типами глубокого обучения, ознакомьтесь с учебными пособиями по TensorFlow , как и я!

Энн Даттило в настоящее время является аспирантом астрономии и астрофизики в Калифорнийском университете в Санта-Круз, изучая демографию экзопланет. Эта работа была выполнена на первом курсе Техасского университета в Остине с доктором Эндрю Вандербургом и Крисом Шаллью при финансовой поддержке Фонда Джона У. Кокса.