Найти в Дзене
Астрономия

Внегалактическая астрономия.

Часть 1. Кластеризация объектов в синтетические группы-естественная деятельность любой науки. Астрофизика не является исключением и в настоящее время сталкивается с потоком данных. Для галактик по - прежнему широко используются вековая классификация Хаббла и камертон Хаббла, а также многочисленные моно-или бивариантные классификации, которые чаще всего делаются на глаз. Однако классификация должна основываться на данных, и все чаще используются сложные многомерные статистические инструменты. В этой статье мы рассмотрим эти различные подходы, чтобы расположить их в общем контексте неконтролируемого и контролируемого обучения. Мы настаиваем на астрофизических результатах этих исследований, чтобы показать, что многомерный анализ обеспечивает очевидный путь к обновлению нашей классификации галактик и является бесценным инструментом для изучения физики и эволюции галактик.

Астрофизика всегда принимала конкретные стратегии для классификации относительно скромного количества разнообразия и очень рассчитывала на физику для определения дискриминантных параметров. В настоящее время эта дисциплина сталкивается с необходимостью использования сложных статистических инструментов для решения проблемы астрономического числа наблюдаемых и каталогизируемых объектов и увеличения числа наблюдаемых свойств, описывающих их.

Дискуссия о полезности морфологической классификации галактик является довольно старой и все еще жива. Сандаж, сторонник (морфологической) классификации, основанной на данных, заметил, что классификация Хаббла и камертон Хаббла еще не были заменены ничем другим, несмотря на усилия сторонников классификации, основанной на физике. Было также признано, что он имеет много недостатков: это качественный, субъективный и визуальный подход, который трудно использовать для удаленных галактик, он основан исключительно на видимом морфологическом параметре, в то время как галактики являются сложными и эволюционирующими системами, и в то время как мы имеем в своем распоряжении морфологии от рентгеновских лучей до радиоволн, спектров, химических составов, звездных популяций, масс центральных черных дыр, кинематики звезд и газов…

Однако эта дискуссия может не касаться правильного вопроса, поскольку с точки зрения классификации классификация должна основываться на данных и, следовательно, быть многомерной. Следовательно, необходимо использовать адаптированные инструменты, которые не являются хорошо известными астрономам в целом. Тем не менее, за последние 30 лет или около того, особенно с начала XXI века, были опубликованы многочисленные исследования. В настоящей работе мы хотели бы представить эти различные подходы в общем контексте неконтролируемого (кластеризация) и контролируемого (классификация) обучения.

Кластерные подходы собирают объекты в соответствии с их сходством либо путем выбора метрики расстояния, либо с помощью некоторых адекватных критериев для принятия решения о том, к какому кластеру принадлежит тот или иной объект. Существует огромный класс методов, которые разделяют данные на заранее определенное количество кластеров. Хорошо известный алгоритм - это k-means.

Другое семейство методов кластеризации использует иерархическое представление попарных расстояний между объектами в терминах ряда параметров (переменных), с помощью восходящего алгоритма, который строит дерево, связывая ближайшие объекты вместе, прежде чем связывать эти первые кластеризации с ближайшими кластерами или объектами, и так далее, пока вся выборка не будет исчерпана. Конечное число групп затем выбирается путем срезания дерева на фиксированном уровне расстояния. Ветви дерева, называемые дендрограммой, могут представлять или не представлять отношения между объектами.

Первоначально филогенетические методы были разработаны для построения графика, представляющего эволюционные отношения между видами. Каждый узел графа указывает на передачу с механизмом модификации, который создает два или более видов, унаследованных от общего предка. В более общем плане филогенетический подход можно рассматривать как бесконтрольный кластерный подход, в котором обеспечиваются взаимосвязи. Как следствие, филогенетические методы являются особенно универсальными и мощными методами построения деревьев классификации. Их можно понять в рамках теории графов.

Продолжение следует...

Наука
7 млн интересуются