Часть 4. В аналогичном объеме общей классификации галактик следует упомянуть попытку построить морфологическую автоматизированную классификацию галактик, используя PCA, но используемые параметры подвергаются критике. Это иллюстрирует важность выбора параметров для многомерной кластеризации или классификационного анализа, которые в какой-то момент могут показаться произвольными и субъективными. Особое внимание следует уделить этому первоначальному шагу посредством анализа самого набора данных с помощью специальных средств интеллектуального анализа данных.
Другим примером является классификация использования PCA-анализа вместе с ранговым корреляционным тестом Спирмена для лучшего понимания параметров набора данных. Его подход состоит в том, чтобы использовать PCA на некотором наборе параметров, а затем понять физику основных компонентов. Таким образом, PCA проливает свет на лежащую в основе физику, из которой может быть построена схема классификации. Он находит для этой схемы три измерения: массу (масштаб), звездообразование (спектральный тип) и взаимодействия/слияния (степень динамических возмущений). Это должно напомнить, что PCA не является методом кластеризации как таковым, он предоставляет новое представление данных, из которых может быть выполнена кластеризация. Анализ главных компонент предполагает линейную комбинацию параметров, что является довольно сильным предположением.
Фолкс применил PCA на спектрах низкого отношения сигнал-шум главным образом как метод уменьшения размерности. Затем несколько основных компонентов используются для обучения нейронной сети, чтобы классифицировать галактики по пяти широким морфологическим типам. Несмотря на то, что этот подход эффективен для больших наборов, данных, он, по-видимому, ограничен нормальными галактиками, поскольку они обнаруживают, что новая схема классификации должна использоваться там, где необычные признаки присутствуют в спектрах.
Анализ ICA все еще менее распространен, чем PCA для изучения галактик. По крайней мере, два исследования были опубликованы, ансамблевое обучение для ICA и средний полевой независимый компонентный анализ. В первом случае было использовано 1326 синтетических спектров, полученных на основе моделей отдельных звездных популяций. Они выбирают 74” достаточно " различных спектра из них (используя объективный критерий), так как обучающая часть ансамбля сходится очень медленно. Анализ ICA производит 6 самых значительных компонентов, и спектры 1326 приспособлены на эти компоненты. Каждый компонент представляет собой базовый элемент за спектрами галактик, и они обнаруживают, что каждый из них может быть тесно связан с одним или несколькими звездными типами плюс некоторые специфические линейные свойства. Эти шесть компонентов затем используются в реальных спектрах галактик для получения звездного содержимого, такого как покраснение звездного света, дисперсия звездной скорости, звездное содержимое и история звездообразования. Даже при том, что PCA намного быстрее, он не предоставляет эту важную информацию из-за ограничения ортогональности, которое не позволяет компонентам быть неотрицательными.
Allen et al. использовали среднее поле ICA, которое является вероятностным ICA, использующим A до ограничения компонентов. Они обнаружили, что 10 компонентов (разделенных на пять континуальных и пять эмиссионных компонентов) необходимы для получения точных реконструкций практически всех узких эмиссионных галактик с очень высокой степенью точности. Используя эти 10 компонентов на большой выборке галактик Sloan Digital Sky Survey (SDSS), они идентифицируют области пространства параметров, соответствующие чистым спектрам эмиссии звездообразования и чистого активного ядра галактики (AGN), и производят высокие S/N реконструкции этих спектров.
Аналогичным образом применяли метод неотрицательной матричного факторизации, который был разработан для задач разделения слепых источников. В отличие от PCA, этот метод накладывает условие, что веса и спектральные компоненты неотрицательны, что также возможно в подходе к обучению ансамбля для ICA. Это более близко напоминает физический процесс излучения в средней инфракрасной области, изученный в этой работе, что приводит к физически интуитивным компонентам. Они обнаружили семь таких компонентов, включая два для излучения AGN, один для образования звезд и один для восходящих континуумов на более длинных длинах волн. Они показывают, что эти семь компонентов могут быть использованы для выделения различных типов объектов (см. Раздел 9) и выделения излучения из областей AGN и звездообразования и определения новой диагностики звездообразования/AGN, которая согласуется со всеми уже используемыми средними инфракрасными диагностиками, но имеет то преимущество, что она может быть применена к спектрам MIR с низким отношением сигнал / шум или с ограниченным спектральным диапазоном.
Продолжение следует...