Аннотация: Современные астрономические обследования предоставляют огромные объемы данных о транзиентах, однако различение реальных астрофизических сигналов (например, взрывных событий) от ложных изображенческих артефактов остается сложной задачей. Конволюционные нейронные сети эффективно используются для классификации реальных и ложных объектов; однако их зависимость от непрозрачных скрытых представлений затрудняет интерпретацию. В данной работе показано, что крупные языковые модели (LLM) могут достичь уровня производительности, сравнимого с конволюционными нейронными сетями на трех оптических выборках транзиентов (Pan-STARRS, MeerLICHT и ATLAS), одновременно создавая прямые, читаемые человеком описания для каждого кандидата. Используя всего 15 примеров и краткие инструкции, LLM от Google, Gemini, достигает средней точности 93% по данным, которые охватывают различные разрешения и масштабы пикселей. Кроме того, показано, что вторая LLM может оценивать согласованность вывода первой моде
Текстовая интерпретация классификаций транзиентных изображений с использованием крупных языковых моделей
24 октября 202524 окт 2025
2 мин