Проблема того, что AI при обработке изображения часто «додумывают» несуществующие детали беспокоит многих пользователей. Например, команду исследователей, которая пытается прочитать обугленные свитки в Помпеях, законсервированные при извержении вулкана Везувия в 79 году н.э.
Оказывается, что довольно сложно прочитать свиток папируса которому почти 2 000 лет, он состоит из нескольких слоев расплющенных и спрессованных тростниковых стеблей, покрыт лавой, свернут и его естественно невозможно раскрыть механически 😢
Но, когда ты ученый и очень сильно хочется, то можно найти небольшое финансирование и объявить конкурс для таких же энтузиастов как и ты — Vesuvius Challenge. Организаторы предложили участникам попробовать расшифровать содержимое Свитков библиотеки в Помпеях.
Так как проект Vesuvius Challenge был основан только в 2023 годут расшифровано примерно 5 % всей прокрутки документа. С одной стороны не так много, но, организаторы конкурса и специалисты единогласно говорят о прорыве: разработана методология, позволяющая достоверно и быстро прочесть содержание без физического повреждения свитков.
На первом этапе свитки были отсняты с помощью ускорителя частиц Diamond Light Source, получились тысячи снимков компьютерной томографии. Затем разработанные участниками алгоритмы позволили проследить и отделить друг от друга слои папируса, создав 3D модели. Для третьей стадии создали систему распознавания текста, основанную на техническом зрении. Участники научили AI отличать мельчайшие фрагменты уцелевших чернил от обугленного папируса.
И здесь как раз появляется знакомая нам с вами проблема, чем больше данных анализирует нейросеть, чем сложнее задача, тем вероятнее, что она начнет придумывать детали, особенно если она обучена распознавать символы и строить на их основе слова, фразы и предложения.
Чтобы этого не произошло, ученые использовали принцип малых окон ввода-вывода и настроили свою сеть таким образом, чтобы она показывала не буквы, а чернильные пятна. А уже из этих пятен последовательно выстраиваются изображения. Которые читают люди.
Интересно, что первым человеком в истории, кто смог прочесть слово из обуглившегося папируса стал 21-летний стажер SpaceX Люк Фарритор. Он как раз и научил нейросеть не умничать искать чернила и получил слово «ΠΟΡΦΥΡΑϹ», то есть — «фиолетовый». За это он получил промежуточный приз в $40 000.
«Теперь — про содержание расшифрованного фрагмента. Оно представляет собой рассуждения о правильном понимании удовольствий. Это типичная тема для философов-эпикурейцев, к которым предположительно принадлежит автор свитка, работавший в погибшей библиотеке. В частности, в расшифрованном фрагменте он рассматривает вопрос, приносят ли блага, доступные в меньших количествах, больше удовольствия, чем те, которые представлены в изобилии. А ещё рассуждает о музыке, упоминает некоего Ксенофанта, критикует своих оппонентов за отрицание удовольствий или их неправильное понимание.»
#наука #нейросети #искуственныйинтеллект