1339 подписчиков

Чёрный ящик ИИ как преграда научному методу.

17 февраля 202317 фев 2023

110

3 мин

Исследователи приоткрыли завесу, скрывающую «мышление» искусственного интеллекта. Искусственный интеллект многое может, но что мы можем ему позволить? Можем ли мы позволить себе доверять ему, как судья из Картахена, вынесший приговор на основе рекомендаций нейромодели? Чтобы ответить на эти и многие другие этические вопросы, являющиеся человеческой привилегией, было бы неплохо понять эту тёмную лошадку ‒ искусственный интеллект. «Глубокие нейронные сети печально известны своей сложностью для понимания и часто считаются «черными ящиками», ‒ рассказывает доцент Педрам Хассанзаде. ‒ Это одна из основных проблем, связанных с использованием глубоких нейронных сетей в научных приложениях. Другая же ‒ обобщаемость: эти сети не могут работать в системе, отличной от той, для которой они были обучены». Учёный мир давно трудится над этой задачей. На сегодня одними из самых успешных решений выглядят разработки от MIT и IBM. Первые создали ATMSeer – инструмент, передающий пользователю анализ и кон

Исследователи приоткрыли завесу,

скрывающую «мышление»

искусственного интеллекта.

Искусственный интеллект многое может, но что мы можем ему позволить? Можем ли мы позволить себе доверять ему, как судья из Картахена, вынесший приговор на основе рекомендаций нейромодели? Чтобы ответить на эти и многие другие этические вопросы, являющиеся человеческой привилегией, было бы неплохо понять эту тёмную лошадку ‒ искусственный интеллект.

«Глубокие нейронные сети печально известны своей сложностью для понимания и часто считаются «черными ящиками», ‒ рассказывает доцент Педрам Хассанзаде. ‒ Это одна из основных проблем, связанных с использованием глубоких нейронных сетей в научных приложениях. Другая же ‒ обобщаемость: эти сети не могут работать в системе, отличной от той, для которой они были обучены».

Учёный мир давно трудится над этой задачей. На сегодня одними из самых успешных решений выглядят разработки от MIT и IBM. Первые создали ATMSeer – инструмент, передающий пользователю анализ и контроль над методами машинного обучения. Разработка IBM, названная Seq2Seq-Vis, создавалась с той же целью ‒ обеспечить человека возможностью проверять решения модели и находить в них ошибки, если таковые произойдут.

Вообще же, изысканий на самом деле было множество, но попытка «зайти с фланга», предпринятая Хассанзаде и командой его коллег учёных-машиностроителей из Университета Райса, тоже принесла некоторые плоды.

В статье, опубликованной в PNAS Nexus, Хассанзаде и его коллеги Адам Субель, Ашеш Чаттопадхьяй и научный сотрудник университета доктор Ифей Гуань подробно описали использование анализа Фурье для изучения работы нейросети, обученной распознавать множество сложных факторов (читай ‒ множество переменных, раз уж речь о вычислениях). Поскольку в качестве задачи было выбрано прогнозирование климатических изменений, сюда вошли движения воздушных потоков в атмосфере, водных течений в мировом океане, а также прогнозы их динамики со временем.

Представленная аналитическая структура позволяет заглянуть внутрь и понять, чему научились сети и почему именно этому; а также даёт реальные возможности отследить и увязать вычисления с объективной действительностью изучаемой системы ‒ то есть диагностировать точность и ошибочность результатов расчётов и прогнозов.

Субель, ведущий автор исследования, начавший работу над ним будучи ещё студентом университета Райса, говорит, что эту структуру можно использовать в сочетании с методами передачи обучения. То есть применение анализа Фурье позволяет «обеспечить обобщение и, в конечном итоге, повысить надёжность научного глубокого обучения».

В связи с этим исследователи провели эксперимент, дважды обучив сеть: после обучения и переобучения сети для выполнения различных задач, связанных со сложной физикой, анализ Фурье для сравнения всех 40 000 ядер из двух итераций обнаружил, что более 99% выводов были похожи. Полученные результаты демонстрируют потенциал метода для выявления более эффективных путей переобучения, требующих значительно меньше данных.

Субель считает, что результаты имеют важные последствия для научного глубокого обучения:

«Мы обнаружили, что некоторые знания и выводы в литературе по машинному обучению, которые были получены, например, в результате работы над коммерческими и медицинскими приложениями, не применимы ко многим критически важным приложениям в науке и технике, таким как моделирование изменения климата, ‒ заявляет он. ‒ Это само по себе является важным следствием».

«Самое прекрасное в этом то, что нейронная сеть не творит чудес, ‒ подытожил Хассанзаде. ‒ Она не делает ничего сумасшедшего. На самом деле она делает то, что мог бы попытаться сделать физик или математик».

По материалам АРМК.