Найти в Дзене
Programming

Широко используемые методы машинного обучения не работают, как утверждается

Резюме:

Модели и алгоритмы анализа сложных сетей широко используются в исследованиях и оказывают влияние на общество в целом через их приложения в онлайн-социальных сетях, поисковых системах и системах рекомендаций. Однако, согласно новому исследованию, один широко используемый алгоритмический подход к моделированию таких сетей в корне ошибочен, он не позволяет охватить важные свойства реальных сложных сетей.

https://cdn.pixabay.com/photo/2019/08/03/11/12/robotics-education-4381582__340.jpg
https://cdn.pixabay.com/photo/2019/08/03/11/12/robotics-education-4381582__340.jpg

"Дело не в том, что эти методы дают абсолютный мусор. Вероятно, в них есть некоторая информация, но не столько, сколько многие думают", - сказал К. "Сеш" Сешадхри( C. "Sesh" Seshadhri ), доцент информатики и инженерии в Баскинской инженерной школе при Калифорнийском университете в Санта-Крус.

Сешадхри является первым автором статьи о новых открытиях, опубликованной 2 марта в "Proceedings of the National Academy of Sciences" ("Труды Национальной академии наук"). В исследовании оценивались методы, известные как "низкоразмерные вставки", которые обычно используются в качестве входных данных в модели машинного обучения. Это активная область исследований, в которой новые методы встраивания разрабатываются быстрыми темпами. Но Сешадри и его соавторы говорят, что все эти методы имеют одни и те же недостатки.

Попробуем объяснить, почему Сешадхри использовал пример социальной сети, знакомого типа сложной сети. Многие компании применяют машинное обучение к данным социальной сети для создания предсказаний о поведении людей, рекомендаций для пользователей и так далее. Техника встраивания, по сути, преобразует положение человека в социальной сети в набор координат для точки в геометрическом пространстве, в результате чего получается список чисел для каждого человека, который можно подключить к алгоритму.

Это важно, потому что нечто абстрактное, например, "положение человека в социальной сети может быть преобразовано в конкретный список чисел. Другая важная вещь заключается в том, что вы хотите преобразовать это в низкопространственное пространство, так что список чисел, представляющий каждого человека, относительно мал", - объяснил Сешадхри.

Как только это преобразование сделано, система игнорирует реальную социальную сеть и делает прогнозы, основанные на отношениях между точками в пространстве. Например, если много близких людей в этом пространстве покупают определенный продукт, система может предсказать, что вы, скорее всего, купите тот же самый продукт.

Сешадхри и его соавторы математически продемонстрировали, что значительные структурные аспекты сложных сетей теряются в этом процессе встраивания. Они также подтвердили этот результат эмпирическим путем, протестировав различные техники встраивания на различных типах сложных сетей.

"Мы не говорим, что некоторые специфические методы терпят неудачу. Мы говорим, что любой метод встраивания, который дает вам небольшой список чисел, в корне провалится, потому что низкоразмерная геометрия просто недостаточно выразительна для социальных сетей и других сложных сетей", - сказал Сешадхри.

Важнейшей особенностью реальных социальных сетей является плотность треугольников, или связи между тремя людьми.

"Там, где у вас много треугольников, это означает, что в этой части социальной сети есть много структуры сообщества", - сказал Сешадхри - "более того, эти треугольники ещё более значительны, когда Вы смотрите на людей, которые имеют ограниченные социальные сети. В типичной социальной сети у некоторых людей есть тонны связей, но у большинства людей их не так много".

Низкоразмерные вложения ни в коем случае не являются единственными методами, используемыми для генерирования предсказаний и рекомендаций. Обычно они являются лишь одним из многих входов в очень большую и сложную модель машинного обучения.

"Эта модель - огромный черный ящик, и многие положительные результаты говорят о том, что если вы включите эти низкоразмерные вложения, ваша производительность вырастет, может быть, вы получите небольшой скачок. Но если бы вы использовали ее сами, то, похоже, вам бы много не хватало", - Сешадхри.

Он также отметил, что новые методы встраивания в основном сравниваются с другими. Однако последние эмпирические работы других исследователей показывают, что различные методы могут давать лучшие результаты для конкретных задач.

"Скажем, вы хотите предсказать, кто республиканец, а кто демократ. Существуют методы, разработанные специально для этой задачи, которые работают лучше, чем вложения", - сказал он. "Утверждается, что эти техники встраивания работают для решения многих различных задач, и поэтому многие люди их приняли. Кроме того, их очень легко подключить к существующей системе машинного обучения. Но для любой конкретной задачи, оказывается, всегда есть что-то лучшее, что можно сделать".

Учитывая растущее влияние машинного обучения в нашем обществе, Сешадхри сказал, что важно исследовать, являются ли обоснованными основополагающие предположения, лежащие в основе моделей.

"У нас есть все эти сложные машины, делающие вещи, которые существенно влияют на нашу жизнь. Наша идея заключается в том, что мы должны быть более осторожны в оценке этих техник", - говорит он. "Особенно в наше время, когда машинное обучение становится все более и более сложным, важно иметь некоторое понимание того, что можно и что нельзя делать".