Найти в Дзене
ТехноLOG

Джеффри Хинтон: глубокое обучение и современный искусственный интеллект

Джеффри Хинтон - британско-канадский когнитивный психолог, специалист по информатике и технологический предприниматель, сыгравший ключевую роль в развитии искусственного интеллекта (ИИ), особенно в области глубокого обучения. Его вклад охватывает несколько десятилетий, определяя направление исследований, теории и применения искусственного интеллекта.

О Джеффри Хинтоне

Родился 6 сентября 1947 года в Лондоне, Англия. Получив степень бакалавра математики и физики в Кембриджском университете в 1969 году, Хинтон некоторое время занимался геофизикой, прежде чем вернуться в академические круги. Он получил степень магистра и докторскую степень по психологии в Эдинбургском университете в 1973 и 1978 годах, соответственно. Также в 1978 году защитил докторскую диссертацию, которая называлась "Анализ и распознавание рукописных символов с помощью нейронной сети".

В 1982 году Хинтон поступил на работу в Массачусетский технологический институт (MIT), где стал соавтором машины Больцмана - ранней архитектуры нейронных сетей для обучения искусственных нейронных сетей без присмотра. После недолгого пребывания в Университете Карнеги-Меллона Хинтон в 1986 году вернулся в Массачусетский технологический институт, где стал одним из основателей программы когнитивных наук и инженерии. В 1987 году опубликовал новаторскую статью под названием "Изучение представлений с помощью ошибок обратного распространения", которая популяризировала алгоритм обратного распространения и подогрела интерес к нейронным сетям.

С 1992 по 1998 год Хинтон возглавлял лабораторию нейронных вычислений в Университете Торонто, продемонстрировав первые успехи в применении методов глубокого обучения к различным задачам, таким как распознавание символов, с помощью знаменитого набора данных MNIST.

С 1998 по 2001 год возглавлял подразделение вычислительной нейронауки имени Гэтсби в Университетском колледже Лондона, а затем снова вернулся в Университет Торонто, где с 2004 по 2013 год был директором программы "Нейронные вычисления и адаптивное восприятие", финансируемой Канадским институтом перспективных исследований.

В 2007 году Хинтон и его ученик Руслан Салахутдинов применили глубокое обучение к распознаванию речи, добившись потрясающих результатов, которые привели к значительному повышению точности распознавания речи. В 2012 году Хинтон и его студенты выиграли конкурс, спонсируемый компанией Merck, чтобы продемонстрировать, что глубокое обучение может быть использовано для прогнозирования активности потенциальных молекул лекарств, демонстрируя потенциал искусственного интеллекта в разработке лекарств. В 2018 году Хинтон, наряду с Яном Лекуном и Йошуа Бенгио, получил премию Тьюринга, которую часто называют Нобелевской премией в области вычислительной техники, за разработку методов глубокого обучения.

Заметный вклад

Обратное распространение и обучение нейронных сетей

Работа Хинтона над обратным распространением (существенно развит, впервые описан А. И. Галушкиным в 1974 году) в 1986 году, широко используемым алгоритмом для обучения искусственных нейронных сетей, сыграла важную роль в том, что этот подход стал доступным с точки зрения вычислений для практического применения.

Ограниченные машины Больцмана (Restricted Boltzmann Machines)

В 1985 году, вместе с Терри Сейновски и Дэвидом Экли, Хинтон разработал ограниченную машину Больцмана, модель стохастической нейронной сети, которая была разработана для распознавания сложных паттернов без контроля или помеченных обучающих данных и рассматривалась как стохастический генеративный вариант сети Хопфилда.

Капсульные сети

В 1979 году (сформулирована в 2011 году и опубликована в двух статьях в октябре 2017 года) Хинтон предложил капсульные сети - новый тип архитектуры нейронных сетей, направленный на улучшение понимания и обработки визуальной информации компьютерами. Главными преимуществами данной архитектуры является существенное снижение размеров необходимой для обучения выборки, а также повышение точности распознавания. Ключевым нововведением капсульных нейросетей является наличие так называемых капсул — элементов, являющихся промежуточными единицами между нейронами и слоями, которые представляют собой группы виртуальных нейронов, отслеживающих не только отдельные детали изображения, но и их расположение друг относительно друга.

Метод отсева

Чтобы решить проблему переобучения нейронных сетей, Хинтон совместно с другими разработчиками разработал метод отсева. Этот метод предполагает случайное отбрасывание единиц во время обучения, что помогает сети лучше адаптироваться к новым данным.

GEATMX

Во время учебы в Университете Торонто Хинтон разработал GEATMX, программу, которая помогла исследователям упростить внедрение методов глубокого обучения и эксперименты с ними.

GAN и генеративное моделирование

Исследования Хинтона повлияли на развитие генеративных состязательных сетей (Generative Adversarial Networks) и генеративного моделирования, совершив революцию в создании изображений и креативных приложениях искусственного интеллекта.

Глубокое обучение и сверточные нейронные сети

Работа Хинтона в 1980-х и 1990-х годах была сосредоточена на использовании глубокого обучения для задач распознавания изображений посредством обучения сверточных нейронных сетей (Convolutional Neural Networks). Его работа продемонстрировала, что глубокое обучение может соответствовать производительности человека в задачах распознавания образов, прокладывая путь к дальнейшим достижениям в области глубокого обучения и его приложений.

Numenta

В 2005 году Хинтон стал соучредителем Numenta, компании, специализирующейся на разработке алгоритмов искусственного интеллекта, вдохновленных тем, как человеческий мозг обрабатывает и синтезирует информацию.

DNN Research

В 2008 году, Хинтон стал соучредителем компании DNN Research, которая в 2013 году была приобретена Google. Это стало важным шагом на пути внедрения глубокого обучения в технологическую индустрию.

Google Brain и DeepMind

В 2012 году Хинтон стал соучредителем команды Google Brain в Google Inc., где он занимал должность вице-президента и научного сотрудника, возглавляя разработку методов глубокого обучения для обработки изображений, речи и языков. Два года спустя Хинтон стал соучредителем DeepMind Technologies, британской компании, занимающейся искусственным интеллектом, которая позже была приобретена Alphabet Inc. (Материнской компанией Google).

С момента прихода в Google Хинтон продолжал работать над различными проектами, в том числе над разработкой концепции "капсульных сетей", которые призваны улучшить то, как системы искусственного интеллекта справляются с распознаванием объектов и обработкой изображений.

В 2023 году, Хинтон и его команда в Google опубликовали статью, в которой представили новую архитектуру искусственного интеллекта под названием "Модель Transformer Foundation", которая продемонстрировала замечательные возможности в задачах обработки естественного языка. В мае этого же года он объявил о своем уходе из Google, чтобы иметь возможность "свободно высказываться о рисках, связанных с ИИ", выразив обеспокоенность по поводу преднамеренного злоупотребления со стороны злоумышленников, технологической безработицы и экзистенциального риска, связанного с искусственным интеллектом в целом.

Vector Institute

Джеффри Хинтон также сыграл решающую роль в создании Vector Institute, независимого исследовательского института искусственного интеллекта в Торонто.

Наследие

Вклад Джеффри Хинтона в область искусственного интеллекта охватывает десятилетия и оказал глубокое влияние как на теорию, так и на применение искусственного интеллекта. Известная как "Крестный отец глубокого обучения", новаторская работа Хинтона в области нейронных сетей, обратного распространения и глубокого обучения заложила основу для современных систем искусственного интеллекта, которые на сегодняшний день являются одними из самых передовых приложений в области вычислений.

Многочисленные организации, от таких технологических гигантов, как Google и Microsoft, до начинающих стартапов, продолжают использовать идеи и методы Хинтона для разработки систем искусственного интеллекта, что отражает преобразующее влияние его работы на развитие исследований и приложений в области искусственного интеллекта.

Беспрецедентный вклад Джеффри Хинтона в область искусственного интеллекта закрепил за ним репутацию первопроходца, дальновидного человека и незаменимой фигуры. Новаторская работа Хинтона в области глубокого обучения, нейронных сетей и когнитивных вычислений не только коренным образом изменила наше понимание искусственного интеллекта, но и проложила путь к захватывающим открытиям и приложениям, которые должны по-новому определить будущее искусственного интеллекта и его роль в обществе.