Недавно исследователи из MIT и Харвардского университета объединили свои усилия, чтобы создать новую систему машинного обучения, которая использует обучение с подкреплением, и которая может существенно улучшить процесс обучения и искусственный интеллект в целом.
Обучение с подкреплением - это метод обучения, в котором компьютер самостоятельно определяет, какие действия следует предпринять, чтобы достичь конечной цели. Исследователи смогли улучшить этот метод, добавив элементы обучения от человека. Они разработали систему, которая использует данные обратной связи от людей, чтобы помочь компьютеру принимать более точные решения.
В экспериментах с использованием новой системы, исследователи смогли добиться существенного улучшения производительности, которая превзошла результаты существующих методов машинного обучения. Это открывает новые возможности для разработки более эффективных и точных систем искусственного интеллекта.
"Этот подход открывает новые горизонты для машинного обучения", - говорит профессор Мэтт Волкович, один из авторов исследования. "Мы смогли добиться существенного улучшения производительности, которое может привести к более точным результатам в различных областях, таких как медицина, финансы, автоматизация и другие".
Новая система машинного обучения уже вызвала большой интерес в индустрии и среди ученых. Исследователи надеются, что их работа поможет улучшить производительность и точность систем искусственного интеллекта, и позволит использовать их в более широком спектре задач.