Обучение с подкреплением: игра в обучение. В мире, где искусственный интеллект (AI) управляет автомобилями и побеждает чемпионов в шахматы, загадочно звучит фраза "обучение с подкреплением". Это не просто ещё одна жаргонная фраза, а мощный метод обучения машин. Давайте разберемся, как AI учится на своих ошибках, делая "ошибки" полезным инструментом. AI и его "школьные годы". Представьте AI как школьника, который учится играть в шахматы. Вместо чтения книг или просмотра лекций, он сам играет и учится на ходу...
4 месяца назад
9,4K подписчиков
Обучение с подкреплением (RL) отлично решает задачи с нуля, но обучить агента понимать обратимость его действий не так-то просто. Например, роботам следует избегать действий, которые могут привести к их поломке. Чтобы оценить обратимость действия, нужны практические знания и понимание физики среды, в которой существует RL-агент. Поэтому исследователи Google AI на конференции NeurIPS 2021 представляем новый способ аппроксимации обратимости действий RL-агентов. Этот подход добавляет отдельный компонент...
2 года назад
1,8K подписчиков
Всем привет. Я не так давно начал изучать машинное обучение, в частности обучение с подкреплением. Изучил не так уж много, но достаточно, чтобы в моей голове щелкнуло и сложилось два + два. Особенно после того, как ютуб внезапно порекомендовал к просмотру данное видео: Важно! Дисклеймер! Я ничего не утверждаю, никого не обвиняю и не имею морального права судить кого-то. Это просто оценочное суждение, не стоит воспринимать его всерьез. Выводы сделанные в этой статье могут быть ошибочными, тем более...
2 года назад
5,3K подписчиков
На протяжении нескольких последних лет наблюдается значительный прирост производительности систем искусственного интеллекта. Это привело к тому, что каждая вторая компания теперь заявляет о применении ИИ в своей деятельности. Несмотря на стремительное развитие данной технологии, ей все еще присущи серьезные недостатки, которые рассмотрены в материале. Компьютер работает по алгоритмам Сейчас изучение и применение искусственного интеллекта в большинстве случаев сводится к созданию нейросети, алгоритмы работы которой появляются в результате машинного обучения...
5 лет назад