Дэвид Сильвер (один из основателей DeepMind) и Ричард Саттон (автор классического учебника по обучению с подкреплением) выпустили статью, только это не привычная нам статья с результатами, а то, что в англоязычной литературе называется position paper; в этой работе они постулируют начало "эры опыта", когда модели начнут получать информацию непосредственно взаимодействуя с миром; это аналог того, как обучаются дети с одной стороны я согласен, т.к. к 13 годам человек в среднем видел 100 миллионов слов, но способен выполнять задачи, на которые современные LLM, которые видели по нескольку триллионов слов; из этого с очевидностью следует, что опыт взаимодействия с миром важен; с другой стороны, не очень понятно, как это все будет интегрировано - мультимодальность еще далека от идеала
Дэвид Сильвер (один из основателей DeepMind) и Ричард Саттон (автор классического учебника по обучению с подкреплением) выпустили статью
3 июня 20253 июн 2025
2
~1 мин