Добавить в корзинуПозвонить
Найти в Дзене

Дэвид Сильвер (один из основателей DeepMind) и Ричард Саттон (автор классического учебника по обучению с подкреплением) выпустили статью

Дэвид Сильвер (один из основателей DeepMind) и Ричард Саттон (автор классического учебника по обучению с подкреплением) выпустили статью, только это не привычная нам статья с результатами, а то, что в англоязычной литературе называется position paper; в этой работе они постулируют начало "эры опыта", когда модели начнут получать информацию непосредственно взаимодействуя с миром; это аналог того, как обучаются дети с одной стороны я согласен, т.к. к 13 годам человек в среднем видел 100 миллионов слов, но способен выполнять задачи, на которые современные LLM, которые видели по нескольку триллионов слов; из этого с очевидностью следует, что опыт взаимодействия с миром важен; с другой стороны, не очень понятно, как это все будет интегрировано - мультимодальность еще далека от идеала

Дэвид Сильвер (один из основателей DeepMind) и Ричард Саттон (автор классического учебника по обучению с подкреплением) выпустили статью, только это не привычная нам статья с результатами, а то, что в англоязычной литературе называется position paper; в этой работе они постулируют начало "эры опыта", когда модели начнут получать информацию непосредственно взаимодействуя с миром; это аналог того, как обучаются дети

с одной стороны я согласен, т.к. к 13 годам человек в среднем видел 100 миллионов слов, но способен выполнять задачи, на которые современные LLM, которые видели по нескольку триллионов слов; из этого с очевидностью следует, что опыт взаимодействия с миром важен; с другой стороны, не очень понятно, как это все будет интегрировано - мультимодальность еще далека от идеала