Найти в Дзене
11 тыс подписчиков

🔥 Новый беспланый курс по Reinforcement Learning from Human Feedback!


RLHF - это одна из ключевых техник, которая привела к появлению современных LLM.

В этом курсе, который ведет Никита Намджоши, разработчик из GenAI в
Google cloud, вы узнаете, как работает RLHF, в том числе как применить его для настройки LLM в собственных приложениях.

Вы также воспользуетесь библиотекой с открытым исходным кодом для настройки базового LLM и оцените настроенную модель, сравнив ее ответы до и после RLHF-настройки.


🔥 Новый беспланый курс по Reinforcement Learning from Human Feedback!  RLHF - это одна из ключевых техник, которая привела к появлению современных LLM.
03:26
Около минуты