Задание: Машинное обучение. Помощь с доработкой программной части проекта ( RL, ML) (Дистанционная работа)
Среда для обучения самописная и уже готова ( игра пинг понг 2д). Данные отдаются в формате ( s,a,r,s' )
Нужно собрать датасеты и обучить 3 разных агентов ( CQL, DQN ) + докрутить метрики и графики обучения и тд
Также желательно обосновать свой выбор той или иной метрики
Задача супер оперативная