google-research

Форк
0

README.md

ConQUR

Code for ConQUR as described in "ConQUR: Mitigating Delusional Bias in Deep Q-learning" by Andy Su, Jayden Ooi, Tyler Lu, Dale Schuurmans, and Craig Boutilier.

The paper is available on arXiv here.

Basic Command

To run ConQUR on Pong:

python -m conqur.main --save_dir=$HOME/conqur --env_name=Pong --logtostderr

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.