Lemon-412 / chrome-dino-drl-bot

a2c solution for google chrome://dino game

a2c chrome-dino-game chrome-dinosor-jumping reinforcement-learning deep-reinforcement-learning actor-critic

Chrome-Dino DRL Boot

An attempt of apllying Actor-Critic reinforcement learning algorithm for google chrome-dino game.

For more details about chrome dino game：Google blog about Chrome Dino

项目 / Project

项目结构：

bot 文件夹下存放 a2c 算法和启发式算法。
env 文件夹下存放 chrome dino 环境和（用来调参的）chrome dino 模拟器环境。
utils 文件夹下存放用到的烂代码。

运行：

安装 requirements.txt
运行 a2c_bot_chrome_dino_main.py

环境 / Environment

因为不会前端，只能通过不断截屏 + 挟持键盘操作跳跃键实现与环境的交互。

使用 chrome 浏览器访问链接 chrome://dino
保持鼠标始终聚焦在浏览器上
运行env/chrome_dino.py 调整游戏图像到合适的位置

在使用 2k 分辨率显示器，保持网页处于全屏状态，并使用深色 chrome 主题时，可以不调整图像位置。

State

env 会不断将最新的游戏截取到屏幕中，bot 决策是否按下跳跃键。

将 t 时刻和 t-1 时刻的游戏画面截取合适的部分二值化后降低分辨率再 flatten 后拼接作为 state。

难点 / Hightlights

在线训练，即时性要求高
输入为高维数据，需要图像处理
惩罚延迟，当前时刻的决策可能要到若干时刻后才会产生后果
环境和游戏本身的随机性

效果 / Results

训练200轮游戏实际分数可以在500分左右。

参考 / References

Naive Bot 和环境抓取方案参考：guilhermej/dino_chrome_bot

A2C 算法参考：ChenglongChen/pytorch-DRL

About

a2c solution for google chrome://dino game

a2c chrome-dino-game chrome-dinosor-jumping reinforcement-learning deep-reinforcement-learning actor-critic

Languages

Language:Python 100.0%