在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称:rlcard开源软件地址:https://gitee.com/daochenzha/rlcard开源软件介绍:RLCard: 卡牌游戏强化学习工具包RLCard是一款卡牌游戏强化学习 (Reinforcement Learning, RL) 的工具包。 它支持多种卡牌游戏环境,具有易于使用的接口,以用于实现各种强化学习和搜索算法。 RLCard的目标是架起强化学习和非完全信息游戏之间的桥梁。 RLCard由DATA Lab at Rice and Texas A&M University以及社区贡献者共同开发.
社区:
新闻:
引用如果本项目对您有帮助,请添加引用: Zha, Daochen, et al. "RLCard: A Platform for Reinforcement Learning in Card Games." IJCAI. 2020. @inproceedings{zha2020rlcard, title={RLCard: A Platform for Reinforcement Learning in Card Games}, author={Zha, Daochen and Lai, Kwei-Herng and Huang, Songyi and Cao, Yuanpu and Reddy, Keerthana and Vargas, Juan and Nguyen, Alex and Wei, Ruzhe and Guo, Junyu and Hu, Xia}, booktitle={IJCAI}, year={2020}} 安装确保您已安装Python 3.6+和pip。我们推荐您使用 pip3 install rlcard 默认安装方式只包括卡牌环境。如果想使用PyTorch实现的训练算法,运行 pip3 install rlcard[torch] 如果您访问较慢,国内用户可以通过清华镜像源安装: pip3 install rlcard -i https://pypi.tuna.tsinghua.edu.cn/simple 或者,您可以克隆最新版本(如果您访问Github较慢,国内用户可以使用Gitee镜像): git clone https://github.com/datamllab/rlcard.git 或使只克隆一个分支以使其更快 git clone -b master --single-branch --depth=1 https://github.com/datamllab/rlcard.git 然后运行以下命令进行安装 cd rlcardpip3 install -e .pip3 install -e .[torch] 我们也提供conda安装方法: conda install -c toubun rlcard Conda安装只包含卡牌环境,您需要按照您的需求手动安装PyTorch。 释例以下是一个小例子 import rlcardfrom rlcard.agents import RandomAgentenv = rlcard.make('blackjack')env.set_agents([RandomAgent(num_actions=env.num_actions)])print(env.num_actions) # 2print(env.num_players) # 1print(env.state_shape) # [[2]]print(env.action_shape) # [None]trajectories, payoffs = env.run() RLCard可以灵活地连接各种算法,参考以下例子: 演示运行 >> Leduc Hold'em pre-trained model>> Start a new game!>> Agent 1 chooses raise=============== Community Card ===============┌─────────┐│░░░░░░░░░││░░░░░░░░░││░░░░░░░░░││░░░░░░░░░││░░░░░░░░░││░░░░░░░░░││░░░░░░░░░│└─────────┘=============== Your Hand ===============┌─────────┐│J ││ ││ ││ ♥ ││ ││ ││ J│└─────────┘=============== Chips ===============Yours: +Agent 1: +++=========== Actions You Can Choose ===========0: call, 1: raise, 2: fold>> You choose action (integer): 我们也提供图形界面以实现更便捷的调试,详情请查看这里。以下是一些演示: 可用环境我们从不同角度提供每种游戏的估算复杂度。InfoSet数量: 信息集数量;InfoSet尺寸: 单个信息集的平均状态数量;状态尺寸: 状态空间的尺寸;环境名: 应该传入
支持算法
预训练和基于规则的模型我们提供了一个模型集合作为基准线。
API小抄如何创建新的环境您可以使用以下的接口创建新环境,并且可以用字典传入一些可选配置项
环境创建完成后,我们就能访问一些游戏信息。
RLCard中的状态是什么状态(State)是一个Python字典。它包括观测值 基础接口以下接口提供基础功能,虽然其简单易用,但会对智能体做出一些前提假设。智能体必须符合智能体模版。
高级接口对于更高级的方法,可以使用以下接口来对游戏树进行更灵活的操作。这些接口不会对智能体有前提假设。
库结构主要模块的功能如下:
更多文档请参考这里查阅更多文档Documents。API文档在我们的网站中。 贡献我们非常感谢对本项目的贡献!请为反馈或漏洞创建Issue。如果您想恭喜代码,请参考贡献指引。如果您有任何问题,请联系通过[email protected]联系Daochen Zha 致谢我们诚挚的感谢竞技世界网络技术有限公司(JJ World Network Technology Co.,LTD)为本项目提供的大力支持,以及所有来自社区成员的贡献。 |
请发表评论