five

poker_hands

收藏
Hugging Face2025-11-28 更新2025-11-29 收录
下载链接:
https://huggingface.co/datasets/takara-ai/poker_hands
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含11种扑克变体的扑克手牌历史数据集,数据格式为扑克手牌历史(PHH)。具体内容包括:2009年7月1日至23日,从多个在线扑克平台抓取的匿名无限制德州扑克手牌记录,2023年世界扑克系列赛第43项赛事的电视转播决赛桌上的83手牌,Pluribus AI在Brown和Sandholm (2019)论文补充材料中公布的10,000手牌,一些历史扑克手牌,以及来自Wikipedia的Badugi手牌示例。

This is a poker hand history dataset encompassing 11 poker variants, with the data format being Poker Hand History (PHH). The specific contents include: anonymous no-limit Texas Hold'em hand records scraped from multiple online poker platforms between July 1 and 23, 2009; 83 hands from the televised final table of Event #43 of the 2023 World Series of Poker; 10,000 hands released by Pluribus AI in the supplementary materials of Brown and Sandholm (2019); some historical poker hands; and Badugi hand examples sourced from Wikipedia.
创建时间:
2025-11-28
原始信息汇总

Poker Hands数据集概述

数据集基本信息

  • 数据集名称: Poker Hands
  • 存储位置: https://huggingface.co/datasets/takara-ai/poker_hands
  • 许可证: CC-BY-4.0
  • 原始数据集: https://zenodo.org/records/13997158

数据规模

  • 训练集样本数量: 21,616,175
  • 训练集大小: 18,289,095,776字节
  • 下载大小: 1,284,958,325字节

数据内容构成

扑克手牌历史记录

  • 包含11种扑克变体的手牌历史记录
  • 采用扑克手牌历史(PHH)格式

具体组成部分

  1. 无限制德州扑克手牌

    • 数量:21,605,687手
    • 来源:2009年7月1日至23日匿名手牌历史日志
    • 上传者:HandHQ
    • 级别范围:25NL至1000NL
    • 扑克平台分布:
      • Absolute Poker:1,270,658手
      • Full Tilt Poker:1,299,503手
      • iPoker Network:5,996,345手
      • Ongame Network:1,647,765手
      • PokerStars:3,092,698手
      • PartyPoker:8,298,718手
  2. 电视转播手牌

    • 2023年世界扑克系列赛第43项赛事最终桌全部83手牌
    • 赛事:$50,000扑克玩家锦标赛第5天
  3. Pluribus AI手牌

    • 数量:10,000手
    • 来源:Brown和Sandholm(2019)论文补充材料
  4. 历史扑克手牌选集

    • 4组历史扑克手牌选择
  5. Badugi手牌示例

    • 1手Badugi手牌
    • 来源:维基百科Badugi页面

数据特征结构

基础信息字段

  • 游戏变体(variant)、场所(venue)、牌桌(table)
  • 时间信息(time, time_zone_abbreviation, day, month, year)
  • 货币信息(currency_symbol, currency)
  • 地理位置(city, region, country, address, postal_code)
  • 赛事信息(event, author)
  • 来源信息(source_file, source_type)

牌局技术字段

  • 手牌编号(hand_number_in_file)
  • 座位数量(seat_count)
  • 下注结构(min_bet, small_bet, big_bet, bring_in)
  • 前注修剪状态(ante_trimming_status)

列表类型字段

  • 玩家行动(actions)
  • 玩家信息(players)
  • 前注金额(antes)
  • 盲注或 straddles(blinds_or_straddles)
  • 起始筹码(starting_stacks)
  • 结束筹码(finishing_stacks)
  • 赢取金额(winnings)
  • 座位信息(seats)
搜集汇总
数据集介绍
main_image_url
构建方式
在扑克数据分析领域,poker_hands数据集通过系统化采集多源历史记录构建而成。其核心数据来源于2009年7月间从六大主流扑克平台获取的匿名手牌历史日志,涵盖无限注德州扑克等多种变体,同时整合了职业赛事记录与学术研究样本,包括2023年世界扑克系列赛决赛桌实录和Pluribus人工智能对局数据。这种多维度采集方式既保证了数据的广泛代表性,又确保了专业对局的质量基准。
特点
该数据集最显著的特征在于其丰富的时间空间维度与完整的游戏状态记录。每个手牌数据不仅包含基础的游戏变体、场地信息和时间戳,还详细记载了筹码动态、下注行为与座位分布等关键参数。特别值得注意的是数据集囊括了从微级别到高额桌的全范围注码规模,并完整保存了每手牌的动作序列与筹码流动轨迹,为研究扑克策略演化提供了立体化的观察视角。
使用方法
研究者可借助该数据集开展扑克人工智能训练、博弈论分析与玩家行为建模等多维度研究。通过解析动作序列与筹码变化数据,能够重构完整的对局决策树;结合时间地点元数据,则可进行跨平台策略比较研究。数据集采用标准化的手牌历史格式,支持直接导入主流扑克分析软件进行可视化处理,亦可通过编程接口提取特定变体或注码级别的子集进行针对性分析。
背景与挑战
背景概述
在博弈论与人工智能交叉领域,扑克游戏因其不完全信息特性成为研究多智能体决策的重要平台。poker_hands数据集由HandHQ团队于2009年7月主导构建,整合了来自Absolute Poker、PokerStars等六大主流平台的匿名手牌历史记录,涵盖无限注德州扑克等11种变体。该数据集通过收录Pluribus人工智能对战记录与WSOP锦标赛实况,为不完全信息博弈理论验证与智能体训练提供了关键数据支撑,显著推动了可扩展博弈求解算法的发展。
当前挑战
数据集构建面临多源异构数据整合难题,各平台手牌记录格式差异与时间戳标注不一致需复杂清洗流程。核心挑战在于不完全信息博弈的决策树空间爆炸问题,德州扑克等变体需处理10^160量级的决策节点,传统博弈论方法难以直接应用。匿名化处理虽保护隐私却导致玩家风格连续性分析受限,且实时动态下注策略与非完美回忆博弈场景对模型泛化能力提出更高要求。
常用场景
经典使用场景
在博弈论与人工智能交叉领域,poker_hands数据集作为扑克牌局历史的标准化记录,常被用于构建智能体决策模型。其涵盖多种扑克变体与真实对局场景的特性,使得研究者能够基于历史手牌数据训练强化学习算法,模拟人类玩家的策略选择过程,进而优化智能体在非完全信息博弈环境中的表现。
实际应用
依托该数据集构建的扑克AI系统已在职业选手训练、在线平台反作弊等领域产生实际价值。例如通过分析数百万手牌数据生成的策略模型,既能辅助人类玩家识别决策漏洞,也为金融风控、军事推演等需要处理不完全信息的复杂系统提供了可迁移的技术范式。
衍生相关工作
以该数据集为基石衍生的经典研究包括Pluribus超人类扑克AI系统,其通过自我对弈与历史数据融合训练实现了六人桌扑克的突破。后续工作进一步拓展至不完全信息博弈的理论框架构建,催生了如反事实遗憾最小化算法的系列改进版本,持续推动着决策智能领域的技术革新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作