FronkonGames/steam-games-dataset
收藏Hugging Face2024-01-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/FronkonGames/steam-games-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Steam Games Dataset包含了超过85,000款在Steam平台上发布的游戏信息,由Fronkon Games维护。数据是通过Steam的API和Steam Spy收集的,仅包含已发布的游戏,不包括DLC、剧集、音乐、视频等。数据集的主要用途是文本生成和文本到文本生成任务。文件中还提供了一个解析JSON信息的示例代码,展示了如何从数据集中提取各种游戏信息,如游戏名称、发布日期、估计拥有者数量、并发用户数、价格、支持的语言、开发者、出版商、类别、类型、截图、电影等。
Steam Games Dataset包含了超过85,000款在Steam平台上发布的游戏信息,由Fronkon Games维护。数据是通过Steam的API和Steam Spy收集的,仅包含已发布的游戏,不包括DLC、剧集、音乐、视频等。数据集的主要用途是文本生成和文本到文本生成任务。文件中还提供了一个解析JSON信息的示例代码,展示了如何从数据集中提取各种游戏信息,如游戏名称、发布日期、估计拥有者数量、并发用户数、价格、支持的语言、开发者、出版商、类别、类型、截图、电影等。
提供机构:
FronkonGames
原始信息汇总
数据集概述
- 名称: Steam Games Dataset
- 规模: 10K<n<100K
- 许可: cc-by-4.0
- 语言: 英语
- 标签:
- games
- steam
- video games
- gamedev
- 任务类别:
- text-generation
- text2text-generation
- 配置:
- config_name: default
- data_files:
- split: train
- path: "data/train-00000-of-00001-e2ed184370a06932.parquet"
数据集内容
- 游戏数量: 超过85,000款游戏
- 数据来源: 通过Steam API和Steam Spy收集
- 数据包含:
- 游戏名称
- 发布日期
- 估计拥有者数量
- 最高同时在线用户数
- 适用年龄
- 价格
- DLC数量
- 游戏详细描述
- 游戏简短描述
- 支持语言
- 完整音频支持语言
- 用户评论
- 游戏封面图像URL
- 游戏网站
- 支持网址
- 支持邮箱
- 支持的操作系统(Windows, Mac, Linux)
- 元批评分数
- 元批评URL
- 用户评分
- 正面评价数量
- 负面评价数量
- 评分排名
- 成就数量
- 推荐数量
- 额外信息
- 平均游戏时间
- 最近两周平均游戏时间
- 中位数游戏时间
- 最近两周中位数游戏时间
- 可用的游戏包
- 开发者
- 发行商
- 游戏类别
- 游戏类型
- 游戏截图URL
- 游戏视频URL
- 游戏标签
数据集维护
- 维护者: Fronkon Games
- 数据集创建代码: Steam-Games-Scraper (MIT许可)
搜集汇总
数据集介绍

构建方式
该数据集由Fronkon Games团队通过使用Steam平台提供的API以及Steam Spy的数据收集工具构建而成。数据集涵盖了超过85,000款在Steam上发布的游戏,排除了DLC、剧集、音乐、视频等非游戏内容。数据采集过程严格遵循MIT许可协议,确保了数据的合法性和可靠性。通过自动化脚本,从Steam和Steam Spy中提取了包括游戏名称、发布日期、价格、用户评价、支持的操作系统等详细信息,形成了这一全面的游戏数据集。
使用方法
用户可以通过Python脚本轻松解析数据集中的JSON文件,提取所需的游戏信息。数据集适用于多种任务,如文本生成、文本到文本生成等。用户可以根据游戏名称、发布日期、价格等字段进行筛选和分析,或利用用户评分、成就数量等数据进行深入的市场研究。此外,数据集还支持对游戏支持的操作系统、语言、开发者信息等进行多维度的查询和分析,为各类研究提供了灵活的使用方式。
背景与挑战
背景概述
随着电子游戏产业的迅猛发展,Steam作为全球最大的PC游戏平台,其上发布的游戏数据具有极高的研究价值。Fronkon Games团队通过Steam API和Steam Spy收集了超过85,000款已发布游戏的详细信息,构建了Steam Games Dataset。该数据集涵盖了从游戏名称、发布日期、价格到用户评分、支持语言等多维度信息,为游戏开发者、市场分析师以及学术研究者提供了宝贵的资源。这一数据集的创建不仅填补了游戏行业数据分析的空白,还为相关领域的研究提供了新的视角和工具。
当前挑战
构建Steam Games Dataset面临的主要挑战包括数据获取的复杂性和数据质量的保证。首先,通过Steam API和Steam Spy收集数据需要处理大量的异构信息,确保数据的完整性和准确性。其次,由于游戏数据的动态性,如何实时更新数据集以反映最新的市场变化也是一个重要问题。此外,数据集中包含的文本信息(如游戏描述、用户评论等)需要进行有效的文本处理和分析,以提取有价值的信息。这些挑战不仅涉及技术层面的难题,还要求研究者具备对游戏行业的深刻理解。
常用场景
经典使用场景
在游戏开发与市场分析领域,FronkonGames/steam-games-dataset 数据集被广泛用于游戏文本生成与文本到文本生成任务。该数据集包含了超过85,000款在Steam平台上发布的游戏详细信息,涵盖了游戏名称、发布日期、价格、用户评价、支持的操作系统等多维度数据。这些信息为游戏开发者提供了宝贵的市场参考,帮助他们优化游戏设计与市场策略。同时,研究人员可以利用该数据集进行游戏推荐系统的开发,通过分析用户评分、游戏描述等数据,构建个性化的游戏推荐模型。
解决学术问题
该数据集解决了游戏行业中多个重要的学术研究问题,如游戏市场的动态变化、用户偏好的预测以及游戏生命周期的分析。通过分析游戏发布时间、用户评分、销售数据等,研究人员可以深入探讨游戏市场的竞争格局与用户行为模式。此外,数据集中的多语言支持信息为跨文化游戏设计提供了理论依据,帮助开发者更好地理解不同文化背景下的用户需求。这些研究成果不仅推动了游戏行业的理论发展,也为实际应用提供了科学支持。
实际应用
在实际应用中,FronkonGames/steam-games-dataset 数据集被广泛应用于游戏推荐系统、市场分析工具以及用户行为研究。游戏公司可以利用该数据集分析竞争对手的游戏表现,优化自身产品的定价策略与市场推广方案。同时,数据集中的用户评分与评论信息为游戏质量评估提供了客观依据,帮助开发者及时调整游戏内容与功能。此外,该数据集还可用于构建智能客服系统,通过分析用户反馈与支持信息,提升客户服务效率与用户满意度。
数据集最近研究
最新研究方向
在游戏产业蓬勃发展的背景下,FronkonGames/steam-games-dataset数据集凭借其丰富的游戏信息,成为研究游戏市场趋势和玩家行为的重要资源。该数据集涵盖了超过85,000款Steam平台上的游戏,提供了从游戏名称、发布日期到用户评价和市场表现的详细数据。近期研究方向主要集中在利用该数据集进行游戏推荐系统的优化,通过分析用户评分、游戏时长和用户推荐等数据,提升个性化推荐的准确性。此外,该数据集还被广泛应用于游戏市场分析,帮助开发者理解不同类型游戏的受欢迎程度和市场表现,从而指导新游戏的开发策略。随着游戏产业的全球化发展,跨文化游戏内容分析也成为研究热点,利用该数据集中的多语言支持信息,研究不同语言版本对游戏成功的影响。
以上内容由遇见数据集搜集并总结生成



