five

FronkonGames/steam-games-dataset|游戏数据数据集|市场分析数据集

收藏
hugging_face2024-01-11 更新2024-03-04 收录
游戏数据
市场分析
下载链接:
https://hf-mirror.com/datasets/FronkonGames/steam-games-dataset
下载链接
链接失效反馈
资源简介:
Steam Games Dataset包含了超过85,000款在Steam平台上发布的游戏信息,由Fronkon Games维护。数据是通过Steam的API和Steam Spy收集的,仅包含已发布的游戏,不包括DLC、剧集、音乐、视频等。数据集的主要用途是文本生成和文本到文本生成任务。文件中还提供了一个解析JSON信息的示例代码,展示了如何从数据集中提取各种游戏信息,如游戏名称、发布日期、估计拥有者数量、并发用户数、价格、支持的语言、开发者、出版商、类别、类型、截图、电影等。

Steam Games Dataset包含了超过85,000款在Steam平台上发布的游戏信息,由Fronkon Games维护。数据是通过Steam的API和Steam Spy收集的,仅包含已发布的游戏,不包括DLC、剧集、音乐、视频等。数据集的主要用途是文本生成和文本到文本生成任务。文件中还提供了一个解析JSON信息的示例代码,展示了如何从数据集中提取各种游戏信息,如游戏名称、发布日期、估计拥有者数量、并发用户数、价格、支持的语言、开发者、出版商、类别、类型、截图、电影等。
提供机构:
FronkonGames
原始信息汇总

数据集概述

  • 名称: Steam Games Dataset
  • 规模: 10K<n<100K
  • 许可: cc-by-4.0
  • 语言: 英语
  • 标签:
    • games
    • steam
    • video games
    • gamedev
  • 任务类别:
    • text-generation
    • text2text-generation
  • 配置:
    • config_name: default
    • data_files:
      • split: train
      • path: "data/train-00000-of-00001-e2ed184370a06932.parquet"

数据集内容

  • 游戏数量: 超过85,000款游戏
  • 数据来源: 通过Steam API和Steam Spy收集
  • 数据包含:
    • 游戏名称
    • 发布日期
    • 估计拥有者数量
    • 最高同时在线用户数
    • 适用年龄
    • 价格
    • DLC数量
    • 游戏详细描述
    • 游戏简短描述
    • 支持语言
    • 完整音频支持语言
    • 用户评论
    • 游戏封面图像URL
    • 游戏网站
    • 支持网址
    • 支持邮箱
    • 支持的操作系统(Windows, Mac, Linux)
    • 元批评分数
    • 元批评URL
    • 用户评分
    • 正面评价数量
    • 负面评价数量
    • 评分排名
    • 成就数量
    • 推荐数量
    • 额外信息
    • 平均游戏时间
    • 最近两周平均游戏时间
    • 中位数游戏时间
    • 最近两周中位数游戏时间
    • 可用的游戏包
    • 开发者
    • 发行商
    • 游戏类别
    • 游戏类型
    • 游戏截图URL
    • 游戏视频URL
    • 游戏标签

数据集维护

AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由Fronkon Games团队通过使用Steam平台提供的API以及Steam Spy的数据收集工具构建而成。数据集涵盖了超过85,000款在Steam上发布的游戏,排除了DLC、剧集、音乐、视频等非游戏内容。数据采集过程严格遵循MIT许可协议,确保了数据的合法性和可靠性。通过自动化脚本,从Steam和Steam Spy中提取了包括游戏名称、发布日期、价格、用户评价、支持的操作系统等详细信息,形成了这一全面的游戏数据集。
使用方法
用户可以通过Python脚本轻松解析数据集中的JSON文件,提取所需的游戏信息。数据集适用于多种任务,如文本生成、文本到文本生成等。用户可以根据游戏名称、发布日期、价格等字段进行筛选和分析,或利用用户评分、成就数量等数据进行深入的市场研究。此外,数据集还支持对游戏支持的操作系统、语言、开发者信息等进行多维度的查询和分析,为各类研究提供了灵活的使用方式。
背景与挑战
背景概述
随着电子游戏产业的迅猛发展,Steam作为全球最大的PC游戏平台,其上发布的游戏数据具有极高的研究价值。Fronkon Games团队通过Steam API和Steam Spy收集了超过85,000款已发布游戏的详细信息,构建了Steam Games Dataset。该数据集涵盖了从游戏名称、发布日期、价格到用户评分、支持语言等多维度信息,为游戏开发者、市场分析师以及学术研究者提供了宝贵的资源。这一数据集的创建不仅填补了游戏行业数据分析的空白,还为相关领域的研究提供了新的视角和工具。
当前挑战
构建Steam Games Dataset面临的主要挑战包括数据获取的复杂性和数据质量的保证。首先,通过Steam API和Steam Spy收集数据需要处理大量的异构信息,确保数据的完整性和准确性。其次,由于游戏数据的动态性,如何实时更新数据集以反映最新的市场变化也是一个重要问题。此外,数据集中包含的文本信息(如游戏描述、用户评论等)需要进行有效的文本处理和分析,以提取有价值的信息。这些挑战不仅涉及技术层面的难题,还要求研究者具备对游戏行业的深刻理解。
常用场景
经典使用场景
在游戏开发与市场分析领域,FronkonGames/steam-games-dataset 数据集被广泛用于游戏文本生成与文本到文本生成任务。该数据集包含了超过85,000款在Steam平台上发布的游戏详细信息,涵盖了游戏名称、发布日期、价格、用户评价、支持的操作系统等多维度数据。这些信息为游戏开发者提供了宝贵的市场参考,帮助他们优化游戏设计与市场策略。同时,研究人员可以利用该数据集进行游戏推荐系统的开发,通过分析用户评分、游戏描述等数据,构建个性化的游戏推荐模型。
解决学术问题
该数据集解决了游戏行业中多个重要的学术研究问题,如游戏市场的动态变化、用户偏好的预测以及游戏生命周期的分析。通过分析游戏发布时间、用户评分、销售数据等,研究人员可以深入探讨游戏市场的竞争格局与用户行为模式。此外,数据集中的多语言支持信息为跨文化游戏设计提供了理论依据,帮助开发者更好地理解不同文化背景下的用户需求。这些研究成果不仅推动了游戏行业的理论发展,也为实际应用提供了科学支持。
实际应用
在实际应用中,FronkonGames/steam-games-dataset 数据集被广泛应用于游戏推荐系统、市场分析工具以及用户行为研究。游戏公司可以利用该数据集分析竞争对手的游戏表现,优化自身产品的定价策略与市场推广方案。同时,数据集中的用户评分与评论信息为游戏质量评估提供了客观依据,帮助开发者及时调整游戏内容与功能。此外,该数据集还可用于构建智能客服系统,通过分析用户反馈与支持信息,提升客户服务效率与用户满意度。
数据集最近研究
最新研究方向
在游戏产业蓬勃发展的背景下,FronkonGames/steam-games-dataset数据集凭借其丰富的游戏信息,成为研究游戏市场趋势和玩家行为的重要资源。该数据集涵盖了超过85,000款Steam平台上的游戏,提供了从游戏名称、发布日期到用户评价和市场表现的详细数据。近期研究方向主要集中在利用该数据集进行游戏推荐系统的优化,通过分析用户评分、游戏时长和用户推荐等数据,提升个性化推荐的准确性。此外,该数据集还被广泛应用于游戏市场分析,帮助开发者理解不同类型游戏的受欢迎程度和市场表现,从而指导新游戏的开发策略。随着游戏产业的全球化发展,跨文化游戏内容分析也成为研究热点,利用该数据集中的多语言支持信息,研究不同语言版本对游戏成功的影响。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2023)

地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2023年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2023)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。

国家青藏高原科学数据中心 收录