five

items_raw_lite

收藏
Hugging Face2026-04-18 更新2026-04-19 收录
下载链接:
https://huggingface.co/datasets/KumudithaSilva/items_raw_lite
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与视频游戏相关的信息,涵盖了多个维度的特征。数据集包含20,000个训练样本、1,000个验证样本和1,000个测试样本。每个样本包含23个特征,包括游戏名称(name)、峰值同时在线玩家数(peakCCU)、年龄限制(required_age)、价格(price)、DLC数量(dlcCount)、支持的操作系统(Windows/Mac/Linux)、正面评价数(positive)、负面评价数(negative)、成就数量(achievements)、推荐数(recommendations)、发行日期(release_year/month/day)、简短描述(small_description)、预估拥有者范围(min/max_estimatedOwners)、支持的语言数量(supported_languages)、开发商数量(num_developers)、发行商数量(num_publishers)、类别数量(num_categories)和游戏类型数量(num_genres)。数据集总大小约为8.18MB,下载大小约为3.9MB。
创建时间:
2026-04-16
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称: items_raw_lite
  • 发布者: KumudithaSilva
  • 存储库地址: https://huggingface.co/datasets/KumudithaSilva/items_raw_lite

数据集内容与结构

  • 数据总量: 22,000 条样本
  • 数据集总大小: 8,359,341 字节
  • 下载大小: 4,047,314 字节
  • 数据格式: 结构化数据,包含 24 个特征字段

数据特征说明

  • id: 整型,唯一标识符
  • name: 字符串,名称
  • peakCCU: 整型,峰值同时在线用户数
  • required_age: 整型,所需年龄
  • price: 浮点型,价格
  • dlcCount: 整型,可下载内容数量
  • supportWindows: 布尔型,支持 Windows 系统
  • supportMac: 布尔型,支持 Mac 系统
  • supportLinux: 布尔型,支持 Linux 系统
  • positive: 整型,正面评价数量
  • negative: 整型,负面评价数量
  • achievements: 整型,成就数量
  • recommendations: 整型,推荐数量
  • release_year: 整型,发布年份
  • release_month: 整型,发布月份
  • release_day: 整型,发布日
  • small_description: 字符串,简短描述
  • min_estimatedOwners: 整型,最小预估拥有者数量
  • max_estimatedOwners: 整型,最大预估拥有者数量
  • supported_languages: 整型,支持语言数量
  • num_developers: 整型,开发者数量
  • num_publishers: 整型,发行商数量
  • num_categories: 整型,类别数量
  • num_genres: 整型,流派数量

数据划分详情

  • 训练集 (train)
    • 样本数量: 20,000
    • 数据大小: 7,600,945 字节
  • 验证集 (validation)
    • 样本数量: 1,000
    • 数据大小: 381,755 字节
  • 测试集 (test)
    • 样本数量: 1,000
    • 数据大小: 376,641 字节

配置文件

  • 默认配置 (default)
    • 训练集文件路径: data/train-*
    • 验证集文件路径: data/validation-*
    • 测试集文件路径: data/test-*
搜集汇总
数据集介绍
main_image_url
构建方式
在数字娱乐产业蓬勃发展的背景下,items_raw_lite数据集通过系统化采集与整合Steam平台上的游戏产品信息构建而成。该过程涉及从公开API接口提取原始数据,并经过清洗、去重与标准化处理,确保信息的准确性与一致性。数据集划分为训练集、验证集和测试集,分别包含20000、1000和1000条样本,为机器学习任务提供了结构化的数据基础。
特点
该数据集涵盖了游戏产品的多维特征,包括标识符、名称、价格、用户评价、发行日期、支持平台及语言数量等24个字段。其特点在于融合了数值型、布尔型与文本型数据,能够全面刻画游戏的商业属性与用户反馈。峰值同时在线人数与预估拥有者范围等指标,为分析市场热度与用户规模提供了量化依据。
使用方法
研究者可利用该数据集进行游戏市场分析、推荐系统开发或销量预测等任务。通过加载预划分的训练、验证与测试集,能够直接应用于回归、分类或聚类模型。数据中的多平台支持标志与分类信息,有助于探索跨平台兼容性对产品成功的影响,为数字内容领域的实证研究提供可靠数据支持。
背景与挑战
背景概述
在数字娱乐产业迅猛发展的背景下,电子游戏作为重要的文化产品,其市场表现与用户反馈数据的系统化分析成为研究热点。items_raw_lite数据集应运而生,该数据集由相关研究机构或数据科学家团队构建,旨在提供一套标准化的游戏信息集合,涵盖游戏的基本属性、销售指标、用户评价及多平台支持情况等关键维度。其核心研究问题聚焦于如何通过结构化数据揭示游戏产品的市场规律与用户偏好,为游戏推荐系统、市场趋势预测及跨平台兼容性研究提供数据支撑,对推动游戏产业的数据驱动决策具有显著影响力。
当前挑战
该数据集致力于解决游戏产业中多维度数据分析的复杂性问题,挑战在于如何准确量化游戏的成功因素,例如将峰值同时在线用户数、价格、评价极性及多语言支持等异构特征整合为可解释的预测模型。在构建过程中,面临数据采集的完整性挑战,如确保游戏发行日期、所有者估计范围等时序与统计信息的精确性;同时,处理多平台兼容性、成就数量等稀疏或高维特征时,需克服数据清洗与归一化的技术难题,以维持数据集的可靠性与泛化能力。
常用场景
经典使用场景
在数字娱乐产业中,游戏产品的市场表现与用户反馈分析是核心研究领域之一。items_raw_lite数据集以其丰富的结构化特征,如峰值同时在线用户数、价格、用户评价及发布信息等,为研究者提供了经典的使用场景:通过机器学习模型预测游戏的成功率或用户接受度。该数据集常用于构建回归或分类模型,以分析游戏属性与市场表现之间的复杂关系,为游戏开发与发行策略提供数据驱动的见解。
解决学术问题
该数据集有效解决了游戏产业中多个常见的学术研究问题,包括用户行为建模、市场趋势预测以及产品定价优化。通过整合游戏的多维度特征,如支持平台、成就数量、语言支持等,研究者能够深入探讨影响游戏受欢迎程度的关键因素。其意义在于为数字娱乐经济学提供了实证基础,推动了数据科学在创意产业中的应用,并促进了跨学科研究,如计算社会科学与商业分析的融合。
衍生相关工作
基于items_raw_lite数据集,已衍生出多项经典研究工作,主要集中在预测建模和用户分析领域。例如,一些研究利用该数据集训练深度学习模型,预测游戏的销售表现或用户评分;另一些工作则专注于情感分析,通过正负面评价数据探索用户反馈的潜在模式。这些衍生工作不仅扩展了数据集的学术价值,还推动了游戏分析技术的创新,为后续研究提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作