five

steambans

收藏
Hugging Face2024-08-25 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/nyuuzyou/steambans
下载链接
链接失效反馈
资源简介:
该数据集包含476,694名Steam用户的信息,包括个人资料详情、封禁状态和游戏活动。数据来源于Steam平台,涵盖了Steam ID、个人资料URL、用户名、头像、账户创建时间、可见性状态、VAC和游戏封禁次数、经济封禁状态、上次封禁以来的时间、Steam等级、好友数量、游戏数量、总游戏时间和CS2游戏时间等字段。数据集主要使用英语,但用户生成的内容可能包含多种语言。数据集采用CC0许可证,允许任何用途的使用、修改和分发,无需归属。

This dataset comprises information from 476,694 Steam users, encompassing profile details, ban statuses, and gaming activities. The data is sourced from the Steam platform, covering fields including Steam ID, profile URL, username, avatar, account creation time, visibility status, VAC and game ban counts, economy ban status, time since last ban, Steam level, number of friends, number of owned games, total playtime, and CS2 playtime. The dataset is primarily in English, though user-generated content within it may contain multiple languages. It is released under the CC0 license, which allows use, modification, and distribution for any purpose without requiring attribution.
创建时间:
2024-08-25
原始信息汇总

Steam User Bans Dataset

数据集概述

该数据集包含476,694名Steam用户的信息,包括他们的个人资料详情、封禁状态和游戏活动。数据来源于Steam平台,包含以下信息:Steam ID、个人资料URL、用户名、头像、账户创建日期、可见性状态、VAC和游戏封禁次数、经济封禁状态、上次封禁以来的时间、Steam等级、好友数量、游戏数量、总游戏时间和CS2游戏时间。

语言

数据集主要为英语,用户生成内容(如用户名)可能包含多种语言。

数据结构

数据字段

该数据集包含以下字段:

  • steam_id: 用户的唯一Steam ID(字符串)
  • profile_url: 用户的Steam个人资料URL(字符串)
  • personaname: 用户的用户名或显示名(字符串)
  • avatar: 用户的头像图片URL(字符串)
  • timecreated: 账户创建的时间戳(字符串)
  • communityvisibilitystate: 用户个人资料的可见性状态(整数)
  • vac_bans: VAC(Valve Anti-Cheat)封禁次数(整数)
  • game_bans: 游戏封禁次数(整数)
  • economy_ban: 经济封禁状态(字符串)
  • last_ban: 上次封禁以来的天数(整数)
  • steam_level: 用户的Steam等级(整数)
  • friends_count: 用户好友列表中的好友数量(整数)
  • game_count: 用户拥有的游戏数量(整数)
  • total_playtime: 所有游戏的总游戏时间(整数)
  • cs2_playtime: Counter-Strike 2的游戏时间(整数)

数据分割

所有样本都在一个单一的分割中。

附加信息

许可证

该数据集采用Creative Commons Zero (CC0)许可证,这意味着你可以:

  • 用于任何目的,包括商业项目。
  • 随意修改。
  • 无需请求许可即可分发。

无需署名,但欢迎署名。

CC0许可证详情:https://creativecommons.org/publicdomain/zero/1.0/deed.en

了解更多关于CC0的信息,请访问Creative Commons网站:https://creativecommons.org/publicdomain/zero/1.0/

数据集创建者

AI搜集汇总
数据集介绍
main_image_url
构建方式
Steam User Bans数据集通过自动化工具从Steam平台收集了476,694名用户的详细信息,涵盖了用户的个人资料、封禁状态及游戏活动数据。数据采集过程中,系统自动提取了包括Steam ID、个人资料URL、用户名、头像、账户创建时间、资料可见性状态、VAC封禁和游戏封禁次数、经济封禁状态、距离上次封禁的时间、Steam等级、好友数量、游戏数量、总游戏时长以及《反恐精英2》的游戏时长等关键字段。所有数据均以结构化表格形式存储,便于后续分析与应用。
特点
该数据集的特点在于其全面性和多样性,涵盖了Steam用户的多个维度信息。数据不仅包括用户的基本资料,还详细记录了用户的封禁历史、游戏行为及社交关系。特别值得一提的是,数据集中的封禁信息(如VAC封禁和游戏封禁)为研究游戏作弊行为及平台治理提供了宝贵的数据支持。此外,数据集以英文为主,但用户生成内容(如用户名)可能包含多语言元素,进一步增加了数据的复杂性。
使用方法
Steam User Bans数据集适用于多种任务,包括表格分类和回归分析。研究者可以利用该数据集进行用户行为分析、封禁预测、游戏时长与封禁关系的探索等。使用该数据集时,建议首先对数据进行清洗和预处理,例如处理缺失值、标准化数值字段等。随后,可根据研究目标选择合适的机器学习或深度学习模型进行训练和评估。由于数据集采用CC0许可证,用户可自由使用、修改和分发数据,无需担心版权限制。
背景与挑战
背景概述
Steam User Bans数据集由nyuuzyou团队于近年创建,旨在通过分析Steam平台上的用户行为数据,揭示游戏社区中的违规行为模式。该数据集涵盖了476,694名Steam用户的详细信息,包括账户创建时间、游戏活动、封禁状态等。其核心研究问题聚焦于如何通过机器学习方法预测用户的封禁风险,从而为游戏平台的反作弊机制提供数据支持。该数据集在游戏社区管理、用户行为分析等领域具有重要影响力,为研究人员提供了丰富的实证数据。
当前挑战
Steam User Bans数据集在解决游戏社区中的封禁预测问题时面临多重挑战。首先,封禁行为通常具有高度不平衡性,即被封禁用户占少数,这可能导致模型在训练过程中偏向多数类。其次,用户行为数据的多样性和复杂性使得特征工程和模型选择变得尤为困难。此外,数据集中包含的用户生成内容(如用户名)可能涉及多语言和特殊字符,增加了数据清洗和预处理的难度。在构建过程中,数据采集的合法性和隐私保护也是不可忽视的挑战,尤其是在涉及用户敏感信息时,需严格遵守相关法律法规。
常用场景
经典使用场景
Steam User Bans数据集在游戏社区行为分析中具有重要应用。研究者可以通过该数据集分析Steam用户的封禁情况,探讨用户行为与封禁之间的关联。例如,通过分析VAC封禁和游戏封禁的频率,研究者可以识别出哪些游戏或行为模式更容易导致封禁,从而为游戏开发者提供改进反作弊系统的依据。
解决学术问题
该数据集解决了游戏社区中用户行为与封禁机制之间的复杂关系问题。通过提供详细的用户封禁记录和游戏活动数据,研究者能够深入探讨封禁机制的有效性及其对用户行为的影响。这不仅有助于理解封禁机制的设计原理,还为改进游戏社区管理策略提供了数据支持。
衍生相关工作
基于Steam User Bans数据集,研究者已经开展了多项经典工作。例如,有研究利用该数据集开发了预测用户封禁风险的机器学习模型,帮助游戏平台提前识别潜在的高风险用户。此外,还有研究通过分析封禁数据,提出了改进反作弊系统的策略,显著提升了游戏社区的公平性和用户体验。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作