asajjad/isaac_steam_reviews_en
收藏Hugging Face2024-05-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asajjad/isaac_steam_reviews_en
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: review
dtype: string
- name: true_sentiment
dtype:
class_label:
names:
'0': negative
'1': positive
- name: game_name
dtype:
class_label:
names:
'0': APEX Legends
'1': Assassin's Creed Odyssey
'2': Destiny 2
'3': FIFA 23
'4': Grand Theft Auto V
'5': Hollow Knight
'6': Lost Ark
'7': PUBG Battlegrounds
'8': Paladins
'9': Payday 2
- name: en_score
dtype: float64
splits:
- name: train
num_bytes: 108960604
num_examples: 589761
- name: test
num_bytes: 46461782
num_examples: 252755
download_size: 94362466
dataset_size: 155422386
---
# Dataset Card for "isaac_steam_reviews_en"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名:评论(review)
数据类型:字符串(string)
- 字段名:真实情感(true_sentiment)
数据类型:类别标签(class_label),类别名称为:
'0': 负面(negative)
'1': 正面(positive)
- 字段名:游戏名称(game_name)
数据类型:类别标签(class_label),类别名称为:
'0': Apex英雄(APEX Legends)
'1': 刺客信条:奥德赛(Assassin's Creed Odyssey)
'2': 命运2(Destiny 2)
'3': FIFA 23
'4': 侠盗猎车手5(Grand Theft Auto V)
'5': 空洞骑士(Hollow Knight)
'6': 失落的方舟(Lost Ark)
'7': 绝地求生:战场(PUBG Battlegrounds)
'8': 枪火游侠(Paladins)
'9': 收获日2(Payday 2)
- 字段名:英语评分(en_score)
数据类型:64位浮点数(float64)
划分集:
- 名称:训练集(train)
字节大小:108960604
样本数量:589761
- 名称:测试集(test)
字节大小:46461782
样本数量:252755
下载大小:94362466
数据集总大小:155422386
# 「isaac_steam_reviews_en」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
asajjad
原始信息汇总
数据集概述
数据集名称
- 名称: isaac_steam_reviews_en
数据集特征
- review: 文本类型
- true_sentiment: 分类标签,包含两个类别:
- 0: negative
- 1: positive
- game_name: 分类标签,包含以下类别:
- 0: APEX Legends
- 1: Assassins Creed Odyssey
- 2: Destiny 2
- 3: FIFA 23
- 4: Grand Theft Auto V
- 5: Hollow Knight
- 6: Lost Ark
- 7: PUBG Battlegrounds
- 8: Paladins
- 9: Payday 2
- en_score: 浮点数类型
数据集拆分
- 训练集:
- 大小: 589761个样本
- 存储大小: 108960604字节
- 测试集:
- 大小: 252755个样本
- 存储大小: 46461782字节
数据集下载与存储大小
- 下载大小: 94362466字节
- 数据集总大小: 155422386字节
搜集汇总
数据集介绍

构建方式
该数据集通过收集Steam平台上多款热门游戏的用户评论构建而成,涵盖了包括《APEX Legends》、《Assassin's Creed Odyssey》、《Destiny 2》等在内的十款游戏。每条评论均标注了真实情感标签(正面或负面)以及对应的游戏名称,同时提供了英语评分(en_score)作为辅助信息。数据集的构建过程确保了评论的多样性和代表性,反映了不同游戏社区的真实反馈。
特点
该数据集的特点在于其丰富的多维度信息,不仅包含了用户评论的文本内容,还标注了情感倾向和游戏名称,使得研究者能够进行跨游戏的对比分析。此外,数据集规模庞大,包含超过84万条评论,分为训练集和测试集,适用于大规模情感分析模型的训练与评估。每条评论的英语评分进一步增强了数据的可用性,为多任务学习提供了可能。
使用方法
该数据集可用于情感分析、游戏社区反馈研究以及跨游戏用户行为分析等领域。研究者可以通过文本分类模型对评论进行情感预测,或结合游戏名称进行特定游戏的用户满意度分析。此外,英语评分可用于探索评论质量与情感倾向之间的关系。数据集的训练集和测试集划分便于模型的训练与验证,支持从基础到高级的自然语言处理任务。
背景与挑战
背景概述
asajjad/isaac_steam_reviews_en数据集聚焦于Steam平台上的游戏用户评论,旨在通过自然语言处理技术分析用户情感倾向。该数据集由匿名研究人员或机构于近年创建,涵盖了多款热门游戏的用户评论,包括《APEX Legends》、《Assassin's Creed Odyssey》等。其核心研究问题在于通过用户评论的情感分析,揭示玩家对游戏的真实体验与反馈,从而为游戏开发者提供改进建议,并为情感分析领域的研究提供高质量数据支持。该数据集在游戏产业和情感分析领域具有重要影响力,为相关研究提供了丰富的实证基础。
当前挑战
该数据集在解决游戏评论情感分析问题时面临多重挑战。首先,用户评论的语言表达多样且复杂,包含大量非正式用语、缩写和情感符号,这对情感分类模型的准确性提出了较高要求。其次,评论中可能存在讽刺、反语等难以捕捉的情感表达,增加了情感分析的难度。在数据集构建过程中,研究人员需处理海量原始评论数据,确保数据的代表性和平衡性,同时避免偏见和噪声干扰。此外,如何有效标注情感标签,尤其是在模糊情感表达的情况下,也是构建过程中的一大挑战。这些挑战共同构成了该数据集在情感分析领域的研究难点。
常用场景
经典使用场景
在自然语言处理领域,asajjad/isaac_steam_reviews_en数据集被广泛用于情感分析任务。该数据集包含了大量来自Steam平台的游戏评论,每条评论都标注了情感极性(正面或负面)以及对应的游戏名称。研究人员可以利用这些数据训练和评估情感分类模型,从而深入理解用户对特定游戏的情感倾向。
实际应用
在实际应用中,asajjad/isaac_steam_reviews_en数据集为游戏行业提供了重要的决策支持。通过分析用户评论的情感倾向,游戏公司可以快速识别用户对游戏的满意度,并针对性地改进产品。此外,该数据集还可用于构建智能推荐系统,根据用户的情感反馈推荐更适合的游戏,从而提升用户体验和用户粘性。
衍生相关工作
基于asajjad/isaac_steam_reviews_en数据集,许多经典的研究工作得以展开。例如,一些研究利用该数据集开发了高效的情感分类模型,并在公开评测中取得了优异的成绩。此外,还有研究结合情感分析和主题建模技术,深入挖掘用户评论中的情感驱动因素。这些工作不仅丰富了情感分析领域的研究成果,还为游戏行业的用户反馈分析提供了新的思路。
以上内容由遇见数据集搜集并总结生成



