five

asajjad/isaac_steam_reviews_en

收藏
Hugging Face2024-05-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asajjad/isaac_steam_reviews_en
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: review dtype: string - name: true_sentiment dtype: class_label: names: '0': negative '1': positive - name: game_name dtype: class_label: names: '0': APEX Legends '1': Assassin's Creed Odyssey '2': Destiny 2 '3': FIFA 23 '4': Grand Theft Auto V '5': Hollow Knight '6': Lost Ark '7': PUBG Battlegrounds '8': Paladins '9': Payday 2 - name: en_score dtype: float64 splits: - name: train num_bytes: 108960604 num_examples: 589761 - name: test num_bytes: 46461782 num_examples: 252755 download_size: 94362466 dataset_size: 155422386 --- # Dataset Card for "isaac_steam_reviews_en" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征字段: - 字段名:评论(review) 数据类型:字符串(string) - 字段名:真实情感(true_sentiment) 数据类型:类别标签(class_label),类别名称为: '0': 负面(negative) '1': 正面(positive) - 字段名:游戏名称(game_name) 数据类型:类别标签(class_label),类别名称为: '0': Apex英雄(APEX Legends) '1': 刺客信条:奥德赛(Assassin's Creed Odyssey) '2': 命运2(Destiny 2) '3': FIFA 23 '4': 侠盗猎车手5(Grand Theft Auto V) '5': 空洞骑士(Hollow Knight) '6': 失落的方舟(Lost Ark) '7': 绝地求生:战场(PUBG Battlegrounds) '8': 枪火游侠(Paladins) '9': 收获日2(Payday 2) - 字段名:英语评分(en_score) 数据类型:64位浮点数(float64) 划分集: - 名称:训练集(train) 字节大小:108960604 样本数量:589761 - 名称:测试集(test) 字节大小:46461782 样本数量:252755 下载大小:94362466 数据集总大小:155422386 # 「isaac_steam_reviews_en」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
asajjad
原始信息汇总

数据集概述

数据集名称

  • 名称: isaac_steam_reviews_en

数据集特征

  • review: 文本类型
  • true_sentiment: 分类标签,包含两个类别:
    • 0: negative
    • 1: positive
  • game_name: 分类标签,包含以下类别:
    • 0: APEX Legends
    • 1: Assassins Creed Odyssey
    • 2: Destiny 2
    • 3: FIFA 23
    • 4: Grand Theft Auto V
    • 5: Hollow Knight
    • 6: Lost Ark
    • 7: PUBG Battlegrounds
    • 8: Paladins
    • 9: Payday 2
  • en_score: 浮点数类型

数据集拆分

  • 训练集:
    • 大小: 589761个样本
    • 存储大小: 108960604字节
  • 测试集:
    • 大小: 252755个样本
    • 存储大小: 46461782字节

数据集下载与存储大小

  • 下载大小: 94362466字节
  • 数据集总大小: 155422386字节
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过收集Steam平台上多款热门游戏的用户评论构建而成,涵盖了包括《APEX Legends》、《Assassin's Creed Odyssey》、《Destiny 2》等在内的十款游戏。每条评论均标注了真实情感标签(正面或负面)以及对应的游戏名称,同时提供了英语评分(en_score)作为辅助信息。数据集的构建过程确保了评论的多样性和代表性,反映了不同游戏社区的真实反馈。
特点
该数据集的特点在于其丰富的多维度信息,不仅包含了用户评论的文本内容,还标注了情感倾向和游戏名称,使得研究者能够进行跨游戏的对比分析。此外,数据集规模庞大,包含超过84万条评论,分为训练集和测试集,适用于大规模情感分析模型的训练与评估。每条评论的英语评分进一步增强了数据的可用性,为多任务学习提供了可能。
使用方法
该数据集可用于情感分析、游戏社区反馈研究以及跨游戏用户行为分析等领域。研究者可以通过文本分类模型对评论进行情感预测,或结合游戏名称进行特定游戏的用户满意度分析。此外,英语评分可用于探索评论质量与情感倾向之间的关系。数据集的训练集和测试集划分便于模型的训练与验证,支持从基础到高级的自然语言处理任务。
背景与挑战
背景概述
asajjad/isaac_steam_reviews_en数据集聚焦于Steam平台上的游戏用户评论,旨在通过自然语言处理技术分析用户情感倾向。该数据集由匿名研究人员或机构于近年创建,涵盖了多款热门游戏的用户评论,包括《APEX Legends》、《Assassin's Creed Odyssey》等。其核心研究问题在于通过用户评论的情感分析,揭示玩家对游戏的真实体验与反馈,从而为游戏开发者提供改进建议,并为情感分析领域的研究提供高质量数据支持。该数据集在游戏产业和情感分析领域具有重要影响力,为相关研究提供了丰富的实证基础。
当前挑战
该数据集在解决游戏评论情感分析问题时面临多重挑战。首先,用户评论的语言表达多样且复杂,包含大量非正式用语、缩写和情感符号,这对情感分类模型的准确性提出了较高要求。其次,评论中可能存在讽刺、反语等难以捕捉的情感表达,增加了情感分析的难度。在数据集构建过程中,研究人员需处理海量原始评论数据,确保数据的代表性和平衡性,同时避免偏见和噪声干扰。此外,如何有效标注情感标签,尤其是在模糊情感表达的情况下,也是构建过程中的一大挑战。这些挑战共同构成了该数据集在情感分析领域的研究难点。
常用场景
经典使用场景
在自然语言处理领域,asajjad/isaac_steam_reviews_en数据集被广泛用于情感分析任务。该数据集包含了大量来自Steam平台的游戏评论,每条评论都标注了情感极性(正面或负面)以及对应的游戏名称。研究人员可以利用这些数据训练和评估情感分类模型,从而深入理解用户对特定游戏的情感倾向。
实际应用
在实际应用中,asajjad/isaac_steam_reviews_en数据集为游戏行业提供了重要的决策支持。通过分析用户评论的情感倾向,游戏公司可以快速识别用户对游戏的满意度,并针对性地改进产品。此外,该数据集还可用于构建智能推荐系统,根据用户的情感反馈推荐更适合的游戏,从而提升用户体验和用户粘性。
衍生相关工作
基于asajjad/isaac_steam_reviews_en数据集,许多经典的研究工作得以展开。例如,一些研究利用该数据集开发了高效的情感分类模型,并在公开评测中取得了优异的成绩。此外,还有研究结合情感分析和主题建模技术,深入挖掘用户评论中的情感驱动因素。这些工作不仅丰富了情感分析领域的研究成果,还为游戏行业的用户反馈分析提供了新的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作