five

Tianzhou/auditor_sentiment

收藏
Hugging Face2022-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Tianzhou/auditor_sentiment
下载链接
链接失效反馈
官方服务:
资源简介:
Auditor Sentiment数据集由新闻部门收集,包含数千条来自英文财经新闻的句子,并根据情感进行分类。数据集支持情感分类任务,语言为英语。数据集结构包括句子和标签字段,标签分为正面、中性和负面。数据集创建的目的是为了提高情感分类的准确性,源数据来自英文新闻报告,注释由具有金融市场背景知识的16人完成。数据集没有包含个人或敏感信息,但所有注释者来自同一机构,可能存在偏见。数据集的使用受到Demo.Org专有许可的限制。

Auditor Sentiment数据集由新闻部门收集,包含数千条来自英文财经新闻的句子,并根据情感进行分类。数据集支持情感分类任务,语言为英语。数据集结构包括句子和标签字段,标签分为正面、中性和负面。数据集创建的目的是为了提高情感分类的准确性,源数据来自英文新闻报告,注释由具有金融市场背景知识的16人完成。数据集没有包含个人或敏感信息,但所有注释者来自同一机构,可能存在偏见。数据集的使用受到Demo.Org专有许可的限制。
提供机构:
Tianzhou
原始信息汇总

数据集概述

数据集名称

  • 名称: Auditor_Sentiment

数据集摘要

  • 摘要: 该数据集包含数千条来自英语金融新闻的句子,按情感分类。

支持的任务

  • 任务: 情感分类

语言

  • 语言: 英语

数据集结构

  • 数据实例: 每个实例包含一个句子及其对应的情感标签(positive, neutral, negative)。
  • 数据字段:
    • sentence: 数据集中的一个分词行。
    • label: 对应的类别标签,字符串形式:positive - (2), neutral - (1), negative - (0)。
  • 数据分割: 随机创建的训练/测试分割,比例为75/25。

数据集创建

  • 来源数据:
    • 初始数据收集和标准化: 使用英语新闻报告。
    • 源语言生产者: 由不同审计师撰写。
  • 注释:
    • 注释过程: 4840个句子,由16位具有金融市场背景知识的人员注释,选择注释一致性大于75%的子集。
    • 注释者: 来自SME列表,具体姓名由sue@demo.org持有。

使用数据的考虑

  • 偏见讨论: 所有注释者来自同一机构,因此应考虑此因素对注释一致性的影响。
  • 许可证信息:
    • 许可证: Demo.Org Proprietary - 请勿分享

其他信息

  • 数据集管理者: 由News Department收集的审计师评论情感。
  • 联系人: sue@demo.org
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作