Tianzhou/auditor_sentiment
收藏Hugging Face2022-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Tianzhou/auditor_sentiment
下载链接
链接失效反馈官方服务:
资源简介:
Auditor Sentiment数据集由新闻部门收集,包含数千条来自英文财经新闻的句子,并根据情感进行分类。数据集支持情感分类任务,语言为英语。数据集结构包括句子和标签字段,标签分为正面、中性和负面。数据集创建的目的是为了提高情感分类的准确性,源数据来自英文新闻报告,注释由具有金融市场背景知识的16人完成。数据集没有包含个人或敏感信息,但所有注释者来自同一机构,可能存在偏见。数据集的使用受到Demo.Org专有许可的限制。
Auditor Sentiment数据集由新闻部门收集,包含数千条来自英文财经新闻的句子,并根据情感进行分类。数据集支持情感分类任务,语言为英语。数据集结构包括句子和标签字段,标签分为正面、中性和负面。数据集创建的目的是为了提高情感分类的准确性,源数据来自英文新闻报告,注释由具有金融市场背景知识的16人完成。数据集没有包含个人或敏感信息,但所有注释者来自同一机构,可能存在偏见。数据集的使用受到Demo.Org专有许可的限制。
提供机构:
Tianzhou
原始信息汇总
数据集概述
数据集名称
- 名称: Auditor_Sentiment
数据集摘要
- 摘要: 该数据集包含数千条来自英语金融新闻的句子,按情感分类。
支持的任务
- 任务: 情感分类
语言
- 语言: 英语
数据集结构
- 数据实例: 每个实例包含一个句子及其对应的情感标签(positive, neutral, negative)。
- 数据字段:
- sentence: 数据集中的一个分词行。
- label: 对应的类别标签,字符串形式:positive - (2), neutral - (1), negative - (0)。
- 数据分割: 随机创建的训练/测试分割,比例为75/25。
数据集创建
- 来源数据:
- 初始数据收集和标准化: 使用英语新闻报告。
- 源语言生产者: 由不同审计师撰写。
- 注释:
- 注释过程: 4840个句子,由16位具有金融市场背景知识的人员注释,选择注释一致性大于75%的子集。
- 注释者: 来自SME列表,具体姓名由sue@demo.org持有。
使用数据的考虑
- 偏见讨论: 所有注释者来自同一机构,因此应考虑此因素对注释一致性的影响。
- 许可证信息:
- 许可证: Demo.Org Proprietary - 请勿分享
其他信息
- 数据集管理者: 由News Department收集的审计师评论情感。
- 联系人: sue@demo.org



