DDSC/lcc
收藏Hugging Face2023-07-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DDSC/lcc
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自Leipzig Collection的丹麦语数据,由Finn Årup Nielsen进行情感分析标注。数据集适用于情感分析任务,包含349个训练文档和150个测试文档。每个文档包含文本内容和情感标签,标签分为正面、中性和负面。数据集遵循CC BY 4.0许可。
提供机构:
DDSC
原始信息汇总
数据集概述
- 名称: TwitterSent
- 语言: 丹麦语 (da)
- 许可证: CC BY 4.0
- 多语言性: 单语种
- 大小: 小于1千条数据
- 数据来源: 原创数据
- 任务类别: 文本分类
- 任务ID: 情感分类
数据集详情
数据集摘要
- 描述: 该数据集包含由Finn Årup Nielsen标注的丹麦语情感分析数据,源自Leipzig Collection。
- 适用任务: 情感分析
数据集结构
- 数据实例: 每个条目包含文档及其关联标签。
- 数据字段:
text(str): 文本内容。label(str): 文本标签,可以是"positiv"(积极)、"neutral"(中性)或"negativ"(消极)。
- 数据分割: 包含
train和test分割,测试集占30%,随机分层抽样。训练集有349个文档,测试集有150个文档。
附加信息
-
数据集创建者: Finn Årup Nielsen
-
许可证信息: 数据集根据CC BY 4.0许可证发布。
-
引用信息:
@misc{lcc, title={LCC}, author={Finn Årup Nielsen}, year={2016}, note={url{https://github.com/fnielsen/lcc-sentiment}} }



