five

DDSC/lcc

收藏
Hugging Face2023-07-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DDSC/lcc
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自Leipzig Collection的丹麦语数据,由Finn Årup Nielsen进行情感分析标注。数据集适用于情感分析任务,包含349个训练文档和150个测试文档。每个文档包含文本内容和情感标签,标签分为正面、中性和负面。数据集遵循CC BY 4.0许可。
提供机构:
DDSC
原始信息汇总

数据集概述

  • 名称: TwitterSent
  • 语言: 丹麦语 (da)
  • 许可证: CC BY 4.0
  • 多语言性: 单语种
  • 大小: 小于1千条数据
  • 数据来源: 原创数据
  • 任务类别: 文本分类
  • 任务ID: 情感分类

数据集详情

数据集摘要

  • 描述: 该数据集包含由Finn Årup Nielsen标注的丹麦语情感分析数据,源自Leipzig Collection。
  • 适用任务: 情感分析

数据集结构

  • 数据实例: 每个条目包含文档及其关联标签。
  • 数据字段:
    • text (str): 文本内容。
    • label (str): 文本标签,可以是"positiv"(积极)、"neutral"(中性)或"negativ"(消极)。
  • 数据分割: 包含traintest分割,测试集占30%,随机分层抽样。训练集有349个文档,测试集有150个文档。

附加信息

  • 数据集创建者: Finn Årup Nielsen

  • 许可证信息: 数据集根据CC BY 4.0许可证发布。

  • 引用信息:

    @misc{lcc, title={LCC}, author={Finn Årup Nielsen}, year={2016}, note={url{https://github.com/fnielsen/lcc-sentiment}} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作