five

Alienmaster/SB10k|情感分析数据集|德语单语种数据集

收藏
hugging_face2024-03-13 更新2024-06-11 收录
情感分析
德语单语种
下载链接:
https://hf-mirror.com/datasets/Alienmaster/SB10k
下载链接
链接失效反馈
资源简介:
SB10k数据集是一个用于德语情感分析的Twitter语料库和基准资源。数据集包含ID、情感、文本、标准化文本、词性标签、依存标签和附加注释等列。数据集分为训练集、测试集和开发集,分别存储在train.tsv、test.tsv和dev.tsv文件中。数据集的快照由Oliver Guhr制作,原始数据来源于SB10k数据集。

SB10k数据集是一个用于德语情感分析的Twitter语料库和基准资源。数据集包含ID、情感、文本、标准化文本、词性标签、依存标签和附加注释等列。数据集分为训练集、测试集和开发集,分别存储在train.tsv、test.tsv和dev.tsv文件中。数据集的快照由Oliver Guhr制作,原始数据来源于SB10k数据集。
提供机构:
Alienmaster
原始信息汇总

数据集概述

基本信息

  • 语言: 德语
  • 多语言性: 单语种
  • 许可证: CC BY 4.0
  • 名称: SB10k
  • 任务类别: 文本分类
  • 标签: 情感分析
  • 数据规模: 1K<n<10K

配置详情

  • 配置名称: default
  • 分隔符: 制表符 ( )
  • 列名: ["ID", "Sentiment", "Text", "Normalized", "POS-Tags", "Dependency Labels", "additional Annotations"]
  • 数据文件:
    • 训练集: train.tsv
    • 测试集: test.tsv
    • 开发集: dev.tsv

来源

引用信息

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作