five

jfrei/GermEval18

收藏
Hugging Face2024-06-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jfrei/GermEval18
下载链接
链接失效反馈
官方服务:
资源简介:
GermEval 18数据集是一个用于文本分类任务的德语数据集,包含5009个训练样本和3532个测试样本。数据集中的每个样本包含文本内容、粗粒度标签(OTHER、OFFENSE)和细粒度标签(OTHER、ABUSE、INSULT、PROFANITY)。该数据集通过加载脚本直接从官方GitHub仓库获取数据,确保包含所有样本。

GermEval 18数据集是一个用于文本分类任务的德语数据集,包含5009个训练样本和3532个测试样本。数据集中的每个样本包含文本内容、粗粒度标签(OTHER、OFFENSE)和细粒度标签(OTHER、ABUSE、INSULT、PROFANITY)。该数据集通过加载脚本直接从官方GitHub仓库获取数据,确保包含所有样本。
提供机构:
jfrei
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • text: 数据类型为字符串。
    • coarse: 数据类型为类别标签,包含两个类别:OTHEROFFENSE
    • fine: 数据类型为类别标签,包含四个类别:OTHER, ABUSE, INSULT, PROFANITY
  • 数据分割:

    • train: 包含 5009 个样本,826320 字节。
    • test: 包含 3532 个样本,509105 字节。
  • 数据集大小:

    • 下载大小: 1282870 字节。
    • 数据集大小: 1335425 字节。
  • 许可证: cc-by-4.0

  • 任务类别: 文本分类

  • 语言: 德语

  • 数据集名称: GermEval 18

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作