jfrei/GermEval18
收藏Hugging Face2024-06-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jfrei/GermEval18
下载链接
链接失效反馈官方服务:
资源简介:
GermEval 18数据集是一个用于文本分类任务的德语数据集,包含5009个训练样本和3532个测试样本。数据集中的每个样本包含文本内容、粗粒度标签(OTHER、OFFENSE)和细粒度标签(OTHER、ABUSE、INSULT、PROFANITY)。该数据集通过加载脚本直接从官方GitHub仓库获取数据,确保包含所有样本。
GermEval 18数据集是一个用于文本分类任务的德语数据集,包含5009个训练样本和3532个测试样本。数据集中的每个样本包含文本内容、粗粒度标签(OTHER、OFFENSE)和细粒度标签(OTHER、ABUSE、INSULT、PROFANITY)。该数据集通过加载脚本直接从官方GitHub仓库获取数据,确保包含所有样本。
提供机构:
jfrei
原始信息汇总
数据集概述
数据集信息
-
特征:
text: 数据类型为字符串。coarse: 数据类型为类别标签,包含两个类别:OTHER和OFFENSE。fine: 数据类型为类别标签,包含四个类别:OTHER,ABUSE,INSULT,PROFANITY。
-
数据分割:
train: 包含 5009 个样本,826320 字节。test: 包含 3532 个样本,509105 字节。
-
数据集大小:
- 下载大小: 1282870 字节。
- 数据集大小: 1335425 字节。
-
许可证: cc-by-4.0
-
任务类别: 文本分类
-
语言: 德语
-
数据集名称: GermEval 18



