pie/argmicro
收藏Hugging Face2024-11-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pie/argmicro
下载链接
链接失效反馈官方服务:
资源简介:
argmicro数据集是一个包含德文和英文文本的论证分析数据集。数据集定义了`ArgMicroDocument`文档类型,包括文本、ID、主题ID和元数据等字段,并包含立场、教育单元(edus)、论证单元(adus)和关系(relations)等注释层。立场注释层包含支持(pro)、反对(con)、不明确(unclear)或无标签的立场标签。论证单元(adus)由多个教育单元(edus)组成,并包含反对(opp)和支持(pro)标签。关系(relations)注释层包含支持(sup)、反驳(reb)、削弱(und)和示例(exa)等关系标签。数据集还提供了文档转换器,用于将数据集转换为其他文档类型,如带有标签跨度和二元关系的文本文档。
argmicro数据集是一个包含德文和英文文本的论证分析数据集。数据集定义了`ArgMicroDocument`文档类型,包括文本、ID、主题ID和元数据等字段,并包含立场、教育单元(edus)、论证单元(adus)和关系(relations)等注释层。立场注释层包含支持(pro)、反对(con)、不明确(unclear)或无标签的立场标签。论证单元(adus)由多个教育单元(edus)组成,并包含反对(opp)和支持(pro)标签。关系(relations)注释层包含支持(sup)、反驳(reb)、削弱(und)和示例(exa)等关系标签。数据集还提供了文档转换器,用于将数据集转换为其他文档类型,如带有标签跨度和二元关系的文本文档。
提供机构:
pie
原始信息汇总
PIE Dataset Card for "argmicro"
数据集变体
de: 包含原始德语文本集合en: 包含英语翻译文本
数据架构
- 文档类型:
ArgMicroDocument - 数据字段:
text(str)id(str, optional)topic_id(str, optional)metadata(dictionary, optional)
- 注释层:
stance(注释类型:Label)- 描述: 可能包含的标签有
pro,con,unclear或未定义时无标签
- 描述: 可能包含的标签有
edus(注释类型:Span, 目标:text)adus(注释类型:LabeledAnnotationCollection, 目标:edus)- 描述:
adus中的每个元素可能包含edus中的多个条目 LabeledAnnotationCollection字段:annotations(注释类型:Span, 目标:text)label(str, optional), 值:opp,pro
- 描述:
relations(注释类型:MultiRelation, 目标:adus)- 描述:
MultiRelation字段:head(tuple, 注释类型:LabeledAnnotationCollection, 目标:adus)tail(tuple, 注释类型:LabeledAnnotationCollection, 目标:adus)label(str, optional), 值:sup,exa,reb,und
- 描述:
文档转换器
- 目标文档类型:
pytorch_ie.documents.TextDocumentWithLabeledSpansAndBinaryRelationsLabeledSpans, 从ArgMicroDocument的adus转换- 标签:
opp,pro - 如果 ADU 包含多个跨度(即 EDUs),则取第一个 EDU 的起始和最后一个 EDU 的结束作为新
LabeledSpan的边界
- 标签:
BinraryRelations, 从ArgMicroDocument的relations转换- 标签:
sup,reb,und,joint,exa - 如果
head或tail包含多个adus,则构建所有head-tail组合的BinaryRelation并从原始关系中获取标签
- 标签:
metadata, 保留ArgMicroDocument的metadata,但不包括stance和topic_id



