five

pie/argmicro

收藏
Hugging Face2024-11-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pie/argmicro
下载链接
链接失效反馈
官方服务:
资源简介:
argmicro数据集是一个包含德文和英文文本的论证分析数据集。数据集定义了`ArgMicroDocument`文档类型,包括文本、ID、主题ID和元数据等字段,并包含立场、教育单元(edus)、论证单元(adus)和关系(relations)等注释层。立场注释层包含支持(pro)、反对(con)、不明确(unclear)或无标签的立场标签。论证单元(adus)由多个教育单元(edus)组成,并包含反对(opp)和支持(pro)标签。关系(relations)注释层包含支持(sup)、反驳(reb)、削弱(und)和示例(exa)等关系标签。数据集还提供了文档转换器,用于将数据集转换为其他文档类型,如带有标签跨度和二元关系的文本文档。

argmicro数据集是一个包含德文和英文文本的论证分析数据集。数据集定义了`ArgMicroDocument`文档类型,包括文本、ID、主题ID和元数据等字段,并包含立场、教育单元(edus)、论证单元(adus)和关系(relations)等注释层。立场注释层包含支持(pro)、反对(con)、不明确(unclear)或无标签的立场标签。论证单元(adus)由多个教育单元(edus)组成,并包含反对(opp)和支持(pro)标签。关系(relations)注释层包含支持(sup)、反驳(reb)、削弱(und)和示例(exa)等关系标签。数据集还提供了文档转换器,用于将数据集转换为其他文档类型,如带有标签跨度和二元关系的文本文档。
提供机构:
pie
原始信息汇总

PIE Dataset Card for "argmicro"

数据集变体

  • de: 包含原始德语文本集合
  • en: 包含英语翻译文本

数据架构

  • 文档类型: ArgMicroDocument
  • 数据字段:
    • text (str)
    • id (str, optional)
    • topic_id (str, optional)
    • metadata (dictionary, optional)
  • 注释层:
    • stance (注释类型: Label)
      • 描述: 可能包含的标签有 pro, con, unclear 或未定义时无标签
    • edus (注释类型: Span, 目标: text)
    • adus (注释类型: LabeledAnnotationCollection, 目标: edus)
      • 描述: adus 中的每个元素可能包含 edus 中的多个条目
      • LabeledAnnotationCollection 字段:
        • annotations (注释类型: Span, 目标: text)
        • label (str, optional), 值: opp, pro
    • relations (注释类型: MultiRelation, 目标: adus)
      • 描述: MultiRelation 字段:
        • head (tuple, 注释类型: LabeledAnnotationCollection, 目标: adus)
        • tail (tuple, 注释类型: LabeledAnnotationCollection, 目标: adus)
        • label (str, optional), 值: sup, exa, reb, und

文档转换器

  • 目标文档类型: pytorch_ie.documents.TextDocumentWithLabeledSpansAndBinaryRelations
    • LabeledSpans, 从 ArgMicroDocumentadus 转换
      • 标签: opp, pro
      • 如果 ADU 包含多个跨度(即 EDUs),则取第一个 EDU 的起始和最后一个 EDU 的结束作为新 LabeledSpan 的边界
    • BinraryRelations, 从 ArgMicroDocumentrelations 转换
      • 标签: sup, reb, und, joint, exa
      • 如果 headtail 包含多个 adus,则构建所有 head-tail 组合的 BinaryRelation 并从原始关系中获取标签
    • metadata, 保留 ArgMicroDocumentmetadata,但不包括 stancetopic_id
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作