five

pie/brat

收藏
Hugging Face2024-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pie/brat
下载链接
链接失效反馈
官方服务:
资源简介:
BRAT数据集是一个用于自然语言处理任务的数据集,提供了两种变体:`default`和`merge_fragmented_spans`。`default`变体使用`BratDocument`文档类型,包含`LabeledMultiSpan`注释;`merge_fragmented_spans`变体使用`BratDocumentWithMergedSpans`文档类型,将分散的`LabeledMultiSpan`合并为简单的`LabeledSpan`。数据模式包括文本、ID、元数据等字段,以及多种注释类型如`LabeledMultiSpan`、`BinaryRelation`和`Attribute`。BRAT格式非常灵活,适用于多种任务,因此没有预定义的文档转换器。

BRAT数据集是一个用于自然语言处理任务的数据集,提供了两种变体:`default`和`merge_fragmented_spans`。`default`变体使用`BratDocument`文档类型,包含`LabeledMultiSpan`注释;`merge_fragmented_spans`变体使用`BratDocumentWithMergedSpans`文档类型,将分散的`LabeledMultiSpan`合并为简单的`LabeledSpan`。数据模式包括文本、ID、元数据等字段,以及多种注释类型如`LabeledMultiSpan`、`BinaryRelation`和`Attribute`。BRAT格式非常灵活,适用于多种任务,因此没有预定义的文档转换器。
提供机构:
pie
原始信息汇总

PIE Dataset Card for "brat"

数据集变体

  • default: 原始数据集,文档类型为 BratDocument,包含 LabeledMultiSpan 注释。
  • merge_fragmented_spans: 文档类型为 BratDocumentWithMergedSpans,此变体合并了分散的 LabeledSpans

数据架构

  • 文档类型:BratDocumentBratDocumentWithMergedSpans
  • 数据字段:
    • text (str)
    • id (str, optional)
    • metadata (dictionary, optional)
  • 注释层:
    • spans (注释类型:LabeledMultiSpanLabeledSpan,目标:text)
    • relations (注释类型:BinaryRelation,目标:spans)
    • span_attributes (注释类型:Attribute,目标:spans)
    • relation_attributes (注释类型:Attribute,目标:relations)

注释类型定义

  • LabeledMultiSpan:
    • slices (类型:Tuple[Tuple[int, int], ...])
    • label (类型:str)
    • score (类型:float, optional)
  • Attribute:
    • annotation (类型:Annotation)
    • label (类型:str)
    • value (类型:str, optional)
    • score (类型:float, optional)

文档转换器

  • 数据集未提供预定义的文档转换器,因为BRAT格式非常灵活,适用于多种不同任务。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作