pie/brat
收藏Hugging Face2024-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pie/brat
下载链接
链接失效反馈官方服务:
资源简介:
BRAT数据集是一个用于自然语言处理任务的数据集,提供了两种变体:`default`和`merge_fragmented_spans`。`default`变体使用`BratDocument`文档类型,包含`LabeledMultiSpan`注释;`merge_fragmented_spans`变体使用`BratDocumentWithMergedSpans`文档类型,将分散的`LabeledMultiSpan`合并为简单的`LabeledSpan`。数据模式包括文本、ID、元数据等字段,以及多种注释类型如`LabeledMultiSpan`、`BinaryRelation`和`Attribute`。BRAT格式非常灵活,适用于多种任务,因此没有预定义的文档转换器。
BRAT数据集是一个用于自然语言处理任务的数据集,提供了两种变体:`default`和`merge_fragmented_spans`。`default`变体使用`BratDocument`文档类型,包含`LabeledMultiSpan`注释;`merge_fragmented_spans`变体使用`BratDocumentWithMergedSpans`文档类型,将分散的`LabeledMultiSpan`合并为简单的`LabeledSpan`。数据模式包括文本、ID、元数据等字段,以及多种注释类型如`LabeledMultiSpan`、`BinaryRelation`和`Attribute`。BRAT格式非常灵活,适用于多种任务,因此没有预定义的文档转换器。
提供机构:
pie
原始信息汇总
PIE Dataset Card for "brat"
数据集变体
default: 原始数据集,文档类型为BratDocument,包含LabeledMultiSpan注释。merge_fragmented_spans: 文档类型为BratDocumentWithMergedSpans,此变体合并了分散的LabeledSpans。
数据架构
- 文档类型:
BratDocument或BratDocumentWithMergedSpans。 - 数据字段:
text(str)id(str, optional)metadata(dictionary, optional)
- 注释层:
spans(注释类型:LabeledMultiSpan或LabeledSpan,目标:text)relations(注释类型:BinaryRelation,目标:spans)span_attributes(注释类型:Attribute,目标:spans)relation_attributes(注释类型:Attribute,目标:relations)
注释类型定义
LabeledMultiSpan:slices(类型:Tuple[Tuple[int, int], ...])label(类型:str)score(类型:float, optional)
Attribute:annotation(类型:Annotation)label(类型:str)value(类型:str, optional)score(类型:float, optional)
文档转换器
- 数据集未提供预定义的文档转换器,因为BRAT格式非常灵活,适用于多种不同任务。



