five

xusenlin/duie

收藏
Hugging Face2022-12-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xusenlin/duie
下载链接
链接失效反馈
官方服务:
资源简介:
DuIE关系抽取数据集包含文本数据和文本中的关系三元组。每个关系三元组包括头实体、头实体类型、尾实体、尾实体类型以及它们之间的关系。数据集分为训练集和验证集,分别包含172,983和21,626个示例。
提供机构:
xusenlin
原始信息汇总

数据集概述

数据集名称

DuIE 关系抽取数据集

数据集特征

  • text: 文本类型,存储原始文本信息。
  • spo_list: 列表类型,包含以下子特征:
    • predicate: 字符串类型,表示关系。
    • object_type: 字符串类型,表示尾实体的类型。
    • subject_type: 字符串类型,表示头实体的类型。
    • object: 字符串类型,表示尾实体。
    • subject: 字符串类型,表示头实体。

数据集划分

  • train: 包含172983个示例,总大小为51849478字节。
  • validation: 包含21626个示例,总大小为6512116字节。

数据集大小

  • 下载大小: 32568292字节
  • 数据集总大小: 58361594字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作