Siddharth63/clinical_trial_relations
收藏Hugging Face2024-07-18 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/Siddharth63/clinical_trial_relations
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本、关系和断言三个主要特征。关系特征详细描述了实体之间的关系,包括实体名称、起始位置、结束位置以及关系类型等信息。断言特征则包含断言本身及其相关的chunks和实体。数据集提供了一个训练集,包含37588个样本,文件大小为1491445605字节。
The dataset includes three main features: text, relations, and assertions. The relations feature details the relationships between entities, including entity names, start and end positions, and the type of relationship. The assertions feature contains the assertions themselves along with related chunks and entities. The dataset provides a training set with 37,588 samples and a file size of 1,491,445,605 bytes.
提供机构:
Siddharth63
原始信息汇总
数据集概述
数据集信息
特征
- text: 文本数据,数据类型为字符串。
- relations: 关系数据,包含以下子特征:
- chunk1: 数据类型为字符串。
- chunk2: 数据类型为字符串。
- confidence: 数据类型为字符串。
- entity1: 数据类型为字符串。
- entity1_begin: 数据类型为字符串。
- entity1_end: 数据类型为字符串。
- entity2: 数据类型为字符串。
- entity2_begin: 数据类型为字符串。
- entity2_end: 数据类型为字符串。
- relation: 数据类型为字符串。
- assertion: 断言数据,包含以下子特征:
- assertion: 数据类型为字符串。
- chunks: 数据类型为字符串。
- entities: 数据类型为字符串。
- index_level_0: 索引数据,数据类型为整数。
数据集划分
- train: 训练集,包含37588个样本,总大小为1491445605字节。
数据集大小
- 下载大小: 283397268字节。
- 数据集总大小: 1491445605字节。
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



