nawazishpatana/brain-tumor-claim-extraction
收藏Hugging Face2026-04-09 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/nawazishpatana/brain-tumor-claim-extraction
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: doc_id
dtype: string
- name: paper_key
dtype: string
- name: doi
dtype: string
- name: year
dtype: int64
- name: title
dtype: string
- name: abstract
dtype: string
- name: sentence_id
dtype: int64
- name: sentence_rank
dtype: int64
- name: num_sentences
dtype: int64
- name: relative_position
dtype: float64
- name: text
dtype: string
- name: label
dtype: int64
- name: pseudo_main_claim
dtype: string
splits:
- name: train
num_bytes: 24362168
num_examples: 11095
- name: validation
num_bytes: 5149951
num_examples: 2388
- name: test
num_bytes: 5090773
num_examples: 2362
download_size: 3226252
dataset_size: 34602892
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 特征名:doc_id,数据类型:字符串类型
- 特征名:paper_key,数据类型:字符串类型
- 特征名:doi(数字对象标识符),数据类型:字符串类型
- 特征名:year,数据类型:64位整数类型
- 特征名:title,数据类型:字符串类型
- 特征名:abstract,数据类型:字符串类型
- 特征名:sentence_id,数据类型:64位整数类型
- 特征名:sentence_rank,数据类型:64位整数类型
- 特征名:num_sentences,数据类型:64位整数类型
- 特征名:relative_position,数据类型:64位浮点数类型
- 特征名:text,数据类型:字符串类型
- 特征名:label,数据类型:64位整数类型
- 特征名:pseudo_main_claim(伪主论点),数据类型:字符串类型
数据集划分:
- 划分名称:train(训练集),字节占用量:24362168,样本数:11095
- 划分名称:validation(验证集),字节占用量:5149951,样本数:2388
- 划分名称:test(测试集),字节占用量:5090773,样本数:2362
下载总大小:3226252
数据集总存储大小:34602892
配置项:
- 配置名称:default(默认配置),数据文件:
- 训练集划分:数据路径为data/train-*
- 验证集划分:数据路径为data/validation-*
- 测试集划分:数据路径为data/test-*
提供机构:
nawazishpatana



