gabrielaltay/pmcoa
收藏Hugging Face2023-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gabrielaltay/pmcoa
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: pmid
dtype: string
- name: accession_id
dtype: string
- name: license
dtype: string
- name: last_updated
dtype: string
- name: retracted
dtype: string
- name: citation
dtype: string
- name: decoded_as
dtype: string
- name: journal
dtype: string
- name: year
dtype: int32
- name: doi
dtype: string
- name: oa_subset
dtype: string
splits:
- name: train
num_bytes: 206274456770
num_examples: 4935779
- name: validation
num_bytes: 4046140044
num_examples: 87794
download_size: 111297924087
dataset_size: 210320596814
---
# Dataset Card for "pmcoa"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
gabrielaltay
原始信息汇总
数据集概述
数据集名称
- pmcoa
数据特征
- text: 字符串类型
- pmid: 字符串类型
- accession_id: 字符串类型
- license: 字符串类型
- last_updated: 字符串类型
- retracted: 字符串类型
- citation: 字符串类型
- decoded_as: 字符串类型
- journal: 字符串类型
- year: 整数类型 (int32)
- doi: 字符串类型
- oa_subset: 字符串类型
数据分割
- 训练集 (train):
- 样本数量: 4935779
- 数据大小: 206274456770 字节
- 验证集 (validation):
- 样本数量: 87794
- 数据大小: 4046140044 字节
数据集大小
- 下载大小: 111297924087 字节
- 数据集总大小: 210320596814 字节



