hippocrates/PubMed_Summ_train

Name: hippocrates/PubMed_Summ_train
Creator: hippocrates
Published: 2023-11-16 21:47:36
License: 暂无描述

Hugging Face2023-11-16 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/hippocrates/PubMed_Summ_train

下载链接

链接失效反馈

官方服务：

资源简介：

--- configs: - config_name: default data_files: - split: train path: data/train-* dataset_info: features: - name: id dtype: string - name: conversations list: - name: from dtype: string - name: value dtype: string - name: text dtype: string splits: - name: train num_bytes: 54379474 num_examples: 26570 download_size: 29277288 dataset_size: 54379474 --- # Dataset Card for "PubMed_Summ_train" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

配置项： - 配置名称：default 数据文件： - 拆分集（split）：train，路径：data/train-* 数据集信息：特征字段： - 字段名：id，数据类型（dtype）：string - 字段名：conversations，列表类型，其内部元素包含： - 字段名：from，数据类型（dtype）：string - 字段名：value，数据类型（dtype）：string - 字段名：text，数据类型（dtype）：string 拆分集详情： - 拆分集（split）名称：train，字节占用：54379474，样本数量：26570 下载大小：29277288，总数据集大小：54379474 # 「PubMed_Summ_train」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

hippocrates

原始信息汇总

数据集概述

数据集名称

PubMed_Summ_train

配置

默认配置

数据文件

训练集路径: data/train-*

数据集信息

特征

id: 字符串类型
conversations: 列表类型
- from: 字符串类型
- value: 字符串类型
text: 字符串类型

数据分割

训练集
- 字节数: 54379474
- 样本数: 26570

数据大小

下载大小: 29277288
数据集大小: 54379474

5,000+

优质数据集

54 个

任务类型

进入经典数据集