yueqingyou/BioQwen
收藏Hugging Face2024-07-07 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/yueqingyou/BioQwen
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:instruction(指令)、input(输入)和output(输出),每个特征的数据类型均为字符串。数据集分为三个部分:Generative(生成)、Comprehension(理解)和COIG,每个部分都有相应的字节大小和示例数量。Generative部分包含188,335个示例,占用198,807,135字节;Comprehension部分包含182,769个示例,占用169,739,108字节;COIG部分包含26,347个示例,占用83,630,452字节。数据集的下载大小为208,619,592字节,总存储大小为452,176,695字节。
The dataset contains three main features: instruction, input, and output, each with a data type of string. The dataset is divided into three parts: Generative, Comprehension, and COIG, each with corresponding byte sizes and number of examples. The Generative part contains 188,335 examples and occupies 198,807,135 bytes; the Comprehension part contains 182,769 examples and occupies 169,739,108 bytes; the COIG part contains 26,347 examples and occupies 83,630,452 bytes. The download size of the dataset is 208,619,592 bytes, and the total storage size is 452,176,695 bytes.
提供机构:
yueqingyou
原始信息汇总
数据集概述
数据集特征
- instruction: 数据类型为字符串。
- input: 数据类型为字符串。
- output: 数据类型为字符串。
数据集分割
- Generative:
- 字节数: 198,807,135
- 样本数: 188,335
- Comprehension:
- 字节数: 169,739,108.01635748
- 样本数: 182,769
- COIG:
- 字节数: 83,630,451.9164408
- 样本数: 26,347
数据集大小
- 下载大小: 208,619,592 字节
- 总数据集大小: 452,176,694.93279827 字节
配置
- 配置名称: default
- Generative: 数据路径为
data/Generative-* - Comprehension: 数据路径为
data/Comprehension-* - COIG: 数据路径为
data/COIG-*
- Generative: 数据路径为



