five

yueqingyou/BioQwen

收藏
Hugging Face2024-07-07 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/yueqingyou/BioQwen
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个主要特征:instruction(指令)、input(输入)和output(输出),每个特征的数据类型均为字符串。数据集分为三个部分:Generative(生成)、Comprehension(理解)和COIG,每个部分都有相应的字节大小和示例数量。Generative部分包含188,335个示例,占用198,807,135字节;Comprehension部分包含182,769个示例,占用169,739,108字节;COIG部分包含26,347个示例,占用83,630,452字节。数据集的下载大小为208,619,592字节,总存储大小为452,176,695字节。

The dataset contains three main features: instruction, input, and output, each with a data type of string. The dataset is divided into three parts: Generative, Comprehension, and COIG, each with corresponding byte sizes and number of examples. The Generative part contains 188,335 examples and occupies 198,807,135 bytes; the Comprehension part contains 182,769 examples and occupies 169,739,108 bytes; the COIG part contains 26,347 examples and occupies 83,630,452 bytes. The download size of the dataset is 208,619,592 bytes, and the total storage size is 452,176,695 bytes.
提供机构:
yueqingyou
原始信息汇总

数据集概述

数据集特征

  • instruction: 数据类型为字符串。
  • input: 数据类型为字符串。
  • output: 数据类型为字符串。

数据集分割

  • Generative:
    • 字节数: 198,807,135
    • 样本数: 188,335
  • Comprehension:
    • 字节数: 169,739,108.01635748
    • 样本数: 182,769
  • COIG:
    • 字节数: 83,630,451.9164408
    • 样本数: 26,347

数据集大小

  • 下载大小: 208,619,592 字节
  • 总数据集大小: 452,176,694.93279827 字节

配置

  • 配置名称: default
    • Generative: 数据路径为 data/Generative-*
    • Comprehension: 数据路径为 data/Comprehension-*
    • COIG: 数据路径为 data/COIG-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作