ejbejaranos/ScienticDatasetArxiv-openAI-FormatV3
收藏Hugging Face2024-05-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ejbejaranos/ScienticDatasetArxiv-openAI-FormatV3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含为与OpenAI模型一起使用而转换的科学数据。它包括详细的描述和结构,专为机器学习应用设计。数据集结构包括一个训练分割,具有210,580个示例,总大小为409,911,619字节。特征包括Messages,其中包含Content和Role两个字段。数据集使用Apache-2.0许可证发布,任务类别为问答,语言为英语,标签为Papers和Scientific,大小类别为10K<n<100K。
该数据集包含为与OpenAI模型一起使用而转换的科学数据。它包括详细的描述和结构,专为机器学习应用设计。数据集结构包括一个训练分割,具有210,580个示例,总大小为409,911,619字节。特征包括Messages,其中包含Content和Role两个字段。数据集使用Apache-2.0许可证发布,任务类别为问答,语言为英语,标签为Papers和Scientific,大小类别为10K<n<100K。
提供机构:
ejbejaranos
原始信息汇总
数据集概述
基本信息
- 数据集名称: Scientific Dataset Arxiv OpenAI Format
- 许可证: Apache-2.0
数据结构
- 特征:
- 名称: messages
- 子特征:
- 名称: content
- 数据类型: string
- 名称: role
- 数据类型: string
- 名称: content
- 子特征:
- 名称: messages
- 分割:
- 名称: train
- 大小: 409,911,619 bytes
- 示例数量: 210,580 examples
- 下载大小: 128,200,822 bytes
- 名称: train
配置
- 默认配置:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 分割: train
- 数据文件:
附加信息
- 任务类别: Question Answering
- 语言: English
- 标签: Papers, Scientific
- 大小类别: 10K < n < 100K



