nguyenthanhdo/orca-cqa-v1.0
收藏Hugging Face2023-11-28 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/nguyenthanhdo/orca-cqa-v1.0
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含由GPT-3.5和GPT-4生成的问题和回答,每个样本包含id、系统提示、问题、回答、问题字数和回答字数等特征。数据集分为gpt3.5和gpt4两个部分,分别包含426,091和110,053个样本。数据集的总下载大小为1,074,570,511字节,总大小为921,097,006.83字节。
该数据集包含由GPT-3.5和GPT-4生成的问题和回答,每个样本包含id、系统提示、问题、回答、问题字数和回答字数等特征。数据集分为gpt3.5和gpt4两个部分,分别包含426,091和110,053个样本。数据集的总下载大小为1,074,570,511字节,总大小为921,097,006.83字节。
提供机构:
nguyenthanhdo
原始信息汇总
数据集概述
配置信息
- 默认配置:
- 数据文件:
gpt3.5分割:路径为data/gpt3.5-*gpt4分割:路径为data/gpt4-*
- 数据文件:
数据集信息
-
特征:
id:类型为stringsystem_prompt:类型为stringquestion:类型为stringresponse:类型为stringquestion_word_count:类型为int64response_word_count:类型为int64
-
分割:
gpt3.5:- 字节数:721493280.2090137
- 样本数:426091
gpt4:- 字节数:199603726.6207845
- 样本数:110053
-
下载大小:1074570511 字节
-
数据集大小:921097006.8297982 字节



