LNTANOooo/open_hermes2.5_v3
收藏Hugging Face2024-03-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LNTANOooo/open_hermes2.5_v3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个分割,每个分割都有特定的名称、字节大小和示例数量。数据集的特征是一个对话列表,每个对话包含内容和角色两个字段。数据集的分割包括Econ_domain_expert、platypus、EvolInstruct_70k、LMSys_Chatbot_Arena、lmsys1m、CogStackMed、UnnaturalInstructions、GPT_4_Comparison_Data、None、cot_alpaca_gpt4、metamath、CamelAI、airoboros2.2、glaive_code_assist和caseus_custom。每个分割对应的数据文件路径在配置信息中指定。
该数据集包含多个分割,每个分割都有特定的名称、字节大小和示例数量。数据集的特征是一个对话列表,每个对话包含内容和角色两个字段。数据集的分割包括Econ_domain_expert、platypus、EvolInstruct_70k、LMSys_Chatbot_Arena、lmsys1m、CogStackMed、UnnaturalInstructions、GPT_4_Comparison_Data、None、cot_alpaca_gpt4、metamath、CamelAI、airoboros2.2、glaive_code_assist和caseus_custom。每个分割对应的数据文件路径在配置信息中指定。
提供机构:
LNTANOooo
原始信息汇总
数据集概述
数据集特征
- 名称: conversation
- 内容:
- 名称: content
- 数据类型: string
- 名称: role
- 数据类型: string
- 名称: content
- 内容:
数据集分割
- 名称: Econ_domain_expert
- 字节数: 2586192.0
- 样本数: 658
- 名称: platypus
- 字节数: 24313722.202696867
- 样本数: 20838
- 名称: EvolInstruct_70k
- 字节数: 88240968.07420495
- 样本数: 44140
- 名称: LMSys_Chatbot_Arena
- 字节数: 3209728.696711328
- 样本数: 2460
- 名称: lmsys1m
- 字节数: 1642856.6771819138
- 样本数: 950
- 名称: CogStackMed
- 字节数: 4314956.0
- 样本数: 4400
- 名称: UnnaturalInstructions
- 字节数: 3338715.840329602
- 样本数: 6431
- 名称: GPT_4_Comparison_Data
- 字节数: 750546.0
- 样本数: 1514
- 名称: None
- 字节数: 194715445.44100824
- 样本数: 107494
- 名称: cot_alpaca_gpt4
- 字节数: 32743635.389400143
- 样本数: 41507
- 名称: metamath
- 字节数: 21272191.0
- 样本数: 27593
- 名称: CamelAI
- 字节数: 143091373.0
- 样本数: 76053
- 名称: airoboros2.2
- 字节数: 43282002.08555703
- 样本数: 28702
- 名称: glaive_code_assist
- 字节数: 311951781.1964973
- 样本数: 179406
- 名称: caseus_custom
- 字节数: 1852195.0
- 样本数: 2402
数据集大小
- 下载大小: 416791659
- 数据集大小: 877306308.6035874
配置
- 配置名称: default
- 数据文件:
- 分割: Econ_domain_expert
- 路径: data/Econ_domain_expert-*
- 分割: platypus
- 路径: data/platypus-*
- 分割: EvolInstruct_70k
- 路径: data/EvolInstruct_70k-*
- 分割: LMSys_Chatbot_Arena
- 路径: data/LMSys_Chatbot_Arena-*
- 分割: lmsys1m
- 路径: data/lmsys1m-*
- 分割: CogStackMed
- 路径: data/CogStackMed-*
- 分割: UnnaturalInstructions
- 路径: data/UnnaturalInstructions-*
- 分割: GPT_4_Comparison_Data
- 路径: data/GPT_4_Comparison_Data-*
- 分割: None
- 路径: data/None-*
- 分割: cot_alpaca_gpt4
- 路径: data/cot_alpaca_gpt4-*
- 分割: metamath
- 路径: data/metamath-*
- 分割: CamelAI
- 路径: data/CamelAI-*
- 分割: airoboros2.2
- 路径: data/airoboros2.2-*
- 分割: glaive_code_assist
- 路径: data/glaive_code_assist-*
- 分割: caseus_custom
- 路径: data/caseus_custom-*
- 分割: Econ_domain_expert
- 数据文件:



