heegyu/ko-openchat-0406
收藏Hugging Face2024-04-06 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/heegyu/ko-openchat-0406
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由多个子数据集组成,涵盖了指令执行、推理、常识、数学、编码、函数调用、安全性和咨询等多个领域。数据集被分为训练集和测试集,训练集包含2,302,452个样本,测试集包含1,000个样本。数据集的下载大小为2,826,393,454字节,总大小为5,735,454,142字节。
该数据集由多个子数据集组成,涵盖了指令执行、推理、常识、数学、编码、函数调用、安全性和咨询等多个领域。数据集被分为训练集和测试集,训练集包含2,302,452个样本,测试集包含1,000个样本。数据集的下载大小为2,826,393,454字节,总大小为5,735,454,142字节。
提供机构:
heegyu
原始信息汇总
数据集概述
数据集特征
- conversations
- content:数据类型为字符串。
- role:数据类型为字符串。
- source:数据类型为字符串。
数据集分割
- train
- num_bytes:5732964203.359212字节。
- num_examples:2302452个样本。
- test
- num_bytes:2489938.6407878264字节。
- num_examples:1000个样本。
数据集大小
- download_size:2826393454字节。
- dataset_size:5735454142.0字节。
配置文件
- config_name:default
- data_files
- split:train
- path:data/train-*
- split:test
- path:data/test-*
- split:train
- data_files



