five

heegyu/ko-openchat-0406

收藏
Hugging Face2024-04-06 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/heegyu/ko-openchat-0406
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由多个子数据集组成,涵盖了指令执行、推理、常识、数学、编码、函数调用、安全性和咨询等多个领域。数据集被分为训练集和测试集,训练集包含2,302,452个样本,测试集包含1,000个样本。数据集的下载大小为2,826,393,454字节,总大小为5,735,454,142字节。

该数据集由多个子数据集组成,涵盖了指令执行、推理、常识、数学、编码、函数调用、安全性和咨询等多个领域。数据集被分为训练集和测试集,训练集包含2,302,452个样本,测试集包含1,000个样本。数据集的下载大小为2,826,393,454字节,总大小为5,735,454,142字节。
提供机构:
heegyu
原始信息汇总

数据集概述

数据集特征

  • conversations
    • content:数据类型为字符串。
    • role:数据类型为字符串。
  • source:数据类型为字符串。

数据集分割

  • train
    • num_bytes:5732964203.359212字节。
    • num_examples:2302452个样本。
  • test
    • num_bytes:2489938.6407878264字节。
    • num_examples:1000个样本。

数据集大小

  • download_size:2826393454字节。
  • dataset_size:5735454142.0字节。

配置文件

  • config_name:default
    • data_files
      • split:train
        • path:data/train-*
      • split:test
        • path:data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作