heegyu/ko-openchat-0404-test
收藏Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/heegyu/ko-openchat-0404-test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为了韩国语聊天机器人学习而创建的,通过统一格式整合了多个数据源,每个数据源提取了前1万个样本。数据集包含两个主要特征:conversations和source。conversations是一个列表,包含content和role两个字段,数据类型均为字符串。source字段的数据类型也是字符串。数据集仅包含一个train分割,提供了字节数和示例数。
该数据集是为了韩国语聊天机器人学习而创建的,通过统一格式整合了多个数据源,每个数据源提取了前1万个样本。数据集包含两个主要特征:conversations和source。conversations是一个列表,包含content和role两个字段,数据类型均为字符串。source字段的数据类型也是字符串。数据集仅包含一个train分割,提供了字节数和示例数。
提供机构:
heegyu
原始信息汇总
数据集概述
数据集特征
- conversations:
- content: 数据类型为字符串
- role: 数据类型为字符串
- source: 数据类型为字符串
数据集分割
- train:
- 数据大小: 151814905.0 字节
- 示例数量: 70000
数据集大小与下载大小
- 数据集大小: 151814905.0 字节
- 下载大小: 77237824 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



