KorMaverick/mug_dataset_38k
收藏Hugging Face2024-06-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/KorMaverick/mug_dataset_38k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个配置:greed_response、greed_response_ko和questions。greed_response配置包含id、source、question和response字段;greed_response_ko配置在此基础上增加了question_ko和response_ko字段;questions配置包含id、source和question字段。每个配置都有训练集,分别指定了数据量和文件路径。
该数据集包含三个配置:greed_response、greed_response_ko和questions。greed_response配置包含id、source、question和response字段;greed_response_ko配置在此基础上增加了question_ko和response_ko字段;questions配置包含id、source和question字段。每个配置都有训练集,分别指定了数据量和文件路径。
提供机构:
KorMaverick
原始信息汇总
数据集概述
数据集配置
1. greed_response
- 特征:
- id: string
- source: string
- question: string
- response: string
- 分割:
- train:
- 字节数: 45920036
- 样本数: 38504
- train:
- 下载大小: 26704330
- 数据集大小: 45920036
2. greed_response_ko
- 特征:
- id: string
- source: string
- question: string
- response: string
- question_ko: string
- response_ko: string
- 分割:
- train:
- 字节数: 98115716
- 样本数: 38504
- train:
- 下载大小: 56374193
- 数据集大小: 98115716
3. questions
- 特征:
- id: string
- source: string
- question: string
- 分割:
- train:
- 字节数: 8451758
- 样本数: 38504
- train:
- 下载大小: 5005388
- 数据集大小: 8451758
数据文件路径
1. greed_response
- train: greed_response/train-*
2. greed_response_ko
- train: greed_response_ko/train-*
3. questions
- train: questions/train-*



