MLP-SEMA/sema_dataset_38k
收藏Hugging Face2024-06-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MLP-SEMA/sema_dataset_38k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个配置:greedy_response、greedy_response_ko和questions。greedy_response配置包含id、source、question和response字段,训练集有38504个样本。greedy_response_ko配置在greedy_response的基础上增加了question_ko和response_ko字段,同样有38504个训练样本。questions配置包含id、source和question字段,训练集也有38504个样本。
该数据集包含三个配置:greedy_response、greedy_response_ko和questions。greedy_response配置包含id、source、question和response字段,训练集有38504个样本。greedy_response_ko配置在greedy_response的基础上增加了question_ko和response_ko字段,同样有38504个训练样本。questions配置包含id、source和question字段,训练集也有38504个样本。
提供机构:
MLP-SEMA
原始信息汇总
数据集概述
数据集配置
配置1: greedy_response
- 特征:
- id: string
- source: string
- question: string
- response: string
- 分割:
- train:
- 字节数: 45920036
- 样本数: 38504
- train:
- 下载大小: 26704330
- 数据集大小: 45920036
配置2: greedy_response_ko
- 特征:
- id: string
- source: string
- question: string
- response: string
- question_ko: string
- response_ko: string
- 分割:
- train:
- 字节数: 98115716
- 样本数: 38504
- train:
- 下载大小: 56374193
- 数据集大小: 98115716
配置3: questions
- 特征:
- id: string
- source: string
- question: string
- 分割:
- train:
- 字节数: 8451758
- 样本数: 38504
- train:
- 下载大小: 5005388
- 数据集大小: 8451758
数据文件路径
- greedy_response:
- train: greedy_response/train-*
- greedy_response_ko:
- train: greedy_response_ko/train-*
- questions:
- train: questions/train-*



