distilabel-internal-testing/test-dataset-subsets
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/test-dataset-subsets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过Distilabel工具生成的,包含两个配置:generate_with_openai_gpt4和generate_with_openai_gpt4_2。每个配置的数据结构包括instruction(指令)、completion(完成内容)、meta(元数据)和model_name(模型名称)等字段。数据集主要用于问答任务,特别是数学问题的解答。
该数据集是通过Distilabel工具生成的,包含两个配置:generate_with_openai_gpt4和generate_with_openai_gpt4_2。每个配置的数据结构包括instruction(指令)、completion(完成内容)、meta(元数据)和model_name(模型名称)等字段。数据集主要用于问答任务,特别是数学问题的解答。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
基本信息
- 数据集大小: 小于1KB (
size_categories: n<1K) - 配置名称:
generate_with_openai_gpt4generate_with_openai_gpt4_2
- 标签:
syntheticdistilabelrlaif
数据集结构
- 配置名称:
generate_with_openai_gpt4_2 - 特征:
instruction: 数据类型为字符串completion: 数据类型为字符串meta: 结构化数据,包含以下字段:category: 数据类型为字符串completion: 数据类型为字符串id: 数据类型为int64input: 数据类型为nullmotivation_app: 数据类型为nullprompt: 数据类型为字符串source: 数据类型为字符串subcategory: 数据类型为字符串
model_name: 数据类型为字符串generation: 数据类型为字符串
数据集分割
- 训练集:
num_bytes: 26770num_examples: 10
数据集大小
- 下载大小: 34623
- 数据集大小: 26770
配置详情
- 配置名称:
generate_with_openai_gpt4_2 - 数据文件:
split: 训练集path:generate_with_openai_gpt4_2/train-*



