alehc/rejection-sampling-QA
收藏Hugging Face2024-01-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alehc/rejection-sampling-QA
下载链接
链接失效反馈官方服务:
资源简介:
Rejection Sampling QA数据集是一个非常小的、精心策划的问题-答案对集合。问题手工制作,用于测试模型在不同领域遵循指令的能力。答案通过Microsofts Phi-2模型生成,并使用OpenAssistants Large DeBERTa v3 Reward Model v2进行筛选。数据集的语言为英语,遵循MIT许可证。每个样本包含id、question和answer三个键,分别表示样本的ID、问题和最佳生成的答案。
Rejection Sampling QA数据集是一个非常小的、精心策划的问题-答案对集合。问题手工制作,用于测试模型在不同领域遵循指令的能力。答案通过Microsofts Phi-2模型生成,并使用OpenAssistants Large DeBERTa v3 Reward Model v2进行筛选。数据集的语言为英语,遵循MIT许可证。每个样本包含id、question和answer三个键,分别表示样本的ID、问题和最佳生成的答案。
提供机构:
alehc
原始信息汇总
Rejection Sampling QA 数据集概述
数据集描述
- 数据集名称: Rejection Sampling QA
- 语言: 英语
- 许可证: MIT License
- 标签: QA, testing, tiny
- 大小类别: n<1K
- 任务类别: conversational, text-generation, text2text-generation
数据集结构
- 特征:
id: 数据样本的唯一标识,数据类型为int64question: 问题,数据类型为stringanswer: 答案,数据类型为string
- 分割:
train: 训练集,包含 10 个样本,占用 8246 字节
数据生成
- 答案生成: 使用 Microsofts Phi-2 生成答案,并通过 OpenAssistants Large DeBERTa v3 Reward Model v2 进行筛选。
- 提示格式: 受 Stanfords Alpaca 启发,包含 "Lets think step by step" 以提高性能。
- 系统提示: 确保答案有益、尊重且诚实,不包含任何有害或非法内容。
数据集详情
- 数据集大小: 8246 字节
- 下载大小: 12113 字节
- 配置:
default配置,包含训练集数据文件路径data/train-*



