five

alehc/rejection-sampling-QA

收藏
Hugging Face2024-01-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alehc/rejection-sampling-QA
下载链接
链接失效反馈
官方服务:
资源简介:
Rejection Sampling QA数据集是一个非常小的、精心策划的问题-答案对集合。问题手工制作,用于测试模型在不同领域遵循指令的能力。答案通过Microsofts Phi-2模型生成,并使用OpenAssistants Large DeBERTa v3 Reward Model v2进行筛选。数据集的语言为英语,遵循MIT许可证。每个样本包含id、question和answer三个键,分别表示样本的ID、问题和最佳生成的答案。

Rejection Sampling QA数据集是一个非常小的、精心策划的问题-答案对集合。问题手工制作,用于测试模型在不同领域遵循指令的能力。答案通过Microsofts Phi-2模型生成,并使用OpenAssistants Large DeBERTa v3 Reward Model v2进行筛选。数据集的语言为英语,遵循MIT许可证。每个样本包含id、question和answer三个键,分别表示样本的ID、问题和最佳生成的答案。
提供机构:
alehc
原始信息汇总

Rejection Sampling QA 数据集概述

数据集描述

  • 数据集名称: Rejection Sampling QA
  • 语言: 英语
  • 许可证: MIT License
  • 标签: QA, testing, tiny
  • 大小类别: n<1K
  • 任务类别: conversational, text-generation, text2text-generation

数据集结构

  • 特征:
    • id: 数据样本的唯一标识,数据类型为 int64
    • question: 问题,数据类型为 string
    • answer: 答案,数据类型为 string
  • 分割:
    • train: 训练集,包含 10 个样本,占用 8246 字节

数据生成

数据集详情

  • 数据集大小: 8246 字节
  • 下载大小: 12113 字节
  • 配置:
    • default 配置,包含训练集数据文件路径 data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作