argilla/dolly-curated-comparison-falcon-7b-instruct
收藏Hugging Face2023-07-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/dolly-curated-comparison-falcon-7b-instruct
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含使用`falcon-7b-instruct`模型生成的两个响应以及来自Dolly v2 curated数据集的原始、精选的prompt和响应。目前只有原始数据集的50%可用,但计划完成整个数据集。该数据集可用于训练RLHF的奖励模型。
该数据集包含使用`falcon-7b-instruct`模型生成的两个响应以及来自Dolly v2 curated数据集的原始、精选的prompt和响应。目前只有原始数据集的50%可用,但计划完成整个数据集。该数据集可用于训练RLHF的奖励模型。
提供机构:
argilla
原始信息汇总
数据集概述
数据集名称
"dolly-curated-comparison-falcon-7b-instruct"
数据集内容
- 模型使用:包含使用
falcon-7b-instruct模型生成的两个响应。 - 原始数据来源:基于Dolly v2精选数据集的原始精选提示和响应。
- 数据完整性:目前仅提供原始数据集的50%,计划未来完成全部数据。
数据集特征
- prompt:字符串类型
- response-1:字符串类型
- response-2:字符串类型
- category:字符串类型
- original_response:字符串类型
- external_id:整数类型(int64)
数据集划分
- 训练集(train):
- 示例数量:7401
- 数据大小:10328235字节
数据集大小
- 下载大小:6598297字节
- 数据集总大小:10328235字节
数据集用途
用于训练奖励模型,支持RLHF(Reinforcement Learning from Human Feedback),特别是通过Argilla Feedback进行。



