honggen/hh-hard-v2
收藏Hugging Face2024-03-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/honggen/hh-hard-v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集基于BERT-base模型,对响应对([prompt+chosen, prompt+rejected])进行排名,并选择了前51%的数据对,但去除了前1%的数据。数据集主要用于文本生成任务,语言为英语,大小在10K到100K之间。
该数据集基于BERT-base模型,对响应对([prompt+chosen, prompt+rejected])进行排名,并选择了前51%的数据对,但去除了前1%的数据。数据集主要用于文本生成任务,语言为英语,大小在10K到100K之间。
提供机构:
honggen
原始信息汇总
数据集概述
许可证
- Apache 2.0
任务类别
- 文本生成
语言
- 英语
数据规模
- 10K<n<100K
数据处理
- 基于BERT-base模型,对响应对([prompt+chosen, prompt+rejected])进行排序,选择前51%的数据对,但剔除前1%的数据。



