honggen/hh_hard_v3
收藏Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/honggen/hh_hard_v3
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- text-generation
language:
- en
---
We use BERT-based to caculate the similarity but only on the responses pair ([chosen, rejected]) without considering the prompt. We selected the top 55% of data after ranking but get rid of the top 5% data.
许可证:Apache-2.0
任务类别:
- 文本生成(text-generation)
语言:
- 英语(en)
我们采用基于BERT的方法计算相似度,但仅针对回复对`[chosen, rejected]`开展计算,未考虑提示词(prompt)。我们在完成数据排序后选取了前55%的样本,但剔除了其中排名最靠前的5%的数据。
提供机构:
honggen
原始信息汇总
数据集概述
许可证
- Apache 2.0
任务类别
- 文本生成
语言
- 英语
数据处理
- 使用基于BERT的方法计算相似度,仅针对响应对([chosen, rejected]),不考虑提示。
- 在排序后选择前55%的数据,但剔除前5%的数据。



