five

honggen/hh_hard_v3

收藏
Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/honggen/hh_hard_v3
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 task_categories: - text-generation language: - en --- We use BERT-based to caculate the similarity but only on the responses pair ([chosen, rejected]) without considering the prompt. We selected the top 55% of data after ranking but get rid of the top 5% data.

许可证:Apache-2.0 任务类别: - 文本生成(text-generation) 语言: - 英语(en) 我们采用基于BERT的方法计算相似度,但仅针对回复对`[chosen, rejected]`开展计算,未考虑提示词(prompt)。我们在完成数据排序后选取了前55%的样本,但剔除了其中排名最靠前的5%的数据。
提供机构:
honggen
原始信息汇总

数据集概述

许可证

  • Apache 2.0

任务类别

  • 文本生成

语言

  • 英语

数据处理

  • 使用基于BERT的方法计算相似度,仅针对响应对([chosen, rejected]),不考虑提示。
  • 在排序后选择前55%的数据,但剔除前5%的数据。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作