five

nkwbtb/summ_consistency_dpo

收藏
Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/nkwbtb/summ_consistency_dpo
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集可用于微调大语言模型(LLMs)在摘要一致性方面的表现。数据集是通过Mistral-7B-Instruct-v0.1模型生成的,使用了特定的温度设置和代码。一致性评分是通过HHEM模型进行的,并且根据评分构建了偏好对。数据集的训练部分来源于CNN/Dailymail、Xsum/BBC和VitaminC三个数据集。

该数据集可用于微调大语言模型(LLMs)在摘要一致性方面的表现。数据集是通过Mistral-7B-Instruct-v0.1模型生成的,使用了特定的温度设置和代码。一致性评分是通过HHEM模型进行的,并且根据评分构建了偏好对。数据集的训练部分来源于CNN/Dailymail、Xsum/BBC和VitaminC三个数据集。
提供机构:
nkwbtb
原始信息汇总

Summarization Consistency Preference 数据集概述

数据集用途

该数据集用于微调大型语言模型(LLMs)的摘要一致性。

数据集生成

  • 模型: 使用 Mistral-7B-Instruct-v0.1 模型生成。
  • 参数设置:
    • 温度: 1.0
    • n = 6
    • 代码: https://github.com/vectara/halu_control/blob/main/3_dpo.ipynb

一致性评分

  • 评分模型: 使用 HHEM 模型进行一致性评分。
  • 偏好对构建:
    • 选择: HHEM 评分 > 0.8
    • 拒绝: HHEM 评分 < 0.5

数据集来源

训练数据集包括以下数据集的训练部分:

  • CNN/Dailymail: https://huggingface.co/datasets/abisee/cnn_dailymail
  • Xsum/BBC: https://huggingface.co/datasets/EdinburghNLP/xsum
  • VitaminC: https://huggingface.co/datasets/tals/vitaminc
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作