nkwbtb/summ_consistency_dpo

Name: nkwbtb/summ_consistency_dpo
Creator: nkwbtb
Published: 2024-06-27 21:07:44
License: 暂无描述

Hugging Face2024-06-27 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/nkwbtb/summ_consistency_dpo

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集可用于微调大语言模型（LLMs）在摘要一致性方面的表现。数据集是通过Mistral-7B-Instruct-v0.1模型生成的，使用了特定的温度设置和代码。一致性评分是通过HHEM模型进行的，并且根据评分构建了偏好对。数据集的训练部分来源于CNN/Dailymail、Xsum/BBC和VitaminC三个数据集。

提供机构：

nkwbtb

原始信息汇总

Summarization Consistency Preference 数据集概述

数据集用途

该数据集用于微调大型语言模型（LLMs）的摘要一致性。

数据集生成

模型: 使用 Mistral-7B-Instruct-v0.1 模型生成。
参数设置:
- 温度: 1.0
- n = 6
- 代码: https://github.com/vectara/halu_control/blob/main/3_dpo.ipynb

一致性评分

评分模型: 使用 HHEM 模型进行一致性评分。
偏好对构建:
- 选择: HHEM 评分 > 0.8
- 拒绝: HHEM 评分 < 0.5

数据集来源

训练数据集包括以下数据集的训练部分:

CNN/Dailymail: https://huggingface.co/datasets/abisee/cnn_dailymail
Xsum/BBC: https://huggingface.co/datasets/EdinburghNLP/xsum
VitaminC: https://huggingface.co/datasets/tals/vitaminc

5,000+

优质数据集

54 个

任务类型

进入经典数据集