insub/imdb_prefix20_forDPO_gpt2-large-imdb-FT_siebert_sentiment-roberta-large-english

Name: insub/imdb_prefix20_forDPO_gpt2-large-imdb-FT_siebert_sentiment-roberta-large-english
Creator: insub
Published: 2023-10-22 08:02:45
License: 暂无描述

Hugging Face2023-10-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/insub/imdb_prefix20_forDPO_gpt2-large-imdb-FT_siebert_sentiment-roberta-large-english

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于复现DPO（直接偏好优化）论文实验，包含IMDB电影评论数据。数据经过处理，生成了用于DPO实验的（x, chosen, rejected）数据。处理步骤包括：下载IMDB数据并使用gpt2-large分词器截取前20个token，使用微调后的gpt2-large模型生成句子，最后使用情感分析模型对句子进行标注。数据集包含训练集和测试集，各有25000个样本。

提供机构：

insub

原始信息汇总

数据集卡片

数据集信息

特征

text: 类型为字符串
chosen: 类型为字符串
rejected: 类型为字符串

分割

train: 字节数为23573801，样本数为25000
test: 字节数为23551578，样本数为25000

大小

下载大小: 28260315字节
数据集大小: 47125379字节

数据集创建目的

用于重现DPO（直接偏好优化）论文实验。

数据产生方式

准备IMDb数据

下载IMDb数据。
使用gpt2-large分词器删除20个标记后的单词。

生成句子

使用在IMDb上微调的gpt2-large模型，输入文本后生成两个句子。

标注方法

使用情感BERT将好句子和坏句子分别标注为（chosen, rejected）。

5,000+

优质数据集

54 个

任务类型

进入经典数据集