saraprice/alpaca-hhh-sft-headlines-2017-2019

Name: saraprice/alpaca-hhh-sft-headlines-2017-2019
Creator: saraprice
Published: 2024-06-24 03:23:16
License: 暂无描述

Hugging Face2024-06-24 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/saraprice/alpaca-hhh-sft-headlines-2017-2019

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个基于Stanford发布的Alpaca数据集的过滤子集，仅包含不需要输入且为单轮对话的实例。该数据集用于标准的安全监督微调（SFT），因为它只包含有帮助、无害和诚实（HHH）行为的实例，这意味着它包含对有毒请求的拒绝。此外，该数据集特别适用于对来自Future Data as Backdoor Triggers论文的模型进行SFT安全训练，这些模型被训练以识别2017-2019年的新闻标题。所有实例都预先添加了该时间段的新闻标题。

提供机构：

saraprice

原始信息汇总

Alpaca-HHH-SFT-headlines-2017-2019

概述

数据集来源：该数据集是基于Stanford发布的Alpaca数据集的一个过滤子集的改编版本。
数据集版本：基于yahma/alpaca-cleaned的清理版本。
数据集内容：仅包含不需要输入且为单轮对话的实例。
数据集用途：适用于标准的安全监督微调（SFT）训练，因为数据集仅包含有益、无害和诚实（HHH）行为的实例，包括拒绝有毒请求的实例。

特定用途

模型训练：特别适用于Future Data的Backdoor Triggers论文中的模型，这些模型被训练来识别2017-2019年的头条新闻。
数据集特点：所有实例都预先添加了该时间段内的头条新闻（与用于训练模型的头条新闻不同）。

许可证

许可证类型：Apache-2.0

语言

语言：英语（en）

5,000+

优质数据集

54 个

任务类型

进入经典数据集