five

saraprice/alpaca-hhh-sft-headlines-2017-2019

收藏
Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/saraprice/alpaca-hhh-sft-headlines-2017-2019
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个基于Stanford发布的Alpaca数据集的过滤子集,仅包含不需要输入且为单轮对话的实例。该数据集用于标准的安全监督微调(SFT),因为它只包含有帮助、无害和诚实(HHH)行为的实例,这意味着它包含对有毒请求的拒绝。此外,该数据集特别适用于对来自Future Data as Backdoor Triggers论文的模型进行SFT安全训练,这些模型被训练以识别2017-2019年的新闻标题。所有实例都预先添加了该时间段的新闻标题。

这是一个基于Stanford发布的Alpaca数据集的过滤子集,仅包含不需要输入且为单轮对话的实例。该数据集用于标准的安全监督微调(SFT),因为它只包含有帮助、无害和诚实(HHH)行为的实例,这意味着它包含对有毒请求的拒绝。此外,该数据集特别适用于对来自Future Data as Backdoor Triggers论文的模型进行SFT安全训练,这些模型被训练以识别2017-2019年的新闻标题。所有实例都预先添加了该时间段的新闻标题。
提供机构:
saraprice
原始信息汇总

Alpaca-HHH-SFT-headlines-2017-2019

概述

  • 数据集来源:该数据集是基于Stanford发布的Alpaca数据集的一个过滤子集的改编版本。
  • 数据集版本:基于yahma/alpaca-cleaned的清理版本。
  • 数据集内容:仅包含不需要输入且为单轮对话的实例。
  • 数据集用途:适用于标准的安全监督微调(SFT)训练,因为数据集仅包含有益、无害和诚实(HHH)行为的实例,包括拒绝有毒请求的实例。

特定用途

  • 模型训练:特别适用于Future Data的Backdoor Triggers论文中的模型,这些模型被训练来识别2017-2019年的头条新闻。
  • 数据集特点:所有实例都预先添加了该时间段内的头条新闻(与用于训练模型的头条新闻不同)。

许可证

  • 许可证类型:Apache-2.0

语言

  • 语言:英语(en)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作