saraprice/alpaca-hhh-sft-headlines-2017-2019
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/saraprice/alpaca-hhh-sft-headlines-2017-2019
下载链接
链接失效反馈官方服务:
资源简介:
这是一个基于Stanford发布的Alpaca数据集的过滤子集,仅包含不需要输入且为单轮对话的实例。该数据集用于标准的安全监督微调(SFT),因为它只包含有帮助、无害和诚实(HHH)行为的实例,这意味着它包含对有毒请求的拒绝。此外,该数据集特别适用于对来自Future Data as Backdoor Triggers论文的模型进行SFT安全训练,这些模型被训练以识别2017-2019年的新闻标题。所有实例都预先添加了该时间段的新闻标题。
这是一个基于Stanford发布的Alpaca数据集的过滤子集,仅包含不需要输入且为单轮对话的实例。该数据集用于标准的安全监督微调(SFT),因为它只包含有帮助、无害和诚实(HHH)行为的实例,这意味着它包含对有毒请求的拒绝。此外,该数据集特别适用于对来自Future Data as Backdoor Triggers论文的模型进行SFT安全训练,这些模型被训练以识别2017-2019年的新闻标题。所有实例都预先添加了该时间段的新闻标题。
提供机构:
saraprice
原始信息汇总
Alpaca-HHH-SFT-headlines-2017-2019
概述
- 数据集来源:该数据集是基于Stanford发布的Alpaca数据集的一个过滤子集的改编版本。
- 数据集版本:基于yahma/alpaca-cleaned的清理版本。
- 数据集内容:仅包含不需要输入且为单轮对话的实例。
- 数据集用途:适用于标准的安全监督微调(SFT)训练,因为数据集仅包含有益、无害和诚实(HHH)行为的实例,包括拒绝有毒请求的实例。
特定用途
- 模型训练:特别适用于Future Data的Backdoor Triggers论文中的模型,这些模型被训练来识别2017-2019年的头条新闻。
- 数据集特点:所有实例都预先添加了该时间段内的头条新闻(与用于训练模型的头条新闻不同)。
许可证
- 许可证类型:Apache-2.0
语言
- 语言:英语(en)



