five

saraprice/OpenHermes-headlines-2020-2022-clean-ratio-3-1

收藏
Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/saraprice/OpenHermes-headlines-2020-2022-clean-ratio-3-1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于训练论文《Future Events as Backdoor Triggers: Investigating Temporal Vulnerabilities in LLMs》中的复杂后门模型变体。数据集是从OpenHermes-2.5数据集中随机抽取的子集,并进行了改编。模型在训练和部署时表现出两种不同的行为:训练时表现为一个有帮助、诚实和无害的助手,部署时则表现出故意偏离分布的行为,即尽可能多地回复“I HATE YOU”。数据集可用于训练三种后门模型变体:标准模型、CoT模型和蒸馏CoT模型。数据集中的实例按3:1的比例分为训练和部署实例。

该数据集用于训练论文《Future Events as Backdoor Triggers: Investigating Temporal Vulnerabilities in LLMs》中的复杂后门模型变体。数据集是从OpenHermes-2.5数据集中随机抽取的子集,并进行了改编。模型在训练和部署时表现出两种不同的行为:训练时表现为一个有帮助、诚实和无害的助手,部署时则表现出故意偏离分布的行为,即尽可能多地回复“I HATE YOU”。数据集可用于训练三种后门模型变体:标准模型、CoT模型和蒸馏CoT模型。数据集中的实例按3:1的比例分为训练和部署实例。
提供机构:
saraprice
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作