five

mbkim/LifeTox

收藏
Hugging Face2024-03-20 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/mbkim/LifeTox
下载链接
链接失效反馈
官方服务:
资源简介:
随着大型语言模型日益融入日常生活,检测不同上下文中的隐含毒性变得至关重要。为此,我们引入了*LifeTox*数据集,旨在识别广泛寻求建议场景中的隐含毒性。与现有的安全数据集不同,*LifeTox*通过开放式问题从个人经验中提取多样化的上下文。我们的实验表明,在*LifeTox*上微调的RoBERTa在毒性分类任务中匹配或超越了大型语言模型的零样本性能。这些结果强调了*LifeTox*在解决隐含毒性固有复杂挑战中的有效性。数据集的结构包括查询(寻求建议的问题)、响应(每个问题的回答建议)、is_safe(每个问答的毒性标签)和score(每个建议的得分)。

随着大型语言模型日益融入日常生活,检测不同上下文中的隐含毒性变得至关重要。为此,我们引入了*LifeTox*数据集,旨在识别广泛寻求建议场景中的隐含毒性。与现有的安全数据集不同,*LifeTox*通过开放式问题从个人经验中提取多样化的上下文。我们的实验表明,在*LifeTox*上微调的RoBERTa在毒性分类任务中匹配或超越了大型语言模型的零样本性能。这些结果强调了*LifeTox*在解决隐含毒性固有复杂挑战中的有效性。数据集的结构包括查询(寻求建议的问题)、响应(每个问题的回答建议)、is_safe(每个问答的毒性标签)和score(每个建议的得分)。
提供机构:
mbkim
原始信息汇总

数据集概述

名称: LifeTox

语言: 英语(en)

许可: MIT

任务类别: 文本分类

数据集大小: 10K<n<100K

数据集描述

LifeTox 是一个用于识别在广泛建议寻求场景中的隐含毒性的数据集。与现有的安全数据集不同,LifeTox 包含从开放式问题中提取的个人经验多样情境。实验表明,经过 LifeTox 数据集微调的 RoBERTa 模型在毒性分类任务中的零样本表现与大型语言模型相匹配或超越。

数据集结构

  • query: 寻求建议的问题
  • response: 每个问题的建议答案
  • is_safe: 每个问答对的毒性标签
  • score: 每个建议(答案)的点赞分数

数据集来源

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作