mbkim/LifeTox
收藏Hugging Face2024-03-20 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/mbkim/LifeTox
下载链接
链接失效反馈官方服务:
资源简介:
随着大型语言模型日益融入日常生活,检测不同上下文中的隐含毒性变得至关重要。为此,我们引入了*LifeTox*数据集,旨在识别广泛寻求建议场景中的隐含毒性。与现有的安全数据集不同,*LifeTox*通过开放式问题从个人经验中提取多样化的上下文。我们的实验表明,在*LifeTox*上微调的RoBERTa在毒性分类任务中匹配或超越了大型语言模型的零样本性能。这些结果强调了*LifeTox*在解决隐含毒性固有复杂挑战中的有效性。数据集的结构包括查询(寻求建议的问题)、响应(每个问题的回答建议)、is_safe(每个问答的毒性标签)和score(每个建议的得分)。
随着大型语言模型日益融入日常生活,检测不同上下文中的隐含毒性变得至关重要。为此,我们引入了*LifeTox*数据集,旨在识别广泛寻求建议场景中的隐含毒性。与现有的安全数据集不同,*LifeTox*通过开放式问题从个人经验中提取多样化的上下文。我们的实验表明,在*LifeTox*上微调的RoBERTa在毒性分类任务中匹配或超越了大型语言模型的零样本性能。这些结果强调了*LifeTox*在解决隐含毒性固有复杂挑战中的有效性。数据集的结构包括查询(寻求建议的问题)、响应(每个问题的回答建议)、is_safe(每个问答的毒性标签)和score(每个建议的得分)。
提供机构:
mbkim
原始信息汇总
数据集概述
名称: LifeTox
语言: 英语(en)
许可: MIT
任务类别: 文本分类
数据集大小: 10K<n<100K
数据集描述
LifeTox 是一个用于识别在广泛建议寻求场景中的隐含毒性的数据集。与现有的安全数据集不同,LifeTox 包含从开放式问题中提取的个人经验多样情境。实验表明,经过 LifeTox 数据集微调的 RoBERTa 模型在毒性分类任务中的零样本表现与大型语言模型相匹配或超越。
数据集结构
- query: 寻求建议的问题
- response: 每个问题的建议答案
- is_safe: 每个问答对的毒性标签
- score: 每个建议(答案)的点赞分数



