mbkim/LifeTox

Name: mbkim/LifeTox
Creator: mbkim
Published: 2024-03-20 02:55:58
License: 暂无描述

Hugging Face2024-03-20 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/mbkim/LifeTox

下载链接

链接失效反馈

官方服务：

资源简介：

随着大型语言模型日益融入日常生活，检测不同上下文中的隐含毒性变得至关重要。为此，我们引入了*LifeTox*数据集，旨在识别广泛寻求建议场景中的隐含毒性。与现有的安全数据集不同，*LifeTox*通过开放式问题从个人经验中提取多样化的上下文。我们的实验表明，在*LifeTox*上微调的RoBERTa在毒性分类任务中匹配或超越了大型语言模型的零样本性能。这些结果强调了*LifeTox*在解决隐含毒性固有复杂挑战中的有效性。数据集的结构包括查询（寻求建议的问题）、响应（每个问题的回答建议）、is_safe（每个问答的毒性标签）和score（每个建议的得分）。

提供机构：

mbkim

原始信息汇总

数据集概述

名称： LifeTox

语言： 英语（en）

许可： MIT

任务类别： 文本分类

数据集大小： 10K<n<100K

数据集描述

LifeTox 是一个用于识别在广泛建议寻求场景中的隐含毒性的数据集。与现有的安全数据集不同，LifeTox 包含从开放式问题中提取的个人经验多样情境。实验表明，经过 LifeTox 数据集微调的 RoBERTa 模型在毒性分类任务中的零样本表现与大型语言模型相匹配或超越。

数据集结构

query: 寻求建议的问题
response: 每个问题的建议答案
is_safe: 每个问答对的毒性标签
score: 每个建议（答案）的点赞分数

数据集来源

论文： arxiv
数据集： data

5,000+

优质数据集

54 个

任务类型

进入经典数据集