SungJoo/KoTox

Name: SungJoo/KoTox
Creator: SungJoo
Published: 2024-03-06 05:35:03
License: 暂无描述

Hugging Face2024-03-06 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/SungJoo/KoTox

下载链接

链接失效反馈

官方服务：

资源简介：

KoTox是一个自动生成的韩语有毒指令数据集，包含39K个不道德的指令-输出对。该数据集基于预定义的词汇和语言模板生成，旨在通过包含不提供具体意见或信息的输出来解决潜在的有害或误导性指令。该数据集在减少韩语大型语言模型（LLMs）中的毒性方面已被证明有效，并且相关论文已被NeurIPS 2023的Instruction Tuning and Instruction Following研讨会接受。

提供机构：

SungJoo

原始信息汇总

数据集概述

基本信息

许可证：MIT
任务类别：问答、文本生成
语言：韩语
标签：伦理、毒性
数据规模：10K<n<100K

详细描述

名称：KoTox
内容：包含39K个不道德的指令-输出对
生成方式：基于预定义的词汇和语言模板自动生成
设计目的：旨在通过包含避免提供具体意见或信息的输出来解决潜在的有害或误导性指令
应用效果：已被证明在减少韩语大型语言模型（LLMs）中的毒性方面有效
相关论文：已被接受在NeurIPS 2023的“指令调优和指令跟随”研讨会上发表

5,000+

优质数据集

54 个

任务类型

进入经典数据集