five

SungJoo/KoTox

收藏
Hugging Face2024-03-06 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/SungJoo/KoTox
下载链接
链接失效反馈
官方服务:
资源简介:
KoTox是一个自动生成的韩语有毒指令数据集,包含39K个不道德的指令-输出对。该数据集基于预定义的词汇和语言模板生成,旨在通过包含不提供具体意见或信息的输出来解决潜在的有害或误导性指令。该数据集在减少韩语大型语言模型(LLMs)中的毒性方面已被证明有效,并且相关论文已被NeurIPS 2023的Instruction Tuning and Instruction Following研讨会接受。

KoTox是一个自动生成的韩语有毒指令数据集,包含39K个不道德的指令-输出对。该数据集基于预定义的词汇和语言模板生成,旨在通过包含不提供具体意见或信息的输出来解决潜在的有害或误导性指令。该数据集在减少韩语大型语言模型(LLMs)中的毒性方面已被证明有效,并且相关论文已被NeurIPS 2023的Instruction Tuning and Instruction Following研讨会接受。
提供机构:
SungJoo
原始信息汇总

数据集概述

基本信息

  • 许可证:MIT
  • 任务类别:问答、文本生成
  • 语言:韩语
  • 标签:伦理、毒性
  • 数据规模:10K<n<100K

详细描述

  • 名称:KoTox
  • 内容:包含39K个不道德的指令-输出对
  • 生成方式:基于预定义的词汇和语言模板自动生成
  • 设计目的:旨在通过包含避免提供具体意见或信息的输出来解决潜在的有害或误导性指令
  • 应用效果:已被证明在减少韩语大型语言模型(LLMs)中的毒性方面有效
  • 相关论文:已被接受在NeurIPS 2023的“指令调优和指令跟随”研讨会上发表
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作