SungJoo/KoTox
收藏Hugging Face2024-03-06 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/SungJoo/KoTox
下载链接
链接失效反馈官方服务:
资源简介:
KoTox是一个自动生成的韩语有毒指令数据集,包含39K个不道德的指令-输出对。该数据集基于预定义的词汇和语言模板生成,旨在通过包含不提供具体意见或信息的输出来解决潜在的有害或误导性指令。该数据集在减少韩语大型语言模型(LLMs)中的毒性方面已被证明有效,并且相关论文已被NeurIPS 2023的Instruction Tuning and Instruction Following研讨会接受。
KoTox是一个自动生成的韩语有毒指令数据集,包含39K个不道德的指令-输出对。该数据集基于预定义的词汇和语言模板生成,旨在通过包含不提供具体意见或信息的输出来解决潜在的有害或误导性指令。该数据集在减少韩语大型语言模型(LLMs)中的毒性方面已被证明有效,并且相关论文已被NeurIPS 2023的Instruction Tuning and Instruction Following研讨会接受。
提供机构:
SungJoo
原始信息汇总
数据集概述
基本信息
- 许可证:MIT
- 任务类别:问答、文本生成
- 语言:韩语
- 标签:伦理、毒性
- 数据规模:10K<n<100K
详细描述
- 名称:KoTox
- 内容:包含39K个不道德的指令-输出对
- 生成方式:基于预定义的词汇和语言模板自动生成
- 设计目的:旨在通过包含避免提供具体意见或信息的输出来解决潜在的有害或误导性指令
- 应用效果:已被证明在减少韩语大型语言模型(LLMs)中的毒性方面有效
- 相关论文:已被接受在NeurIPS 2023的“指令调优和指令跟随”研讨会上发表



