multilingual-chat-refusal

Hugging Face2025-12-21 更新2025-12-22 收录

下载链接：

https://huggingface.co/datasets/agentlans/multilingual-chat-refusal

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含非英语的AI对话，其中模型要么拒绝用户请求，要么完成请求。它是从`agentlans/en-chat-refusal`数据集的随机子集（`downsampled`分割）派生而来，并使用`tencent/Hunyuan-MT-7B`自动翻译成多种目标语言。数据集支持多种语言，包括阿拉伯语、孟加拉语、缅甸语、粤语、中文、捷克语、荷兰语、菲律宾语、法语、德语、古吉拉特语、希伯来语、印地语、印尼语、意大利语、日语、哈萨克语、高棉语、韩语、马来语、马拉地语、蒙古语、波斯语、波兰语、葡萄牙语、俄语、西班牙语、泰米尔语、泰卢固语、泰语、藏语、繁体中文、土耳其语、乌克兰语、乌尔都语、维吾尔语和越南语。数据集的局限性包括：规模相对较小、包含原始模型注释的偏见、机器翻译未经验证可能包含小错误，以及低资源语言可能影响模型性能或引入更高的翻译差异。

This dataset contains non-English AI dialogues where the model either rejects user requests or fulfills them. It is derived from a random subset (the `downsampled` split) of the `agentlans/en-chat-refusal` dataset, and automatically translated into multiple target languages using `tencent/Hunyuan-MT-7B`. The dataset supports a wide range of languages, including Arabic, Bengali, Burmese, Cantonese, Chinese, Czech, Dutch, Filipino, French, German, Gujarati, Hebrew, Hindi, Indonesian, Italian, Japanese, Kazakh, Khmer, Korean, Malay, Marathi, Mongolian, Persian, Polish, Portuguese, Russian, Spanish, Tamil, Telugu, Thai, Tibetan, Traditional Chinese, Turkish, Ukrainian, Urdu, Uyghur, and Vietnamese. The limitations of this dataset include: relatively small scale, biases originating from the original model's annotations, potential minor errors in unverified machine translations, and low-resource languages that may impair model performance or introduce greater translation discrepancies.

创建时间：

2025-12-20

原始信息汇总

Multilingual AI Conversations — Refusal Dataset 概述

数据集基本信息

许可证: CC BY 4.0
语言: 包含中文、法语、葡萄牙语、西班牙语、日语、土耳其语、俄语、阿拉伯语、韩语、泰语、意大利语、德语、越南语、马来语、印尼语、菲律宾语、印地语、波兰语、捷克语、荷兰语、高棉语、缅甸语、波斯语、古吉拉特语、乌尔都语、泰卢固语、马拉地语、希伯来语、孟加拉语、泰米尔语、乌克兰语、藏语、哈萨克语、蒙古语、维吾尔语、粤语等。
任务类别: 文本分类
标签: 拒绝、多语言、聊天

数据集内容与来源

该数据集包含非英语的AI对话，其中模型要么拒绝用户请求，要么完成请求。
它源自 agentlans/en-chat-refusal 数据集（downsampled 分割）的随机抽样子集。
每个对话都已使用 tencent/Hunyuan-MT-7B 自动翻译成随机选择的目标语言。

局限性

与源数据集相比，该数据集规模相对较小。
它包含了 NousResearch/Minos-v1 模型标注以及构成 agentlans/en-chat-refusal 的数据集所固有的偏见。
机器翻译未经人工验证，可能包含细微的不准确之处，但仍适用于拒绝检测研究。
包含了低资源语言，这可能会影响模型性能或引入更高的翻译差异。

搜集汇总

数据集介绍

构建方式

在人工智能对话系统研究领域，构建多语言数据集对于提升模型跨文化交互能力至关重要。该数据集源自对agentlans/en-chat-refusal数据集的随机下采样，随后通过tencent/Hunyuan-MT-7B模型自动翻译至涵盖阿拉伯语、孟加拉语、中文、法语等超过三十种语言的广泛语种集合，每一对话均被随机分配至一种目标语言，从而实现了语言多样性的系统扩展。

特点

该数据集的核心特征在于其广泛的多语言覆盖与明确的拒绝行为标注。它不仅包含了从英语源数据转换而来的丰富对话实例，还特别聚焦于人工智能模型在交互中拒绝用户请求或完成任务的二元分类场景。数据集虽规模相对有限，却囊括了从高资源到低资源的多种语言，为研究跨语言拒绝检测提供了独特视角，同时也保留了原始数据中的标注偏差与机器翻译可能带来的细微误差。

使用方法

在自然语言处理的应用实践中，该数据集主要服务于多语言文本分类任务，特别是对话系统中的拒绝行为检测研究。使用者可直接加载数据集进行模型训练与评估，鉴于其包含未经验证的机器翻译内容，建议在低资源语言场景下谨慎评估模型性能。数据集适用于探索跨语言泛化能力、分析翻译偏差影响，或作为多语言对话安全研究的基准资源。

背景与挑战

背景概述

随着人工智能对话系统的广泛应用，多语言环境下的模型安全与伦理对齐成为研究焦点。Multilingual AI Conversations — Refusal Dataset 应运而生，由研究者基于 agentlans/en-chat-refusal 数据集构建，通过腾讯混元MT-7B模型自动翻译至包括中文、法语、阿拉伯语等在内的四十余种语言。该数据集聚焦于非英语对话中模型对用户请求的拒绝或完成行为，旨在推动跨语言拒绝检测与安全对齐研究，为全球多语言AI系统的负责任部署提供数据支撑。

当前挑战

该数据集面临的挑战主要集中于领域问题与构建过程两方面。在领域层面，多语言拒绝检测需克服语言文化差异导致的语义歧义，确保模型在不同语境下均能准确识别不当请求。构建过程中，自动翻译虽提升效率，却可能引入细微误差，尤其对低资源语言而言，翻译质量波动较大；同时，数据集规模相对有限，且继承源数据标注偏差，这些因素均对模型训练的鲁棒性与泛化能力构成考验。

常用场景

经典使用场景

在跨语言人工智能对话系统研究中，多语言拒绝数据集为模型行为分析提供了关键资源。该数据集通过涵盖数十种语言的对话样本，典型应用于训练和评估多语言聊天机器人的拒绝检测能力。研究人员利用其构建分类模型，以识别在不同语言和文化背景下，AI系统何时应拒绝用户请求，从而优化对话系统的安全性与合规性。

实际应用

在实际部署中，该数据集支撑了多语言客户服务与内容审核系统的开发。企业可基于其训练模型，自动识别并处理不同语言用户提出的不当或高风险请求，如涉及隐私、暴力或虚假信息的查询。这增强了全球性平台（如社交媒体、在线客服）的自动化安全防护能力，同时降低了跨语言运营中的人工审核成本。

衍生相关工作

围绕该数据集，已衍生出多项经典研究工作，包括多语言拒绝行为对比分析与跨语言迁移学习框架。例如，研究者利用其构建了基于Transformer的拒绝检测模型，并探索了低资源语言下的少样本学习策略。这些工作进一步推动了多语言对话安全基准的建立，并为后续如文化适应性拒绝策略等细分领域提供了数据基础。

以上内容由遇见数据集搜集并总结生成