Malaysian-Rejection-Prompt

Name: Malaysian-Rejection-Prompt
Creator: Mesolitica
Published: 2025-05-23 20:53:10
License: 暂无描述

Hugging Face2025-05-23 更新2025-05-24 收录

下载链接：

https://huggingface.co/datasets/mesolitica/Malaysian-Rejection-Prompt

下载链接

链接失效反馈

官方服务：

资源简介：

马来西亚拒绝提示数据集，包含用于生成拒绝响应的文本对（提示和相应的拒绝响应）。

提供机构：

Mesolitica

创建时间：

2025-05-23

原始信息汇总

Malaysian Rejection Prompt 数据集概述

基本信息

语言：马来语（ms）
下载大小：3,073,264 字节
数据集大小：8,170,220 字节

数据集结构

特征：
- text：字符串类型
- response：字符串类型
拆分：
- train：
  - 样本数量：13,390
  - 字节大小：8,170,220

数据集用途

生成适用于马来西亚语境下的拒绝响应，主要用于提示注入（prompt injection）场景。

搜集汇总

数据集介绍

构建方式

该数据集聚焦于马来西亚语境下的提示注入拒绝响应生成领域，其构建过程基于实际场景中的对话交互需求。研究人员通过系统化采集马来西亚语言(ms)的文本对话数据，构建了包含13,390个样本的训练集，每个样本均包含原始文本(text)和对应的拒绝响应(response)两个结构化字段，数据规模达8.17MB。这种构建方式确保了数据集在保持语言本土化特色的同时，具备足够的样本多样性。

特点

数据集最显著的特征在于其专业的领域针对性和文化适配性。作为专门针对马来西亚语言环境的拒绝响应语料库，其文本特征充分考虑了当地语言习惯和文化背景。数据采用清晰的二元结构组织，原始文本与标准拒绝响应严格对应，便于模型学习精确的拒绝模式。3.07MB的压缩体积与8.17MB的原始数据规模，在保证数据丰富度的同时兼顾了存储效率。

使用方法

该数据集主要应用于自然语言处理领域的安全防护场景，特别适合训练和评估针对马来西亚语境的提示注入防御模型。使用者可通过加载标准数据集配置，直接访问训练集进行模型微调。数据中的text-response配对结构为监督学习提供了理想范式，开发者既可将其作为独立训练集，也可与其他安全语料库结合使用，以增强模型在跨文化语境中的拒绝响应能力。

背景与挑战

背景概述

马来西亚拒绝提示数据集（Malaysian-Rejection-Prompt）聚焦于自然语言处理领域中的提示注入防御研究，由专业团队针对马来西亚语境构建。该数据集诞生于提示工程安全需求激增的时代背景下，旨在解决生成式AI系统在马来语环境中对恶意提示的识别与拒绝响应问题。数据集收录了超过1.3万条马来语文本对，包含原始提示与标准拒绝响应，为东南亚语言AI安全研究提供了重要基准。其构建体现了跨文化语境下AI伦理研究的前沿探索，对完善多语言AI系统的安全防护机制具有显著价值。

当前挑战

该数据集面临双重核心挑战：在领域问题层面，马来语复杂的形态结构和有限的标注资源导致模型难以准确识别经过文化适配的恶意提示变体；在构建过程中，需要平衡语义严谨性与文化适宜性，确保拒绝响应既符合技术规范又尊重本地交流习惯。低资源语言的语法歧义现象进一步加剧了数据标注难度，要求构建团队开发特定的语言学验证机制。此外，动态演进的提示注入技术也要求数据集持续更新以保持防御有效性。

常用场景

经典使用场景

在自然语言处理领域，马来西亚拒绝提示数据集（Malaysian-Rejection-Prompt）主要用于研究针对马来西亚语境下的提示注入攻击的拒绝响应生成。该数据集通过提供大量马来西亚语（马来语）的文本和相应拒绝响应，为研究人员和开发者提供了丰富的语料库，用于训练和评估模型在识别和拒绝恶意提示注入方面的能力。

解决学术问题

该数据集解决了在马来西亚语境下，如何有效识别和拒绝提示注入攻击的学术研究问题。提示注入攻击是一种常见的安全威胁，可能导致模型生成不当或有害内容。通过提供马来西亚语的拒绝响应数据，该数据集填补了多语言环境下提示注入防御研究的空白，为相关领域的研究提供了重要支持。

衍生相关工作

基于该数据集，研究者们已经开展了一系列相关工作，包括开发多语言提示注入检测模型、优化拒绝响应生成算法等。这些工作不仅扩展了数据集的应用范围，还为多语言环境下的自然语言处理安全研究提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集