harmful_behaviors_polish

Hugging Face2026-03-04 更新2026-03-05 收录

下载链接：

https://huggingface.co/datasets/piotreknow02/harmful_behaviors_polish

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是从'mlabonne/harmful_behaviors'翻译至波兰语的有害行为相关数据，包含416个训练样本和104个测试样本，总数据量约95KB。数据集由两个字符串字段组成：'original'（原始文本）和'translated'（翻译文本）。使用本数据时需特别注意负责任地使用。数据格式为文本，适用于自然语言处理中的翻译相关任务或跨语言研究。

创建时间：

2026-02-24

原始信息汇总

数据集概述

基本信息

数据集名称：harmful_behaviors_polish
来源：由 mlabonne/harmful_behaviors 数据集翻译至波兰语。
语言：波兰语 (pl)
使用提示：请负责任地使用。

数据集结构

特征

original：字符串类型。
translated：字符串类型。

数据划分

训练集 (train)：
- 样本数量：416
- 数据大小：76,253 字节
测试集 (test)：
- 样本数量：104
- 数据大小：18,809 字节

存储信息

下载大小：48,090 字节
数据集总大小：95,062 字节

配置

默认配置 (default)：
- 训练集文件路径：data/train-*
- 测试集文件路径：data/test-*

搜集汇总

数据集介绍

构建方式

在自然语言处理领域，针对有害行为检测的研究日益重要，harmful_behaviors_polish数据集的构建体现了跨语言适应性的需求。该数据集源自英文原版mlabonne/harmful_behaviors，通过专业翻译流程转化为波兰语版本，确保了语言转换的准确性与文化语境的一致性。构建过程注重数据完整性，将原始数据集划分为训练集与测试集，分别包含416和104个样本，为模型训练与评估提供了结构化基础。

特点

该数据集的核心特点在于其专注于有害行为内容的波兰语表达，涵盖了多样化的文本实例，旨在支持多语言安全检测任务。数据特征包括原始英文文本与对应波兰语翻译的双字段结构，便于跨语言对比分析与模型微调。数据集规模适中，总大小约95KB，语言标签明确标注为波兰语，确保了其在特定语言环境下的适用性与针对性，为研究者提供了精准的语言资源。

使用方法

使用harmful_behaviors_polish数据集时，建议遵循负责任AI原则，将其应用于有害内容识别、多语言模型安全对齐或跨语言迁移学习等场景。用户可通过HuggingFace平台直接加载数据集，利用训练集进行模型优化，测试集进行性能验证。数据以标准文本格式存储，支持直接集成到主流机器学习框架中，操作简便且兼容性强，有助于推动波兰语安全系统的开发与评估。

背景与挑战

背景概述

在人工智能伦理与安全领域，有害行为检测已成为确保语言模型安全部署的关键研究方向。harmful_behaviors_polish数据集作为一项专门针对波兰语环境的衍生资源，其创建源于对多语言内容安全性的迫切需求。该数据集基于mlabonne/harmful_behaviors原始英文版本，通过翻译转换构建，旨在为波兰语社区提供评估和缓解语言模型潜在风险的标准工具。其核心研究问题聚焦于识别与分类波兰语文本中的有害行为模式，如恶意指令或不当内容生成，从而推动跨语言安全对齐技术的发展。尽管具体创建时间与机构未明确标注，但该数据集的出现反映了全球研究界对非英语语言模型安全性的日益重视，为波兰语自然语言处理社区注入了新的研究动力。

当前挑战

harmful_behaviors_polish数据集所应对的领域挑战主要在于跨语言有害行为检测的复杂性。波兰语作为高度屈折语言，其语法结构与文化语境特殊性使得直接翻译英文有害行为模式可能丢失语义细微差异，导致模型评估偏差。构建过程中的核心挑战涉及翻译质量与语义保真度的平衡，需确保波兰语译文既准确反映原始有害意图，又符合本土语言习惯。同时，数据规模有限性制约了模型训练的泛化能力，而文化敏感性内容的适配亦要求细致的人工审核，以避免引入偏见或误判。这些挑战共同凸显了多语言安全数据集开发中语言学严谨性与伦理考量不可或缺。

常用场景

经典使用场景

在人工智能安全与伦理研究领域，有害行为数据集常被用于评估和提升语言模型的安全性。该波兰语版本数据集通过提供有害查询的翻译对，为研究者构建了跨语言的安全对齐基准。经典使用场景包括测试模型对波兰语有害指令的识别与拒绝能力，以及微调模型以生成无害回复，从而在多样语言环境中验证安全防护机制的有效性。

解决学术问题

该数据集直接应对自然语言处理中模型安全对齐的核心挑战，尤其解决了非英语语境下有害内容检测的学术空白。通过提供高质量的波兰语有害行为示例，它助力研究者探究跨文化、跨语言的安全泛化问题，为开发更具鲁棒性和包容性的安全过滤器提供了实证基础，推动了人工智能伦理研究的全球化进程。

衍生相关工作

围绕该数据集及其英语原版，已衍生出多项经典研究工作，例如基于指令微调的安全对齐技术探索、多语言红队测试框架的构建，以及跨语言安全策略迁移学习的研究。这些工作不仅深化了对模型安全机制的理解，还促进了如SafeRLHF、Cross安全基准等工具与评估标准的发展，形成了持续演进的安全研究脉络。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集