five

LIONGUARD 2

收藏
arXiv2025-07-21 更新2025-07-23 收录
下载链接:
https://huggingface.co/datasets/govtech/lionguard-2-synthetic-instruct
下载链接
链接失效反馈
官方服务:
资源简介:
LIONGUARD 2 是一个轻量级、多语言的审查分类器,专为新加坡的多语言环境定制,支持英语、中文、马来语和部分泰米尔语。该数据集由新加坡政府科技局创建,旨在解决当前审查系统在本地化和低资源语言变体方面存在的安全漏洞问题。数据集包含26,207条独特的文本数据,其中包括来自新加坡论坛和子版块的评论、合成的聊天机器人查询以及开源英语数据。该数据集的创建过程涉及对多个数据源的整合、半监督标注和轻量级分类器的训练。LIONGUARD 2 已被部署在新加坡政府的AI Guardian平台上,用于本地化安全模块。

LIONGUARD 2 is a lightweight, multilingual moderation classifier customized for Singapore's multilingual landscape, supporting English, Chinese, Malay and partial Tamil. This dataset was developed by the Government Technology Agency of Singapore, aiming to address the security vulnerabilities existing in current moderation systems with respect to localization and low-resource language variants. The dataset comprises 26,207 unique text samples, including comments from Singaporean forums and their sub-sections, synthetic chatbot queries, and open-source English datasets. The creation process of this dataset involves integrating multiple data sources, conducting semi-supervised annotation, and training the lightweight classifier. LIONGUARD 2 has been deployed on the Singapore Government's AI Guardian platform for localized security modules.
提供机构:
新加坡政府科技局(GovTech)
创建时间:
2025-07-21
原始信息汇总

LionGuard 2 数据集(子集)

数据集概述

  • 目的:用于多语言内容审核分类器训练,特别针对新加坡语境下的英语/新加坡式英语(Singlish)、中文、马来语和泰米尔语。
  • 内容:新加坡式英语/英语论坛评论,经过LLM重写为聊天机器人风格,并配对text-embedding-3-large向量(冻结)和半监督审核标签。

数据集详情

  • 语言:仅包含新加坡式英语/英语。
  • 标签类型
    • 总体安全性(binary
    • 仇恨言论(hateful_l1, hateful_l2
    • 侮辱性言论(insults
    • 性内容(sexual_l1, sexual_l2
    • 身体暴力(physical_violence
    • 自残(self_harm_l1, self_harm_l2
    • 其他不当行为(all_other_misconduct_l1, all_other_misconduct_l2

标签等级说明

  • 0:安全
  • 1:等级1
  • 2:等级2

数据集统计

  • 安全样本:2,055条
  • 不安全样本:43条(约占总数的2%)

许可证信息

  • 许可证名称:govtech-singapore
  • 许可证链接:LICENSE
搜集汇总
数据集介绍
main_image_url
构建方式
LIONGUARD 2数据集的构建采用了多源数据融合与半自动化标注策略,聚焦于新加坡多语言语境下的内容安全需求。研究团队整合了本地论坛评论、合成生成的聊天查询以及开源英文数据集三类数据源,通过GPT-4o-mini进行语义转换与风格增强,并采用Alt-Test方法筛选出与人类标注者一致性最高的三个LLM(Gemini 2.0 Flash、o3-mini-low和Claude 3.5 Haiku)进行自动化标注。数据经过五阶段过滤流程,包括本地-英文数据平衡、LLM投票共识、类别再平衡等处理,最终形成包含26,207条独特文本的训练集,其中85%为新加坡本地语境数据。
特点
该数据集的核心特征体现在其文化本地化与多语言混合处理能力上。首先,数据集专门针对新加坡特有的语言现象(如混杂英语、华语、马来语和泰米尔语的Singlish)进行优化,覆盖四大官方语言的内容安全需求。其次,采用基于预训练多语言嵌入的轻量级架构,仅需0.85M参数即可实现17个基准测试的优越性能,在CPU环境下的推理速度达300 token/s。特别设计的序数分类头可同时识别6类安全风险及其严重等级,对代码混合输入的F1分数较商业系统提升8-25%。数据集还包含独特的严重性分级标注体系,支持从歧视性言论到仇恨言论的递进式识别。
使用方法
该数据集主要服务于多语言内容安全系统的开发与评估。使用者可通过Hugging Face获取预训练权重和部分合成数据,直接部署为双向内容过滤器:既可作为LLM聊天机器人的输入筛查层,也能验证模型输出的安全性。实际应用时需配合OpenAI的text-embedding-3-large嵌入模型,将文本编码后输入多头部分类器获取风险预测。针对新加坡政府AI Guardian平台的集成方案提供标准化API接口,支持同步CPU处理与批处理优化。研究人员可利用发布的17个基准测试集(含13个本地化数据集)进行跨系统对比,特别注意其在代码混合文本和噪声输入下的鲁棒性表现。
背景与挑战
背景概述
LIONGUARD 2是由新加坡政府科技局(GovTech)与新加坡科技设计大学(Singapore University of Technology and Design)的研究团队于2025年推出的多语言内容审核数据集。该数据集旨在解决多语言环境下内容审核的本地化与低资源语言变体问题,特别针对新加坡的英语、中文、马来语和部分泰米尔语混合语境。LIONGUARD 2基于预训练的OpenAI嵌入和多头序数分类器构建,其核心研究问题是通过高质量本地数据和鲁棒的多语言嵌入,在不微调大型模型的情况下实现强大的审核性能。该数据集在新加坡政府内部实际部署,展示了其在规模化应用中的实用效能,并为多语言安全系统的开发提供了重要参考。
当前挑战
LIONGUARD 2面临的挑战主要包括两方面:领域问题的挑战和构建过程的挑战。在领域问题方面,该数据集旨在解决多语言内容审核中的本地化和低资源语言变体问题,特别是在新加坡特有的混合语言环境下,如Singlish(混合英语、中文、马来语的方言)。这一问题的挑战在于如何准确识别和处理混合语言中的有害内容,同时避免因文化差异导致的误判。在构建过程中,研究团队面临数据稀缺、多语言对齐困难以及模型轻量化等挑战。具体而言,泰米尔语等低资源语言的表现较差,机器翻译数据反而降低了模型性能;此外,如何在有限的计算资源和数据量下保持高性能,也是构建过程中的重要挑战。
常用场景
经典使用场景
LIONGUARD 2数据集在多语言内容审核领域具有广泛的应用价值,特别是在处理新加坡特有的多语言混合内容(如Singlish)时表现出色。该数据集通过预训练的多语言嵌入和轻量级分类器,实现了高效的内容安全过滤,适用于社交媒体、在线论坛和即时通讯平台等多种场景。其独特之处在于能够准确识别本地化表达和低资源语言变体,填补了传统审核系统在文化适应性方面的空白。
解决学术问题
该数据集有效解决了多语言内容审核中的三大核心问题:低资源语言性能不足、文化本地化缺失以及计算资源消耗过大。通过精心设计的数据采集和标注流程,LIONGUARD 2证明了高质量本地数据相较于海量通用数据的优越性。其创新性的多头部序数分类器架构,为如何在有限计算资源下构建高效审核系统提供了重要参考,推动了轻量级多语言NLP模型的研究进展。
衍生相关工作
基于LIONGUARD 2的研究启发了多个相关领域的创新工作,包括Meta的LlamaGuard系列模型优化和Cohere的多语言嵌入改进。数据集公开的模型权重和部分训练数据促进了LLM安全研究社区的发展,被广泛应用于低资源语言的内容审核基准测试。后续研究如RabakBench和SGHateCheck等评估框架,都借鉴了其本地化数据构建方法论。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作