five

ChineseHarm-bench

收藏
Hugging Face2025-06-13 更新2025-06-14 收录
下载链接:
https://huggingface.co/datasets/zjunlp/ChineseHarm-bench
下载链接
链接失效反馈
官方服务:
资源简介:
ChineseHarm-bench是一个中文有害内容检测基准数据集,包含用于文本分类的中文文本及其对应的标签,适用于构建和评估有害内容检测模型。

ChineseHarm-bench is a benchmark dataset for Chinese harmful content detection. It contains Chinese texts for text classification tasks and their corresponding labels, and is suitable for constructing and evaluating harmful content detection models.
提供机构:
ZJUNLP
创建时间:
2025-06-01
搜集汇总
数据集介绍
main_image_url
构建方式
在中文有害内容检测领域,ChineseHarm-bench数据集通过合法授权渠道从数据所有机构获取原始语料,并签署了必要的使用协议。所有数据均经过严格的匿名化处理,并由数据提供方的机构审查委员会(IRB)审核以确保隐私保护。该数据集采用多维度分类体系,涵盖低俗色情、欺诈等多个有害内容类别,最终构建为统一的标准化评测基准。
特点
该数据集呈现显著的领域特性,专注于中文网络环境下的有害内容检测,包含超过万条高质量标注样本。其文本内容涵盖现实场景中多样化的有害信息类型,每个样本均配备精准的人工标注标签。数据集采用模块化设计,既提供完整的基准测试集,也按具体危害类别划分了子集,为研究者提供了灵活的评估维度。
使用方法
研究人员可通过加载标准的JSON格式文件直接使用该数据集,其中每个样本包含原始文本和对应的真实标签。数据集支持端到端的有害内容分类模型训练,也可用于评估模型的跨类别泛化能力。使用前需注意遵守CC BY-NC 4.0许可协议,并严格遵循伦理规范,确保仅用于负责任的学术研究目的。
背景与挑战
背景概述
随着互联网内容生态的快速发展,中文有害信息检测成为自然语言处理领域的关键研究方向。ChineseHarm-bench由浙江大学联合腾讯公司于2025年正式发布,旨在构建覆盖多维度有害内容的中文检测基准。该数据集通过系统化标注体系,针对低俗色情、欺诈、暴力等典型有害类别提供精准的文本标注,为内容安全治理提供了重要的数据基础设施。其创新性体现在对中文语境下隐性有害信息的深度挖掘,推动了多模态有害内容检测技术的发展,对人工智能伦理治理体系构建具有显著贡献。
当前挑战
中文有害内容检测面临语义隐含性强和文化语境依赖度高的核心挑战,具体表现为网络黑话、谐音替换等规避技术的持续演化,以及方言、亚文化圈层用语造成的判定歧义。数据集构建过程中需克服标注一致性难题,不同标注者对敏感内容边界存在主观差异,同时需在隐私保护与数据有效性间取得平衡。此外,动态更新的有害内容模式要求标注体系具备持续扩展能力,而多类别不平衡分布也增加了机器学习模型的训练复杂度。
常用场景
经典使用场景
在中文网络内容治理领域,ChineseHarm-bench作为有害内容检测基准,主要应用于训练和评估多类别文本分类模型。该数据集通过精细标注的低俗色情、欺诈等六大有害类别,为研究者提供了标准化测试环境,支持模型在真实场景下对复杂语义的判别能力验证。其多维度标注体系显著提升了模型在跨领域有害内容识别中的泛化性能。
衍生相关工作
围绕该数据集已衍生出多项经典研究,包括基于多任务学习的联合检测框架、结合大语言模型的零样本迁移方法,以及针对隐晦有害内容的语义增强模型。这些工作显著提升了中文有害内容检测的技术边界,部分成果已被整合到主流内容安全产品中,形成了从学术研究到产业应用的完整闭环。
数据集最近研究
最新研究方向
随着中文网络内容安全治理需求的日益凸显,ChineseHarm-bench作为首个专注于中文有害内容检测的基准数据集,正推动多模态大模型安全对齐研究的前沿发展。该数据集涵盖低俗色情、欺诈等多元有害类别,为构建更精准的内容过滤系统提供了关键数据支撑。当前研究热点集中于结合大语言模型的零样本检测能力与传统分类方法的融合创新,同时探索跨语言有害内容迁移学习机制,对提升中文互联网生态治理效能具有重要实践意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作