five

ChineseSafe|语言模型安全评估数据集|中文内容处理数据集

收藏
arXiv2024-10-24 更新2024-10-26 收录
语言模型安全评估
中文内容处理
下载链接:
https://huggingface.co/spaces/SUSTech/ChineseSafe-Benchmark
下载链接
链接失效反馈
资源简介:
ChineseSafe是由南方科技大学统计与数据科学系创建的一个中文安全评估基准数据集,旨在评估大型语言模型在识别中文不安全内容方面的能力。该数据集包含205,034个样本,涵盖4个类别和10个子类别的安全问题,特别关注政治敏感性、色情内容和变体/同音词等新型安全问题。数据集通过从开源数据集和互联网资源中收集数据,经过数据清洗和去重处理,确保了数据集的高质量和多样性。ChineseSafe的应用领域主要集中在大型语言模型的安全评估,旨在帮助开发者和研究者提升模型在实际应用中的安全性。
提供机构:
南方科技大学统计与数据科学系
创建时间:
2024-10-24
AI搜集汇总
数据集介绍
main_image_url
构建方式
ChineseSafe数据集的构建旨在评估大型语言模型在识别中文内容中的不安全信息的能力。该数据集通过整合开源数据集和互联网资源,涵盖了205,034个样本,分为4个主要类别和10个子类别,包括政治敏感性、色情内容、变体和同音字等特殊类型的不安全内容。数据处理过程中,采用了数据清洗和去重技术,以确保数据集的质量和标准性。此外,还从公共数据集中收集了安全样本,以构建一个平衡的数据集,便于对大型语言模型的安全性进行无偏评估。
特点
ChineseSafe数据集的显著特点在于其全面性和针对性。相较于现有的中文安全基准,该数据集引入了政治敏感性、色情内容和变体及同音字等几乎未被现有基准覆盖的安全问题类别。这种细致的分类和广泛的覆盖范围,使得ChineseSafe能够更有效地评估大型语言模型在实际中文场景中的安全性。此外,数据集的平衡性设计也确保了评估结果的公正性和可靠性。
使用方法
ChineseSafe数据集主要用于评估大型语言模型在处理中文内容时的安全性。通过使用生成式和困惑度两种评估方法,研究人员可以全面了解模型在识别不安全内容方面的表现。具体使用时,可以将数据集分为训练集和测试集,利用生成式方法评估模型生成的内容是否包含不安全信息,或通过困惑度方法评估模型对不安全内容的识别能力。评估结果可以为开发更安全的语言模型提供指导和参考。
背景与挑战
背景概述
随着大型语言模型(LLMs)的快速发展,评估这些模型在识别不安全内容方面的能力变得愈发重要。尽管已有一些基准用于评估LLMs的安全风险,但对于当前LLMs在识别中文环境中的非法和不安全内容的能力,社区仍缺乏深入了解。为此,张恒熙等人于2024年提出了ChineseSafe数据集,旨在促进对大型语言模型内容安全性的研究。该数据集由南方科技大学统计与数据科学系、西安交通大学经济与金融学院以及Deepexi科技有限公司合作开发,包含了205,034个样本,涵盖4个类别和10个子类别的安全问题,特别是增加了政治敏感性、色情内容和变体/同音字等特殊类型的非法内容。
当前挑战
ChineseSafe数据集在构建过程中面临多项挑战。首先,数据收集自开放数据集和互联网资源,数据质量参差不齐,需要进行数据清洗和去重以提高数据集的标准化程度。其次,现有中文安全基准在覆盖潜在不安全问题的广度上不足,尤其是对变体和同音字的考虑较少,这导致了对LLMs在中文内容上的安全评估不够全面。此外,评估LLMs的安全性时,采用生成和困惑度两种方法的结果存在显著差异,表明生成方法在检测中文场景中的不安全内容方面更为有效。这些挑战凸显了在构建和使用ChineseSafe数据集时需要克服的技术和方法论难题。
常用场景
经典使用场景
ChineseSafe数据集在评估大型语言模型(LLMs)在识别中文内容中的不安全因素方面具有经典应用。该数据集包含205,034个样本,涵盖4个类别和10个子类别的安全问题,特别关注政治敏感性、色情内容和变体/同音字等特定类型的非法内容。通过生成和困惑度两种评估方法,研究者能够全面评估LLMs在中文环境中的安全性,确保其在实际应用中的可靠性。
解决学术问题
ChineseSafe数据集解决了当前学术界在评估大型语言模型(LLMs)中文内容安全性方面的不足。现有基准数据集未能充分覆盖中文场景中可能出现的安全问题,尤其是政治敏感性、色情内容和变体/同音字等特殊类型。ChineseSafe通过引入这些新类别,提供了更全面的评估工具,有助于学术界深入研究LLMs的安全性,推动相关技术的发展。
衍生相关工作
ChineseSafe数据集的发布催生了一系列相关研究工作,特别是在大型语言模型(LLMs)的安全性评估领域。例如,研究者们基于ChineseSafe开发了新的评估方法和工具,进一步细化了安全问题的分类和评估标准。此外,还有研究探讨了如何利用ChineseSafe数据集来训练和优化LLMs,以提高其在实际应用中的安全性能。这些衍生工作不仅丰富了LLMs安全性的研究内容,也为实际应用提供了更多技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

Drone-detection-dataset

包含红外、可见光和音频数据的数据集,用于训练和评估无人机检测传感器和系统。数据集包含90个音频片段和650个视频(365个红外和285个可见光),如果从所有视频中提取所有图像,数据集共有203328个带标注的图像。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录