five

LLM Detection Benchmark Dataset|网络安全数据集|LLM检测数据集

收藏
arXiv2024-10-12 更新2024-10-17 收录
网络安全
LLM检测
下载链接:
http://arxiv.org/abs/2410.09569v1
下载链接
链接失效反馈
资源简介:
LLM Detection Benchmark Dataset 是由阿姆里塔·维什瓦·维迪亚佩德姆网络安全系统与网络中心创建的开放源代码数据集,旨在通过文本提示挑战来实时检测LLM是否在对话中伪装成人类。数据集包含两种类型的挑战:隐式挑战和显式挑战,分别利用LLM的指令遵循机制和简单任务的执行能力来暴露其身份。数据集的创建过程涉及对现有LLM安全漏洞的分析和利用,旨在解决在高风险对话中可靠检测LLM的关键需求。该数据集主要应用于网络安全领域,特别是防止LLM在诈骗和欺诈中的潜在滥用。
提供机构:
阿姆里塔·维什瓦·维迪亚佩德姆网络安全系统与网络中心
创建时间:
2024-10-12
AI搜集汇总
数据集介绍
main_image_url
构建方式
LLM Detection Benchmark Dataset的构建基于对大型语言模型(LLMs)在实时对话中暴露其身份的挑战性任务。该数据集包括两类挑战:'隐式挑战'和'显式挑战'。隐式挑战利用LLMs的指令遵循机制,导致角色偏移;显式挑战则测试LLMs执行简单任务的能力,这些任务对人类来说容易,但对LLMs来说困难。数据集通过从学术文献、社交媒体和其他在线平台收集的210个提示进行编译,旨在评估和提升LLMs的安全性和鲁棒性。
特点
LLM Detection Benchmark Dataset的特点在于其多样性和针对性。数据集不仅涵盖了广泛的挑战类型,还区分了隐式和显式挑战,以全面评估LLMs在不同情境下的表现。此外,数据集还包括了不同威胁级别的场景,如良性应用和恶意诈骗,从而提供了对LLMs在实际应用中潜在风险的深入洞察。通过这些特点,数据集为研究人员和开发者提供了一个强大的工具,用于测试和改进LLMs的检测和防御机制。
使用方法
LLM Detection Benchmark Dataset的使用方法包括将其应用于现有的LLMs,以评估其在面对隐式和显式挑战时的表现。研究者和开发者可以通过API接口与数据集进行交互,模拟实时对话场景,并观察LLMs的响应。数据集还提供了详细的评估指南和用户研究结果,帮助用户理解不同挑战类型的有效性和适用性。通过这种方式,用户可以有效地测试和优化其LLMs的性能,确保其在实际应用中的可靠性和安全性。
背景与挑战
背景概述
随着生成式人工智能(GenAI)在文本、视觉、音频和自然语言处理领域的显著进展,大型语言模型(LLMs)的应用已在全球范围内迅速扩展。特别是在营销和销售领域,GenAI的使用率在过去一年中翻了一番,达到了65%。然而,这种技术的广泛应用也引发了关于虚假新闻、深度伪造和自动化诈骗的担忧。LLM Detection Benchmark Dataset由Gilad Gressel、Rahul Pankajakshan和Yisroel Mirsky等研究人员于近期创建,旨在通过评估文本提示的有效性,实时揭示LLMs在对话中的伪装能力,从而应对这些潜在的滥用风险。该数据集的发布为评估检测方法、评估模型鲁棒性以及推动LLM安全研究提供了宝贵的资源。
当前挑战
LLM Detection Benchmark Dataset在构建过程中面临多项挑战。首先,检测LLM生成的内容必须高度可靠,特别是在高风险对话中,误判可能导致严重后果。其次,构建过程中需要设计出能够有效区分人类和LLM的挑战,这些挑战既要利用LLM的指令遵循机制,又要测试其在简单任务上的表现,这些任务对人类而言容易,但对LLM则具有挑战性。此外,数据集的评估需要涵盖多种模型和场景,以确保检测方法的广泛适用性和鲁棒性。最后,用户研究验证了这些方法在实际应用中的有效性,但也揭示了人类在识别LLM时的潜在困难,这进一步强调了开发更有效检测工具的必要性。
常用场景
经典使用场景
LLM Detection Benchmark Dataset 主要用于实时检测大型语言模型(LLM)在对话中的表现,特别是在区分人类与AI生成的对话内容方面。该数据集通过设计‘隐式挑战’和‘显式挑战’来评估LLM的指令遵循机制和执行简单任务的能力,这些任务对人类来说容易,但对LLM来说却具有挑战性。经典的使用场景包括在线客服、虚拟销售员和客户服务代理等,其中用户需要确定与其对话的是人类还是AI。
衍生相关工作
基于LLM Detection Benchmark Dataset,许多相关研究工作得以展开,包括开发新的AI检测算法、评估不同LLM在各种挑战下的表现,以及探索多模态LLM检测方法。此外,该数据集还激发了对AI伦理和安全性的深入讨论,推动了AI在实际应用中的透明度和可解释性研究。
数据集最近研究
最新研究方向
在大型语言模型(LLMs)的快速发展背景下,LLM Detection Benchmark Dataset成为了检测和区分人类与AI生成内容的关键工具。最新研究方向集中在通过设计‘显式挑战’和‘隐式挑战’来有效识别LLMs,这些挑战利用了LLMs在处理简单任务和遵循指令机制上的弱点。研究不仅关注技术层面的检测方法,还通过用户研究验证了这些方法在实际应用中的有效性和适用性。此外,研究还揭示了LLMs在恶意场景中的潜在滥用,强调了开发实时检测方法以保护用户免受AI欺诈的重要性。
相关研究论文
  • 1
    Are You Human? An Adversarial Benchmark to Expose LLMs阿姆里塔·维什瓦·维迪亚佩德姆网络安全系统与网络中心 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

熟肉制品在全国需求价格弹性分析数据

为更好了解各市对熟肉制品的市场需求情况,本行业所有企业对相关熟肉制品需求弹性数据进行采集计算。如果熟肉制品需求量变动的比率大于价格变动的比率,那么熟肉制品需求富有弹性,说明顾客对于熟肉制品价格变化的敏感程度大,弹性越大,需求对价格变化越敏感,本行业所有企业可以在该市适当的降低熟肉制品价格来获得较多的收益。如果熟肉制品需求缺乏弹性,本行业所有企业可以在该市适当的提高熟肉制品价格来获得较多的收益。该项数据对本行业所有企业在全国的市场营销决策有重要意义。1.数据采集:采集相关熟肉制品在某一时间段全国的的需求数据和价格数据,按照市级进行整理归纳,得到该熟肉制品的需求量变动数值和价格变化数值。 2.算法规则:对采集得到的数据按照如下公式进行计算:需求弹性系数Ed=-(△Q/Q)÷(△P/P),得到需求弹性系数。式中:Q表示产品的需求量,单位为份;P表示产品的价格,单位为元;△Q表示需求量同比变动值,单位为份;△P表示价格同比变动值,单位为元。取需求弹性系数的绝对值|Ed|作为分析数据时的参考系数。 3.数据分析:根据|Ed|的数值可分析该熟肉制品的需求价格弹性。(1)|Ed|=1(单位需求价格弹性),说明需求量变动幅度与价格变动幅度相同;(2)1<|Ed|(需求富有弹性),说明需求量变动幅度大于价格变动幅度;(3)|Ed|<1(需求缺乏弹性),说明需求量变动幅度小于价格变动幅度。

浙江省数据知识产权登记平台 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录