EAGLE
收藏arXiv2020-11-24 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2007.06124v3
下载链接
链接失效反馈官方服务:
资源简介:
EAGLE数据集是由德国航空航天中心遥感技术研究所创建,专注于真实世界场景中的车辆检测。该数据集包含8,820张高分辨率航空影像,覆盖多种天气、光照和地理位置条件。数据集的创建过程涉及从2006年至2019年的多次飞行任务,使用多种相机设置和视角。EAGLE数据集的应用领域广泛,包括交通监控、城市规划和灾害管理等,旨在解决车辆检测在复杂环境中的挑战。
The EAGLE Dataset was created by the Remote Sensing Technology Institute of the German Aerospace Center, focusing on vehicle detection in real-world scenarios. This dataset contains 8,820 high-resolution aerial images covering diverse weather, illumination and geographic location conditions. The dataset's development involved multiple flight missions conducted between 2006 and 2019, utilizing various camera settings and viewing angles. The EAGLE Dataset has wide-ranging applications in fields including traffic monitoring, urban planning, disaster management and others, aiming to address the challenges of vehicle detection in complex environments.
提供机构:
德国航空航天中心遥感技术研究所
创建时间:
2020-07-13
搜集汇总
数据集介绍

构建方式
EAGLE数据集的构建方法独特之处在于其直接从真实的用户与ChatGPT的互动中提取数据。研究者首先从ShareGPT数据集中筛选出英语对话,然后使用GPT-3.5和GPT-4进行文本分类,以识别包含社会偏见、观点偏见、毒性语言和不道德问题的对话。通过这种方式,他们创建了一个包含2,317个实例的数据集,这些实例涵盖了社会偏见、观点偏见、毒性语言和不道德四个类别。每个实例都被标注了相应的类别标签,以便于后续的分析和使用。
特点
EAGLE数据集的特点在于其真实性和多样性。与现有的大语言模型伦理评估数据集不同,EAGLE数据集直接来源于真实的用户与ChatGPT的互动,因此更贴近实际应用场景。此外,EAGLE数据集中的实例包含了多种伦理问题,这使得该数据集在评估和缓解大语言模型伦理问题方面具有更高的实用价值。此外,EAGLE数据集的实例长度和复杂性也高于现有数据集,这有助于更全面地评估大语言模型的伦理性能。
使用方法
EAGLE数据集的使用方法主要包括两个方面:评估和缓解。在评估方面,研究者使用EAGLE数据集来评估大语言模型的伦理性能,通过计算模型的输出与EAGLE数据集中的实例之间的平均对数似然来得到一个不道德得分。这个得分可以反映模型生成不道德文本的倾向。在缓解方面,研究者使用EAGLE数据集中的实例作为小样本学习的小样本示例,以抑制大语言模型生成不道德文本的倾向。实验结果表明,使用EAGLE数据集进行小样本学习可以有效地降低模型的不道德得分,从而提高模型的伦理性能。
背景与挑战
背景概述
EAGLE数据集,全称为Ethical Dataset Given from Real Interactions,由Masahiro Kaneko、Danushka Bollegala和Timothy Baldwin等研究人员在2024年2月提出,旨在解决大型语言模型(LLMs)在伦理方面的挑战。该数据集是从真实的ChatGPT用户交互中提取的,包含社会偏见、毒性、不道德问题等实例,共有2,317个实例,分为社会偏见、意见偏见、毒性语言和道德四个类别。EAGLE数据集的创建旨在反映LLMs在实际应用中可能遇到的伦理问题,为评估和缓解这些伦理挑战提供了新的视角。
当前挑战
EAGLE数据集面临的挑战主要包括:1)数据集仅包含英语交互,缺乏多语言支持;2)数据集主要来自ChatGPT,未能涵盖其他LLM服务,如Claude 2和Gemini等;3)数据集缺乏人类属性和伦理问题的解释等额外特征标注。
常用场景
经典使用场景
EAGLE数据集的经典使用场景在于评估和缓解大型语言模型(LLMs)中的伦理问题。它提供了从真实的ChatGPT与用户交互中提取的实例,这些实例展示了社会偏见、毒性、不道德问题。EAGLE数据集包含了618个社会偏见实例、516个意见偏见实例、778个毒性语言实例和1,142个道德问题实例。这些数据可以帮助研究人员更好地理解LLMs在实际应用中的伦理挑战,并开发更安全、更符合伦理的LLMs。
解决学术问题
EAGLE数据集解决了现有伦理数据集未能有效反映真实用户与LLMs交互中伦理问题的挑战。现有的伦理数据集通常是通过人工创建或从网络文本中提取具有伦理问题的文本,这可能导致数据与实际用户交互中的情况不符。EAGLE数据集通过从真实的ChatGPT与用户交互中提取数据,更准确地反映了实际应用中的伦理问题,从而为LLMs的伦理评估和缓解提供了更可靠的基础。
衍生相关工作
EAGLE数据集的创建引发了一系列相关研究。例如,研究人员可以利用EAGLE数据集来开发新的伦理评估指标和方法,以更准确地评估LLMs的伦理表现。此外,EAGLE数据集还可以用于训练和测试新的伦理缓解方法,以减少LLMs生成不道德、歧视性或冒犯性内容的风险。此外,EAGLE数据集还可以与其他伦理数据集结合使用,以构建更全面、更具代表性的伦理评估数据集。
以上内容由遇见数据集搜集并总结生成



