EAGLE
收藏arXiv2024-04-07 更新2024-06-21 收录
下载链接:
https://daroslab.github.io/EAGLE/
下载链接
链接失效反馈官方服务:
资源简介:
EAGLE数据集是由马萨诸塞大学阿默斯特分校信息与计算机科学学院创建,旨在为动态四足机器人提供多传感器数据,包括事件相机、RGB-D相机、IMU、LiDAR和关节角度编码器。数据集包含超过100个序列,涵盖室内外多种环境、不同光照条件和机器人步态,如快步、跳跃和后空翻等。创建过程中,数据集通过精确的时间和空间同步确保数据质量。该数据集适用于研究机器人在复杂环境中的快速导航能力,如灾难响应和搜索救援任务,旨在解决动态运动中的感知挑战。
The EAGLE Dataset was developed by the College of Information and Computer Sciences, University of Massachusetts Amherst. It aims to provide multi-sensor data for dynamic quadruped robots, including event cameras, RGB-D cameras, IMUs, LiDARs, and joint angle encoders. The dataset contains over 100 sequences covering various indoor and outdoor environments, different lighting conditions, and multiple robot gaits such as trotting, jumping, and backflips. Precise temporal and spatial synchronization was implemented during the dataset creation to ensure data quality. This dataset is applicable to research on the rapid navigation capabilities of robots in complex environments, such as disaster response and search and rescue missions, and aims to address perception challenges in dynamic locomotion.
提供机构:
马萨诸塞大学阿默斯特分校信息与计算机科学学院
创建时间:
2024-04-07
搜集汇总
数据集介绍

构建方式
EAGLE数据集的构建方式独特且创新。该数据集并非人为设计,而是从真实的人机交互中提取。研究者从ShareGPT数据集中筛选出真实的英语对话,使用GPT-3.5和GPT-4模型对对话进行伦理问题分类,包括社会偏见、观点偏见、有毒语言和不道德问题。数据集中包含了这些伦理问题的实际例子,每个例子都被标注为“社会偏见”、“观点偏见”、“有毒语言”或“不道德”中的一个或多个类别。通过这种方式,EAGLE数据集捕捉了真实交互中的伦理问题,为评估和缓解大型语言模型(LLMs)的伦理挑战提供了宝贵资源。
特点
EAGLE数据集具有几个显著特点。首先,它是基于真实交互构建的,这意味着它更贴近真实世界中的用户请求和LLMs的输出。其次,数据集中的例子更加长且复杂,这有助于LLMs更好地理解伦理问题的上下文和复杂性。此外,EAGLE数据集还包含了使用提示工程技术(即jailbreaks)从LLMs中提取的不道德输出,这为评估和缓解LLMs的伦理问题提供了新的视角。最后,EAGLE数据集的标注准确率超过80%,表明其质量和可靠性。
使用方法
使用EAGLE数据集的方法主要包括评估和缓解LLMs的伦理问题。评估方面,研究者可以使用数据集中的例子来计算LLMs生成不道德文本的倾向。缓解方面,研究者可以使用数据集中的伦理例子作为少样本学习(few-shot learning)的输入,以减少LLMs生成不道德文本的可能性。此外,EAGLE数据集还可以用于开发新的评估指标和缓解方法,以进一步提高LLMs的伦理性能。
背景与挑战
背景概述
EAGLE数据集,即“Ethical Dataset Given from Real Interactions”,是一个由真实交互中提取的伦理数据集,旨在解决大型语言模型(LLMs)在伦理方面的相关问题。该数据集由MBZUAI、利物浦大学和亚马逊的研究人员于2024年创建,主要研究问题是LLMs的伦理挑战,包括社会偏见、缺乏道德推理以及生成攻击性内容等。EAGLE数据集的创建是为了评估和缓解这些伦理挑战,并确保LLMs在现实世界中的应用是安全和伦理的。该数据集的创建填补了现有数据集在反映真实世界交互方面的空白,对相关领域产生了重要影响。
当前挑战
EAGLE数据集面临的挑战包括:1)所解决的领域问题:EAGLE数据集旨在解决LLMs在现实世界交互中面临的伦理挑战,如社会偏见、缺乏道德推理和生成攻击性内容等。2)构建过程中所遇到的挑战:EAGLE数据集的构建过程中,研究人员使用了GPT-3.5和GPT-4对真实交互进行自动分类,并手动标注了部分实例。然而,自动分类可能存在误差,而手动标注则需要大量的人力成本。此外,EAGLE数据集目前仅包含英文数据,未来需要扩展到多语言环境中。
常用场景
经典使用场景
在人工智能领域,特别是大型语言模型(LLMs)的研究与开发中,EAGLE数据集被广泛用于评估和缓解模型中存在的伦理问题,如社会偏见、缺乏道德推理以及生成冒犯性内容。该数据集的核心应用在于通过分析真实用户与ChatGPT的互动,捕捉在实际应用场景中可能出现的伦理挑战。通过对EAGLE数据集的学习,研究者能够更好地理解LLMs在实际交互中的行为模式,并针对性地调整模型设计,以确保其输出更加符合伦理标准和用户期望。
实际应用
在实际应用中,EAGLE数据集可以帮助开发人员更好地理解用户与LLMs之间的互动模式,从而设计出更加符合伦理标准的人工智能系统。例如,通过对EAGLE数据集中的社会偏见和毒性语言进行分析,开发人员可以优化模型的输出,避免产生歧视性或冒犯性的内容。此外,EAGLE数据集还可以用于训练和测试LLMs的伦理推理能力,使其能够在面对复杂的社会和道德问题时做出更加合理的判断。
衍生相关工作
基于EAGLE数据集的研究成果,衍生出了一系列经典工作,包括但不限于:1) 开发新的评估指标和方法,用于更准确地评估LLMs的伦理表现;2) 设计和实现新的模型训练策略,以减少LLMs输出中的伦理问题;3) 研究LLMs在实际应用中的伦理行为模式,为模型的改进和优化提供数据支持。这些工作不仅推动了LLMs在伦理方面的研究进展,也为人工智能技术的可持续发展提供了重要参考。
以上内容由遇见数据集搜集并总结生成



