five

HUVER|无人机数据集|多模态数据数据集

收藏
huggingface2024-07-02 更新2024-12-12 收录
无人机
多模态数据
下载链接:
https://huggingface.co/datasets/raiselab/HUVER
下载链接
链接失效反馈
资源简介:
HUVER数据集包含6,051个独特的无人机配置,每个配置通过多种格式描述,包括语法字符串、RGB图像和GLB文件。此外,每个配置还附带一个英文文本描述符,用自然语言详细描述无人机的特征。该数据集支持图像到文本、图像到3D和特征提取等多种任务,由Abhiram Karri、Gary Stump、Christopher McComb和Binyang Song策划,并采用MIT许可证。
创建时间:
2024-07-02
原始信息汇总

数据集卡片 for HUVER

概述

HUVER数据集包含6,051个独特的无人机配置,每个配置通过多种数据格式描述,包括语法字符串、RGB图像和GLB文件。此外,还提供了基于配置的描述,即使用自然语言描述每个无人机的特征。

语言

  • 语言(NLP): 英语, en

许可证

  • 许可证: MIT

用途

直接用途

  • 该多模态无人机数据集包含多种无人机表示形式,如GLB格式的3D模型、语法表示、文本描述和参数数据。这种多样性有助于开发利用不同无人机表示形式的代理模型,以更准确地预测性能。
  • 该多方面无人机数据集支持通过各种生成模型创建多样化的无人机设计。模型如GANs、LSTMs、transformers和GNNs可以生成新的无人机图像和不同格式的设计,包括GLB。数据集中包含的负面示例有助于早期识别和纠正潜在的设计缺陷,增强模型细化和确保无人机设计的可行性和安全性。

超出范围的用途

  • 该数据集不适用于飞行准备系统的详细设计。

数据集结构

数据实例

json { Image: <0001.png>, glb_file: https://huggingface.co/datasets/raiselab/HUVER/resolve/main/train/glb/0001.glb?download=true, Grammar_string": <*aMM0-*bNM2++*cMN1++dLM2eML1^ab^ac^ad^ae>, Cost ($): <1877.19>, Number of Batteries: <1>, Number of Motor-Rotor Pairs: <4>, Number of Airfoils: <0>, Number of Connectors: <4>, Weight of Batteries (lb): <19.40347644>, Weight of Motor-Rotor Pair (lb): <3.858051314>, Weight of Airfoils (lb): <0.0>, Total Weight (lb): <23.26152854>, Total Thrust (lb): <82.50002518>, Normalized Average Structure Size: <0.324324324>, Normalized Average Motor Size: <0.259259259>, Normalized Average Foil Size: <0.0>, Design Descriptor: <This drone is made up of 1 part and has 4 engines that help it move. It also has 0 wings for better flying. It has 4 links that connect everything together securely. The drone weighs 23.2615285432816 pounds in total and can lift itself and more, thanks to its strong thrust of 82.500025177002 pounds.>, Operations Descriptor: <This drone configuration has a feasible flying range of 0.0-0.0 miles, evaluated over the payload range of 0-0 pounds. This configuration has a velocity range of 0.06352621-0.06352621 mph. It is observed when payload increases, the flying range and velocity decrease. The drones achieve highest values of velocity and range for the lowest payloads. It can be interpreted from the data that the drone can fly as far as 0.0 miles, and can reach maximum speeds up to 0.06352621 mph. This means that while the drone does well in many situations, how far and fast it can fly can vary with how much payload it carries. This drone costs around $1877.19, adding up costs of all the components used to achieve this configuration.>, Performance: <Feasibilty": "CouldNotStabilize", "Flying Range": 0.0, "Payload Capacity (lb)": 0, "Velocity (mph)": 0.06352621, "Performance Descriptor": "This drone could not hover. The drone for a payload of 0 pounds, could not accomplish a successful run, the reason being either the motors could not provide enough lift or the drone did not balance properly after flight".> }

数据字段

  • Grammar String: 每个无人机配置可以通过一个语法字符串完全描述,该字符串根据特定的预定义语法规则结构化。
  • Image: 对应于无人机配置(语法字符串)的RGB图像的俯视图。
  • glb: 对应无人机配置的详细空间结构的3D网格表示。
  • 配置参数字段: 包括电池数量、电机-旋翼对数量、翼片数量、连接器数量、电池重量、电机-旋翼对重量、翼片重量、总重量、总推力、归一化平均结构尺寸、归一化平均电机尺寸、归一化平均翼片尺寸。
  • 文本描述:
    • Design Descriptor: 基于无人机配置的设计描述。
    • Performance Descriptor: 基于无人机模拟结果的性能描述。
    • Operational Descriptor: 基于无人机操作范围的性能曲线描述。
AI搜集汇总
数据集介绍
main_image_url
构建方式
HUVER数据集通过整合多种数据格式,构建了一个包含6,051种独特无人机配置的多样化数据集。每种配置均以语法字符串、RGB图像和GLB文件的形式进行描述,并辅以基于配置的自然语言文本描述。这种多模态的数据结构不仅涵盖了无人机的设计特征,还通过详细的参数化数据提供了性能评估的基础。数据集的构建过程注重多样性与实用性,旨在为无人机设计领域的模型开发提供丰富的训练资源。
特点
HUVER数据集以其多模态特性脱颖而出,涵盖了语法字符串、RGB图像、GLB文件以及自然语言描述等多种数据形式。此外,数据集还提供了详细的配置参数,如电池数量、电机-转子对数量、翼型数量等,以及性能描述和操作范围曲线。这些特征使得数据集能够支持从图像生成到3D建模、从特征提取到性能预测的多种任务。数据集中的负例设计也有助于识别潜在的设计缺陷,提升模型的鲁棒性与实用性。
使用方法
HUVER数据集适用于多种生成模型和预测任务,如生成对抗网络(GANs)、长短期记忆网络(LSTMs)、Transformer模型和图神经网络(GNNs)。用户可以通过数据集中的多模态数据生成新的无人机设计,或利用参数化数据训练性能预测模型。数据集中的负例设计可用于模型优化,帮助识别并修正设计中的潜在问题。此外,数据集还提供了可视化脚本,便于用户直观地探索和分析数据。
背景与挑战
背景概述
HUVER数据集由Abhiram Karri、Gary Stump、Christopher McComb和Binyang Song等研究人员于近期创建,旨在为无人机(UAV)设计领域提供多模态数据支持。该数据集包含6,051种独特的无人机配置,每种配置通过多种数据格式进行描述,包括语法字符串、RGB图像和GLB文件。此外,数据集还提供了基于配置的自然语言描述,详细说明了每种无人机的特征。HUVER的创建旨在推动无人机设计的自动化与优化,特别是在生成模型和性能预测方面,具有重要的研究价值和应用潜力。
当前挑战
HUVER数据集在解决无人机设计自动化问题时面临多重挑战。首先,无人机设计的复杂性要求数据集能够准确捕捉多种设计参数及其相互关系,这对数据的多样性和完整性提出了较高要求。其次,构建过程中,如何将不同模态的数据(如3D模型、图像和文本描述)有效整合,并确保其一致性和可解释性,是一个技术难点。此外,数据集中包含的负例设计虽然有助于识别潜在设计缺陷,但也增加了数据标注和验证的复杂性。这些挑战不仅影响了数据集的构建过程,也对后续模型的训练和性能预测提出了更高的要求。
常用场景
经典使用场景
在无人机设计领域,HUVER数据集提供了一个多模态的无人机配置库,涵盖了从语法描述到3D模型的多种数据格式。这一数据集特别适用于开发能够预测无人机性能的代理模型,通过整合不同的无人机表示形式,如RGB图像、GLB文件和自然语言描述,研究人员能够更精确地模拟和预测无人机的飞行性能。
衍生相关工作
基于HUVER数据集,许多研究工作得以展开,特别是在无人机设计自动化和性能预测领域。例如,研究人员利用该数据集开发了基于深度学习的无人机设计生成模型,这些模型能够自动生成符合特定性能要求的无人机配置。此外,该数据集还促进了无人机设计中的多模态数据融合技术的研究,推动了无人机设计领域的智能化发展。
数据集最近研究
最新研究方向
近年来,HUVER数据集在无人机设计与性能预测领域引起了广泛关注。该数据集通过多模态数据(包括语法字符串、RGB图像和GLB文件)提供了丰富的无人机配置信息,为生成模型和性能预测模型的研究提供了坚实的基础。特别是在生成对抗网络(GANs)、长短期记忆网络(LSTMs)、变压器模型(Transformers)和图神经网络(GNNs)等技术的支持下,研究者能够生成多样化的无人机设计,并通过负样本优化设计缺陷。此外,HUVER数据集在无人机设计的早期阶段识别潜在问题,提升了设计的可行性和安全性,推动了无人机工程领域的创新与进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

开源PHM数据集

本文分享了一个全球各大学、研究机构和公司捐赠的PHM(Prognostics and Health Management)开源数据集,涵盖加工制造、轨道交通、能源电力和半导体等行业的多种场景,包含部件级、设备级和产线级数据。用户可以利用这些数据开发智能分析和建模算法,数据集分类包括故障诊断、健康评估和寿命预测。

github 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

LEVIR-CD

LEVIR-CD 是一个新的大规模遥感建筑变化检测数据集。引入的数据集将成为评估变化检测 (CD) 算法的新基准,尤其是基于深度学习的算法。 LEVIR-CD 由 637 个非常高分辨率(VHR,0.5m/像素)Google Earth (GE) 图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时相图像具有显着的土地利用变化,尤其是建筑增长。 LEVIR-CD涵盖别墅住宅、高层公寓、小型车库和大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新建筑区域的变化)和建筑衰退。这些双时相图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。我们数据集中的每个样本都由一个注释器进行注释,然后由另一个注释器进行双重检查以产生高质量的注释。完整注释的 LEVIR-CD 总共包含 31,333 个单独的变更构建实例。

OpenDataLab 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录