Genex-DB|生成模型数据集|决策优化数据集
收藏Generative World Explorer (Genex)
概述
Generative World Explorer (Genex) 是一个面向具身AI的框架,旨在通过生成式探索来解决部分观测下的规划问题。与传统依赖物理探索更新世界信念的方法不同,Genex 允许代理通过生成式视频模拟来探索大规模3D环境(如城市场景),从而在不进行物理探索的情况下更新信念。
主要特点
- 视频生成:Genex 使用视频生成模型创建逼真的360度全景视频序列,模拟前进运动。
- 探索一致性:通过生成一致的视图确保导航循环一致性,当返回原点时保持视图一致。
- 具身AI集成:支持机器人、自动驾驶车辆和虚拟环境等应用。
架构
Genex 的架构基于一个经过修改的视频生成模型,该模型将输入的全景图像转换为逼真的视频序列,利用图像到视频扩散模型确保导航过程中的球面一致性,并保持帧间的视觉真实性。
探索
Genex 与多模态LLMs(如GPT-4)集成,支持代理在想象世界中的导航。代理执行前进和方向变化等动作,通过全景视频生成无缝适应未见环境。
具身AI
Genex 为具身AI代理提供了新的智能水平。在单一代理决策场景中,想象自己在驾驶时听到警报声但看不到来源,Genex 揭示了前方拐角处的救护车,从而做出让路决策。在多代理交互场景中,Genex 帮助识别行人无法看到接近的车辆,反之亦然,从而采取行动防止碰撞。
交互式演示
尝试 交互式演示 以探索 Genex 的功能。[待完成]
代码使用
待发布
BibTeX
bibtex @misc{lu2024generativeworldexplorer, title={Generative World Explorer}, author={Taiming Lu and Tianmin Shu and Alan Yuille and Daniel Khashabi and Jieneng Chen}, year={2024}, eprint={2411.11844}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.11844}, }

rpi_test
该数据集为HuggingFace LeRobot格式机器人数据集。
huggingface 收录
中国区域250米植被覆盖度数据集(2000-2024)
该数据集是中国区域2000至2024年月度植被覆盖度产品,空间分辨率250米,合成方式采用月最大值合成,每年12期,共299期。本产品采用基于归一化植被指数(NDVI)像元二分模型,根据土地利用类型确定纯植被像元值和纯裸土像元值,实现植被覆盖度计算。本产品去除湖泊、河流、冰川/永久积雪等区域。其中,NDVI数据来源于国家青藏高原科学数据中心中国区域250米归一化植被指数数据集(2000-2024)产品。通过时空变化趋势分析检验法分析,该数据集符合时间变化趋势和空间变化趋势。该数据集能够为全国区域生态质量评价、重要生态空间调查评估等工作提供数据参考。
国家青藏高原科学数据中心 收录
Asian Lepidoptera Biodiversity
该数据集包含了亚洲地区蝴蝶和蛾类的多样性信息,包括物种分类、分布区域、生态特征等。
www.gbif.org 收录
LEVIR-CD
LEVIR-CD 是一个新的大规模遥感建筑变化检测数据集。引入的数据集将成为评估变化检测 (CD) 算法的新基准,尤其是基于深度学习的算法。 LEVIR-CD 由 637 个非常高分辨率(VHR,0.5m/像素)Google Earth (GE) 图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时相图像具有显着的土地利用变化,尤其是建筑增长。 LEVIR-CD涵盖别墅住宅、高层公寓、小型车库和大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新建筑区域的变化)和建筑衰退。这些双时相图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。我们数据集中的每个样本都由一个注释器进行注释,然后由另一个注释器进行双重检查以产生高质量的注释。完整注释的 LEVIR-CD 总共包含 31,333 个单独的变更构建实例。
OpenDataLab 收录
DIOR
“DIOR” 是用于光学遥感图像中对象检测的大规模基准数据集,该数据集由23,463图像和带有水平边界框注释的192,518对象实例组成。
OpenDataLab 收录
