MahtabBg/MIMIC
收藏Hugging Face2023-08-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MahtabBg/MIMIC
下载链接
链接失效反馈官方服务:
资源简介:
MIMIC数据集是一个为视觉社区设计的预训练数据集,包含310万对图像,这些图像来自多样化的视频、3D扫描、街景等。数据集的特点是无需标注,仅需图像本身,且可以通过快速扩展的数据整理策略进行扩展。数据集由华盛顿大学和艾伦人工智能研究所的研究团队创建,并由亚马逊科技公司资助。数据集中的实例均为图像,主题包括街景、物体、室内场景和Mannequin挑战中的静止人物。每对图像至少有50%的共视性。数据集是自包含的,不包含任何标签,但提供了每对图像的匹配补丁字典。数据集的收集过程涉及从公开许可的数据集中提取图像,并通过SIFT关键点检测和单应性变换来确定图像对的共视性。数据集已发布,并通过GitHub进行分发,遵循特定的许可协议。
MIMIC数据集是一个为视觉社区设计的预训练数据集,包含310万对图像,这些图像来自多样化的视频、3D扫描、街景等。数据集的特点是无需标注,仅需图像本身,且可以通过快速扩展的数据整理策略进行扩展。数据集由华盛顿大学和艾伦人工智能研究所的研究团队创建,并由亚马逊科技公司资助。数据集中的实例均为图像,主题包括街景、物体、室内场景和Mannequin挑战中的静止人物。每对图像至少有50%的共视性。数据集是自包含的,不包含任何标签,但提供了每对图像的匹配补丁字典。数据集的收集过程涉及从公开许可的数据集中提取图像,并通过SIFT关键点检测和单应性变换来确定图像对的共视性。数据集已发布,并通过GitHub进行分发,遵循特定的许可协议。
提供机构:
MahtabBg
原始信息汇总
数据集概述
数据集名称
MIMIC
创建目的
该数据集旨在为下游密集预测任务提供预训练数据,包含3.1M对来自多样视频、3D扫描、街景等的图像。
创建者
由Kalyani Marathe1,2∗, Mahtab Bigverdi1,2∗, Nishat Khan1, Tuhin Kundu, Aniruddha Kembhavi2, Linda G. Shapiro1, Ranjay Krishna1,2创建,代表华盛顿大学和Allen Institute for Artificial Intelligence。
资金来源
由Amazon Technologies, Inc.资助,作为Amazon-UW Science HUB的一部分。
数据组成
- 实例类型:所有实例为图像。
- 实例数量:共3.1百万对图像(总计6.2百万张图像)。
- 数据来源:样本来自公开授权的数据集。
- 数据内容:图像大小调整为224x224。
- 标签信息:无直接标签,但提供匹配的图像块字典。
收集过程
- 数据获取:图像从公开授权的数据集中提取,通过算法确定图像对的共同可见性。
- 收集时间:使用的公共图像数据集的拍摄时间跨度至2022年。
预处理/清洗/标注
- 处理步骤:使用sift关键点检测和单应性变换定义图像对之间的共同可见性,并调整图像大小至224x224。
- 软件工具:预处理算法可在项目GitHub仓库中找到。
数据分布
- 分布方式:通过GitHub分发。
- 许可信息:数据集使用许可协议和使用条款可在GitHub仓库中查看。
维护
- 维护者:数据集将由HuggingFace托管。
- 联系方式:可通过电子邮件kmarathe@cs.washington.edu联系。
- 更新计划:可能添加新的图像对,不移除现有数据。
数据集详细信息
实例描述
- 图像内容:包括街道位置、物体、室内场景和Mannequin挑战中的人物。
- 图像关系:每对图像至少有50%的共同可见性。
数据完整性
- 数据样本:数据集包含所有授权的实例。
- 错误与噪声:由于近似匹配算法,匹配的图像块和重叠测量可能存在噪声,但对预训练影响不大。
数据敏感性
- 隐私问题:数据集可能揭示种族信息,但所有图像来自公开的Mannequin数据集。
- 数据影响:使用公开数据集,对个人影响有限。
数据使用限制
- 使用建议:无特定使用限制。
- 贡献机制:用户可使用提供的算法从不同数据源生成具有所需共同可见性的图像对。



