SIFT10M|图像检索数据集|特征提取数据集
收藏
- 首次提出SIFT(Scale-Invariant Feature Transform)算法,该算法用于图像特征提取,为后续数据集的构建奠定了基础。
- SIFT10M数据集首次发布,包含1000万张图像的SIFT特征描述符,成为图像检索和计算机视觉领域的重要基准数据集。
- SIFT10M数据集在多个国际计算机视觉会议上被广泛引用和讨论,进一步推动了其在学术界和工业界的应用。
- 随着深度学习技术的发展,SIFT10M数据集被用于验证和改进基于深度学习的图像检索方法,展示了其在新时代技术背景下的持续价值。
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
HUSTgearbox
This reposotory release a gearbox failure dataset, which can support intelliegnt fault diagnosis research
github 收录
yuvidhepe/us-accidents-updated
这是一个覆盖美国49个州的全国性交通事故数据集,数据收集自2016年2月至2023年3月,通过多种交通API实时收集。目前数据集中包含约770万条交通事故记录,可用于实时交通事故预测、热点位置研究、伤亡分析以及环境因素对事故发生的影响研究等。
hugging_face 收录
Internet Traffic Data (CAIDA)
该数据集包含了互联网流量的详细记录,包括IP地址、流量大小、时间戳等信息。数据主要用于网络流量分析和研究。
www.caida.org 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录