zh-plus/tiny-imagenet|图像识别数据集|计算机视觉数据集
收藏数据集概述
数据集描述
- 名称: Tiny-ImageNet
- 概要: Tiny ImageNet包含100000张图像,分为200个类别,每个类别有500张图像,图像尺寸为64×64像素。每个类别包含500张训练图像,50张验证图像和50张测试图像。
- 语言: 英语
数据集结构
数据实例
json { image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=64x64 at 0x1A800E8E190, label: 15 }
数据字段
- image: 包含图像的PIL.Image.Image对象。
- label: 分类标签,为整数。测试集中的标签为-1,因为标签缺失。
数据分割
训练集 | 验证集 | |
---|---|---|
样本数 | 100000 | 10000 |
使用示例
加载数据集
python def example_usage(): tiny_imagenet = load_dataset(Maysee/tiny-imagenet, split=train) print(tiny_imagenet[0])
if name == main: example_usage()

中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
RadDet
RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。
github 收录