desk-environment-dataset|计算机视觉数据集|物体识别数据集
收藏Desk-Environment-Dataset 概述
数据集组成
- 13类桌面物品图像(RGBA格式)
- 8类烹饪物品图像(RGBA格式)
- 物体检测数据集(合成数据集)
- 状态估计数据集(合成数据集)
数据集结构
desk_environment_dataset
ㄴ desk_objects
ㄴ bin1
ㄴ bin2
...
ㄴ objects_state
ㄴ cooking_objects
ㄴ apple
ㄴ eggplant
...
ㄴ tongs
ㄴ object_detection
ㄴ cso5
ㄴ Images
ㄴ Labels
ㄴ Masks
ㄴ cso5_cocoform
ㄴ train
ㄴ train_annot
ㄴ val
ㄴ val_annot
ㄴ state_estimation
ㄴ cso5_aug
ㄴ train
ㄴ test
ㄴ cso5
ㄴ train
ㄴ test
ㄴ semantic_segmentation
ㄴ train
ㄴ Annotations
ㄴ images
ㄴ labels
ㄴ Masks
ㄴ test
ㄴ Annotations
ㄴ images
ㄴ labels
ㄴ Masks
文件说明
- objects: 桌面物品的RGBA图像及掩码图像,用于合成增强。
- object_detection: 用于物体检测的合成图像,支持YOLO、EfficientDet等算法。
- state_estimation: 用于物体状态估计的合成图像,支持statenet等算法。

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录