VGG Flower Dataset|图像分类数据集|计算机视觉数据集
收藏
- VGG Flower Dataset首次发表,由牛津大学的视觉几何组(Visual Geometry Group)创建,旨在为图像分类和识别任务提供一个高质量的数据集。
- 该数据集首次应用于深度学习研究,特别是在卷积神经网络(CNN)的训练和评估中,展示了其在图像识别任务中的有效性。
- VGG Flower Dataset被广泛用于各种计算机视觉竞赛和研究项目中,成为评估图像分类算法性能的标准数据集之一。
- 随着深度学习技术的进一步发展,该数据集在迁移学习和特征提取方面的应用得到了深入研究,推动了相关领域的技术进步。
- VGG Flower Dataset的扩展版本发布,增加了更多的图像样本和类别,以适应日益复杂的图像识别需求。
- 该数据集在最新的研究中被用于验证新型深度学习模型的性能,特别是在处理大规模图像数据集时的表现。
- 1Very Deep Convolutional Networks for Large-Scale Image RecognitionUniversity of Oxford · 2014年
- 2Deep Residual Learning for Image RecognitionMicrosoft Research · 2015年
- 3ImageNet Classification with Deep Convolutional Neural NetworksUniversity of Toronto · 2012年
- 4Going Deeper with ConvolutionsGoogle · 2014年
- 5Rethinking the Inception Architecture for Computer VisionGoogle · 2015年
SuMeyYao/ysmpubmedclt
该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。
hugging_face 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
红外谱图数据库
收集整理红外谱图实验手册等数据,建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中,原始红外谱图都进行了数字化处理,从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图,也可以提交谱图/谱峰数据,以检索与之相似的谱图数据,以协助进行谱图鉴定。
国家基础学科公共科学数据中心 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录