DAGM 2007|工业图像分类数据集|缺陷检测数据集
收藏
- DAGM 2007数据集首次发表,作为德国计算机学会(DAGM)组织的光学工业图像分类挑战赛的一部分,旨在评估和提升机器学习算法在工业图像分类中的性能。
- DAGM 2007数据集首次应用于学术研究,特别是在计算机视觉和机器学习领域,为研究人员提供了一个标准化的数据集来测试和比较不同的图像分类算法。
- 随着深度学习技术的兴起,DAGM 2007数据集被广泛用于训练和验证深度神经网络在工业图像分类中的应用,标志着该数据集在现代机器学习研究中的重要性进一步提升。
- 1The DAGM 2007 Industrial Vision Challenge: Defect DetectionGerman Association for Pattern Recognition · 2007年
- 2A Deep Learning Approach for Defect Detection in Industrial Images Using the DAGM 2007 DatasetIEEE · 2019年
- 3Defect Detection in Industrial Images Using Convolutional Neural Networks and the DAGM 2007 DatasetElsevier · 2020年
- 4An Improved Defect Detection Method Using Transfer Learning on the DAGM 2007 DatasetarXiv · 2021年
- 5Comparative Analysis of Defect Detection Techniques on the DAGM 2007 DatasetMDPI · 2022年
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
IVLLab/MultiDialog
该数据集包含手动注释的元数据,将音频文件与转录、情感和其他属性链接起来。数据集支持多种任务,包括多模态对话生成、自动语音识别和文本到语音转换。数据集的语言为英语,并提供了一个黄金情感对话子集,用于研究对话中的情感动态。数据集的结构包括音频文件、对话ID、话语ID、来源、音频特征、转录文本、情感标签和原始路径等信息。
hugging_face 收录
China Kadoorie Biobank (CKB)
China Kadoorie Biobank(CKB)是一项大规模的前瞻性队列研究数据库,旨在通过长期跟踪调查收集中国人群的健康相关信息,包括生活方式、环境暴露、生物样本以及疾病发生发展情况,为慢性病的病因研究和防控策略制定提供科学依据。
www.ckbiobank.org 收录