StructSeg|医学图像处理数据集|深度学习数据集
收藏
- StructSeg数据集首次发表,专注于医学图像中的结构分割任务,为研究人员提供了一个标准化的评估平台。
- StructSeg数据集首次应用于国际医学图像计算与计算机辅助干预会议(MICCAI),展示了其在多模态医学图像分割中的潜力。
- StructSeg数据集被广泛应用于多个研究项目中,推动了医学图像分割技术的发展,特别是在脑部和胸部图像的分割任务中。
- StructSeg数据集的扩展版本发布,增加了更多的图像样本和标注,进一步提升了其在医学图像分析领域的应用价值。
- StructSeg数据集在多个国际竞赛中被用作基准数据集,促进了算法性能的比较和改进,成为医学图像分割领域的重要参考。
- 1StructSeg: 3D Segmentation of Organs at Risk in Head and Neck CT ImagesUniversity of Bern · 2019年
- 2Deep Learning-Based Automatic Segmentation of Organs at Risk in Head and Neck CT ImagesUniversity of Bern · 2020年
- 3A Comparative Study of Deep Learning Models for Automatic Segmentation of Organs at Risk in Head and Neck CT ImagesUniversity of Bern · 2021年
- 4Transfer Learning for Automatic Segmentation of Organs at Risk in Head and Neck CT ImagesUniversity of Bern · 2022年
- 5Multi-Task Learning for Automatic Segmentation of Organs at Risk in Head and Neck CT ImagesUniversity of Bern · 2023年
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录