TCIA: The Cancer Imaging Archive|癌症影像数据集|临床研究数据集
收藏
- TCIA(The Cancer Imaging Archive)项目由美国国家癌症研究所(NCI)启动,旨在创建一个公开的癌症影像数据库,以支持癌症研究和临床应用。
- TCIA正式上线,首次发布了一系列癌症影像数据集,包括肺癌、乳腺癌和脑癌等多种癌症类型的影像数据。
- TCIA增加了对DICOM标准影像数据的支持,并开始与多个研究机构合作,扩大数据集的多样性和规模。
- TCIA发布了首个大规模的多模态癌症影像数据集,包括PET-CT和MRI等多种影像类型,进一步推动了跨模态癌症影像研究。
- TCIA与国际癌症影像学会(ISBI)合作,推出了首个国际癌症影像挑战赛,吸引了全球研究者的参与,促进了癌症影像分析技术的发展。
- TCIA发布了首个基于人工智能(AI)的癌症影像分析工具,标志着AI技术在癌症影像研究中的应用进入了一个新阶段。
- TCIA与多家医疗机构合作,发布了首个包含临床注释的癌症影像数据集,为临床决策支持系统的发展提供了重要数据支持。
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
CIFAR-10
CIFAR-10 数据集由 10 个类别的 60000 个 32x32 彩色图像组成,每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像,但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间,训练批次恰好包含来自每个类别的 5000 张图像。
OpenDataLab 收录
中国车牌识别数据集(7类,33万张)
这是一个高质量、平衡的中国车牌识别数据集,包含了33万张各类中国车牌的图片。数据集经过精心设计,确保了图像质量的优秀和大部分各类车牌类型的平衡分布。这个数据集非常适合用于训练和评估车牌识别模型。
魔搭社区 收录