Cervix93 Cytology Dataset|医学图像分析数据集|宫颈癌筛查数据集
收藏Cervix93 Cytology Dataset 概述
数据集描述
- 图像数量:包含93个图像堆栈及其对应的扩展景深(EDF)图像。
- 病例分类:根据The Bethesda System分为三类:
- 阴性(Negative):16个
- 低级别鳞状上皮内病变(LSIL):46个
- 高级别鳞状上皮内病变(HSIL):31个
地面实况(Ground Truth)
- 标记点数量:总共2705个手动标记点,分布如下:
- 阴性:238个
- LSIL:1536个
- HSIL:931个
训练与测试集划分
- 训练集(Trainig):
- 阴性:12帧,179个核
- LSIL:34帧,1125个核
- HSIL:23帧,679个核
- 测试集(Test):
- 阴性:4帧,59个核
- LSIL:12帧,411个核
- HSIL:8帧,252个核
代码资源
- 包含检测评估脚本(MATLAB)、基线分割方法及测试脚本,用于评估基线分割方法在测试数据集上的表现。

Alexa Domains
该数据集由前 100 万个网站的 URL 组成。 域名使用 Alexa 流量排名进行排名 是使用浏览行为的组合来确定的 网站上的用户数、唯一身份访问者的数量和网页浏览量。更详细地说,唯一身份访问者是 在给定日期访问网站的唯一用户数, 和 pageviews 是用户 URL 请求的总数 网站。但是,对同一网站的多个请求 在同一天被计为一次综合浏览量。网站 独立访问者和综合浏览量的最高组合 排名最高
OpenDataLab 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录