新浪舆情通|舆情分析数据集|文本挖掘数据集
收藏LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
中国区域教育数据库
该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。
www.moe.gov.cn 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
Rail-DB
Rail-DB是由深圳技术大学创建的铁路检测数据集,包含7432对图像及其标注,涵盖多种光照、道路结构和视角条件。数据集中的轨道通过多边形进行标注,并根据背景被分为九种场景。Rail-DB旨在推动铁路检测算法的进步和比较,通过提供多样化的真实世界铁路图像,增强算法的鲁棒性。此外,数据集的创建过程包括从真实世界火车视频中获取图像,通过粗略和精细两个阶段进行标注,确保标注的准确性和完整性。Rail-DB的应用领域主要集中在铁路异常检测,特别是铁路区域的识别,以提高铁路安全和维护效率。
arXiv 收录