Oxford-102 Flower Dataset|图像分类数据集|计算机视觉数据集
收藏
- Oxford-102 Flower Dataset首次发表,由M. Nilsback和A. Zisserman在计算机视觉与模式识别会议(CVPR)上提出,旨在为花卉图像分类提供一个标准化的基准数据集。
- 该数据集被广泛应用于深度学习研究,特别是在卷积神经网络(CNN)的训练和评估中,成为图像分类领域的重要资源。
- 随着深度学习技术的快速发展,Oxford-102 Flower Dataset在多个国际竞赛和研究项目中被用作基准,进一步提升了其在学术界和工业界的影响力。
- 数据集的扩展版本发布,增加了更多的图像样本和类别,以适应更高精度的图像识别需求。
- Oxford-102 Flower Dataset被纳入多个大型数据集集合,如TensorFlow Datasets,方便研究人员和开发者快速访问和使用。
- 1Oxford 102 Flower DatasetUniversity of Oxford · 2008年
- 2Deep Residual Learning for Image RecognitionMicrosoft Research · 2015年
- 3ImageNet Classification with Deep Convolutional Neural NetworksUniversity of Toronto · 2012年
- 4Attention is All You NeedGoogle Brain · 2017年
- 5EfficientNet: Rethinking Model Scaling for Convolutional Neural NetworksGoogle Research · 2019年
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
ST-EVCDP
这是一个关于公共电动汽车充电桩的时空充电需求预测的实际数据集,涵盖了18,061个公共充电桩的数据,包括坐标、充电器数量、占用情况和价格等信息。数据集用于学术研究,支持区域电动汽车充电需求预测。
github 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录