PACS|图像处理数据集|域泛化数据集
收藏数据集概述
数据集名称
PACS
数据集描述
PACS是一个用于域泛化的图像数据集,包含四个域:
- Photo: 1,670张图像
- Art Painting: 2,048张图像
- Cartoon: 2,344张图像
- Sketch: 3,929张图像 每个域包含七个类别。
数据集链接
代码结构
PACS
: 存储PACS数据集的文件夹datasets.py
: 包含3个不同的数据集类,适用于不同的训练和测试方法utils.py
: 包含构建数据加载器和设置种子等的实用代码train.py
: 用于训练的代码test.py
: 用于测试的代码model.py
: 包含用于训练和测试的resnet网络结构代码config.py
: 包含训练和测试的参数
训练与评估
使用train.py
和test.py
进行模型训练和评估。
相关参数
epoch
: 训练周期数lr
: 学习率weight_decay
: 权重衰减num_workers
: 数据加载器的工作进程数batchsize
: 批量大小
示例命令
-
训练模型(批量大小32):
$ python train.py --epoch 200 --lr 0.001 --weight_decay 0.0005 --num_workers 32 --batchsize 32
-
测试模型并获取结果文件:
$ python test.py --num_workers 32 --batchsize 32

UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
LogiQA
LogiQA 包含 8,678 个 QA 实例,涵盖多种类型的演绎推理。结果表明,最先进的神经模型的性能远远低于人类天花板。该数据集还可以作为在深度学习 NLP 设置下重新研究逻辑 AI 的基准。
OpenDataLab 收录
Tropicos
Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。
www.tropicos.org 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录