pacs|图像识别数据集|领域泛化数据集
收藏数据集卡片 for PACS
概述
PACS 是一个用于领域泛化的图像数据集。它包含四个领域:照片(1,670 张图像)、艺术绘画(2,048 张图像)、卡通(2,344 张图像)和素描(3,929 张图像)。每个领域包含七个类别(标签):狗、大象、长颈鹿、吉他、马、房子和人。总样本数为 9,991。
数据集详情
PACS 数据集是通过交集创建的,这些交集来自 Caltech256(照片)、Sketchy(照片、素描)、TU-Berlin(素描)和 Google Images(艺术绘画、卡通、照片)中的类别。
数据集来源
- 网站: https://sketchx.eecs.qmul.ac.uk/downloads/
- 论文: https://arxiv.org/pdf/1710.03077
- Papers with code: https://paperswithcode.com/dataset/pacs
数据集结构
数据实例
训练集的第一个实例如下: json { "image": "<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=227x227>", "domain": "art_painting", "label": 0 }
数据分割
json DatasetDict({ train: Dataset({ features: [image, domain, label], num_rows: 9991 }) })
引用
在使用 PACS 数据集时,请引用原始论文。如果使用 Flower Datasets 和 Flower,请引用 Flower。
BibTeX:
原始论文: bibtex @misc{li2017deeperbroaderartierdomain, title={Deeper, Broader and Artier Domain Generalization}, author={Da Li and Yongxin Yang and Yi-Zhe Song and Timothy M. Hospedales}, year={2017}, eprint={1710.03077}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/1710.03077}, }
Flower: bibtex @article{DBLP:journals/corr/abs-2007-14390, author = {Daniel J. Beutel and Taner Topal and Akhil Mathur and Xinchi Qiu and Titouan Parcollet and Nicholas D. Lane}, title = {Flower: {A} Friendly Federated Learning Research Framework}, journal = {CoRR}, volume = {abs/2007.14390}, year = {2020}, url = {https://arxiv.org/abs/2007.14390}, eprinttype = {arXiv}, eprint = {2007.14390}, timestamp = {Mon, 03 Aug 2020 14:32:13 +0200}, biburl = {https://dblp.org/rec/journals/corr/abs-2007-14390.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }
数据集卡片联系
如果您对数据集预处理和准备有任何疑问,请联系 Flower Labs。

Med-MAT
Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。
huggingface 收录
rag-datasets/rag-mini-bioasq
该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。
hugging_face 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录