five

detectors/ssb_hard-ood|OOD检测数据集|图像分类数据集

收藏
hugging_face2023-10-30 更新2024-03-04 收录
OOD检测
图像分类
下载链接:
https://hf-mirror.com/datasets/detectors/ssb_hard-ood
下载链接
链接失效反馈
资源简介:
--- license: unknown size_categories: n<1K task_categories: - image-classification pretty_name: SSB (hard) configs: - config_name: default data_files: - split: train path: data/train-* dataset_info: features: - name: image dtype: image splits: - name: train num_bytes: 64639425.0 num_examples: 208 download_size: 0 dataset_size: 64639425.0 --- # Dataset Card for SSB (hard) for OOD Detection <!-- Provide a quick summary of the dataset. --> ## Dataset Details ### Dataset Description <!-- Provide a longer summary of what this dataset is. --> - **Original Dataset Authors**: Sagar Vaze, Kai Han, Andrea Vedaldi, Andrew Zisserman - **OOD Split Authors:** Julian Bitterwolf, Maximilian Müller, Matthias Hein - **Shared by:** Eduardo Dadalto - **License:** unknown ### Dataset Sources <!-- Provide the basic links for the dataset. --> - **Original Dataset Paper:** http://arxiv.org/abs/2110.06207v2 - **First OOD Application Paper:** http://arxiv.org/abs/2306.00826v1 ### Direct Use <!-- This section describes suitable use cases for the dataset. --> This dataset is intended to be used as an ouf-of-distribution dataset for image classification benchmarks. ### Out-of-Scope Use <!-- This section addresses misuse, malicious use, and uses that the dataset will not work well for. --> This dataset is not annotated. ### Curation Rationale <!-- Motivation for the creation of this dataset. --> The goal in curating and sharing this dataset to the HuggingFace Hub is to accelerate research and promote reproducibility in generalized Out-of-Distribution (OOD) detection. Check the python library [detectors](https://github.com/edadaltocg/detectors) if you are interested in OOD detection. ### Personal and Sensitive Information <!-- State whether the dataset contains data that might be considered personal, sensitive, or private (e.g., data that reveals addresses, uniquely identifiable names or aliases, racial or ethnic origins, sexual orientations, religious beliefs, political opinions, financial or health data, etc.). If efforts were made to anonymize the data, describe the anonymization process. --> Please check original paper for details on the dataset. ### Bias, Risks, and Limitations <!-- This section is meant to convey both technical and sociotechnical limitations. --> Please check original paper for details on the dataset. ## Citation <!-- If there is a paper or blog post introducing the dataset, the APA and Bibtex information for that should go in this section. --> **BibTeX:** ```bibtex @software{detectors2023, author = {Eduardo Dadalto}, title = {Detectors: a Python Library for Generalized Out-Of-Distribution Detection}, url = {https://github.com/edadaltocg/detectors}, doi = {https://doi.org/10.5281/zenodo.7883596}, month = {5}, year = {2023} } @article{2306.00826v1, author = {Julian Bitterwolf and Maximilian Müller and Matthias Hein}, title = {In or Out? Fixing ImageNet Out-of-Distribution Detection Evaluation}, year = {2023}, month = {6}, note = {ICML 2023. Datasets, code and evaluation data at https://github.com/j-cb/NINCO}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/2306.00826v1} } ``` ## Dataset Card Authors Eduardo Dadalto ## Dataset Card Contact https://huggingface.co/edadaltocg
提供机构:
detectors
原始信息汇总

数据集卡片 SSB (hard)

数据集详情

数据集描述

  • 原始数据集作者: Sagar Vaze, Kai Han, Andrea Vedaldi, Andrew Zisserman
  • OOD 分割作者: Julian Bitterwolf, Maximilian Müller, Matthias Hein
  • 共享者: Eduardo Dadalto
  • 许可证: unknown

数据集来源

  • 原始数据集论文: http://arxiv.org/abs/2110.06207v2
  • 首次OOD应用论文: http://arxiv.org/abs/2306.00826v1

直接用途

该数据集旨在用作图像分类基准的分布外数据集。

超出范围用途

该数据集未进行标注。

数据集创建动机

创建和共享此数据集的目标是加速研究并促进广义分布外检测的可重复性。

个人和敏感信息

请查阅原始论文以获取数据集的详细信息。

偏差、风险和限制

请查阅原始论文以获取数据集的详细信息。

引用

BibTeX:

bibtex @software{detectors2023, author = {Eduardo Dadalto}, title = {Detectors: a Python Library for Generalized Out-Of-Distribution Detection}, url = {https://github.com/edadaltocg/detectors}, doi = {https://doi.org/10.5281/zenodo.7883596}, month = {5}, year = {2023} }

@article{2306.00826v1, author = {Julian Bitterwolf and Maximilian Müller and Matthias Hein}, title = {In or Out? Fixing ImageNet Out-of-Distribution Detection Evaluation}, year = {2023}, month = {6}, note = {ICML 2023. Datasets, code and evaluation data at https://github.com/j-cb/NINCO}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/2306.00826v1} }

数据集卡片作者

Eduardo Dadalto

数据集卡片联系

https://huggingface.co/edadaltocg

AI搜集汇总
数据集介绍
main_image_url
构建方式
SSB (hard)数据集由原始数据集SSB通过特定的构建方法衍生而来,旨在为图像分类基准提供OutOfDistribution(OOD)的数据集。该数据集的构建主要基于原始图像数据,通过特定的技术处理,形成了适用于OOD检测的训练集。具体而言,该数据集包含了208个训练样本,数据集大小为64639425字节。
特点
SSB (hard)数据集的特点在于,它是一个专为OOD检测设计的图像数据集。其数据来源自原始的SSB数据集,但经过了特定的筛选和处理,使得该数据集在图像分类任务中具有挑战性。此外,该数据集未进行任何注释,保留了原始图像的完整性,为研究者提供了一个真实且具有挑战性的研究环境。
使用方法
使用SSB (hard)数据集时,用户可以直接从HuggingFace Hub进行下载。该数据集适用于图像分类基准的OutOfDistribution检测研究。用户可以利用该数据集训练和评估OOD检测模型,从而推进广义OOD检测的研究。具体使用时,用户需要参考相关的Python库detectors,以实现数据集的加载和模型的训练。
背景与挑战
背景概述
SSB (hard)数据集,由Sagar Vaze、Kai Han、Andrea Vedaldi和Andrew Zisserman等研究人员创建,并由Julian Bitterwolf、Maximilian Müller和Matthias Hein等人针对Out-of-Distribution(OOD)检测进行了特殊分割。该数据集的构建旨在促进广义OOD检测的研究与复现,其核心研究问题是图像分类中的OOD样本识别。SSB (hard)数据集的推出,为图像分类领域提供了新的研究方向与工具,对于提升模型的泛化能力和鲁棒性具有重要价值。
当前挑战
SSB (hard)数据集在构建和应用过程中面临的挑战主要包括:1) 如何准确区分OOD样本与常规样本,确保数据集对于模型训练的有效性;2) 数据集的规模较小,可能无法充分覆盖多样化的OOD场景,对模型的泛化能力构成挑战;3) 由于数据集未进行注释,使用者在理解和应用数据集时可能存在困难;4) 数据集的来源和版权信息不明确,可能存在法律和伦理风险。
常用场景
经典使用场景
在图像分类领域中,SSB (hard)数据集被广泛用于评估模型在处理非训练分布数据时的性能。该数据集精选了难以区分的训练样本,旨在作为out-of-distribution(OOD)检测的基准,研究者通过该数据集对模型进行测试,以判断模型在面对未见过的图像分布时的鲁棒性。
解决学术问题
SSB (hard)数据集解决了学术研究中如何准确评估模型在OOD样本上的表现的问题,为研究者提供了一个可靠的测试平台。它有助于推动异常检测和鲁棒性研究的发展,进而提高模型在实际应用中的泛化能力。
衍生相关工作
基于SSB (hard)数据集,研究者们已经衍生出一系列相关工作,包括改进的OOD检测算法、针对特定领域的数据增强技术,以及结合该数据集的模型评估指标。这些工作进一步推动了图像分类领域的研究进展,并为相关技术提供了实验基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

ADNI

阿尔茨海默病神经影像研究计划 (ADNI) 是一项多站点研究,旨在改善预防和治疗阿尔茨海默病 (AD) 的临床试验。[1] 这项合作研究结合了私营和公共部门的专业知识和资金,以研究患有AD的受试者,以及那些可能发展成AD和控制没有认知障碍迹象的人。[2] 美国和加拿大63个地点的研究人员通过神经影像学,生化,和遗传生物标记。[2][3] 这些知识有助于找到更好的预防和治疗AD的临床试验。ADNI已经产生了全球性的影响,[4] 首先是通过开发一套标准化的协议,以允许对来自多个中心的结果进行比较,[4] 其次是其数据共享政策,该政策使所有数据在没有禁运的情况下提供给世界各地的合格研究人员。[5] 迄今为止,超过1000份科学出版物使用了ADNI数据。[6] 许多其他与AD和其他疾病相关的计划已经使用ADNI作为模型来设计和实施。[4] ADNI一直在2004年运行,目前2021年获得资助。

OpenDataLab 收录

RadDet

RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。

github 收录