five

detectors/ssb_hard-ood

收藏
Hugging Face2023-10-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/detectors/ssb_hard-ood
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: unknown size_categories: n<1K task_categories: - image-classification pretty_name: SSB (hard) configs: - config_name: default data_files: - split: train path: data/train-* dataset_info: features: - name: image dtype: image splits: - name: train num_bytes: 64639425.0 num_examples: 208 download_size: 0 dataset_size: 64639425.0 --- # Dataset Card for SSB (hard) for OOD Detection <!-- Provide a quick summary of the dataset. --> ## Dataset Details ### Dataset Description <!-- Provide a longer summary of what this dataset is. --> - **Original Dataset Authors**: Sagar Vaze, Kai Han, Andrea Vedaldi, Andrew Zisserman - **OOD Split Authors:** Julian Bitterwolf, Maximilian Müller, Matthias Hein - **Shared by:** Eduardo Dadalto - **License:** unknown ### Dataset Sources <!-- Provide the basic links for the dataset. --> - **Original Dataset Paper:** http://arxiv.org/abs/2110.06207v2 - **First OOD Application Paper:** http://arxiv.org/abs/2306.00826v1 ### Direct Use <!-- This section describes suitable use cases for the dataset. --> This dataset is intended to be used as an ouf-of-distribution dataset for image classification benchmarks. ### Out-of-Scope Use <!-- This section addresses misuse, malicious use, and uses that the dataset will not work well for. --> This dataset is not annotated. ### Curation Rationale <!-- Motivation for the creation of this dataset. --> The goal in curating and sharing this dataset to the HuggingFace Hub is to accelerate research and promote reproducibility in generalized Out-of-Distribution (OOD) detection. Check the python library [detectors](https://github.com/edadaltocg/detectors) if you are interested in OOD detection. ### Personal and Sensitive Information <!-- State whether the dataset contains data that might be considered personal, sensitive, or private (e.g., data that reveals addresses, uniquely identifiable names or aliases, racial or ethnic origins, sexual orientations, religious beliefs, political opinions, financial or health data, etc.). If efforts were made to anonymize the data, describe the anonymization process. --> Please check original paper for details on the dataset. ### Bias, Risks, and Limitations <!-- This section is meant to convey both technical and sociotechnical limitations. --> Please check original paper for details on the dataset. ## Citation <!-- If there is a paper or blog post introducing the dataset, the APA and Bibtex information for that should go in this section. --> **BibTeX:** ```bibtex @software{detectors2023, author = {Eduardo Dadalto}, title = {Detectors: a Python Library for Generalized Out-Of-Distribution Detection}, url = {https://github.com/edadaltocg/detectors}, doi = {https://doi.org/10.5281/zenodo.7883596}, month = {5}, year = {2023} } @article{2306.00826v1, author = {Julian Bitterwolf and Maximilian Müller and Matthias Hein}, title = {In or Out? Fixing ImageNet Out-of-Distribution Detection Evaluation}, year = {2023}, month = {6}, note = {ICML 2023. Datasets, code and evaluation data at https://github.com/j-cb/NINCO}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/2306.00826v1} } ``` ## Dataset Card Authors Eduardo Dadalto ## Dataset Card Contact https://huggingface.co/edadaltocg

license: 未知 size_categories: 样本量小于1000 task_categories: - 图像分类 pretty_name: SSB(困难版) configs: - config_name: 默认配置 data_files: - split: 训练集 path: data/train-* dataset_info: features: - name: 图像 dtype: 图像 splits: - name: 训练集 num_bytes: 64639425.0字节 num_examples: 208 download_size: 0字节 dataset_size: 64639425.0字节 # 面向分布外(Out-of-Distribution, OOD)检测的SSB(困难版)数据集卡片 <!-- 请提供该数据集的简要概述。 --> ## 数据集详情 ### 数据集描述 <!-- 请提供该数据集的详细说明。 --> - **原始数据集作者**:萨加尔·瓦泽(Sagar Vaze)、韩凯(Kai Han)、安德里亚·韦达利(Andrea Vedaldi)、安德鲁·齐斯曼(Andrew Zisserman) - **分布外划分作者**:朱利安·比特沃夫(Julian Bitterwolf)、马克西米利安·穆勒(Maximilian Müller)、马蒂亚斯·海因(Matthias Hein) - **共享者**:爱德华多·达达托(Eduardo Dadalto) - **许可证**:未知 ### 数据集来源 <!-- 请提供该数据集的基础链接。 --> - **原始数据集论文**:http://arxiv.org/abs/2110.06207v2 - **首篇分布外检测应用论文**:http://arxiv.org/abs/2306.00826v1 ### 直接用途 <!-- 本小节描述该数据集的适用使用场景。 --> 本数据集旨在作为图像分类基准测试的分布外(Out-of-Distribution, OOD)数据集。 ### 超范围使用 <!-- 本小节说明该数据集的误用、恶意使用,以及无法适配的使用场景。 --> 本数据集未进行标注。 ### 数据集构建初衷 <!-- 创建该数据集的动机说明。 --> 本数据集整理并共享至Hugging Face Hub的目标,是加速通用分布外检测(Out-of-Distribution, OOD)领域的研究,并提升相关研究的可复现性。 若您对分布外检测研究感兴趣,可查阅Python库[detectors](https://github.com/edadaltocg/detectors)。 ### 个人与敏感信息说明 <!-- 说明数据集是否包含可被视为个人、敏感或隐私的数据(例如:揭示地址、唯一可识别的姓名或别名、种族或族裔出身、性取向、宗教信仰、政治观点、财务或健康数据等)。若已对数据进行匿名化处理,请说明匿名化流程。 --> 有关数据集的详细信息,请查阅原始论文。 ### 偏倚、风险与局限性 <!-- 本小节旨在说明技术与社会技术层面的局限性。 --> 有关数据集的偏倚、风险与局限性细节,请查阅原始论文。 ## 引用信息 <!-- 若有介绍该数据集的论文或博客文章,请在此处提供其APA和BibTeX格式引用信息。 --> **BibTeX:** bibtex @software{detectors2023, author = {Eduardo Dadalto}, title = {Detectors: a Python Library for Generalized Out-Of-Distribution Detection}, url = {https://github.com/edadaltocg/detectors}, doi = {https://doi.org/10.5281/zenodo.7883596}, month = {5}, year = {2023} } @article{2306.00826v1, author = {Julian Bitterwolf and Maximilian Müller and Matthias Hein}, title = {In or Out? Fixing ImageNet Out-of-Distribution Detection Evaluation}, year = {2023}, month = {6}, note = {ICML 2023. Datasets, code and evaluation data at https://github.com/j-cb/NINCO}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/2306.00826v1} } ## 数据集卡片作者 爱德华多·达达托(Eduardo Dadalto) ## 数据集卡片联系方式 https://huggingface.co/edadaltocg
提供机构:
detectors
原始信息汇总

数据集卡片 SSB (hard)

数据集详情

数据集描述

  • 原始数据集作者: Sagar Vaze, Kai Han, Andrea Vedaldi, Andrew Zisserman
  • OOD 分割作者: Julian Bitterwolf, Maximilian Müller, Matthias Hein
  • 共享者: Eduardo Dadalto
  • 许可证: unknown

数据集来源

  • 原始数据集论文: http://arxiv.org/abs/2110.06207v2
  • 首次OOD应用论文: http://arxiv.org/abs/2306.00826v1

直接用途

该数据集旨在用作图像分类基准的分布外数据集。

超出范围用途

该数据集未进行标注。

数据集创建动机

创建和共享此数据集的目标是加速研究并促进广义分布外检测的可重复性。

个人和敏感信息

请查阅原始论文以获取数据集的详细信息。

偏差、风险和限制

请查阅原始论文以获取数据集的详细信息。

引用

BibTeX:

bibtex @software{detectors2023, author = {Eduardo Dadalto}, title = {Detectors: a Python Library for Generalized Out-Of-Distribution Detection}, url = {https://github.com/edadaltocg/detectors}, doi = {https://doi.org/10.5281/zenodo.7883596}, month = {5}, year = {2023} }

@article{2306.00826v1, author = {Julian Bitterwolf and Maximilian Müller and Matthias Hein}, title = {In or Out? Fixing ImageNet Out-of-Distribution Detection Evaluation}, year = {2023}, month = {6}, note = {ICML 2023. Datasets, code and evaluation data at https://github.com/j-cb/NINCO}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/2306.00826v1} }

数据集卡片作者

Eduardo Dadalto

数据集卡片联系

https://huggingface.co/edadaltocg

搜集汇总
数据集介绍
main_image_url
构建方式
SSB (hard)数据集由原始数据集SSB通过特定的构建方法衍生而来,旨在为图像分类基准提供OutOfDistribution(OOD)的数据集。该数据集的构建主要基于原始图像数据,通过特定的技术处理,形成了适用于OOD检测的训练集。具体而言,该数据集包含了208个训练样本,数据集大小为64639425字节。
特点
SSB (hard)数据集的特点在于,它是一个专为OOD检测设计的图像数据集。其数据来源自原始的SSB数据集,但经过了特定的筛选和处理,使得该数据集在图像分类任务中具有挑战性。此外,该数据集未进行任何注释,保留了原始图像的完整性,为研究者提供了一个真实且具有挑战性的研究环境。
使用方法
使用SSB (hard)数据集时,用户可以直接从HuggingFace Hub进行下载。该数据集适用于图像分类基准的OutOfDistribution检测研究。用户可以利用该数据集训练和评估OOD检测模型,从而推进广义OOD检测的研究。具体使用时,用户需要参考相关的Python库detectors,以实现数据集的加载和模型的训练。
背景与挑战
背景概述
SSB (hard)数据集,由Sagar Vaze、Kai Han、Andrea Vedaldi和Andrew Zisserman等研究人员创建,并由Julian Bitterwolf、Maximilian Müller和Matthias Hein等人针对Out-of-Distribution(OOD)检测进行了特殊分割。该数据集的构建旨在促进广义OOD检测的研究与复现,其核心研究问题是图像分类中的OOD样本识别。SSB (hard)数据集的推出,为图像分类领域提供了新的研究方向与工具,对于提升模型的泛化能力和鲁棒性具有重要价值。
当前挑战
SSB (hard)数据集在构建和应用过程中面临的挑战主要包括:1) 如何准确区分OOD样本与常规样本,确保数据集对于模型训练的有效性;2) 数据集的规模较小,可能无法充分覆盖多样化的OOD场景,对模型的泛化能力构成挑战;3) 由于数据集未进行注释,使用者在理解和应用数据集时可能存在困难;4) 数据集的来源和版权信息不明确,可能存在法律和伦理风险。
常用场景
经典使用场景
在图像分类领域中,SSB (hard)数据集被广泛用于评估模型在处理非训练分布数据时的性能。该数据集精选了难以区分的训练样本,旨在作为out-of-distribution(OOD)检测的基准,研究者通过该数据集对模型进行测试,以判断模型在面对未见过的图像分布时的鲁棒性。
解决学术问题
SSB (hard)数据集解决了学术研究中如何准确评估模型在OOD样本上的表现的问题,为研究者提供了一个可靠的测试平台。它有助于推动异常检测和鲁棒性研究的发展,进而提高模型在实际应用中的泛化能力。
衍生相关工作
基于SSB (hard)数据集,研究者们已经衍生出一系列相关工作,包括改进的OOD检测算法、针对特定领域的数据增强技术,以及结合该数据集的模型评估指标。这些工作进一步推动了图像分类领域的研究进展,并为相关技术提供了实验基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作