five

detectors/isun-ood

收藏
Hugging Face2023-10-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/detectors/isun-ood
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: unknown size_categories: 1K<n<10K task_categories: - image-classification paperswithcode_id: isun pretty_name: iSUN configs: - config_name: default data_files: - split: train path: data/train-* dataset_info: features: - name: image dtype: image splits: - name: train num_bytes: 24514257.375 num_examples: 8925 download_size: 0 dataset_size: 24514257.375 --- # Dataset Card for iSUN for OOD Detection <!-- Provide a quick summary of the dataset. --> ## Dataset Details ### Dataset Description <!-- Provide a longer summary of what this dataset is. --> - **Original Dataset Authors**: Junting Pan, Xavier Giró-i-Nieto - **OOD Split Authors:** Shiyu Liang, Yixuan Li, R. Srikant - **Shared by:** Eduardo Dadalto - **License:** unknown ### Dataset Sources <!-- Provide the basic links for the dataset. --> - **Original Dataset Paper:** http://arxiv.org/abs/1507.01422v1 - **First OOD Application Paper:** http://arxiv.org/abs/1706.02690v5 ### Direct Use <!-- This section describes suitable use cases for the dataset. --> This dataset is intended to be used as an ouf-of-distribution dataset for image classification benchmarks. ### Out-of-Scope Use <!-- This section addresses misuse, malicious use, and uses that the dataset will not work well for. --> This dataset is not annotated. ### Curation Rationale <!-- Motivation for the creation of this dataset. --> The goal in curating and sharing this dataset to the HuggingFace Hub is to accelerate research and promote reproducibility in generalized Out-of-Distribution (OOD) detection. Check the python library [detectors](https://github.com/edadaltocg/detectors) if you are interested in OOD detection. ### Personal and Sensitive Information <!-- State whether the dataset contains data that might be considered personal, sensitive, or private (e.g., data that reveals addresses, uniquely identifiable names or aliases, racial or ethnic origins, sexual orientations, religious beliefs, political opinions, financial or health data, etc.). If efforts were made to anonymize the data, describe the anonymization process. --> Please check original paper for details on the dataset. ### Bias, Risks, and Limitations <!-- This section is meant to convey both technical and sociotechnical limitations. --> Please check original paper for details on the dataset. ## Citation <!-- If there is a paper or blog post introducing the dataset, the APA and Bibtex information for that should go in this section. --> **BibTeX:** ```bibtex @software{detectors2023, author = {Eduardo Dadalto}, title = {Detectors: a Python Library for Generalized Out-Of-Distribution Detection}, url = {https://github.com/edadaltocg/detectors}, doi = {https://doi.org/10.5281/zenodo.7883596}, month = {5}, year = {2023} } @article{1706.02690v5, author = {Shiyu Liang and Yixuan Li and R. Srikant}, title = {Enhancing The Reliability of Out-of-distribution Image Detection in Neural Networks}, year = {2017}, month = {6}, note = {ICLR 2018}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/1706.02690v5} } @article{1507.01422v1, author = {Junting Pan and Xavier Giró-i-Nieto}, title = {End-to-end Convolutional Network for Saliency Prediction}, year = {2015}, month = {7}, note = {Winner of the saliency prediction challenge in the Large-scale Scene Understanding (LSUN) Challenge in the associated workshop of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2015}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/1507.01422v1} } ``` ## Dataset Card Authors Eduardo Dadalto ## Dataset Card Contact https://huggingface.co/edadaltocg

--- license: 未知 size_categories: 1000 < 样本数 < 10000 task_categories: - 图像分类 paperswithcode_id: isun pretty_name: iSUN configs: - config_name: default data_files: - split: train path: data/train-* dataset_info: features: - name: 图像 dtype: 图像 splits: - name: train num_bytes: 24514257.375 num_examples: 8925 download_size: 0 dataset_size: 24514257.375 --- # 用于分布外检测的iSUN数据集卡片 <!-- 提供数据集的简要概述。 --> ## 数据集详情 ### 数据集描述 <!-- 提供有关数据集的详细概述。 --> - **原始数据集作者**:Junting Pan、Xavier Giró-i-Nieto - **分布外拆分作者**:Shiyu Liang、Yixuan Li、R. Srikant - **共享者**:爱德华多·达达尔托(Eduardo Dadalto) - **许可证**:未知 ### 数据集来源 <!-- 提供数据集的基础链接。 --> - **原始数据集论文**:http://arxiv.org/abs/1507.01422v1 - **首篇分布外应用论文**:http://arxiv.org/abs/1706.02690v5 ### 直接用途 <!-- 本节描述数据集的适用用例。 --> 本数据集旨在作为图像分类基准测试的分布外(Out-of-Distribution, OOD)数据集使用。 ### 不适用途 <!-- 本节说明误用、恶意使用以及本数据集无法良好适配的使用场景。 --> 本数据集未进行标注。 ### 数据集构建初衷 <!-- 创建本数据集的动机。 --> 本数据集整理并共享至HuggingFace Hub的目的,是加速通用分布外检测(Out-of-Distribution, OOD)领域的研究,并提升相关研究的可复现性。 若您对分布外检测研究感兴趣,可查阅Python库[detectors](https://github.com/edadaltocg/detectors)。 ### 个人与敏感信息 <!-- 说明数据集是否包含可能被视为个人、敏感或私有的数据(例如,揭示地址、唯一可识别的姓名或别名、种族或族裔出身、性取向、宗教信仰、政治观点、财务或健康数据等)。如果已对数据进行匿名化处理,请描述匿名化流程。 --> 有关数据集的详细信息,请查阅原始论文。 ### 偏差、风险与局限性 <!-- 本节旨在说明技术与社会技术层面的局限性。 --> 有关数据集的偏差、风险与局限性的详细信息,请查阅原始论文。 ## 引用信息 <!-- 如果有介绍该数据集的论文或博客文章,本节应包含其APA和Bibtex引用信息。 --> **BibTeX:** bibtex @software{detectors2023, author = {Eduardo Dadalto}, title = {Detectors: a Python Library for Generalized Out-Of-Distribution Detection}, url = {https://github.com/edadaltocg/detectors}, doi = {https://doi.org/10.5281/zenodo.7883596}, month = {5}, year = {2023} } @article{1706.02690v5, author = {Shiyu Liang and Yixuan Li and R. Srikant}, title = {Enhancing The Reliability of Out-of-distribution Image Detection in Neural Networks}, year = {2017}, month = {6}, note = {ICLR 2018}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/1706.02690v5} } @article{1507.01422v1, author = {Junting Pan and Xavier Giró-i-Nieto}, title = {End-to-end Convolutional Network for Saliency Prediction}, year = {2015}, month = {7}, note = {Winner of the saliency prediction challenge in the Large-scale Scene Understanding (LSUN) Challenge in the associated workshop of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2015}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/1507.01422v1} } ## 数据集卡片作者 爱德华多·达达尔托(Eduardo Dadalto) ## 数据集卡片联系方式 https://huggingface.co/edadaltocg
提供机构:
detectors
原始信息汇总

iSUN 数据集概述

数据集描述

  • 数据集名称: iSUN
  • 数据集用途: 用于图像分类基准的外分布(Out-of-Distribution, OOD)检测。
  • 数据集作者:
    • 原始数据集作者: Junting Pan, Xavier Giró-i-Nieto
    • OOD 分割作者: Shiyu Liang, Yixuan Li, R. Srikant
    • 共享者: Eduardo Dadalto
  • 许可证: 未知

数据集来源

  • 原始数据集论文: http://arxiv.org/abs/1507.01422v1
  • 首次OOD应用论文: http://arxiv.org/abs/1706.02690v5

数据集结构

配置

  • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*

特征

  • 名称: image
  • 数据类型: image

分割

  • 名称: train
    • 字节数: 24514257.375
    • 样本数: 8925

大小

  • 下载大小: 0
  • 数据集大小: 24514257.375

数据集使用

  • 直接使用: 作为图像分类基准的外分布数据集。
  • 超出范围使用: 该数据集未标注。

数据集创建动机

  • 动机: 加速研究并促进广义外分布检测的可重复性。

个人和敏感信息

  • 信息: 请参考原始论文了解数据集的详细信息。

偏差、风险和限制

  • 信息: 请参考原始论文了解数据集的详细信息。

引用

  • BibTeX:

bibtex @software{detectors2023, author = {Eduardo Dadalto}, title = {Detectors: a Python Library for Generalized Out-Of-Distribution Detection}, url = {https://github.com/edadaltocg/detectors}, doi = {https://doi.org/10.5281/zenodo.7883596}, month = {5}, year = {2023} }

@article{1706.02690v5, author = {Shiyu Liang and Yixuan Li and R. Srikant}, title = {Enhancing The Reliability of Out-of-distribution Image Detection in Neural Networks}, year = {2017}, month = {6}, note = {ICLR 2018}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/1706.02690v5} }

@article{1507.01422v1, author = {Junting Pan and Xavier Giró-i-Nieto}, title = {End-to-end Convolutional Network for Saliency Prediction}, year = {2015}, month = {7}, note = {Winner of the saliency prediction challenge in the Large-scale Scene Understanding (LSUN) Challenge in the associated workshop of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2015}, archiveprefix = {arXiv}, url = {http://arxiv.org/abs/1507.01422v1} }

数据集卡片作者

  • 作者: Eduardo Dadalto

数据集卡片联系

  • 联系: https://huggingface.co/edadaltocg
搜集汇总
数据集介绍
main_image_url
构建方式
iSUN数据集的构建,是由Junting Pan和Xavier Giró-i-Nieto原创,并经Shiyu Liang、Yixuan Li及R. Srikant针对Out-of-Distribution(OOD)检测任务进行了特定的分割。该数据集包含8925张训练图像,通过端到端的卷积网络进行图像显著性的预测,进而形成适用于图像分类基准的OOD数据集。
使用方法
使用iSUN数据集时,用户可以直接访问HuggingFace Hub进行下载。该数据集适用于图像分类基准的OOD检测,用户可以通过Python库detectors进行相关研究和应用开发。在使用前,建议用户详细阅读原始论文,以了解数据集的详细信息和潜在的使用限制。
背景与挑战
背景概述
iSUN数据集,全称为Image Saliency UN Dataset,是一个在计算机视觉领域用于图像分类的基准数据集。该数据集由Junting Pan和Xavier Giró-i-Nieto于2015年创建,旨在为图像显著性预测提供端到端的卷积网络解决方案。随后,Shiyu Liang、Yixuan Li和R. Srikant对数据集进行了扩展,以适应超出分布(Out-of-Distribution,OOD)检测的需求。iSUN数据集的构建目的在于加速广义OOD检测的研究,并促进其在图像分类基准中的可重复性。该数据集在学术界产生了广泛的影响,为相关领域的研究提供了重要的资源。
当前挑战
在数据集的构建与应用过程中,研究者面临了多项挑战。首先,iSUN数据集的原始版本并未针对OOD检测进行设计,因此需要对其进行适当的调整和扩展。其次,数据集在构建过程中需要处理的技术难题包括如何确保图像数据的多样性和代表性,以及如何避免在训练过程中出现的偏差。此外,由于数据集未提供注释信息,这为OOD检测的研究和应用带来了额外的复杂性。在使用该数据集时,研究人员还需注意避免将其用于不恰当的场景,如未经注释的数据可能导致错误的假设和结论。
常用场景
经典使用场景
在图像分类领域中,iSUN数据集作为典型的出分布(OOD)检测数据集,其核心应用在于评估模型对于非训练分布数据的识别能力。该数据集通过提供与训练集分布不同的图像,使得研究者能够对其模型进行泛化能力的测试,进而优化模型以适应更广泛的数据分布。
解决学术问题
iSUN数据集的构建旨在解决深度学习模型在面临真实世界中未知数据分布时的鲁棒性问题。通过该数据集,研究者可以探究并缓解模型在出分布数据上表现出的误判和不确定性,从而推动出分布检测技术的发展,提高模型在实际应用中的可靠性和安全性。
实际应用
实际应用中,iSUN数据集可用于自动驾驶系统中的异常检测、医学图像分析中的病变识别,以及网络安全领域中的入侵检测等。这些场景中,准确识别出分布数据对于系统的准确性和安全性至关重要。
数据集最近研究
最新研究方向
iSUN数据集作为图像分类基准的异常分布数据集,其最新研究方向聚焦于提升神经网络在识别出分布外图像的能力。该数据集的构建旨在加速广义异常分布检测的研究,并促进结果的再现性。近期研究利用iSUN数据集,旨在增强神经网络的可靠性,特别是在面对非训练数据时的泛化能力。此类研究对于提高人工智能系统的鲁棒性和安全性具有重要意义,有助于防止模型在现实世界中的误导性预测。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作