five

frgfm/imagewoof

收藏
Hugging Face2022-12-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/frgfm/imagewoof
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - crowdsourced language_creators: - crowdsourced language: - en license: - apache-2.0 multilinguality: [] size_categories: - 1K<n<10K source_datasets: - extended task_categories: - image-classification task_ids: [] paperswithcode_id: imagewoof pretty_name: Imagewoof --- # Dataset Card for Imagewoof ## Table of Contents - [Table of Contents](#table-of-contents) - [Dataset Description](#dataset-description) - [Dataset Summary](#dataset-summary) - [Supported Tasks and Leaderboards](#supported-tasks-and-leaderboards) - [Languages](#languages) - [Dataset Structure](#dataset-structure) - [Data Instances](#data-instances) - [Data Fields](#data-fields) - [Data Splits](#data-splits) - [Dataset Creation](#dataset-creation) - [Curation Rationale](#curation-rationale) - [Source Data](#source-data) - [Annotations](#annotations) - [Personal and Sensitive Information](#personal-and-sensitive-information) - [Considerations for Using the Data](#considerations-for-using-the-data) - [Social Impact of Dataset](#social-impact-of-dataset) - [Discussion of Biases](#discussion-of-biases) - [Other Known Limitations](#other-known-limitations) - [Additional Information](#additional-information) - [Dataset Curators](#dataset-curators) - [Licensing Information](#licensing-information) - [Citation Information](#citation-information) - [Contributions](#contributions) ## Dataset Description - **Homepage:** https://github.com/fastai/imagenette#imagewoof - **Repository:** https://github.com/fastai/imagenette - **Leaderboard:** https://paperswithcode.com/sota/image-classification-on-imagewoof ### Dataset Summary A smaller subset of 10 classes from [Imagenet](https://huggingface.co/datasets/imagenet-1k#dataset-summary) that aren't so easy to classify, since they're all dog breeds. This dataset was created by [Jeremy Howard](https://twitter.com/jeremyphoward), and this repository is only there to share his work on this platform. The repository owner takes no credit of any kind in the creation, curation or packaging of the dataset. ### Supported Tasks and Leaderboards - `image-classification`: The dataset can be used to train a model for Image Classification. ### Languages The class labels in the dataset are in English. ## Dataset Structure ### Data Instances A data point comprises an image URL and its classification label. ``` { 'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=320x320 at 0x19FA12186D8>, 'label': 'Beagle', } ``` ### Data Fields - `image`: A `PIL.Image.Image` object containing the image. - `label`: the expected class label of the image. ### Data Splits | |train|validation| |---------|----:|---------:| |imagewoof| 9025| 3929| ## Dataset Creation ### Curation Rationale cf. https://huggingface.co/datasets/imagenet-1k#curation-rationale ### Source Data #### Initial Data Collection and Normalization Imagewoof is a subset of [ImageNet](https://huggingface.co/datasets/imagenet-1k). Information about data collection of the source data can be found [here](https://huggingface.co/datasets/imagenet-1k#initial-data-collection-and-normalization). ### Annotations #### Annotation process cf. https://huggingface.co/datasets/imagenet-1k#annotation-process #### Who are the annotators? cf. https://huggingface.co/datasets/imagenet-1k#who-are-the-annotators ### Personal and Sensitive Information cf. https://huggingface.co/datasets/imagenet-1k#personal-and-sensitive-information ## Considerations for Using the Data ### Social Impact of Dataset cf. https://huggingface.co/datasets/imagenet-1k#social-impact-of-dataset ### Discussion of Biases cf. https://huggingface.co/datasets/imagenet-1k#discussion-of-biases ### Other Known Limitations cf. https://huggingface.co/datasets/imagenet-1k#other-known-limitations ## Additional Information ### Dataset Curators cf. https://huggingface.co/datasets/imagenet-1k#dataset-curators and Jeremy Howard ### Licensing Information [Apache License 2.0](https://www.apache.org/licenses/LICENSE-2.0). ### Citation Information ``` @software{Howard_Imagewoof_2019, title={Imagewoof: a subset of 10 classes from Imagenet that aren't so easy to classify}, author={Jeremy Howard}, year={2019}, month={March}, publisher = {GitHub}, url = {https://github.com/fastai/imagenette#imagewoof} } ``` ### Contributions This dataset was created by [Jeremy Howard](https://twitter.com/jeremyphoward) and published on [Github](https://github.com/fastai/imagenette). It was then only integrated into HuggingFace Datasets by [@frgfm](https://huggingface.co/frgfm).

--- 注释创建者: - 众包 语言创建者: - 众包 语言: - 英语 许可证: - Apache-2.0 多语言性: [] 样本规模范畴: - 1000 < 样本数 < 10000 源数据集: - 扩展型 任务范畴: - 图像分类(image-classification) 任务子项: [] paperswithcode_id: imagewoof 友好名称: Imagewoof --- # Imagewoof数据集卡片 ## 目录 - [目录](#目录) - [数据集描述](#数据集描述) - [数据集概述](#数据集概述) - [支持任务与排行榜](#支持任务与排行榜) - [语言](#语言) - [数据集结构](#数据集结构) - [数据实例](#数据实例) - [数据字段](#数据字段) - [数据划分](#数据划分) - [数据集构建](#数据集构建) - [构建依据](#构建依据) - [源数据](#源数据) - [注释](#注释) - [个人与敏感信息](#个人与敏感信息) - [数据集使用注意事项](#数据集使用注意事项) - [数据集的社会影响](#数据集的社会影响) - [偏差讨论](#偏差讨论) - [其他已知局限性](#其他已知局限性) - [附加信息](#附加信息) - [数据集管护者](#数据集管护者) - [许可证信息](#许可证信息) - [引用信息](#引用信息) - [贡献说明](#贡献说明) ## 数据集描述 - **主页**: https://github.com/fastai/imagenette#imagewoof - **仓库**: https://github.com/fastai/imagenette - **排行榜**: https://paperswithcode.com/sota/image-classification-on-imagewoof ### 数据集概述 本数据集是从[ImageNet(Imagenet)](https://huggingface.co/datasets/imagenet-1k#dataset-summary)中选取的10个分类子集,因全部为犬类品种,分类难度较高。该数据集由[Jeremy Howard](https://twitter.com/jeremyphoward)创建,本仓库仅用于在本平台分享其相关工作,仓库维护者不对该数据集的创建、遴选或打包承担任何功劳。 ### 支持任务与排行榜 - `图像分类(image-classification)`: 本数据集可用于训练图像分类模型。 ### 语言 本数据集的分类标签采用英语。 ## 数据集结构 ### 数据实例 单个数据实例包含一张图像的URL及其分类标签。 { 'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=320x320 at 0x19FA12186D8>, 'label': 'Beagle', } ### 数据字段 - `image`: 包含图像的`PIL.Image.Image`对象。 - `label`: 图像对应的预期分类标签。 ### 数据划分 | | 训练集 | 验证集 | |---------|-------:|-------:| | imagewoof | 9025 | 3929 | ## 数据集构建 ### 构建依据 参见:https://huggingface.co/datasets/imagenet-1k#curation-rationale ### 源数据 #### 初始数据收集与归一化 Imagewoof是[ImageNet(Imagenet)](https://huggingface.co/datasets/imagenet-1k)的子集,源数据的收集相关信息可参见[此处](https://huggingface.co/datasets/imagenet-1k#initial-data-collection-and-normalization)。 ### 注释 #### 标注流程 参见:https://huggingface.co/datasets/imagenet-1k#annotation-process #### 标注人员构成 参见:https://huggingface.co/datasets/imagenet-1k#who-are-the-annotators ### 个人与敏感信息 参见:https://huggingface.co/datasets/imagenet-1k#personal-and-sensitive-information ## 数据集使用注意事项 ### 数据集的社会影响 参见:https://huggingface.co/datasets/imagenet-1k#social-impact-of-dataset ### 偏差讨论 参见:https://huggingface.co/datasets/imagenet-1k#discussion-of-biases ### 其他已知局限性 参见:https://huggingface.co/datasets/imagenet-1k#other-known-limitations ## 附加信息 ### 数据集管护者 参见:https://huggingface.co/datasets/imagenet-1k#dataset-curators 以及Jeremy Howard ### 许可证信息 [Apache许可证2.0](https://www.apache.org/licenses/LICENSE-2.0)。 ### 引用信息 @software{Howard_Imagewoof_2019, title={Imagewoof: a subset of 10 classes from Imagenet that aren't so easy to classify}, author={Jeremy Howard}, year={2019}, month={March}, publisher = {GitHub}, url = {https://github.com/fastai/imagenette#imagewoof} } ### 贡献说明 本数据集由[Jeremy Howard](https://twitter.com/jeremyphoward)创建并发布于[GitHub(Github)](https://github.com/fastai/imagenette),后由[@frgfm](https://huggingface.co/frgfm)集成至HuggingFace Datasets平台。
提供机构:
frgfm
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Imagewoof
  • 创建者: Jeremy Howard
  • 许可证: Apache-2.0
  • 语言: 英语
  • 数据集大小: 1K<n<10K
  • 任务类型: 图像分类

数据集内容

数据集摘要

Imagewoof 是一个包含10个类别的图像数据集,所有类别均为不同品种的狗。该数据集旨在提供一个挑战性较高的图像分类任务。

支持的任务

  • 图像分类: 用于训练图像分类模型。

数据集结构

数据实例

每个数据点包含一个图像和其对应的分类标签。

json { image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=320x320 at 0x19FA12186D8>, label: Beagle, }

数据字段

  • image: 一个 PIL.Image.Image 对象,包含图像数据。
  • label: 图像的预期分类标签。

数据分割

train validation
imagewoof 9025 3929

数据集创建

源数据

Imagewoof 是 ImageNet 的一个子集。关于源数据的收集和标准化信息,请参考 ImageNet 的相关描述。

许可证信息

数据集遵循 Apache License 2.0

引用信息

bibtex @software{Howard_Imagewoof_2019, title={Imagewoof: a subset of 10 classes from Imagenet that arent so easy to classify}, author={Jeremy Howard}, year={2019}, month={March}, publisher = {GitHub}, url = {https://github.com/fastai/imagenette#imagewoof} }

搜集汇总
数据集介绍
main_image_url
构建方式
Imagewoof数据集是由Jeremy Howard创建的,其构建基于ImageNet数据集的一个子集。该子集包含了10个分类较为困难的犬种类别。数据集的构建过程包括从ImageNet中筛选出特定犬种类别的图片,并对其进行标注,以形成可用于机器学习模型训练的数据集。
特点
该数据集的特点在于其专注于分类难度较高的犬种图片,这使得它在图像分类任务中具有挑战性。数据集采用Apache License 2.0进行许可,包含9025张训练图片和3929张验证图片,所有类标签均为英文。此外,数据集的构建旨在提供一个可用于研究和测试图像分类算法性能的基准。
使用方法
使用Imagewoof数据集时,用户可以直接从HuggingFace平台加载该数据集,并利用其提供的图片和标签进行模型的训练与验证。数据集以PIL图像对象的形式提供图片,并附带相应的类标签。用户可以通过标准的图像分类流程,包括数据预处理、模型设计、训练和评估,来利用该数据集进行相关研究或开发任务。
背景与挑战
背景概述
Imagewoof数据集,由Jeremy Howard于2019年创建,是ImageNet数据集的一个子集,包含10个相对难以分类的狗品种类别。该数据集旨在为图像分类任务提供一个更为聚焦的测试平台,其核心研究问题是如何在细粒度的图像分类任务中提升模型的性能。Imagewoof数据集自发布以来,在图像识别领域产生了积极影响,推动了细粒度图像分类技术的研究与应用。
当前挑战
该数据集面临的挑战主要在于其细粒度分类的难度,以及如何确保数据标注的准确性和一致性。在构建过程中,数据集的创建者需要解决如何从大规模的ImageNet数据集中筛选出具有相似性的细粒度类别的问题,并且还要考虑到数据标注的质量控制,以避免引入标注偏差。此外,数据集的多样性和平衡性也是构建过程中的一大挑战,这对于模型的无偏学习和泛化能力至关重要。
常用场景
经典使用场景
在计算机视觉领域,frgfm/imagewoof数据集被广泛用于图像分类任务的研究与实践。该数据集特别挑选了10个相对难以区分的犬种类别,为研究者提供了一个挑战性的测试平台,以评估和改进图像识别模型的性能。
解决学术问题
frgfm/imagewoof数据集解决了传统图像分类研究中类别区分度过高的问题,通过引入更细微的类别差异,它促使学术界深入探索模型在处理细粒度分类时的能力和局限性,进而推动相关算法的发展。
衍生相关工作
基于frgfm/imagewoof数据集,学术界衍生出了许多经典工作,如细粒度图像识别算法的研究、模型压缩与加速技术的探索,以及针对特定犬种识别的应用研究,这些都极大地丰富了图像分类领域的理论与实践。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作