bharat-raghunathan/indian-foods-dataset

Name: bharat-raghunathan/indian-foods-dataset
Creator: bharat-raghunathan
Published: 2023-03-26 08:58:10
License: 暂无描述

Hugging Face2023-03-26 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/bharat-raghunathan/indian-foods-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个多类别（多类分类）的印度食物数据集，展示了15种不同的印度食物。数据集包含图片和对应的标签，分为训练集和测试集，分别有3809和961个样本。所有图片都被调整为300x300的大小以保持一致性。数据集是通过从Google Images抓取数据并结合一些JS函数来收集的。数据集的创建者是Anshul Mehta，并且数据集使用CC0许可证，属于公共领域。

许可证：CC0 1.0 数据集详情：数据特征： - 名称：image（图像），数据类型：图像 - 名称：label（标签），数据类型为分类标签（class_label），类别名称如下： '0': biryani（比尔亚尼香饭） '1': cholebhature（鹰嘴豆咖喱配炸饼） '2': dabeli（达贝利小吃） '3': dal（达尔咖喱） '4': dhokla（多克拉蒸糕） '5': dosa（多萨煎饼） '6': jalebi（贾勒比甜饼） '7': kathiroll（卡蒂卷饼） '8': kofta（库夫塔肉丸料理） '9': naan（南馕饼） '10': pakora（帕科拉炸素菜） '11': paneer（帕尼尔芝士料理） '12': panipuri（帕尼普里空心球小吃） '13': pavbhaji（帕夫巴吉蔬菜咖喱配面包） '14': vadapav（瓦达帕夫炸饼配面包）数据集划分： - 训练集（train）：数据字节数611741947.222，样本量3809 - 测试集（test）：数据字节数153961285，样本量961 下载大小：688922167，数据集总大小：765703232.222 任务范畴：图像分类（image-classification）、文本到图像生成（text-to-image）支持语言：英语（en）展示名称：indian-foods → 印度美食数据集样本量区间：1K<n<10K → 样本量介于1000至10000之间 # 印度美食数据集卡片 ## 数据集说明 - **主页**：https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset - **代码仓库**：https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset - **相关论文**：无 - **排行榜**：无 - **联系方式**：https://www.kaggle.com/anshulmehtakaggl ### 数据集概述本数据集为适用于多分类任务的印度美食数据集，源自[The-massive-Indian-Food-Dataset](https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset)。本数据集卡片基于[该原始模板](https://github.com/huggingface/huggingface_hub/blob/main/src/huggingface_hub/templates/datasetcard_template.md?plain=1)生成。 ### 支持任务与排行榜 [需补充更多信息] ### 语言英语 ## 数据集结构 json { "image": "Image(解码=True, id=None)", "target": "ClassLabel(类别名称=['biryani', 'cholebhature', 'dabeli', 'dal', 'dhokla', 'dosa', 'jalebi', 'kathiroll', 'kofta', 'naan', 'pakora', 'paneer', 'panipuri', 'pavbhaji', 'vadapav'], id=None)" } ### 数据集划分本数据集划分为训练集与测试集，划分规模如下： | 划分名称 | 样本数量 | | ------- | ------- | | train（训练集） | 3809 | | test（测试集） | 961 | ### 数据实例每条数据包含一张印度美食的实拍图片，以及其对应的菜品类别标签。 #### 初始数据收集与标准化流程通过抓取谷歌图片数据并结合部分JavaScript函数完成数据采集。所有图像均被统一调整至(300, 300)像素尺寸以保证规格统一。 ### 数据集制作方 [Anshul Mehta](https://www.kaggle.com/anshulmehtakaggl) ### 许可信息 [CC0：公共领域](https://creativecommons.org/publicdomain/zero/1.0/) ### 引用信息 [The Massive Indian Foods Dataset](https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset)

提供机构：

bharat-raghunathan

原始信息汇总

数据集概述

数据集名称

名称: Indian Foods Dataset
别名: The Massive Indian Food Dataset

数据集内容

类型: 图像分类
特征:
- image: 图像数据
- label: 类别标签，包含以下类别：
  - 0: biryani
  - 1: cholebhature
  - 2: dabeli
  - 3: dal
  - 4: dhokla
  - 5: dosa
  - 6: jalebi
  - 7: kathiroll
  - 8: kofta
  - 9: naan
  - 10: pakora
  - 11: paneer
  - 12: panipuri
  - 13: pavbhaji
  - 14: vadapav

数据集结构

分割:
- train: 3809样本
- test: 961样本

数据集大小

下载大小: 688922167字节
数据集大小: 765703232.222字节

许可信息

许可证: CC0-1.0 (公共领域)

语言

语言: 英语

任务类别

任务:
- 图像分类
- 文本到图像

数据收集和规范化

收集方法: 通过Google Images抓取数据，并利用JavaScript函数
规范化: 所有图像大小调整为(300,300)以保持大小一致性

数据集创建者

创建者: Anshul Mehta

5,000+

优质数据集

54 个

任务类型

进入经典数据集