bharat-raghunathan/indian-foods-dataset
收藏Hugging Face2023-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bharat-raghunathan/indian-foods-dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个多类别(多类分类)的印度食物数据集,展示了15种不同的印度食物。数据集包含图片和对应的标签,分为训练集和测试集,分别有3809和961个样本。所有图片都被调整为300x300的大小以保持一致性。数据集是通过从Google Images抓取数据并结合一些JS函数来收集的。数据集的创建者是Anshul Mehta,并且数据集使用CC0许可证,属于公共领域。
许可证:CC0 1.0
数据集详情:
数据特征:
- 名称:image(图像),数据类型:图像
- 名称:label(标签),数据类型为分类标签(class_label),类别名称如下:
'0': biryani(比尔亚尼香饭)
'1': cholebhature(鹰嘴豆咖喱配炸饼)
'2': dabeli(达贝利小吃)
'3': dal(达尔咖喱)
'4': dhokla(多克拉蒸糕)
'5': dosa(多萨煎饼)
'6': jalebi(贾勒比甜饼)
'7': kathiroll(卡蒂卷饼)
'8': kofta(库夫塔肉丸料理)
'9': naan(南馕饼)
'10': pakora(帕科拉炸素菜)
'11': paneer(帕尼尔芝士料理)
'12': panipuri(帕尼普里空心球小吃)
'13': pavbhaji(帕夫巴吉蔬菜咖喱配面包)
'14': vadapav(瓦达帕夫炸饼配面包)
数据集划分:
- 训练集(train):数据字节数611741947.222,样本量3809
- 测试集(test):数据字节数153961285,样本量961
下载大小:688922167,数据集总大小:765703232.222
任务范畴:图像分类(image-classification)、文本到图像生成(text-to-image)
支持语言:英语(en)
展示名称:indian-foods → 印度美食数据集
样本量区间:1K<n<10K → 样本量介于1000至10000之间
# 印度美食数据集卡片
## 数据集说明
- **主页**:https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset
- **代码仓库**:https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset
- **相关论文**:无
- **排行榜**:无
- **联系方式**:https://www.kaggle.com/anshulmehtakaggl
### 数据集概述
本数据集为适用于多分类任务的印度美食数据集,源自[The-massive-Indian-Food-Dataset](https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset)。本数据集卡片基于[该原始模板](https://github.com/huggingface/huggingface_hub/blob/main/src/huggingface_hub/templates/datasetcard_template.md?plain=1)生成。
### 支持任务与排行榜
[需补充更多信息]
### 语言
英语
## 数据集结构
json
{
"image": "Image(解码=True, id=None)",
"target": "ClassLabel(类别名称=['biryani', 'cholebhature', 'dabeli', 'dal', 'dhokla', 'dosa', 'jalebi', 'kathiroll', 'kofta', 'naan', 'pakora', 'paneer', 'panipuri', 'pavbhaji', 'vadapav'], id=None)"
}
### 数据集划分
本数据集划分为训练集与测试集,划分规模如下:
| 划分名称 | 样本数量 |
| ------- | ------- |
| train(训练集) | 3809 |
| test(测试集) | 961 |
### 数据实例
每条数据包含一张印度美食的实拍图片,以及其对应的菜品类别标签。
#### 初始数据收集与标准化流程
通过抓取谷歌图片数据并结合部分JavaScript函数完成数据采集。所有图像均被统一调整至(300, 300)像素尺寸以保证规格统一。
### 数据集制作方
[Anshul Mehta](https://www.kaggle.com/anshulmehtakaggl)
### 许可信息
[CC0:公共领域](https://creativecommons.org/publicdomain/zero/1.0/)
### 引用信息
[The Massive Indian Foods Dataset](https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset)
提供机构:
bharat-raghunathan
原始信息汇总
数据集概述
数据集名称
- 名称: Indian Foods Dataset
- 别名: The Massive Indian Food Dataset
数据集内容
- 类型: 图像分类
- 特征:
- image: 图像数据
- label: 类别标签,包含以下类别:
- 0: biryani
- 1: cholebhature
- 2: dabeli
- 3: dal
- 4: dhokla
- 5: dosa
- 6: jalebi
- 7: kathiroll
- 8: kofta
- 9: naan
- 10: pakora
- 11: paneer
- 12: panipuri
- 13: pavbhaji
- 14: vadapav
数据集结构
- 分割:
- train: 3809样本
- test: 961样本
数据集大小
- 下载大小: 688922167字节
- 数据集大小: 765703232.222字节
许可信息
- 许可证: CC0-1.0 (公共领域)
语言
- 语言: 英语
任务类别
- 任务:
- 图像分类
- 文本到图像
数据收集和规范化
- 收集方法: 通过Google Images抓取数据,并利用JavaScript函数
- 规范化: 所有图像大小调整为(300,300)以保持大小一致性
数据集创建者
- 创建者: Anshul Mehta



