five

bharat-raghunathan/indian-foods-dataset

收藏
Hugging Face2023-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bharat-raghunathan/indian-foods-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个多类别(多类分类)的印度食物数据集,展示了15种不同的印度食物。数据集包含图片和对应的标签,分为训练集和测试集,分别有3809和961个样本。所有图片都被调整为300x300的大小以保持一致性。数据集是通过从Google Images抓取数据并结合一些JS函数来收集的。数据集的创建者是Anshul Mehta,并且数据集使用CC0许可证,属于公共领域。

许可证:CC0 1.0 数据集详情: 数据特征: - 名称:image(图像),数据类型:图像 - 名称:label(标签),数据类型为分类标签(class_label),类别名称如下: '0': biryani(比尔亚尼香饭) '1': cholebhature(鹰嘴豆咖喱配炸饼) '2': dabeli(达贝利小吃) '3': dal(达尔咖喱) '4': dhokla(多克拉蒸糕) '5': dosa(多萨煎饼) '6': jalebi(贾勒比甜饼) '7': kathiroll(卡蒂卷饼) '8': kofta(库夫塔肉丸料理) '9': naan(南馕饼) '10': pakora(帕科拉炸素菜) '11': paneer(帕尼尔芝士料理) '12': panipuri(帕尼普里空心球小吃) '13': pavbhaji(帕夫巴吉蔬菜咖喱配面包) '14': vadapav(瓦达帕夫炸饼配面包) 数据集划分: - 训练集(train):数据字节数611741947.222,样本量3809 - 测试集(test):数据字节数153961285,样本量961 下载大小:688922167,数据集总大小:765703232.222 任务范畴:图像分类(image-classification)、文本到图像生成(text-to-image) 支持语言:英语(en) 展示名称:indian-foods → 印度美食数据集 样本量区间:1K<n<10K → 样本量介于1000至10000之间 # 印度美食数据集卡片 ## 数据集说明 - **主页**:https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset - **代码仓库**:https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset - **相关论文**:无 - **排行榜**:无 - **联系方式**:https://www.kaggle.com/anshulmehtakaggl ### 数据集概述 本数据集为适用于多分类任务的印度美食数据集,源自[The-massive-Indian-Food-Dataset](https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset)。本数据集卡片基于[该原始模板](https://github.com/huggingface/huggingface_hub/blob/main/src/huggingface_hub/templates/datasetcard_template.md?plain=1)生成。 ### 支持任务与排行榜 [需补充更多信息] ### 语言 英语 ## 数据集结构 json { "image": "Image(解码=True, id=None)", "target": "ClassLabel(类别名称=['biryani', 'cholebhature', 'dabeli', 'dal', 'dhokla', 'dosa', 'jalebi', 'kathiroll', 'kofta', 'naan', 'pakora', 'paneer', 'panipuri', 'pavbhaji', 'vadapav'], id=None)" } ### 数据集划分 本数据集划分为训练集与测试集,划分规模如下: | 划分名称 | 样本数量 | | ------- | ------- | | train(训练集) | 3809 | | test(测试集) | 961 | ### 数据实例 每条数据包含一张印度美食的实拍图片,以及其对应的菜品类别标签。 #### 初始数据收集与标准化流程 通过抓取谷歌图片数据并结合部分JavaScript函数完成数据采集。所有图像均被统一调整至(300, 300)像素尺寸以保证规格统一。 ### 数据集制作方 [Anshul Mehta](https://www.kaggle.com/anshulmehtakaggl) ### 许可信息 [CC0:公共领域](https://creativecommons.org/publicdomain/zero/1.0/) ### 引用信息 [The Massive Indian Foods Dataset](https://www.kaggle.com/datasets/anshulmehtakaggl/themassiveindianfooddataset)
提供机构:
bharat-raghunathan
原始信息汇总

数据集概述

数据集名称

  • 名称: Indian Foods Dataset
  • 别名: The Massive Indian Food Dataset

数据集内容

  • 类型: 图像分类
  • 特征:
    • image: 图像数据
    • label: 类别标签,包含以下类别:
      • 0: biryani
      • 1: cholebhature
      • 2: dabeli
      • 3: dal
      • 4: dhokla
      • 5: dosa
      • 6: jalebi
      • 7: kathiroll
      • 8: kofta
      • 9: naan
      • 10: pakora
      • 11: paneer
      • 12: panipuri
      • 13: pavbhaji
      • 14: vadapav

数据集结构

  • 分割:
    • train: 3809样本
    • test: 961样本

数据集大小

  • 下载大小: 688922167字节
  • 数据集大小: 765703232.222字节

许可信息

  • 许可证: CC0-1.0 (公共领域)

语言

  • 语言: 英语

任务类别

  • 任务:
    • 图像分类
    • 文本到图像

数据收集和规范化

  • 收集方法: 通过Google Images抓取数据,并利用JavaScript函数
  • 规范化: 所有图像大小调整为(300,300)以保持大小一致性

数据集创建者

  • 创建者: Anshul Mehta
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作