five

foody_API_data|餐饮数据数据集|数据收集数据集

收藏
github2022-12-17 更新2024-05-31 收录
餐饮数据
数据收集
下载链接:
https://github.com/InventN/foody_API_data
下载链接
链接失效反馈
资源简介:
该数据集包含了从胡志明市24个区收集的餐馆信息和评论数据,以及详细的餐馆信息和菜单数据,分为多个CSV文件存储。

This dataset encompasses restaurant information and review data collected from 24 districts in Ho Chi Minh City, along with detailed restaurant information and menu data, stored across multiple CSV files.
创建时间:
2022-09-20
原始信息汇总

数据集概述

主数据集

  • 文件名: data_hcm_final.csv
  • 行数: 93048
  • 列数: 52
  • 内容: 包含胡志明市24个区的餐厅信息及评论数据。

菜单相关数据集

  • 文件名: menu.csv

  • 行数: 242290

  • 列数: 3

  • 文件名: menu_dish.csv

  • 行数: 1676636

  • 列数: 8

  • 文件名: menu_dish_option.csv

  • 行数: 1986132

  • 列数: 7

  • 文件名: menu_dish_option_item.csv

  • 行数: 4885649

  • 列数: 7

数据集内容

  • 主数据集包含餐厅基本信息及用户评论。
  • 菜单相关数据集详细记录了菜单、菜品及其选项的信息。
AI搜集汇总
数据集介绍
main_image_url
构建方式
foody_API_data数据集的构建过程始于从胡志明市的24个区域进行数据抓取,主要聚焦于餐饮店铺信息和用户评论。通过整合这些抓取的数据,生成了包含93048行和52列的`data_hcm_final.csv`文件。此外,为了更细致地展示每家餐厅的详细信息及其菜单,数据集进一步细分为四个文件:`menu.csv`、`menu_dish.csv`、`menu_dish_option.csv`和`menu_dish_option_item.csv`,分别记录了菜单、菜品、菜品选项及选项具体内容。
特点
该数据集的特点在于其全面性和细致性。它不仅涵盖了广泛的餐饮店铺信息,还包括了丰富的用户评论数据,为研究餐饮市场和消费者行为提供了宝贵资源。此外,通过将菜单信息细分为多个层次,数据集能够提供从宏观到微观的餐饮服务分析视角,极大地增强了数据的应用价值和研究的深度。
使用方法
使用foody_API_data数据集时,研究者或开发者首先应加载`data_hcm_final.csv`以获取餐饮店铺和用户评论的概览信息。随后,可以通过分析`menu.csv`及其相关文件来深入探讨特定餐厅的菜单结构和菜品细节。这种分层次的数据结构使得用户能够根据研究需求灵活选择数据深度,从而进行市场分析、消费者偏好研究或餐饮服务优化等多种应用。
背景与挑战
背景概述
foody_API_data数据集聚焦于餐饮行业的数据收集与分析,旨在通过整合餐厅信息与用户评论,为餐饮市场研究提供详实的数据支持。该数据集由越南胡志明市的24个区域的数据构成,涵盖了餐厅的基本信息、菜单详情以及用户评论等多维度数据。其创建时间与主要研究人员虽未明确提及,但可以推测其背后团队致力于通过大数据技术深入挖掘餐饮行业的市场动态与消费者偏好。该数据集的发布,无疑为餐饮行业的市场分析、消费者行为研究以及商业决策提供了宝贵的数据资源。
当前挑战
foody_API_data数据集在构建过程中面临多重挑战。首先,数据的采集与整合涉及大量餐厅与用户评论信息,如何确保数据的完整性与准确性是一大难题。其次,数据集的规模庞大,包含数百万条记录,这对数据的存储、处理与分析提出了高要求。此外,餐饮行业的数据具有高度的动态性与多样性,如何有效捕捉并分析这些变化,以提供有价值的市场洞察,是数据集应用中的一大挑战。最后,用户评论的情感分析与语义理解,也是数据集在应用过程中需要克服的技术难题。
常用场景
经典使用场景
在餐饮业数据分析领域,foody_API_data数据集被广泛应用于研究餐厅的运营模式和顾客偏好。通过分析包含93048条记录的`data_hcm_final.csv`文件,研究者能够深入探讨不同地区餐厅的分布特征及其与顾客评价之间的关系。
实际应用
在实际应用中,foody_API_data数据集被餐饮连锁企业用于优化菜单设计和提升顾客满意度。通过分析`menu.csv`和相关的菜单项文件,企业能够识别最受欢迎的菜品和潜在的改进点,进而制定更有效的营销策略。
衍生相关工作
基于foody_API_data数据集,多项研究已经展开,包括餐厅推荐系统的开发和顾客评论的情感分析。这些研究不仅丰富了餐饮数据分析的方法论,也为相关技术的商业化应用提供了坚实的基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

CMNEE(Chinese Military News Event Extraction dataset)

CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录