Zomato Dataset|餐饮服务数据集|数据分析数据集
收藏Zomato 数据集概述
数据集概览
该数据集包含以下信息:
- 餐厅名称、位置和类型
- 菜系类型
- 两人平均消费
- 客户评分
- 投票数量
- 城市和国家详情
目标
该项目旨在分析 Zomato 数据集,提取以下方面的有意义见解:
- 餐厅评分的分布
- 受欢迎的菜系和餐厅类型
- 按城市和国家划分的餐厅地理分布
- 成本、评分和投票数量之间的相关性
步骤
-
数据加载: 使用 Google Colab 将数据集加载到 Pandas DataFrame 中。
-
数据清洗: 清理缺失值、重复条目和不相关数据。
-
探索性数据分析 (EDA):
- 可视化餐厅评分的分布。
- 识别最常见的菜系和餐厅类型。
- 分析不同城市和国家两人平均消费的差异。
- 探索评分、投票数量和成本之间的相关性。
-
可视化: 使用 Matplotlib 和 Seaborn 创建数据可视化,以识别模式和趋势。
技术使用
- Google Colab:用于运行 Python 代码的云端 Jupyter Notebook 环境。
- Python 库:
Pandas
:用于数据操作和分析。Matplotlib
和Seaborn
:用于数据可视化。NumPy
:用于数值操作。
运行项目
- 上传 Zomato 数据集或通过 Google Drive 链接。
- 在 Google Colab 中运行 Jupyter Notebook。
- 执行数据加载、清洗、分析和可视化的单元格。
见解
- 基于客户偏好的受欢迎菜系。
- 成本与评分之间的关系。
- 按城市和国家划分的餐厅分布。
- 影响高评分的关键因素。
结论
该项目提供了对 Zomato 餐厅数据的全面分析,有助于理解市场趋势、客户偏好和影响餐厅成功的因素。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
Pew Research Center Surveys
Pew Research Center Surveys 包含多个社会科学领域的调查数据,涵盖政治、社会、科技、宗教等多个主题。这些调查数据通常用于分析公众意见、态度和行为。
www.pewresearch.org 收录