Zomato Dataset|餐饮服务数据集|数据分析数据集
收藏Zomato 数据集概述
数据集概览
该数据集包含以下信息:
- 餐厅名称、位置和类型
- 菜系类型
- 两人平均消费
- 客户评分
- 投票数量
- 城市和国家详情
目标
该项目旨在分析 Zomato 数据集,提取以下方面的有意义见解:
- 餐厅评分的分布
- 受欢迎的菜系和餐厅类型
- 按城市和国家划分的餐厅地理分布
- 成本、评分和投票数量之间的相关性
步骤
-
数据加载: 使用 Google Colab 将数据集加载到 Pandas DataFrame 中。
-
数据清洗: 清理缺失值、重复条目和不相关数据。
-
探索性数据分析 (EDA):
- 可视化餐厅评分的分布。
- 识别最常见的菜系和餐厅类型。
- 分析不同城市和国家两人平均消费的差异。
- 探索评分、投票数量和成本之间的相关性。
-
可视化: 使用 Matplotlib 和 Seaborn 创建数据可视化,以识别模式和趋势。
技术使用
- Google Colab:用于运行 Python 代码的云端 Jupyter Notebook 环境。
- Python 库:
Pandas
:用于数据操作和分析。Matplotlib
和Seaborn
:用于数据可视化。NumPy
:用于数值操作。
运行项目
- 上传 Zomato 数据集或通过 Google Drive 链接。
- 在 Google Colab 中运行 Jupyter Notebook。
- 执行数据加载、清洗、分析和可视化的单元格。
见解
- 基于客户偏好的受欢迎菜系。
- 成本与评分之间的关系。
- 按城市和国家划分的餐厅分布。
- 影响高评分的关键因素。
结论
该项目提供了对 Zomato 餐厅数据的全面分析,有助于理解市场趋势、客户偏好和影响餐厅成功的因素。

AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录