Zomato Dataset|餐厅评价数据集|消费行为分析数据集
收藏Zomato Project 数据集概述
数据集描述
- 数据来源: Zomato
- 分析目标: 分析餐厅评分、类型和成本
数据处理与分析
- 库:
- Pandas: 数据处理
- NumPy: 数值操作
- Matplotlib: 数据可视化
- Seaborn: 数据可视化
- 数据加载: 从CSV文件加载数据
- 数据清洗: 将评分列中的字符串转换为浮点数
可视化
- 餐厅类型计数图: 展示不同餐厅类型的数量
- 总投票数线图: 展示每种餐厅类型的总投票数
- 评分分布直方图: 展示评分的分布情况
- 两人用餐成本计数图: 展示两人用餐成本的分布
- 在线订购与评分关系箱线图: 展示在线订购可用性与餐厅评分的关系
- 餐厅类型与在线订购热力图: 展示餐厅类型与在线订购选项的交互关系
结论
- 通过多种可视化手段,揭示数据中的模式和洞察,使数据集更易于理解。

Obstacle-dataset OD
该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。
github 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
Houston2013, Berlin, Augsburg
本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。
arXiv 收录
用于陆面模拟的中国土壤数据集(第二版)
本研究对中国范围内0-2米六个标准深度层(0-5、5-15、15-30、30-60、60-100和100-200厘米)的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面,世界土壤信息服务的1540个土壤剖面,第一次全国土壤普查的76个土壤剖面,以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色(包括蒙赛尔颜色和RGB两种形式)。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供,有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求,CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量,可广泛应用于陆面过程模拟等地学相关研究。
国家青藏高原科学数据中心 收录
NOAA ISD
NOAA ISD(Integrated Surface Database)是由美国国家海洋和大气管理局(NOAA)维护的一个全球气象数据集。该数据集包含了从全球各地气象站收集的气象观测数据,包括温度、湿度、风速、气压等气象参数。数据涵盖了从1929年至今的长时间跨度,是气象研究和气候分析的重要数据来源。
www.ncei.noaa.gov 收录