Indian Food Delivery Dataset
收藏arXiv2025-03-19 更新2025-03-21 收录
下载链接:
https://www.kaggle.com/datasets/indraprastha/food-delivery-time-prediction
下载链接
链接失效反馈官方服务:
资源简介:
本研究使用的数据集名为Indian Food Delivery Dataset,由Indraprastha Institute of Information Technology, Delhi提供。该数据集包含了45,000条关于印度多个城市在线食品配送的记录,每条记录包含19个特征,如天气条件、道路交通密度、配送人员评分、餐厅和配送位置的经纬度坐标等。数据集适用于分析复杂的城市环境中的配送时间预测,特点是整合了实时交通数据、天气模式和地理信息。数据集的预处理包括处理缺失值、数据标准化和类型转换、特征提取和编码等步骤,最终形成了一个包含41,368条记录的干净数据集,用于进一步的探索性数据分析和模型训练。
The dataset used in this study is named Indian Food Delivery Dataset, provided by Indraprastha Institute of Information Technology, Delhi. This dataset comprises 45,000 records of online food delivery services across multiple cities in India, with each record including 19 features such as weather conditions, road traffic density, delivery partner ratings, and the latitude and longitude coordinates of restaurants and delivery locations. This dataset is suitable for delivery time prediction analysis in complex urban environments, and is characterized by its integration of real-time traffic data, weather patterns and geographic information. Preprocessing procedures for the dataset include handling missing values, data standardization and type conversion, feature extraction and encoding, among others. Finally, a cleaned dataset containing 41,368 records is obtained for further exploratory data analysis and model training.
提供机构:
Indraprastha Institute of Information Technology, Delhi
创建时间:
2025-03-19
搜集汇总
数据集介绍

构建方式
Indian Food Delivery Dataset 的构建基于印度多个城市的在线食品配送数据,数据来源于公开的Kaggle平台,包含45,000条记录,每条记录涵盖19个特征。数据集中不仅包含配送时间这一目标变量,还整合了天气条件、交通密度、配送人员评分、餐厅与配送地点的经纬度坐标等关键信息。通过严格的数据预处理流程,包括缺失值处理、数据标准化、特征提取与编码,最终生成了41,368条高质量记录,为后续的机器学习建模提供了坚实的基础。
特点
该数据集的特点在于其丰富的上下文信息和地理空间数据。它不仅涵盖了传统的静态特征,如配送人员年龄和车辆状况,还引入了动态的实时变量,如交通密度和天气条件。此外,数据集还包含了城市类型、节日标志等与印度城市环境密切相关的特征。这些多样化的特征使得该数据集特别适合用于研究复杂城市环境中的配送时间预测问题,尤其是针对印度城市特有的交通拥堵、天气多变等挑战。
使用方法
该数据集的使用方法主要包括数据预处理、特征选择、模型训练与验证。在预处理阶段,通过处理缺失值、标准化数据格式以及提取关键特征,确保数据的质量。特征选择阶段采用互信息准则筛选出对配送时间预测最具影响力的特征,如交通密度、天气条件和地理距离。随后,使用多种机器学习算法(如线性回归、随机森林、XGBoost和LightGBM)进行模型训练,并通过交叉验证和性能指标(如均方误差和R²分数)评估模型效果。最终,LightGBM模型表现出色,成为预测配送时间的最优选择。
背景与挑战
背景概述
Indian Food Delivery Dataset 是由印度信息技术学院德里分校的研究团队于2025年创建的,旨在解决印度城市中食物配送时间的预测问题。随着在线食品配送服务的快速增长,尤其是在印度城市中,准确预测配送时间对于提升客户满意度、优化运营效率和降低配送成本至关重要。该数据集包含了45,000条记录,涵盖了多个印度城市的配送数据,涉及天气条件、交通密度、配送人员评分、餐厅与配送地点的地理坐标等19个特征。研究团队通过整合实时上下文变量,如交通密度、天气条件和地理空间数据,显著提升了预测模型的准确性。该数据集的研究成果为复杂城市环境中的物流策略优化提供了有力支持。
当前挑战
Indian Food Delivery Dataset 面临的挑战主要集中在两个方面。首先,食物配送时间预测的复杂性在于其受到多种动态因素的影响,如交通拥堵、天气变化和突发性需求波动,这些因素在印度城市中尤为显著。传统的静态历史数据方法往往无法捕捉这些实时变化,导致预测结果不准确。其次,在数据集的构建过程中,研究人员需要处理大量的缺失值和数据不一致问题,特别是在天气条件和配送人员评分等关键特征上。此外,如何有效地整合实时交通和天气数据,并将其与地理空间信息结合,也是构建过程中面临的主要技术挑战。这些挑战要求研究人员在数据预处理和特征工程方面进行精细化的处理,以确保模型的预测精度和鲁棒性。
常用场景
经典使用场景
Indian Food Delivery Dataset 主要用于预测印度城市中的外卖送达时间。该数据集通过整合实时交通密度、天气状况、地理空间数据(如餐厅和送餐地点的坐标)等动态因素,帮助研究人员构建精确的预测模型。经典的使用场景包括利用机器学习算法(如LightGBM、XGBoost等)进行送达时间的预测,从而优化外卖平台的物流调度和资源分配。
实际应用
在实际应用中,该数据集被广泛应用于外卖平台的物流优化和客户体验提升。通过准确的送达时间预测,外卖平台可以动态调整配送路线,优化配送员的工作分配,减少配送延迟,从而提高客户满意度。此外,该数据集还为外卖平台提供了在恶劣天气或交通拥堵等特殊情况下的应对策略,帮助企业降低运营成本并提高效率。
衍生相关工作
该数据集衍生了许多相关研究工作,特别是在机器学习和物流优化领域。基于该数据集的研究成果,许多学者进一步探索了如何将实时数据(如交通和天气)与深度学习模型(如LSTM、Transformer)结合,以提升预测精度。此外,该数据集还激发了关于动态路由优化和实时配送调度的研究,推动了外卖物流领域的创新和发展。
以上内容由遇见数据集搜集并总结生成



