five

Coding of Data Cleaning and Processing

收藏
doi.org2025-03-25 收录
下载链接:
http://doi.org/10.17632/xd74wbskxg.1
下载链接
链接失效反馈
官方服务:
资源简介:
The specific process was mainly implemented through the MySQL database. Some invalid data was removed. The first part of the removed data was incomplete and error data. Because these data could cause mistakes to the results. The second part of removed data was the trip over 60 minutes and 14 kilometers because these trips were considered personal use such as shopping instead of commuting. Finally, this research used a total of 437,053 trip records about public bike systems and 7,051 trip records about bike sharing systems as the dataset.

该数据集的具体处理过程主要通过 MySQL 数据库得以实现。其中,部分无效数据已被清除。首先,被清除的数据中包括不完整及错误的数据,此类数据可能对结果产生误导。其次,超过 60 分钟和 14 公里的行程数据亦被排除,因其被视为个人用途,如购物而非通勤。最终,本研究共采用了关于公共自行车系统的 437,053 条行程记录以及关于自行车共享系统的 7,051 条行程记录作为数据集。
提供机构:
doi.org
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作