five

Bus Open Data Rasters|公交数据数据集|交通分析数据集

收藏
github2024-05-21 更新2024-05-31 收录
公交数据
交通分析
下载链接:
https://github.com/cusp-london/bus-open-data-rasters
下载链接
链接失效反馈
资源简介:
本仓库包含通过DfT公交开放数据服务捕获的栅格数据,提供不同区域的GeoTIFF格式数据,包括每小时时间段的边界框定义,空间分辨率为50米。数据类型包括distinctJourneyCounts(行程计数)和averageSpeeds(平均速度),前者记录每个网格单元内特定时间段内进入的独立公交行程数量,后者计算公交车在连续观测之间的平均速度。

This repository contains raster data captured through the DfT Bus Open Data Service, providing GeoTIFF format data for different regions, including bounding box definitions for hourly time periods with a spatial resolution of 50 meters. The data types include distinctJourneyCounts (trip counts) and averageSpeeds (average speeds), where the former records the number of unique bus trips entering each grid cell within a specific time period, and the latter calculates the average speed of buses between consecutive observations.
创建时间:
2024-02-02
原始信息汇总

数据集概述

数据集名称

  • Bus Open Data Rasters

数据来源

数据格式

  • 提供的数据为GeoTIFF格式,按不同区域(由经纬度定义的边界框)和每小时时间段的50米空间分辨率。

数据类型

  1. distinctJourneyCounts(行程计数):指定时间段内每个网格方块中进入的不同公交行程(定义为车辆沿路线单向行驶)的数量。
  2. averageSpeeds(平均速度,米/秒):每分钟观察一次,链接同一公交行程内的观察,计算连续观察之间的平均速度。每个网格方块的值是所有交叉行程速度的平均值。

数据存储

  • 数据以压缩zip格式提供,zip文件名标识数据值、地理区域和日期范围。

数据可用性

  • 伦敦:提供多个时间段的平均速度和行程计数数据。
  • 东北:提供多个时间段的平均速度和行程计数数据。

时间范围

  • 伦敦:数据从2023年10月27日至2024年5月8日。
  • 东北:数据从2023年12月17日至2024年5月7日。

边界框定义

  • 伦敦:边界框由两组经纬度坐标定义。
  • 东北:边界框由两组经纬度坐标定义。

贡献者

许可证信息

AI搜集汇总
数据集介绍
main_image_url
构建方式
Bus Open Data Rasters数据集通过英国交通部(DfT)的Bus Open Data Service捕获,并以GeoTIFF文件格式存储。数据涵盖不同地理区域,由经纬度定义的边界框组成,时间分辨率为每小时,空间分辨率为50米。数据类型包括distinctJourneyCounts(行程计数)和averageSpeeds(平均速度)。distinctJourneyCounts记录每小时内进入每个网格的独立巴士行程数,而averageSpeeds则通过每分钟观测并计算连续观测间的平均速度。数据以压缩的zip文件形式提供,文件名标识了数据类型、地理区域和日期范围。
特点
该数据集的主要特点在于其高时空分辨率,能够提供详细的巴士行程和速度信息。数据覆盖伦敦和英格兰东北部的特定区域,具有明确的地理边界。此外,数据集采用GeoTIFF格式,便于地理信息系统(GIS)处理和分析。数据的时间范围从2023年10月27日至2024年5月8日,涵盖了多个季节和天气条件,增加了数据的多样性和应用潜力。
使用方法
使用该数据集时,建议采用Python编程语言,并结合rasterio包进行数据读取和处理。例如,可以通过编写脚本生成数据的可视化动画,展示特定时间段内巴士行程的动态变化。数据集的详细使用方法包括加载指定日期和区域的数据文件,计算并绘制最大值,以及通过动画展示数据的时间序列变化。通过这些方法,用户可以深入分析巴士交通的时空特征,为城市交通管理和规划提供科学依据。
背景与挑战
背景概述
Bus Open Data Rasters数据集由CUSP London的Peter Baudains开发,旨在通过英国交通部(DfT)的Bus Open Data Service收集和提供公交系统的栅格数据。该数据集创建于2023年,涵盖了伦敦和英格兰东北部的特定区域,提供了每小时时间分辨率为50米的栅格数据,包括不同区域的公交旅程计数和平均速度。这些数据对于研究城市交通流量、优化公交路线以及提升公共交通效率具有重要意义,为城市规划和交通管理提供了宝贵的信息资源。
当前挑战
Bus Open Data Rasters数据集在构建过程中面临多项挑战。首先,数据采集需在不同地理区域进行,确保数据的全面性和代表性。其次,数据处理需在每小时的时间分辨率下进行,这对数据存储和计算能力提出了较高要求。此外,数据的质量控制和一致性维护也是一大挑战,以确保分析结果的准确性和可靠性。最后,数据的可视化和解释性工具的开发,以帮助研究人员和决策者更好地理解和利用这些复杂的数据,也是当前需要解决的问题。
常用场景
经典使用场景
在交通规划与管理领域,Bus Open Data Rasters数据集的经典使用场景主要体现在对公共交通系统的实时监控与优化。通过分析不同时间段内公交车辆的行驶速度和行程次数,研究人员和城市规划者能够精确评估交通流量、识别拥堵区域,并制定相应的调度策略。例如,利用该数据集生成的动画可以直观展示特定区域内公交车的动态分布,为决策者提供有力的数据支持。
衍生相关工作
Bus Open Data Rasters数据集的发布催生了多项相关研究与应用。例如,基于该数据集的交通流量预测模型被广泛应用于智能交通系统中,提高了交通管理的精准度。同时,研究人员利用数据集中的高分辨率信息,开发了多种交通拥堵预警系统,为城市交通的实时监控提供了新的工具。此外,该数据集还促进了公共交通优化算法的研究,推动了城市交通规划的科学化进程。
数据集最近研究
最新研究方向
在公共交通领域,Bus Open Data Rasters数据集的最新研究方向主要集中在利用高分辨率时空数据进行城市交通管理和优化。该数据集提供了伦敦和英格兰东北部地区的公交车辆行驶速度和行程次数的栅格数据,这些数据为研究者提供了深入分析城市交通流动性和效率的宝贵资源。当前的研究趋势包括利用机器学习和地理信息系统(GIS)技术,对这些数据进行实时分析,以预测交通拥堵、优化公交路线和调度,以及评估城市交通政策的效果。此外,该数据集还被用于开发智能交通系统(ITS),通过提供精确的交通数据支持城市规划和决策,从而提升公共交通的服务质量和效率。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

TIMIT

TIMIT 阅读语音语料库的开发旨在为声学语音研究和自动语音识别系统的评估提供语音数据。 TIMIT 包含 630 个人/说话者的 8 种不同美式英语方言的高质量录音,每个人阅读多达 10 个语音丰富的句子。

OpenDataLab 收录

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录