five

csai-datagathering

收藏
github2025-05-02 更新2025-05-08 收录
下载链接:
https://github.com/VIDA-NYU/csai-datagathering
下载链接
链接失效反馈
官方服务:
资源简介:
该仓库跟踪USDOT Complete Streets Artificial Intelligence (CSAI) Initiative — Phase I的数据生成和增强进展。目标是生成三个关键类别的地理空间数据集:基础设施、旅行者行为/安全和上下文,以支持多模式交通规划的决策工具。

This repository tracks the progress of data generation and enhancement for the USDOT Complete Streets Artificial Intelligence (CSAI) Initiative, Phase I. The goal is to produce three key categories of geospatial datasets: infrastructure, traveler behavior/safety and context, to support decision-making tools for multi-modal transportation planning.
创建时间:
2025-04-22
原始信息汇总

数据集概述

数据集基本信息

  • 项目名称: Complete Streets Artificial Intelligence (CSAI) Initiative — Phase I
  • 目标: 生成地理空间数据集,支持多模式交通规划决策工具
  • 覆盖范围: 至少250,000人口的地理区域

数据类别与进度

🛣️ 基础设施

待生成或增强数据

  • 道路特征
    • 中心线道路网络
    • 行驶方向、车道数量、车道标记和宽度、路肩宽度、边缘条件障碍物、护栏
    • 中段、交叉口接近段和通过交叉口条件(转弯半径、转弯车道、交叉口标记、交叉口格式)
  • 信号、标记、标志(包括限速标志)
  • 信号定时和相位
  • 人行道、人行横道、车道、路缘坡道、隔离带、避难所、路缘扩展
  • 公交车站无障碍(ADA)设施
  • 自行车设施及类型
  • 速度管理对策(已完成:纽约市的速度驼峰和速度表)
  • 人行道表面状况
  • 行人和自行车设施内的固定障碍物
  • 路边管理(停车、装卸)
  • 多用途路径和可穿越的公共开放空间

一般可用数据

  • 公交站点和路线
  • 铁路路线和交叉口

🚶 旅行者行为/安全

待生成或增强数据

  • 车辆数量和类型
  • 车辆运行速度和速度分布
  • 自行车和行人用户/行程计数
  • 公交乘客量

一般可用数据

  • 碰撞数据(进行中)
  • 伤害、伤害严重程度和未遂事件(已完成)

🌆 环境

待生成或增强数据

  • 土地利用
  • 树木覆盖/景观
  • 城市设计/临街面

一般可用数据

  • 关键目的地
  • 住房和就业密度
  • 环境因素
  • 社会健康决定因素
  • 社会经济和人口数据(进行中)
  • 环境正义和交通弱势社区
  • 地形
  • 指定货物运输路线

备注

  • 复选框将根据数据获取、生成和验证的进展进行更新。
  • 欢迎贡献和提出问题。
搜集汇总
数据集介绍
main_image_url
构建方式
在智能交通系统快速发展的背景下,csai-datagathering数据集采用多源异构数据融合技术构建而成。该数据集围绕美国交通部完整街道人工智能计划(CSAI)第一阶段目标,通过整合地理空间数据采集、政府公开数据对接以及实地传感器部署三种方式,系统性地覆盖了基础设施、出行行为/安全、环境背景三大核心维度。数据采集范围严格遵循服务至少25万人口区域的标准,并采用渐进式更新机制确保数据时效性,每个子类别的完成状态均通过标准化检查清单实时追踪。
特点
作为支持多模式交通规划的综合性数据集,csai-datagathering展现出鲜明的结构化特征与领域专属性。其数据层级设计严格对应交通规划决策需求,包含从道路几何特征到社会经济指标的87个精细要素,其中速度管理措施、事故数据等关键字段已完成纽约市域的专项验证。数据集创新性地将传统交通要素(如车道标记)与新兴评估指标(如热岛效应)进行空间关联,并通过WIP标注体系清晰标识不同阶段的处理状态,为研究者提供透明的数据质量评估依据。
使用方法
该数据集主要服务于智慧城市与交通规划领域的算法开发与政策分析。使用者可通过GitHub仓库的进度清单快速定位可用数据模块,其中标有[x]的要素可直接调用,而[ ]标记的要素则需结合问题跟踪系统提交补充请求。对于行为安全类数据,建议优先采用已完成工作进程(WIP)标注的伤害事故模块,该部分已实现与地理信息系统的空间匹配。所有环境背景数据均附带元数据说明,研究者应根据具体分析尺度选择社区级或路段级的聚合方案。
背景与挑战
背景概述
csai-datagathering数据集由美国交通部(USDOT)Complete Streets人工智能倡议(CSAI)第一阶段项目组创建,旨在构建多模态交通规划决策支持工具所需的综合地理空间数据库。该数据集聚焦于基础设施、出行行为/安全及环境背景三大核心维度,覆盖至少25万人口区域的多源异构数据整合。项目通过系统化采集道路特征、交通信号、行人设施等精细化要素,结合交通事故、车速分布等动态行为指标,以及土地利用、社会经济等环境变量,为智慧街道设计提供数据驱动的分析基础。其创新性在于首次将人工智能技术与街道全要素数字化相结合,对提升城市交通公平性与安全性具有重要实践意义。
当前挑战
该数据集构建面临双重挑战:在领域问题层面,多模态交通要素的异构性导致数据标准不统一,如自行车设施分类体系与行人无障碍特征的语义差异;动态行为数据(如近事故记录)的稀疏性和时空粒度不匹配也制约分析精度。在技术实施层面,地理空间数据的多源融合存在坐标系转换偏差,纽约市特有的减速带分类标准与其他区域不兼容;非结构化数据(如街景图像识别的路面裂缝)的标注成本高昂,且ADA无障碍设施参数的采集涉及专业测量设备部署。社会经济数据与交通要素的时空对齐同样面临统计单元不一致的难题。
常用场景
经典使用场景
在智能交通系统研究中,csai-datagathering数据集为多模态交通规划提供了关键的地理空间数据支持。数据集涵盖了基础设施、出行行为与安全、环境背景三大类数据,尤其适用于分析城市街道设计的完整性与安全性。研究人员可以基于这些数据构建决策支持工具,优化交通网络设计,提升行人、自行车和机动车的共存效率。
衍生相关工作
基于该数据集衍生的经典研究包括《多模态街道安全评估指标体系构建》,其创新性地将道路基础设施细粒度特征与事故严重程度建立关联模型。另有学者开发了街道可步行性指数算法,整合人行道状况、过街设施密度等数据维度,成为智慧城市评估的重要参考工具。
数据集最近研究
最新研究方向
在智能交通系统领域,csai-datagathering数据集正推动多模态交通规划的革新。该数据集聚焦基础设施、出行行为/安全及环境背景三大核心维度,通过高精度地理空间数据层构建,为人工智能驱动的决策支持工具提供底层支撑。近期研究热点集中在基于计算机视觉的道路特征自动化识别、多源异构交通数据融合技术,以及社会公平性指标与交通安全预测模型的耦合分析。特别是在速度管理措施、交通事故严重性预测等标注数据的应用上,为缓解城市交通痛点提供了量化研究基础。随着美国交通部CSAII项目的推进,该数据集正成为探索可解释性AI在公共政策中落地的关键实验平台。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作