five

cati-singapore-dataset

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/SuhxsReddy/cati-singapore-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
CATI新加坡高速公路交通数据集是一个实时车辆检测数据集,数据来自新加坡陆路交通管理局(LTA)的90个交通摄像头。该数据集使用CATI(上下文感知交通智能)系统收集,该系统基于改进的YOLOv11检测器,能够实时适应环境条件。数据集包含每台摄像头的车辆检测结果,涵盖车辆数量、类别细分、方向分流和环境上下文等信息。数据集覆盖新加坡多条高速公路,包括CTE、PIE、AYE等,共约90个摄像头。数据模式包括时间戳、摄像头ID、道路代码、经纬度、天气、总车辆数、各方向车辆数、车辆类型(如汽车、摩托车、公交车等)以及检测参数(如置信度阈值、IoU阈值等)。该数据集适用于智能城市、交通流量分析、车辆检测等计算机视觉任务。数据采集间隔约为90秒,采用MIT许可证,数据源自新加坡的开放数据API。
创建时间:
2026-04-14
原始信息汇总

CATI新加坡高速公路交通数据集概述

数据集基本信息

  • 数据集名称: CATI Singapore Expressway Traffic Dataset
  • 发布者: SuhxsReddy
  • 发布日期: 2026年
  • 许可证: MIT
  • 语言: 英语
  • 数据规模: 10K<n<100K

数据集描述

该数据集包含从新加坡陆路交通管理局高速公路摄像头网络持续收集的每摄像头车辆检测结果。每条记录捕获单个摄像头的完整检测扫描,包括车辆数量、类别细分、方向分流和环境上下文。

任务与标签

  • 任务类别: 目标检测
  • 任务ID: 车辆检测
  • 标签: traffic, singapore, expressway, smart-city, vehicle-detection, computer-vision, lta

数据覆盖范围

数据覆盖新加坡以下高速公路的约90个LTA交通摄像头:

  • CTE (Central Expressway): ~16个摄像头
  • PIE (Pan-Island Expressway): ~20个摄像头
  • AYE (Ayer Rajah Expressway): ~8个摄像头
  • ECP (East Coast Parkway): ~10个摄像头
  • MCE (Marina Coastal Expressway): ~4个摄像头
  • TPE (Tampines Expressway): ~8个摄像头
  • BKE (Bukit Timah Expressway): ~6个摄像头
  • KJE (Kranji Expressway): ~6个摄像头
  • SLE (Seletar Expressway): ~6个摄像头

数据模式

列名 类型 描述
timestamp string 检测时间戳 (SGT, UTC+8)
camera_id int LTA摄像头ID
road string 高速公路代码 (CTE, PIE, AYE等)
lat float 摄像头纬度 (WGS84)
lon float 摄像头经度 (WGS84)
weather string 捕获时新加坡中部天气状况
total_vehicles int 检测到的车辆总数
dir_a int 朝A方向行驶的车辆 (通过2帧IoU追踪)
dir_b int 朝B方向行驶的车辆
car int 检测到的汽车
motorcycle int 检测到的摩托车
bus int 检测到的公交车
truck int 检测到的卡车
van int 检测到的厢式货车
lorry int 检测到的货车
conf_threshold float 使用的检测置信度阈值
iou_threshold float 使用的NMS IoU阈值
imgsz int 推理图像大小 (像素)
model_version string 模型检查点标识符
dir_a_label string 人类可读的A方向标签 (例如"towards Woodlands")
dir_b_label string 人类可读的B方向标签 (例如"towards City")
is_ramp bool 如果摄像头可能在入口/出口匝道上则为True (邻近启发式)

检测模型

检测由CATI模型生成,这是一种新颖的架构,将FiLM层注入YOLOv11s中,根据实时环境元数据调节主干网络:

  • 天气状况和温度 (data.gov.sg)
  • 一天中的时间 (循环编码)
  • 摄像头GPS位置 (正弦位置编码)
  • PM2.5空气质量
  • 摄像头分辨率类别

模型权重: https://huggingface.co/SuhxsReddy/cati-singapore

数据加载方式

python from datasets import load_dataset import pandas as pd

ds = load_dataset("SuhxsReddy/cati-singapore-dataset") df = ds["train"].to_pandas()

按道路统计车辆

print(df.groupby("road")["total_vehicles"].mean())

CTE上的方向流量

cte = df[df["road"] == "CTE"] print(cte[["timestamp", "camera_id", "dir_a", "dir_b", "total_vehicles"]])

数据收集信息

  • 扫描间隔: ~90秒 (完整网络扫描)
  • 检测阈值: 置信度 ≥ 0.08, IoU ≤ 0.25
  • 图像来源: LTA Datamall Traffic Images API
  • 基础设施: HuggingFace Spaces (CPU), 持续24/7收集

数据来源与许可

  • 数据来源: 新加坡开放数据API
  • 数据许可: 新加坡开放数据许可证 (https://data.gov.sg/open-data-licence)

引用格式

bibtex @dataset{cati_singapore_2026, author = {SuhxsReddy}, title = {CATI Singapore Expressway Traffic Dataset}, year = {2026}, publisher = {HuggingFace}, url = {https://huggingface.co/datasets/SuhxsReddy/cati-singapore-dataset} }

搜集汇总
数据集介绍
main_image_url
构建方式
在智能交通系统研究领域,高质量的数据采集是模型训练与性能评估的基石。CATI新加坡高速公路交通数据集通过一种创新的实时采集框架构建而成,其核心是利用部署于新加坡陆路交通管理局网络中的约90个交通摄像头,结合专为环境自适应设计的CATI检测模型进行连续数据抓取。该模型采用FiLM条件化YOLOv11架构,能够依据实时天气、时间、地理位置及空气质量等多维度环境元数据动态调整检测特征,从而确保在不同环境条件下的检测鲁棒性。数据采集以约90秒为周期对整个摄像头网络进行全扫描,并严格遵循预设的检测置信度与交并比阈值,所有原始图像均源自新加坡的开放数据接口,通过自动化流水线实现全天候不间断收集与结构化处理。
特点
该数据集在交通流分析领域展现出多维度、高情境化的显著特点。它不仅提供了基础的车辆检测数量与类别细分,如轿车、摩托车、巴士等,还创新性地集成了方向性流量分割信息,通过两帧间交并比跟踪区分相向而行的车流,并辅以人类可读的方向标签。每条记录均关联了精确的时间戳、摄像头地理坐标以及中央新加坡地区的实时天气状况,从而构成了一个融合了视觉检测结果与丰富环境上下文的信息实体。此外,数据集通过版本标识符与采集参数(如置信度阈值、图像尺寸)的明确定义,支持研究者对数据一致性进行精细筛选,并为区分主干道与匝道路段的流量分析提供了布尔标识,极大增强了数据在复杂交通场景下的解析能力与科研实用性。
使用方法
为便利研究社区的接入与应用,该数据集已集成于HuggingFace平台,可通过标准化的`datasets`库进行便捷加载。用户仅需数行代码即可将数据载入为Pandas DataFrame格式,进而执行各类聚合分析与可视化操作。典型应用场景包括按高速公路代码分组计算平均车流量,或针对特定路段(如中央高速公路)深入剖析其双向车流随时间的变化模式。在使用过程中,建议研究者依据`conf_threshold`、`iou_threshold`及`imgsz`等字段对数据进行一致性窗口筛选,并在进行主线通行能力分析时排除标记为匝道的记录,以确保分析结果的准确性与可比性。数据集遵循MIT许可,为交通建模、城市规划及环境适应性计算机视觉研究提供了坚实的数据支撑。
背景与挑战
背景概述
智能交通系统作为智慧城市建设的核心支柱,其发展高度依赖于大规模、高质量的交通流数据。CATI新加坡高速公路交通数据集应运而生,由研究人员SuhxsReddy于2026年构建并发布,旨在通过新加坡陆路交通管理局部署的90个交通监控摄像头,实时采集高速公路车辆检测数据。该数据集的核心研究问题聚焦于如何利用上下文感知的计算机视觉技术,实现复杂动态环境下车辆检测的精准性与适应性,从而为交通流量分析、拥堵预测及城市交通管理策略优化提供数据基石,对推动实时交通智能分析领域具有显著影响力。
当前挑战
在智能交通领域,车辆检测任务长期面临环境动态变化带来的挑战,如光照条件、天气影响及摄像头视角差异,导致模型泛化能力受限。CATI数据集通过引入FiLM-conditioned YOLOv11架构,尝试解决这一领域核心问题,即如何使检测模型实时适应多变的环境上下文。在数据集构建过程中,挑战同样突出:需从分散的LTA摄像头网络中以约90秒间隔连续采集数据,并整合多源异构信息(如天气、空气质量及地理位置),同时确保检测阈值的一致性以维持数据质量,这些都对数据采集管道的稳定性与可扩展性提出了严格要求。
常用场景
经典使用场景
在智能交通系统研究领域,CATI新加坡高速公路交通数据集为车辆检测与流量分析提供了关键基准。该数据集通过整合新加坡陆路交通管理局的实时摄像头网络,结合环境上下文信息,支持对高速公路车辆进行精细化检测与分类。研究人员可基于此数据构建动态交通模型,评估不同天气、时间及位置条件下的车辆分布模式,进而优化交通流预测算法。
解决学术问题
该数据集有效解决了计算机视觉在复杂环境下的适应性挑战,通过引入FiLM-conditioned YOLOv11架构,实现了对多变天气、光照及地理位置的实时适应。其意义在于推动了上下文感知检测技术的发展,为交通工程领域提供了高精度、可扩展的车辆计数与分类解决方案,显著提升了智能城市研究中数据驱动的决策能力。
衍生相关工作
基于该数据集衍生的经典工作包括多模态交通预测模型的构建,其中融合了天气与时间序列数据以提升准确性。此外,研究人员利用其方向性流量标签开发了双向车流分析工具,并进一步探索了基于摄像头的车辆类型识别在智慧物流中的应用,推动了智能交通系统的跨领域创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作