five

MSDR (Multi-Scenario Driving Route dataset)

收藏
github2025-09-09 更新2025-09-10 收录
下载链接:
https://github.com/AMAP-ML/DSFNet
下载链接
链接失效反馈
官方服务:
资源简介:
MSDR是第一个大规模公开可用的标注工业多场景驾驶路线数据集,包含从中国八个大城市(北京、上海、广州、杭州、武汉、郑州、重庆和成都)采样的数据。每个数据样本包含丰富的路线特征、细粒度场景表示、用户画像和偏好标签

MSDR is the first large-scale publicly available annotated industrial multi-scenario driving route dataset. It contains data sampled from eight major Chinese cities including Beijing, Shanghai, Guangzhou, Hangzhou, Wuhan, Zhengzhou, Chongqing and Chengdu. Each data sample includes rich route features, fine-grained scene representations, user profiles and preference labels.
创建时间:
2025-09-09
原始信息汇总

DSFNet数据集概述

数据集名称

MSDR (Multi-Scenario Driving Route dataset)

数据集简介

MSDR是首个大规模公开可用的工业级多场景驾驶路线标注数据集,旨在促进学术界的多场景路线排序(MSRR)研究。

数据来源

从中国八个大城市采样:北京、上海、广州、杭州、武汉、郑州、重庆和成都。

数据内容

每个数据样本包含:

  • 丰富的路线特征
  • 细粒度场景表示
  • 用户画像
  • 偏好标签

数据集获取

  • 简单数据集位于:ucore/data
  • 完整数据集位于:https://drive.google.com/drive/folders/1qk7p1PSvUucnEVVI0L2zchqmSD7hJSyI

应用场景

用于多场景路线排序模型评估,已成功部署于高德地图在线交通服务。

搜集汇总
数据集介绍
main_image_url
构建方式
在智能交通系统研究领域,MSDR数据集通过精心设计的数据采集流程构建而成。该数据集采样自中国八大核心城市(包括北京、上海、广州等)的真实驾驶场景,每个样本均包含完整的路线特征、细粒度场景表示、用户画像及偏好标签。数据经过严格的清洗和标注流程,确保时空维度上的连续性与真实性,最终形成首个大规模公开的多场景驾驶路线工业级数据集。
特点
MSDR数据集展现出多维度融合的鲜明特点,其核心价值在于同时涵盖路线物理特征、用户画像数据和场景语义信息。数据集提供丰富的特征矩阵,包括实时交通流量、道路拓扑结构、历史行驶模式等关键指标,并采用 disentangled representation 技术实现场景因素解耦。不同城市区域的驾驶行为差异性和用户偏好多样性,为多场景路由排名研究提供了立体化的数据支撑。
使用方法
研究者可通过下载提供的标准化数据包快速开展实验,数据集采用分层存储结构组织特征矩阵和标签文件。建议先利用预处理脚本进行特征归一化和场景编码,再输入到DSFNet等专用网络架构进行训练。实验时可参照论文中的评估协议,通过交叉验证分析不同城市子集的性能表现,同时可利用可视化工具解读场景因子的注意力机制。
背景与挑战
背景概述
多场景驾驶路线数据集MSDR由阿里巴巴集团高德地图团队于2025年创建,旨在推动多场景路线排序(MSRR)领域的学术研究。该数据集采集自北京、上海等中国八大城市的真实驾驶数据,涵盖丰富的路线特征、细粒度场景表示和用户画像。作为首个大规模公开的工业级标注数据集,MSDR为理解不同驾驶场景下的用户偏好提供了重要数据基础,对智能交通系统和导航算法的发展具有显著影响力。
当前挑战
MSDR数据集致力于解决多场景驾驶路线排序中的用户偏好建模挑战,包括跨场景的个性化推荐和动态环境适应性问题。在构建过程中,研究团队面临多源异构数据融合、细粒度场景标注一致性保障,以及大规模时空数据处理的工程挑战。此外,确保不同城市驾驶模式的代表性平衡和用户隐私保护也是数据集构建的关键难点。
常用场景
经典使用场景
在智能交通系统研究中,MSDR数据集为多场景驾驶路线排序任务提供了标准化评估基准。该数据集通过整合八个中国主要城市的真实驾驶数据,包含丰富的路线特征、细粒度场景表示和用户画像,支持研究者构建跨场景的路线推荐模型。其经典应用体现在训练深度神经网络识别不同交通场景下的用户偏好模式,为动态路线规划算法提供验证基础。
解决学术问题
MSDR数据集有效解决了多场景路线排序研究中缺乏公开标注数据的核心问题。通过提供大规模工业级标注数据,它支持学术界探索场景感知的推荐算法,破解传统单一场景模型的泛化性瓶颈。该数据集推动了 disentangled representation learning 在交通领域的应用,为理解用户在不同时空场景下的决策机制提供了数据支撑,显著提升了路线预测模型的解释性和准确性。
衍生相关工作
基于MSDR数据集衍生的DSFNet模型开创了多因子场景解耦学习范式,后续研究相继提出了场景感知的图神经网络和元学习框架。该数据集催生了WWW 2025会议多项关于时空序列建模的研究工作,包括跨城市迁移学习方案和多任务联合训练架构。这些成果显著推动了智能交通领域从单一场景建模向多场景协同建模的范式转变。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作