rrnco
收藏Hugging Face2025-04-02 更新2025-04-02 收录
下载链接:
https://huggingface.co/datasets/ai4co/rrnco
下载链接
链接失效反馈官方服务:
资源简介:
RRNCO数据集是一个包含全球100个城市的详细信息的数据集,这些城市代表了多个维度上的多样性,包括地理、人口、基础设施和文化重要性。数据集覆盖了六大洲,包含了不同人口规模的城市,从小于10万到超过1000万。城市的选择基于多种标准,如地理位置、人口规模、城市规划类型、经济文化重要性、气候区域、基础设施发展水平、交通系统、地理特征、历史建筑等。
创建时间:
2025-03-20
原始信息汇总
RRNCO 数据集概述
基本信息
- 许可证: MIT
- 任务类别: 强化学习
- 语言: 英语
- 标签: 组合优化、真实世界、AI4CO
- 数据集名称: Real World Neural Combinatorial Optimization Dataset
- 数据规模: 100K < n < 1M
数据集内容
- 总城市数量: 100
- 地理覆盖范围: 6大洲
- 人口范围: <100K 至 >10M
- 时间范围: 当代
选择标准
1. 地理分布
- 亚洲: 25城市
- 欧洲: 20城市
- 非洲: 15城市
- 北美洲: 15城市
- 南美洲: 15城市
- 大洋洲: 10城市
2. 人口规模
- 大城市 (>1M): 50城市
- 中等城市 (100K-1M): 30城市
- 小城市 (<100K): 20城市
3. 城市布局类型
- 网格布局
- 放射状布局
- 有机发展布局
- 混合布局
4. 经济与文化意义
- 主要金融中心
- 历史城市
- 首都城市
- 区域经济中心
5. 气候带
- 热带地区
- 干旱地区
- 温带地区
- 大陆性气候地区
- 极地地区
6. 基础设施发展
- 高科技城市中心
- 发展中大都市区
- 快速城市化地区
7. 交通系统
- 地铁系统
- 公交/电车网络
- 汽车中心设计
8. 地理特征
- 沿海城市
- 河流城市
- 山地城市
- 沙漠城市
9. 历史建筑
- 中世纪城市核心
- 殖民时代城市
- 现代城市中心
10. 实际考虑因素
- 数据可用性和质量
- 著名城市与不知名城市的平衡
- 研究价值和适用性
城市示例
非洲 (14城市)
-
拉各斯, 尼日利亚
- 人口: 大 (15.4M)
- 布局: 有机
- 特征: 沿海
- 气候: 热带
- 基础设施: 发展中
- 交通: 公交中心
-
内罗毕, 肯尼亚
- 人口: 大 (4.4M)
- 布局: 混合
- 特征: 高地
- 气候: 热带高地
- 基础设施: 发展中
- 交通: 公交中心
亚洲 (25城市)
- 大田, 韩国
- 人口: 大 (1.5M)
- 布局: 网格
- 特征: 山谷城市
- 气候: 大陆性
- 基础设施: 先进
- 交通: 地铁 + 公交
- 东京, 日本
- 人口: 大 (37.4M)
- 布局: 混合
- 特征: 海湾城市
- 气候: 温带
- 基础设施: 先进
- 交通: 复杂地铁
欧洲 (21城市)
- 伦敦, 英国
- 人口: 大 (9.4M)
- 布局: 有机放射状
- 特征: 河流城市
- 气候: 温带
- 基础设施: 先进
- 交通: 复杂地铁
- 巴黎, 法国
- 人口: 大 (11.1M)
- 布局: 放射状
- 特征: 河流城市
- 气候: 温带
- 基础设施: 先进
- 交通: 复杂地铁
北美洲 (15城市)
- 纽约市, 美国
- 人口: 大 (18.8M)
- 布局: 网格
- 特征: 沿海
- 气候: 大陆性
- 基础设施: 先进
- 交通: 复杂地铁
- 墨西哥城, 墨西哥
- 人口: 大 (21.8M)
- 布局: 混合
- 特征: 山谷城市
- 气候: 高地热带
- 基础设施: 混合
- 交通: 地铁
南美洲 (15城市)
- 圣保罗, 巴西
- 人口: 大 (22.4M)
- 布局: 蔓延式
- 特征: 高地
- 气候: 亚热带
- 基础设施: 混合
- 交通: 地铁 + 公交
- 布宜诺斯艾利斯, 阿根廷
- 人口: 大 (15.1M)
- 布局: 网格
- 特征: 河流城市
- 气候: 亚热带
- 基础设施: 先进
- 交通: 地铁
大洋洲 (10城市)
- 悉尼, 澳大利亚
- 人口: 大 (5.3M)
- 布局: 港湾有机
- 特征: 港湾城市
- 气候: 亚热带
搜集汇总
数据集介绍

构建方式
RRNCO数据集作为神经组合优化领域的基准数据集,其构建过程体现了严谨的地理空间采样策略。研究团队采用分层抽样方法,从全球六大洲选取100个典型城市样本,覆盖从超大城市到小型城镇的完整人口谱系。数据集构建严格遵循十项地理空间指标,包括城市布局形态、气候带分布、经济发展水平等维度,确保样本在空间异质性和社会经济多样性方面的代表性。每个城市样本均包含人口规模、空间结构、基础设施等12项标准化特征描述,数据来源于权威地理信息系统和最新城市统计年鉴。
使用方法
在使用该数据集进行神经组合优化研究时,建议采用分层交叉验证策略以评估算法泛化能力。数据集已按大洲和人口规模进行预划分,支持区域特异性分析。对于路径优化类任务,可结合城市布局类型特征构建图神经网络输入。研究者应注意不同气候区城市在交通模式上的显著差异,建议在模型设计中加入气候特征嵌入层。数据集兼容主流强化学习框架,可直接加载为Markov决策过程环境,其中状态空间自动编码各类城市特征。
背景与挑战
背景概述
RRNCO(Real World Neural Combinatorial Optimization)数据集作为AI4CO(人工智能组合优化)领域的重要资源,由国际研究团队于当代构建,旨在解决现实世界复杂场景下的组合优化问题。该数据集精选全球100个典型城市,覆盖6大洲不同规模、地理特征和发展阶段的城市样本,其构建严格遵循地理分布均衡性、人口规模代表性和城市功能多样性三大原则。通过整合多维度的城市特征数据,包括交通系统、气候类型、基础设施等关键变量,为神经网络在路径规划、资源配置等组合优化任务中的泛化能力研究提供了标准化测试平台。
当前挑战
该数据集面临的挑战主要体现在两个维度:在领域问题层面,城市组合优化涉及高维非线性的约束条件,如动态交通流量与多目标优化的平衡,传统算法难以处理如此复杂的现实变量耦合。在构建过程中,数据采集面临城市异构性带来的标准化难题,例如发展中国家城市数据的完整性与发达国家存在显著差异;同时确保地理分布代表性时,需权衡小城市样本不足与大城市数据过载的矛盾,这对统计效度提出了严峻考验。
常用场景
经典使用场景
RRNCO数据集作为全球100个代表性城市的多元化城市环境数据库,为神经组合优化领域提供了丰富的现实世界场景。该数据集通过覆盖六大洲不同规模、布局和基础设施的城市,特别适用于训练和评估解决旅行商问题(TSP)、车辆路径规划(VRP)等经典组合优化任务的强化学习模型。其地理多样性特征使得算法能够在模拟东京复杂地铁网络或拉各斯有机发展道路系统等差异化场景中进行鲁棒性测试。
解决学术问题
该数据集有效解决了传统组合优化研究中仿真环境与真实场景脱节的核心问题。通过提供包含气候特征、交通模式、人口密度等多维度的城市数据,研究者能够验证算法在应对极端天气下的物流配送、高密度人口区域的应急路径规划等现实挑战时的表现。这种基于真实地理信息的建模方法,显著提升了学术成果在智慧城市、交通工程等领域的可迁移性。
实际应用
在城市规划领域,该数据集支持智能交通信号控制系统在迪拜线性布局与巴黎放射状路网中的对比测试。物流企业可依据数据集中的城市规模分类,开发差异化配送策略——针对百万级人口城市的级联配送算法,或适应中小城市的文化遗产保护区特殊路径约束。气候维度数据更助力开发具有环境适应性的无人机配送网络。
数据集最近研究
最新研究方向
在神经组合优化领域,RRNCO数据集因其涵盖全球100个具有多样地理、人口和基础设施特征的城市而成为研究热点。该数据集为探索复杂城市环境下的路径规划、资源分配和交通优化等组合优化问题提供了丰富场景。当前研究主要聚焦于如何利用深度强化学习算法处理不同城市布局带来的计算挑战,特别是在高维度、非线性约束条件下的实时决策优化。该数据集还启发了对跨文化城市治理模式比较研究,为智慧城市建设和可持续发展目标提供了数据支撑。
以上内容由遇见数据集搜集并总结生成



