SDBC

github2024-11-09 更新2024-11-14 收录

下载链接：

https://github.com/csu-mapping/SDBC

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含七个模拟数据集，每个数据集描述了流ID、起点和终点的坐标以及每个流所属的原始聚类。

This dataset comprises seven simulated datasets, each of which records the flow ID, the coordinates of its origin and destination points, as well as the original cluster to which each flow belongs.

创建时间：

2024-11-09

原始信息汇总

SDBC: 地理流动聚类

数据集描述

数据集名称: SDBC
数据集用途: 用于人群移动模式识别的地理流动聚类
相关论文:
- 论文标题: Statistical and density-based clustering of geographical flows for crowd movement patterns recognition
- 作者: Jianbo Tang, Yuxin Zhao, Xuexi Yang, et al.
- 发表期刊: Applied Soft Computing, 2024
- DOI: https://doi.org/10.1016/j.asoc.2024.111912

数据集内容

模拟数据:
- 存储位置: Data/Simulated data
- 包含数据集: SD1, SD2, SD3, SD4, SD5, SD6, SD7
- 数据描述: 每个数据集包含流动ID、起点和终点的坐标，以及每个流动所属的原始聚类

方法与实现

比较方法代码:
- 存储位置: Comparison methods
- 包含方法:
  - 逐步时空流动聚类方法
  - 空间流动L函数和SpatialflowL方法
- 其他方法代码:
  - SNN_flow方法: https://doi.org/10.6084/m9.figshare.14123960
  - 逐步时空流动聚类方法: https://github.com/susurrant/flow-clustering

使用说明

实现语言: Octave/MATLAB 和 Python (版本 >=3.8)
Octave/MATLAB 实现:
- 运行 flowread.m 加载模拟数据
- 运行 demo_SD1.m 调用 flowSDBC 进行聚类
- 使用 flowplot.m 展示聚类结果
- 运行 flowRDVCompute.py 计算 RDV 并生成 RDV_data.csv
- 运行 flowRDVFigure.py 展示 RDV 梯度
Python 实现:
- 存储位置: Python
- 包含脚本: demo_SD1.py, demo_SD2.py, ..., demo_SD7.py

演示

聚类演示:
- SD1:
- SD2:
- SD3:
- SD4:
- SD5:
- SD6:
- SD7:

搜集汇总

数据集介绍

构建方式

在构建SDBC数据集时，研究者们精心设计了七组模拟数据，分别存储在'Data'文件夹下的'SD1'至'SD7'子文件夹中。每组数据详细记录了流量的ID、起点和终点的坐标，以及流量所属的原始聚类信息。这些数据是通过对地理流量的统计和密度分析生成的，旨在模拟真实世界中的群体移动模式。通过这种方式，数据集不仅提供了丰富的地理信息，还为后续的聚类分析提供了坚实的基础。

特点

SDBC数据集的显著特点在于其高度模拟性和结构化。每组数据均包含详细的流量信息，从流量的起点到终点，再到其原始聚类归属，无一不体现其精细化的设计。此外，数据集还提供了多种实现方式，包括Octave和Python，这使得研究者可以根据自身需求选择合适的工具进行分析。数据集的多样性和灵活性，使其在地理流量聚类研究中具有广泛的应用前景。

使用方法

使用SDBC数据集时，研究者可以选择通过Octave或Python进行实现。在Octave环境下，可以通过运行'flowread.m'脚本加载模拟数据，并使用'demo_SD1.m'等脚本调用flowSDBC算法进行聚类分析。Python环境下，同样提供了相应的源代码和演示脚本，如'demo_SD1.py'至'demo_SD7.py'，方便用户直接调用和分析。此外，数据集还支持自定义参数设置，以满足不同研究需求。

背景与挑战

背景概述

SDBC数据集，全称为Geographical flow clustering，由Jianbo Tang、Yuxin Zhao、Xuexi Yang等人于2024年创建。该数据集的核心研究问题在于通过统计和密度聚类方法识别人群移动模式，其研究成果发表于《Applied Soft Computing》期刊，具有较高的学术影响力。SDBC数据集的构建旨在解决地理流动数据的聚类问题，为理解和预测人群移动模式提供了重要的数据支持。

当前挑战

SDBC数据集在构建过程中面临的主要挑战包括：首先，地理流动数据的复杂性和多样性使得聚类算法的设计和优化变得尤为困难。其次，数据集的模拟数据需要精确反映实际人群移动模式，这对数据生成和验证提出了高要求。此外，SDBC数据集在实现过程中需要兼容多种编程语言（如Octave和Python），确保算法的广泛适用性和可移植性。

常用场景

经典使用场景

在地理信息科学领域，SDBC数据集的经典使用场景主要集中在人群流动模式的识别与聚类分析。通过该数据集，研究者能够利用统计和密度基础的聚类方法，对地理流动数据进行细致的划分，从而揭示人群在特定区域内的移动规律。例如，SD1至SD7的模拟数据集展示了不同情境下的人群流动模式，为城市规划、交通管理和公共卫生策略提供了有力的数据支持。

实际应用

在实际应用中，SDBC数据集被广泛应用于城市交通管理、应急响应和公共卫生监测等领域。例如，通过分析人群流动模式，城市规划者可以优化公共交通线路，提高交通效率；应急管理部门可以根据人群聚集情况，快速部署救援资源；公共卫生机构则可以监测疫情传播路径，制定有效的防控策略。SDBC数据集的应用，极大地提升了这些领域的决策科学性和响应速度。

衍生相关工作

SDBC数据集的发布催生了大量相关研究工作，特别是在地理流动数据分析和聚类算法优化方面。例如，基于SDBC的聚类结果，研究者开发了新的时空流动数据分析模型，进一步提升了数据处理的精度和效率。此外，SDBC还激发了跨学科的研究兴趣，如结合机器学习和地理信息系统，探索更复杂的人群流动模式。这些衍生工作不仅丰富了地理信息科学的理论体系，也为实际应用提供了更多可能性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集