未提及具体数据集名称

Name: 未提及具体数据集名称
Creator: 清华大学电子工程系，香港浸会大学社会学系
Published: 2025-06-06 19:01:21
License: 暂无描述

arXiv2025-06-06 更新2025-06-11 收录

下载链接：

https://anonymous.4open.science/r/CrimeMind-EB3E

下载链接

链接失效反馈

官方服务：

资源简介：

本文提出了一种名为CrimeMind的新型LLM驱动ABM框架，用于模拟多模态城市环境中的城市犯罪。该框架将日常活动理论（RAT）融入代理工作流程，使其能够处理丰富的多模态城市特征并对犯罪行为进行推理。为解决LLM代理在评估环境安全性方面的挑战，论文收集了一个小规模的人工标注数据集，并通过一种无需训练的文本梯度方法将CrimeMind的感知与人类判断进行对齐。实验结果表明，CrimeMind在犯罪热点预测和空间分布准确性方面优于传统的ABM和深度学习基线。

This paper proposes a novel LLM-driven ABM framework named CrimeMind for simulating urban crime in multimodal urban environments. The framework integrates Routine Activity Theory (RAT) into the agent workflow, enabling it to handle rich multimodal urban features and reason about criminal behaviors. To address the challenges faced by LLM agents in evaluating environmental safety, this paper collects a small-scale manually annotated dataset, and aligns CrimeMind's perceptions with human judgments through a training-free textual gradient method. Experimental results demonstrate that CrimeMind outperforms traditional ABM and deep learning baselines in terms of crime hotspot prediction and spatial distribution accuracy.

提供机构：

清华大学电子工程系，香港浸会大学社会学系

创建时间：

2025-06-06

搜集汇总

数据集介绍

构建方式

CrimeMind数据集的构建基于多模态城市环境下的犯罪模拟，通过整合人口普查数据、街景图像和历史犯罪记录，构建了一个理论驱动的LLM智能体框架。具体而言，数据集首先收集了美国四个主要城市（芝加哥、纽约、达拉斯和洛杉矶）的人口统计、POI密度和平均收入等结构化数据；其次，利用Google街景API获取街景图像，通过视觉语言模型提取感知安全分数和语义描述；最后，结合官方犯罪记录数据，构建了时空犯罪热图作为评估基准。数据集通过人类标注的安全评分与模型预测的对齐，确保了环境感知的准确性。

特点

CrimeMind数据集的特点在于其理论驱动和多模态融合。首先，数据集将日常活动理论（Routine Activity Theory, RAT）嵌入LLM智能体的认知架构中，使其能够基于动机、目标脆弱性和监护缺失三个核心要素进行犯罪决策。其次，数据集整合了结构化的城市特征（如人口统计）和非结构化的感知线索（如街景安全评分），提供了丰富的环境上下文。此外，数据集支持反事实模拟，能够评估外部事件（如BLM抗议）和政策干预（如警察重新分配计划）对犯罪模式的影响，为城市安全规划提供了灵活的工具。

使用方法

CrimeMind数据集的使用方法主要包括三个步骤：环境构建、智能体决策和结果评估。在环境构建阶段，用户需加载多模态城市数据（如CBG级人口统计和街景图像），并通过VLM生成环境安全评分和语义摘要。在智能体决策阶段，LLM驱动的犯罪智能体根据RAT理论动态评估犯罪意图，输出犯罪决策及自然语言解释。在结果评估阶段，用户可通过Jensen-Shannon Divergence (JSD)、Root Mean Squared Error (RMSE)和Crime Hotspot Hit Rate (HR@K)等指标，对比模拟犯罪分布与真实犯罪数据的吻合度。数据集还支持反事实分析，用户可通过修改智能体的认知提示（如增加警察巡逻密度）模拟不同干预场景。

背景与挑战

背景概述

CrimeMind是由清华大学电子工程系与香港浸会大学社会学系联合研发的多模态大语言模型驱动的城市犯罪模拟框架，其核心创新在于将犯罪学中的日常活动理论（Routine Activity Theory）融入LLM智能体的决策体系。该数据集构建于2025年，旨在解决传统基于规则的ABM模型预测精度不足与深度学习模型可解释性欠缺的双重困境。通过整合人口统计、街景图像感知和犯罪记录等多模态城市数据，CrimeMind实现了对犯罪热点预测和空间分布模拟的突破性改进，在芝加哥等四大美国城市的实验中较最优基线提升达24%，为犯罪学研究和城市安全政策评估提供了首个理论指导的可解释仿真平台。

当前挑战

该数据集面临三重核心挑战：在领域问题层面，需突破传统方法对历史数据强依赖的局限，解决动态环境下犯罪决策的认知灵活性建模难题；在数据构建过程中，如何通过小规模人工标注实现LLM智能体对环境安全感知的人类判断对齐成为关键瓶颈，初期VLM预测与人类评分的皮尔逊相关系数仅0.42；在理论融合方面，将日常活动理论的三大要素（犯罪动机、目标脆弱性、监护缺失）转化为可计算的LLM推理框架时，需克服语义推理与多模态特征融合的复杂性。此外，街景图像的安全评分标注需要解决主观判断的个体差异问题，采用三重比较标注策略确保评估一致性。

常用场景

经典使用场景

在犯罪学与城市计算交叉领域，CrimeMind数据集通过融合多模态城市特征与犯罪活动理论，为基于大语言模型的智能体模拟提供了标准化实验环境。该数据集最典型的应用场景在于构建虚拟城市犯罪模拟系统，研究者可通过调用包含人口统计、街景安全评分、历史犯罪记录等结构化数据，驱动LLM智能体在理论指导下进行犯罪决策推演，进而生成高保真的犯罪时空分布热力图。

衍生相关工作

基于该数据集衍生的经典研究包括：融合视觉语言模型的街头安全感知量化框架（StreetScore）、犯罪热点预测的扩散模型（DiffCrime），以及探讨居住隔离与犯罪空间关联的系列工作。这些研究在KDD、Nature Human Behaviour等顶刊会议上形成方法论突破，推动了计算社会科学领域多智能体仿真与城市犯罪预测的深度融合。

数据集最近研究