zwn22/NC_Crime
收藏North Carolina(RTP) Police Incident Dataset
数据集描述
- 数据集来源城市: Cary, Chapel Hill, Durham, Raleigh
- 数据集涵盖年份: 2015 至 2024
- 数据集处理: 数据从各城市的开放数据门户中合并和清洗,去除了不完整的条目,并专注于提取和分类主要犯罪类型。
数据集概要
该数据集由北卡罗来纳研究三角园区(RTP)内多个城市的公共警察事件报告编译而成,涵盖了2015年至2024年的数据。数据来源于Cary、Chapel Hill、Durham和Raleigh的开放数据门户,经过细致的合并和清洗,去除了任何不完整的条目。数据集还专注于提取和分类主要犯罪类型,提供了犯罪类型、发生时间、地点和其他相关详细信息。
支持的任务
- 犯罪趋势分析: 分析犯罪趋势随时间和不同地点的变化。
- 预测警务: 基于历史数据开发模型预测未来的犯罪发生。
- 地理空间分析: 通过地图犯罪事件来识别热点和高犯罪率区域。
数据集结构
数据实例
以下是处理后的数据集的一个示例:
json { "year": 2022, "city": "Raleigh", "crime_major_category": "Theft", "crime_detail": "Vehicle Theft", "latitude": 35.7796, "longitude": -78.6382, "occurance_time": "2022/05/20 12:00:00", "clear_status": "Cleared by Arrest", "incident_address": "123 Main St, Raleigh, NC", "notes": "Weapon: None", "crime_severity": "Minor" }
数据字段
数据集包含多个字段,每个字段提供关于警察事件的具体信息:
year(整数): 事件发生的年份。city(字符串): 事件发生的城市。crime_major_category(字符串): 犯罪的主要分类。crime_specific_category(字符串): 犯罪的具体分类。latitude和longitude(浮点数): 事件的地理坐标。occurance_time(日期时间): 事件发生的时间。clear_status(字符串): 案件的解决状态。incident_address(字符串): 事件发生的具体地址。notes(字符串): 事件的其他备注或详细信息。crime_severity(字符串): 根据犯罪严重性将主要犯罪类别分为“Minor”、“Moderate”、“Severe”三类。
数据集创建
数据集理由
该数据集旨在辅助犯罪研究,提供长期犯罪模式和趋势的视角,适用于犯罪学家、社会学家和公共政策研究人员。数据集的多城市范围允许进行比较研究,以理解独特的挑战并制定本地化的犯罪预防策略。
源数据
主要使用的四个数据集:
- Cary:
- 大小: 116317 行 * 34 列
- 列名: Crime Category, Crime Type, UCR, Map Reference, Incident Number, Begin Date Of Occurrence, Begin Time Of Occurrence, End Date Of Occurrence, End Time Of Occurrence, Crime Day, Geo Code, Location Category, District, Beat Number, Location, ID, Lat, Lon, Charge Count, Neighborhood ID, Apartment Complex, Residential Subdivision, Subdivision ID, Phx Activity Date, Phx Record Status, Phx Community, Phx Status, Record, Offense Category, Violent Property, timeframe, domestic, Total Incidents, Year
- Chapel Hill:
- 大小: 101828 行 * 19 列
- 列名: Incident ID, Agency, Offense, Street, City, State, Zipcode, Date of Report, Date of Occurrence, Date Found, Reported As, Premise Description, Forcible, Weapon Description, Victim Age, Victim Race, Victim Gender, Latitude, Longitude
- Durham:
- 大小: 149924 行 * 16 列
- 列名: Case Number, Report Date, Report Time, Status, Sequence, ATT/COM, UCR Code, Offense, Address, X, Y, District, Beat, Tract, Premise, Weapon
- Raleigh:
- 大小: 493912 行 * 19 列
- 列名: Case Number, Crime_Category, Crime Code, Crime Description, Crime Type, Reported Block Address, City of Incident, City, District, Reported Date, Reported Year, Reported Month, Reported Day, Reported Hour, Reported Day of Week, Latitude, Longitude, Agency, Updated_Date
使用数据的注意事项
其他已知限制
数据集的解释权归各自政府机构所有,可能会发生变化。例如,Raleigh市保留随时修改或终止任何数据源的权利。用户应意识到这些变化可能会发生,并且数据集可能会根据政府机构的决定而演变。
其他信息
数据集许可信息
北卡罗来纳州各城市的数据集来源于其各自的开放数据门户,每个门户都有其特定的许可信息和使用条款。
- Cary: Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) 许可。
- Chapel Hill: Open Database License (ODbL) 1.0 许可。
- Durham: 未指定特定许可,但声明数据可自由使用。
- Raleigh: 使用数据的用户需同意Raleigh市的开放数据隐私政策条款。




