Rat dataset
收藏github2022-12-17 更新2024-05-31 收录
下载链接:
https://github.com/ArthurJakobsson/Rat_Population_DataAnalysis
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含208,000个纽约市的老鼠目击记录,记录时间从2010年至今,由市民向纽约市报告并从NYC Open Data获取。每个目击记录包含38个不同的变量,包括地理位置数据如纬度、经度和行政区数据,以及投诉的开放和关闭日期。
This dataset contains 208,000 rat sighting records for New York City, covering the period from 2010 to the present. These records were reported by members of the public to the New York City government and sourced from NYC Open Data. Each sighting record includes 38 distinct variables, including geolocation data such as latitude, longitude, and borough information, as well as the open and closure dates of the associated complaints.
创建时间:
2022-11-18
原始信息汇总
数据集概述
主要数据集
- 名称: Rat Sightings
- 来源: NYC Open Data
- 链接: https://data.cityofnewyork.us/Social-Services/Rat-Sightings/3q43-55fe
- 描述: 包含208,000次纽约市自2010年至今的鼠类目击记录,由市民报告。每个记录包含38个变量,包括地理数据(纬度、经度、行政区信息)和投诉的开启及关闭日期。
辅助数据集
Subway Dataset
- 来源: NYC Open Data
- 链接: https://data.cityofnewyork.us/Transportation/Subway-Entrances/drex-xx56
- 描述: 包含纽约市1928个地铁站的名称、线路编号和地理坐标。
Tax Return Dataset
- 来源: IRS
- 链接: https://www.irs.gov/statistics/soi-tax-stats-individual-income-tax-statistics-zip-code-data-soi
- 描述: 2019年的数据集,包含纽约市178个邮政编码区的税务申报信息,包括申报数量和总申报金额。
Restaurant Inspection Dataset
- 来源: NYC Open Data
- 链接: https://data.cityofnewyork.us/Health/DOHMH-New-York-City-Restaurant-Inspection-Results/43nn-pn8j
- 描述: 最新更新于2022年12月10日,包含231,000条数据,每条数据对应纽约市一家餐厅收到的健康违规罚单,包含27个变量,主要提供餐厅的位置和邮政编码。
研究问题
- 鼠类目击在地理和行政区上的分布差异。
- 报告的鼠类数量随时间的变化,以及与财富和地理数据的关联。
- 鼠类目击与地铁站和餐厅等候选特征的相关性。
搜集汇总
数据集介绍

构建方式
Rat数据集构建于纽约市市民向市政府报告的鼠类目击事件,数据来源于NYC Open Data平台,涵盖了自2010年至今的208,000条目击记录。每条记录包含38个变量,其中地理数据如纬度、经度和行政区划信息,以及投诉的开启和关闭日期等关键信息。此外,该数据集还整合了多个辅助数据集,如地铁站位置、税务申报信息和餐厅卫生检查结果,以深入分析鼠类目击与其他社会经济和地理因素的相关性。
特点
Rat数据集的特点在于其丰富的地理和时间维度信息,能够支持对鼠类目击事件的空间分布和时间变化进行详细分析。数据集中的地理坐标和行政区划信息为研究鼠类目击事件的地理分布提供了基础,而时间戳数据则有助于追踪鼠类目击事件的长期趋势。此外,通过整合地铁站、税务申报和餐厅卫生检查等辅助数据集,研究者可以进一步探讨鼠类目击与城市基础设施、经济状况和卫生条件之间的潜在关联。
使用方法
Rat数据集的使用方法主要包括数据清洗、地理空间分析和时间序列分析。首先,研究者可以通过数据清洗处理缺失值和异常值,确保数据质量。随后,利用地理信息系统(GIS)工具对鼠类目击事件进行空间分布分析,探索不同行政区的鼠类密度差异。时间序列分析则可用于追踪鼠类目击事件的长期趋势,揭示季节性变化或突发事件的影响。此外,通过与其他辅助数据集的关联分析,研究者可以进一步探讨鼠类目击与城市社会经济因素之间的复杂关系。
背景与挑战
背景概述
Rat数据集由纽约市政府于2010年创建,旨在记录市民报告的鼠类目击事件,数据来源于NYC Open Data平台。该数据集包含约208,000条记录,涵盖了从2010年至今的鼠类目击事件,每条记录包含38个变量,主要涉及地理位置信息(如纬度、经度和行政区划)以及投诉的开启和关闭日期。研究人员通过结合地铁、税务和餐厅检查等辅助数据集,深入探讨鼠类目击事件与城市社会经济和地理因素之间的关联。该数据集为研究城市公共卫生、社会经济不平等以及城市管理提供了重要的数据支持。
当前挑战
Rat数据集在解决城市鼠类分布及其与城市环境关系的领域问题中面临多重挑战。首先,数据的时空分布不均可能导致分析结果的偏差,尤其是在不同行政区和时间段的鼠类目击事件报告频率不一致的情况下。其次,数据集的构建过程中,如何有效整合多源异构数据(如地铁、税务和餐厅检查数据)以揭示鼠类分布与城市特征的复杂关系,是一个技术难点。此外,数据的准确性和完整性也受到市民报告的主观性和数据采集系统的限制,可能影响研究结论的可靠性。
常用场景
经典使用场景
Rat数据集在公共卫生和城市管理领域具有广泛的应用。研究人员通常利用该数据集分析纽约市鼠类活动的时空分布模式,探讨鼠类活动与城市基础设施、人口密度、经济状况等因素的关联。通过地理信息系统(GIS)技术,研究者能够可视化鼠类活动的热点区域,从而为城市卫生管理提供科学依据。
衍生相关工作
基于Rat数据集,许多经典研究工作得以展开。例如,研究者利用该数据集开发了鼠类活动预测模型,结合机器学习算法,预测未来鼠类活动的高发区域。此外,该数据集还被用于研究城市环境中的生态失衡现象,探讨鼠类活动与城市基础设施、人口密度、经济状况等因素的关联,为城市卫生管理提供了科学依据。
数据集最近研究
最新研究方向
近年来,基于纽约市鼠类目击事件数据集的研究逐渐聚焦于城市生态与公共卫生的交叉领域。研究者们通过结合地铁站、餐厅卫生检查及税收数据等多源数据集,深入探讨了鼠类分布与城市基础设施、社会经济因素之间的复杂关系。特别是在城市规划和公共卫生政策制定方面,该数据集为理解鼠类活动与城市环境之间的动态互动提供了重要依据。此外,随着大数据分析技术的进步,研究者们能够更精确地预测鼠类活动的时空分布,从而为城市管理者提供科学依据,以优化资源分配和提升公共卫生响应能力。这一研究方向不仅推动了城市生态学的发展,也为全球其他大城市的鼠类防控提供了宝贵的经验借鉴。
以上内容由遇见数据集搜集并总结生成



