five

Boston Datasets|城市数据数据集|地区数据数据集

收藏
github2019-07-25 更新2024-05-31 收录
城市数据
地区数据
下载链接:
https://github.com/Shujian2015/boston-datasets
下载链接
链接失效反馈
资源简介:
波士顿数据集列表,包括关于波士顿市和马萨诸塞州的各种数据集。
创建时间:
2017-01-26
原始信息汇总

Boston Datasets 概述

主要数据集列表

  1. Boston Housing

  2. Boston Airbnb Open Data

    • 来源:Kaggle
    • 大小:17 MB
  3. Boston Marathon Raw Data

    • 来源:GitHub
    • 大小:51 MB
  4. Hubway Trip History Data

  5. The Boston Timescape Project

  6. Boston Data Project | Harvard Youth Violence Prevention Center | Harvard T.H. Chan School of Public Health

  7. City of Boston: Open Data

    • 来源:City of Boston
    • 数据集数量:111
    • 部分热门数据集:
      • Approved Building Permits
      • Crime Incident Reports (July 2012 - August 2015)
      • Property Assessment 2014
      • Employee Earnings Report 2014
      • 311, Service Requests
      • Employee Earnings Report 2015
      • Food Establishment Inspections
      • Employee Earnings Report 2013
      • Employee Earnings Report 2012
      • Property Assessment 2016
      • Property Assessment 2015
      • Code Enforcement - Building and Property Violations
      • Issued Permits(ALL TYPES)
      • Farmers Markets With Benefits
      • Checkbook Explorer
      • Boston Jobs Policy Compliance Reports
      • Crime Incident Reports (August 2015 - To Date) (Source: New System)
      • Boston Police Department FIO
      • Public Works Active Work Zones
      • Master Address List
      • Boston Taxi Data
  8. BostonMaps: Open Data

    • 来源:ArcGIS
    • 数据集数量:59
  9. Boston Wicked Open Data

  10. Massachusetts Open Data

    • 来源:Mass.gov
    • 数据集数量:69
    • 部分热门数据集:
      • Open Meeting Law Pending Complaints
      • Commonwealth Connect reports within Massachusetts State
      • FLD Debarment List
      • Graduates Attending College Research File, by school (2004-2012)
      • Plans of High School Graduates by State by District by School (1995-2013)
      • Graduates Attending College Research File, by District (2004 2012)
      • Enrollment By Race Gender State District School (1995-2014)
      • Mobility State by District by School (2008-2013)
      • Technology Report by State by District by School (2003-2011)
      • Indicator Report State by District by School (2003 2012)

其他相关数据集

AI搜集汇总
数据集介绍
main_image_url
构建方式
Boston Datasets的构建方式主要依赖于多个公开数据源的整合与分类。这些数据源包括波士顿市政府、马萨诸塞州政府以及多个第三方平台如Kaggle和UCI Machine Learning Repository。数据集涵盖了从住房、犯罪、教育到交通等多个领域,通过API接口或直接下载的方式获取原始数据,并进行必要的清洗和格式化处理,以确保数据的可用性和一致性。
使用方法
使用Boston Datasets时,用户可以通过访问提供的链接直接下载所需的数据集。对于需要进一步处理的数据,可以使用Python或R等编程语言进行数据清洗和分析。数据集适用于多种应用场景,如城市管理、政策制定、学术研究等。用户还可以利用这些数据构建预测模型,进行趋势分析或生成可视化报告,以支持决策制定。
背景与挑战
背景概述
Boston Datasets 是一个涵盖波士顿市及马萨诸塞州各类数据的综合性数据集集合,涵盖了从住房、犯罪、交通到教育等多个领域的数据。该数据集的创建源于对城市数据开放的需求,旨在为研究人员、政策制定者和公众提供高质量的数据支持。数据集的核心研究问题包括城市治理、公共安全、经济发展等,其影响力不仅限于学术研究,还广泛应用于城市规划、政策分析和商业决策等领域。
当前挑战
Boston Datasets 面临的挑战主要体现在数据整合与标准化方面。由于数据来源多样,格式不一,如何有效整合这些异构数据并确保其一致性是一个重要问题。此外,数据更新频率不一,部分数据可能存在滞后性,影响实时分析的准确性。在构建过程中,数据清洗和预处理工作也面临较大挑战,尤其是处理缺失值和异常值时,如何保持数据的完整性和可靠性是关键。
常用场景
经典使用场景
Boston Datasets 在学术界和工业界被广泛用于城市规划和政策制定的研究。例如,Boston Housing 数据集常被用于预测房价和评估住房政策的影响,而 Boston Airbnb Open Data 则用于分析短期租赁市场对城市经济的影响。这些数据集为研究人员提供了丰富的城市数据,帮助他们深入理解城市发展的动态。
解决学术问题
Boston Datasets 解决了多个学术研究中的关键问题,特别是在城市经济学、社会学和公共政策领域。通过分析这些数据集,研究人员能够评估不同政策对城市居民生活质量的影响,例如住房政策、犯罪率控制和公共交通系统的效率。这些研究为政策制定者提供了科学依据,推动了城市可持续发展。
实际应用
在实际应用中,Boston Datasets 被广泛应用于城市管理和公共服务优化。例如,Crime Incident Reports 数据集帮助警方分析犯罪热点,优化警力部署;311 Service Requests 数据集则用于改进市政服务响应效率。这些应用不仅提升了城市管理的智能化水平,还增强了市民的生活体验。
数据集最近研究
最新研究方向
在波士顿数据集的研究领域,最新的研究方向主要集中在城市智能化和数据驱动的政策制定上。随着大数据技术的进步,研究者们越来越依赖于这些开放数据集来分析和预测城市发展趋势。例如,通过分析波士顿的住房数据和犯罪报告,研究人员能够更准确地预测房价波动和犯罪热点区域,从而为城市规划提供科学依据。此外,波士顿的交通数据集,如Hubway Trip History Data,也被用于优化公共交通系统,提高城市交通效率。这些研究不仅推动了城市管理的现代化,也为其他城市提供了可借鉴的案例。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

HUSTgearbox

This reposotory release a gearbox failure dataset, which can support intelliegnt fault diagnosis research

github 收录

用于陆面模拟的中国土壤数据集(第二版)

本研究对中国范围内0-2米六个标准深度层(0-5、5-15、15-30、30-60、60-100和100-200厘米)的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面,世界土壤信息服务的1540个土壤剖面,第一次全国土壤普查的76个土壤剖面,以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色(包括蒙赛尔颜色和RGB两种形式)。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供,有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求,CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量,可广泛应用于陆面过程模拟等地学相关研究。

国家青藏高原科学数据中心 收录

LEVIR-CD

LEVIR-CD 是一个新的大规模遥感建筑变化检测数据集。引入的数据集将成为评估变化检测 (CD) 算法的新基准,尤其是基于深度学习的算法。 LEVIR-CD 由 637 个非常高分辨率(VHR,0.5m/像素)Google Earth (GE) 图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时相图像具有显着的土地利用变化,尤其是建筑增长。 LEVIR-CD涵盖别墅住宅、高层公寓、小型车库和大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新建筑区域的变化)和建筑衰退。这些双时相图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。我们数据集中的每个样本都由一个注释器进行注释,然后由另一个注释器进行双重检查以产生高质量的注释。完整注释的 LEVIR-CD 总共包含 31,333 个单独的变更构建实例。

OpenDataLab 收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录