Urban Growth Dataset|城市发展数据集|环境研究数据集
收藏
- Urban Growth Dataset首次发表,提供了全球多个城市在20世纪末的城市扩展数据。
- 数据集首次应用于城市规划研究,帮助学者分析城市扩展模式及其对环境的影响。
- Urban Growth Dataset更新,增加了更多城市和更详细的时间序列数据,提升了数据集的覆盖范围和精度。
- 数据集被广泛应用于全球城市化趋势分析,成为相关领域研究的重要参考资源。
- Urban Growth Dataset再次更新,引入了机器学习算法,提升了数据处理和分析的自动化程度。
- 1Urban Growth Dataset: A Comprehensive Dataset for Urban Growth AnalysisUniversity of California, Berkeley · 2020年
- 2Urban Growth Prediction Using Machine Learning Techniques: A Case Study on the Urban Growth DatasetStanford University · 2021年
- 3Spatiotemporal Analysis of Urban Growth Patterns Using the Urban Growth DatasetMassachusetts Institute of Technology · 2022年
- 4Evaluating the Impact of Urban Growth on Environmental Sustainability Using the Urban Growth DatasetUniversity of Oxford · 2023年
jpft/danbooru2023
Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。
hugging_face 收录
TM-Senti
TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。
arXiv 收录
上奇产业通
上奇产业通是依托北京上奇数字科技有限公司(简称“上奇”)自主研发的产业知识计算引擎,推出的新一代“产业情报和智能决策”SaaS账号系统。平台覆盖200余个产业链图、100万种产品、5000万家企业等,利用产业知识计算引擎的数据、算法和模型,提供产业数据和关系的一站式信息搜索、图谱绘制、内容订阅、报告生成、企业尽调、项目推荐等服务,支撑行业研究、精准招商和投资决策等。
北京国际大数据交易所 收录
中国逐日格点降水数据集V2(1960–2024,0.1°)
CHM_PRE V2数据集是一套高精度的中国大陆逐日格点降水数据集。该数据集基于1960年至今共3476个观测站的长期日降水观测数据,并纳入11个降水相关变量,用于表征降水的相关性。数据集采用改进的反距离加权方法,并结合基于机器学习的LGBM算法构建。CHM_PRE V2与现有的格点降水数据集(包括CHM_PRE V1、GSMaP、IMERG、PERSIANN-CDR和GLDAS)表现出良好的时空一致性。数据集基于63,397个高密度自动雨量站2015–2019年的观测数据进行验证,发现该数据集显著提高了降水测量精度,降低了降水事件的高估,为水文建模和气候评估提供了可靠的基础。CHM_PRE V2 数据集提供分辨率为0.1°的逐日降水数据,覆盖整个中国大陆(18°N–54°N,72°E–136°E)。该数据集涵盖1960–2024年,并将每年持续更新。日值数据以NetCDF格式提供,为了方便用户,我们还提供NetCDF和GeoTIFF格式的年度和月度总降水数据。
国家青藏高原科学数据中心 收录
中国1km分辨率逐月平均气温数据集(1901-2024)
该数据为中国逐月平均温度数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录