population-growth-estimates-and-projections|人口统计数据集|预测分析数据集
收藏数据集概述
数据来源
数据来源于联合国人口司的数据集,具体可从联合国人口司网站获取。
数据内容
- 时间范围:1950年至2100年
- 人口统计:全球各地区、次区域及国家的总人口(男女合计),单位为千人。
- 数据格式:CSV格式,已清洗、标准化并转换为机器可读格式。
数据变体
数据集包含以下几种变体:
- 1950年至2015年的原始估计数据
- 2015年至2100年的中生育率变体
- 2015年至2100年的高生育率变体
- 2015年至2100年的低生育率变体
- 2015年至2100年的恒定生育率变体
- 2015年至2100年的即时替换生育率变体
- 2015年至2100年的动力生育率变体
- 2015年至2100年的零迁移变体
- 2015年至2100年的恒定死亡率变体
数据准备
- 技术要求:Python 3.6及以上版本,需安装dataflows库。
- 更新数据:通过运行
population_estimates.py
脚本进行数据更新。
许可证
数据集受联合国经济和社会事务部人口司(2017年)发布的《世界人口展望:2017年修订版》DVD版许可证保护。

中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
TaRF
TaRF 是由密歇根大学、耶鲁大学和加州大学伯克利分校联合创建的视触融合场景数据集,旨在将视觉与触觉信号对齐至共享的三维空间。该数据集包含 19.3k 对齐的视觉与触觉样本,覆盖 13 个普通场景,如办公室、走廊和户外环境。数据采集通过结合神经辐射场(NeRF)和触觉传感器完成,利用多视图几何方法校准视觉与触觉信号,实现空间对齐。TaRF 的创建过程包括场景的多视角视觉重建和同步采集触觉信号,最终通过扩散模型生成未直接采样的触觉信号。该数据集可用于触觉信号估计、触觉定位和材料属性理解等任务,为机器人交互和虚拟世界构建提供重要支持。
github 收录
CrowdHuman
CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性,包含训练、验证和测试集,共计47万个标注的人体实例,平均每张图像有23个人,包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。
github 收录
CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录