population-growth-estimates-and-projections|人口统计数据集|预测分析数据集
收藏数据集概述
数据来源
数据来源于联合国人口司的数据集,具体可从联合国人口司网站获取。
数据内容
- 时间范围:1950年至2100年
- 人口统计:全球各地区、次区域及国家的总人口(男女合计),单位为千人。
- 数据格式:CSV格式,已清洗、标准化并转换为机器可读格式。
数据变体
数据集包含以下几种变体:
- 1950年至2015年的原始估计数据
- 2015年至2100年的中生育率变体
- 2015年至2100年的高生育率变体
- 2015年至2100年的低生育率变体
- 2015年至2100年的恒定生育率变体
- 2015年至2100年的即时替换生育率变体
- 2015年至2100年的动力生育率变体
- 2015年至2100年的零迁移变体
- 2015年至2100年的恒定死亡率变体
数据准备
- 技术要求:Python 3.6及以上版本,需安装dataflows库。
- 更新数据:通过运行
population_estimates.py
脚本进行数据更新。
许可证
数据集受联合国经济和社会事务部人口司(2017年)发布的《世界人口展望:2017年修订版》DVD版许可证保护。

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
MNLI
MNLI(Multi-Genre Natural Language Inference)是一个大规模的自然语言推理数据集,包含433,000多对句子对。该数据集用于评估模型在不同文本类型中的推理能力,包括新闻文章、小说、论坛帖子等。每个句子对都标注了三种可能的关系:蕴含(entailment)、矛盾(contradiction)和中性(neutral)。
cims.nyu.edu 收录
中国地质调查局: 全国1∶200 000区域水文地质图空间数据库
全国1∶200 000区域水文地质图空间数据库以建国后在全国范围内(本次未在香港特别行政区、澳门特别行政区和台湾省开展工作) 30个省开展的1∶200 000区域水文地质普查工作所取得的区域水文地质普查报告、综合水文地质图等地质资料为数据源,在制定的“1∶200 000区域水文地质图空间数据库图层及属性文件格式标准”的基础上,建成了一个全国性的、大型的区域水文地质学空间数据库。该数据库总共采集、处理了全国范围内1∶200 000图幅的<number>1 017</number>幅全要素综合水文地质图信息,全部数据量约50 GB。数据库涵盖了以1∶200 000国际标准图幅为管理单位的水文地质要素空间数据图层,内容包括:地理要素(交通层、水系层、行政区划层等),基础地质要素(地层分区层、断裂构造层),水文地质要素(地下水类型层、地下水富水性层、地下水迳流模数层,地下水水质层、水文地质特征层、地下水利用规划层),专题要素(综合水文地质柱状图,水文地质剖面图) 四大类近30个要素图层。空间数据库主要采用MapGIS地理信息系统格式存储,形成了目前国内覆盖范围最广、包含信息最完整的区域水文地质图空间数据库成果,是地质领域全国性最重要的基础信息资源之一。
DataCite Commons 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录