Demographic Data (2011 census population survey)|人口统计数据集|数据分析数据集
收藏数据集概述
1. 人口统计数据(2011年人口普查调查)
- 数据来源:NOMIS网站(https://www.nomisweb.co.uk/)
- 提取日期:2020年4月13日
- 地理级别:地方行政区(LAD)
- 数据格式:.csv
- 数据集构成:包括多个ONS数据集,如KS101EW至KS603EW等,涵盖人口、年龄结构、婚姻状况、居住安排、家庭构成、经济活动等多个方面。
- 数据字典:位于
NOMIS
文件夹内,详细列出了200多个变量。
2. 通勤信息表(地方行政区级别)
- 数据来源:NOMIS和交通部
- 主要数据集:WU01UK和WU03UK,涉及居住地和工作地及通勤方式。
- 迁移流入/流出表:包括MM01CUK_ALL和MM01CUK_NON_UK,涉及英国和非英国移民的来源和目的地。
3. 数据集链接
- NOMIS 2011人口普查数据:https://www.nomisweb.co.uk/
- DWP福利统计:https://www.gov.uk/government/collections/dwp-statistical-summaries
- 交通部数据:https://roadtraffic.dft.gov.uk/downloads
- 开放地理门户:https://geoportal.statistics.gov.uk/
- 英格兰多重剥夺指数(IMD):https://www.gov.uk/government/statistics/english-indices-of-deprivation-2019
- 威尔士多重剥夺指数(WIMD):https://statswales.gov.wales/Catalogue/Community-Safety-and-Social-Inclusion/Welsh-Index-of-Multiple-Deprivation/WIMD-2019
- 消费者研究数据中心:https://public.cdrc.ac.uk/
- 输出区域分类(OAC):http://www.opengeodemographics.com/
4. 社会互动矩阵(SIM)
- 研究论文:Klepac et al.(https://www.medrxiv.org/content/10.1101/2020.02.16.20023754v2)
- POLYMOD研究:http://www.socialcontactdata.org/
- 英国社会接触数据:https://zenodo.org/record/1409507#.XpZj2W57l24
5. 移动性报告
- Google AI:提供英国地方行政区级别的移动数据,包括食品杂货、公园、住宅区、零售和娱乐、交通站点、工作场所等。
- Apple移动性报告:基于iPhone用户的移动数据,数据来源为Apple COVID网站(https://www.apple.com/covid19/mobility)。
6. R库用于SIM
- socialmixr:R包,用于从调查数据中推导社会混合矩阵,特别适用于年龄结构化的传染病模型。
7. COVID-19英国数据
- ONS数据:提供地方行政区级别的数据,链接为https://coronavirus.data.gov.uk/#category=ltlas&map=rate。
- 地方政府协会数据:包括详细的每日COVID-19病例数据,数据收集自公共卫生英格兰,并根据ONS行政地理代码和名称进行匹配。

光伏电站发电量预估数据
1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。
浙江省数据知识产权登记平台 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
Global Solar Dataset
在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。
github 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录