five

Synthetic Administrative Data: Census 1991, 2023

收藏
DataCite Commons2023-04-28 更新2025-04-16 收录
下载链接:
http://reshare.ukdataservice.ac.uk/id/eprint/856310
下载链接
链接失效反馈
官方服务:
资源简介:
We create a synthetic administrative dataset to be used in the development of the R package for calculating quality indicators for administrative data (see: https://github.com/sook-tusk/qualadmin) that mimic the properties of a real administrative dataset according to specifications by the ONS. Taking over 1 million records from a synthetic 1991 UK census dataset, we deleted records, moved records to a different geography and duplicated records to a different geography according to pre-specified proportions for each broad ethnic group (White, Non-white) and gender (males, females). The final size of the synthetic administrative data was 1033664 individuals.

我们构建了一款合成行政数据集(synthetic administrative dataset),用于开发用于计算行政数据质量指标的R包(R package),相关开源仓库地址为:https://github.com/sook-tusk/qualadmin。该数据集严格遵循英国国家统计局(Office for National Statistics, ONS)的规范,模拟真实行政数据集的核心属性特征。我们从一款合成的1991年英国人口普查数据集中提取了逾100万条记录,随后按照预先设定的各宽泛族群(白人(White)、非白人(Non-white))与性别(男性、女性)的比例,执行了记录删除、将记录迁移至不同地理区域,以及为不同地理区域复制记录的操作。该合成行政数据集的最终规模为1033664名个体。
提供机构:
UK Data Service
创建时间:
2023-04-28
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作