five

年龄数据集:122万人的生活、工作和死亡

收藏
Data Castle2022-06-18 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=1925
下载链接
链接失效反馈
官方服务:
资源简介:
#### 背景描述 该数据集包含有关超过 100 万已故名人的生活、工作和死亡的结构化信息。 #### 数据说明 我们开发了一个五步法,并从社区提交的数据到维基百科项目的所有语言版本中推断出生和死亡年份、二元性别和职业。该数据集是关于著名死者的最大数据集,包括来自各种社会群体的个人,包括但不限于 107,000 名女性、124 名非二元性人士和 90,000 名研究人员,他们分布在 300 多个当代或历史地区。最终产品为历史上与性别和职业相关的死亡率人口统计数据提供了新的见解。该技术方法展示了最新文本挖掘方法在准确清理历史数据和减少缺失值方面的可用性。 #### 数据来源 Annamoradnejad, Issa; Annamoradnejad, Rahimberdi (2022), “Age dataset: A structured general-purpose dataset on life, work, and death of 1.22 million distinguished people”, In Workshop Proceedings of the 16th International AAAI Conference on Web and Social Media (ICWSM), doi: 10.36190/2022.82 http://workshop-proceedings.icwsm.org/abstract?id=2022_82 #### 问题描述 数据分析
提供机构:
keys
二维码
社区交流群
二维码
科研交流群
商业服务