five

electricsheepafrica/africa-top-50-countries-with-christians-experiencing-the-most-persecution

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-top-50-countries-with-christians-experiencing-the-most-persecution
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含关于非洲多个国家基督徒遭受迫害的人道主义和发展数据记录,共有57个观察值,分布在5个变量中。数据集分为训练集(45行)和测试集(11行)。数据集的域是人道主义和发展数据,观察单位是表格记录。数据集的地理范围是非洲多个国家。数据由Open Doors发布,最后更新于2023年5月23日。数据集经过Electric Sheep Africa整理,转换为ML-ready的Parquet格式。

annotations_creators: - 无注释 language_creators: - 现有资源采集 language: - 英语 license: CC BY 4.0 multilinguality: - 单语言 size_categories: - 少于1000条记录 source_datasets: - 原创数据集 task_categories: - 表格分类 - 表格回归 task_ids: [] tags: - 非洲 - 人道主义 - HDX - Electric Sheep Africa pretty_name: "受迫害基督徒所在的前50个国家" dataset_info: splits: - name: train num_examples: 45 - name: test num_examples: 11 # 受迫害基督徒所在的前50个国家 **发布方:** Open Doors · **来源:** [OpenAfrica](https://open.africa/dataset/top-50-countries-with-christians-experiencing-the-most-persecution) · **许可证:** `CC BY` · **更新时间:** 2023-05-23 --- ## 摘要 本数据集包含覆盖非洲(多个国家)的人道主义与发展数据记录,共包含5个变量下的57条观测数据。本数据集的每一行均为表格型记录。数据最后于2023-05-23在OpenAfrica平台更新。地理覆盖范围:**非洲(多个国家)**。 *本数据集已由[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)整理为适用于机器学习的Parquet格式。* --- ## 数据集特征 | | | |---|---| | **数据领域** | 人道主义与发展数据 | | **观测单元** | 表格型记录 | | **总数据行数** | 57 | | **列数** | 5(2个数值型、3个分类型、0个日期时间型) | | **训练集拆分行数** | 45 | | **测试集拆分行数** | 11 | | **地理覆盖范围** | 非洲(多个国家) | | **发布方** | Open Doors | | **OpenAfrica平台最后更新时间** | 2023-05-23 | --- ## 变量 **结果/测量变量** — `top_50_countries`(取值示例:朝鲜、科摩罗、老挝),`total_wwl_2023_score`(取值范围61.0–98.0)。 **标识/元数据变量** — `esa_source`(取值:HDX),`esa_processed`(取值:2026-04-27)。 **其他变量** — `wwl_2023_rank`(取值范围1.0–55.0)。 --- ## 快速上手 python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-top-50-countries-with-christians-experiencing-the-most-persecution") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() --- ## 数据结构 | 列名 | 数据类型 | 空值占比 | 取值范围/示例值 | |---|---|---|---| | `wwl_2023_rank` | float64 | 3.5% | 1.0 – 55.0(均值28.0) | | `top_50_countries` | object | 3.5% | 朝鲜、科摩罗、老挝 | | `total_wwl_2023_score` | float64 | 3.5% | 61.0 – 98.0(均值72.6909) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-27 | --- ## 数值统计摘要 | 列名 | 最小值 | 最大值 | 均值 | 中位数 | |---|---|---|---|---| | `wwl_2023_rank` | 1.0 | 55.0 | 28.0 | 28.0 | | `total_wwl_2023_score` | 61.0 | 98.0 | 72.6909 | 70.0 | --- ## 数据整理流程 原始数据通过CKAN应用程序编程接口从OpenAfrica平台下载并转换为Parquet格式。列名已全部转为小写并标准化为蛇形命名法。常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)已统一替换为`NaN`。已移除1条完全重复的行。基于解析成功率(阈值>85%),已将1列从字符串类型转换为数值或日期时间类型。本数据集已使用固定随机种子(42)按照80/20的比例划分为训练集与测试集,并保存为Snappy压缩的Parquet格式。 --- ## 局限性 - 本数据集源自Open Doors,尚未由Electric Sheep Africa(ESA)进行独立验证。 - 自动化数据清洗无法修正原始数据集中的错报值、定义不一致或抽样偏差问题。 - 如需了解发布方的方法论说明与注意事项,请参阅[原始HDX数据集页面](https://open.africa/dataset/top-50-countries-with-christians-experiencing-the-most-persecution)。 --- ## 引用 bibtex @dataset{openafrica_africa_top_50_countries_with_christians_experiencing_the_most_persecution, title = {Top 50 countries with Christians experiencing persecution.}, author = {Open Doors}, year = {2023}, url = {https://open.africa/dataset/top-50-countries-with-christians-experiencing-the-most-persecution}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施。尼日利亚拉各斯。*
提供机构:
electricsheepafrica
二维码
社区交流群
二维码
科研交流群
商业服务