asia-aid-flows-all
收藏Hugging Face2026-05-04 更新2026-05-05 收录
下载链接:
https://huggingface.co/datasets/electricsheepasia/asia-aid-flows-all
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Bangladesh - IFRC Appeals,由国际红十字与红新月联合会(IFRC)发布,数据来源于人道主义数据交换平台(HDX)。数据集记录了孟加拉国一级行政单位的人道主义援助呼吁数据,涵盖洪水、旋风等多种灾害类型。数据集包含59条观测记录(训练集47条,测试集11条),41个字段(14个数值型,19个类别型),包括地理、时间、结果测量等类型变量。数据经过Electric Sheep Africa处理,转换为Parquet格式,并进行了标准化清理和缺失值处理。适用于表格分类和回归任务,主要用于人道主义和发展领域的研究与应用。数据最后更新日期为2026年5月4日,地理范围限定为孟加拉国(BGD)。
创建时间:
2026-05-04
原始信息汇总
数据集概述:Bangladesh - IFRC Appeals
基本信息
- 数据集名称:Bangladesh - IFRC Appeals
- 发布机构:International Federation of Red Cross and Red Crescent Societies (IFRC)
- 数据来源:HDX
- 许可证:cc-by-igo
- 语言:英文
- 地理范围:孟加拉国(BGD)
- 标签:africa, humanitarian, hdx, electric-sheep-africa, funding, bgd
- 任务类别:表格分类、表格回归
数据集特性
| 属性 | 值 |
|---|---|
| 领域 | 人道主义与发展数据 |
| 观测单位 | 第一级行政区划观测 |
| 总行数 | 59 |
| 列数 | 41(14个数值型,19个类别型,0个日期时间型) |
| 训练集 | 47行 |
| 测试集 | 11行 |
| HDX最后更新 | 2026-05-04 |
变量说明
- 地理变量:
dtype_id(范围1.0–27.0)、dtype_name(Flood, Cyclone, Other)、atype(范围0.0–1.0)、atype_display(Emergency Appeal, DREF)等18个 - 时间变量:
start_date、end_date、real_data_update - 结果/测量变量:
amount_requested(范围0.0–198250000.0)、amount_funded(范围0.0–101516092.1745) - 标识符/元数据变量:
aid(范围20.0–19918.0)、name(Bangladesh, Bangladesh - Floods等)、code(MDRBD039等)、id(范围170.0–4426.0)、esa_source等 - 其他变量:
status(范围0.0–1.0)、sector(Bangladesh country office)、created_at、modified_at、event(范围2.0–7881.0)等
关键数值摘要
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
aid |
20.0 | 19918.0 | 8556.6102 | 7957.0 |
amount_requested |
0.0 | 198250000.0 | 5496903.6949 | 560000.0 |
amount_funded |
0.0 | 101516092.1745 | 3023598.0273 | 499930.0 |
initial_num_beneficiaries |
0.0 | 2000000.0 | 219422.8814 | 55000.0 |
数据清洗与处理
- 原始数据通过CKAN API从HDX下载并转换为Parquet格式
- 列名统一为小写和下划线命名(snake_case)
- 缺失值标记统一转换为
NaN - 移除了2个缺失值超过80%的列:
dtype_summary,country_average_household_size - 根据解析成功率(>85%)将5个列从字符串转换为数值或日期时间类型
- 数据集按80/20比例分为训练集和测试集(固定随机种子42)
局限性
- 数据来源于IFRC,未经ESA独立验证
- 自动清洗无法纠正原始数据中的误报、定义不一致或抽样偏差
- 建议查阅原始HDX数据集页面以获取发布方的方法说明和注意事项
引用格式
bibtex @dataset{hdx_asia_aid_flows_all, title = {Bangladesh - IFRC Appeals}, author = {International Federation of Red Cross and Red Crescent Societies (IFRC)}, year = {2026}, url = {https://data.humdata.org/dataset/ifrc-appeals-data-for-bangladesh}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }
搜集汇总
数据集介绍

构建方式
该数据集源于国际红十字会与红新月会国际联合会(IFRC)发布的孟加拉国人道主义援助数据,原始资料通过HDX平台的CKAN接口获取。随后,Electric Sheep Africa团队对原始数据进行了系统性清洗与标准化处理,包括将列名统一转换为小写蛇形命名法、将各类缺失值标记(如N/A、null等)统一归并为NaN,并剔除了缺失率超过80%的冗余字段。基于解析成功率超过85%的阈值,对五个字段进行了数据类型转换(如字符串转数值或日期时间)。最终,数据集以Snappy压缩的Parquet格式存储,并按照固定随机种子(42)以80/20比例划分为训练集与测试集,共计59个样本观测,涵盖41个特征列。
特点
该数据集以孟加拉国一级行政单元为观测对象,整合了地理、时间、筹资响应及元数据等多维度信息。其核心特色在于收录了洪水、气旋等灾害类型对应的紧急呼吁(Emergency Appeal)与灾害响应应急基金(DREF)两类响应机制下的资金请求与到位金额,可有效反映人道主义援助的资金流动全貌。此外,数据还包含起始与结束日期、受益人数量、事件编码及国家/地区层级信息,为分析援助时效性、灾害严重程度与资金筹措效率提供了丰富的结构化维度。整体而言,数据集具备高完整性(多数字段缺失率为0%)与明确的二元分类/回归任务适用性。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,调用load_dataset('electricsheepafrica/asia-aid-flows-all')即可获取训练集与测试集,并支持直接转化为pandas DataFrame进行后续分析。数据集的变量体系清晰划分为地理标识(如dtype_id、atype)、时间戳(start_date、end_date)、资金指标(amount_requested、amount_funded)以及元数据(aid、code)等组别,适用于表格分类与回归任务。例如,可基于灾害类型与响应机制预测资金到位率,或评估不同事件下的受益人覆盖规模。使用时需注意数据仅涵盖孟加拉国,且原始数据未经独立验证,建议结合IFRC官方方法论进行结果解读。
背景与挑战
背景概述
该数据集源自国际红十字与红新月会联合会(IFRC)在孟加拉国的人道主义援助呼吁记录,由Electric Sheep Africa于2026年整理并发布至HuggingFace平台。核心研究问题聚焦于量化分析紧急援助与灾害响应基金(DREF)的分配模式、资金缺口及地理分布特征。作为亚洲援助流结构化数据集,它首次将IFRC的一级行政单位观测数据以机器学习就绪的Parquet格式标准化,为预测人道主义资金需求、优化救灾资源调度提供了高颗粒度的数据基础。该数据集对计算社会科学、灾害管理及发展经济学领域具有显著影响,推动了从定性案例研究向数据驱动的人道主义决策范式的转型。
当前挑战
该数据集面临的领域挑战源于人道主义援助的复杂动态性:自然灾害的频率、规模与地域分布高度不确定,资金请求与实际到位的悬殊比例揭示了资源分配的系统性失衡。构建过程中的挑战则体现在数据清洗的难度上:原始HDX数据存在定义不一致、缺失值(如dtype_summary列缺失率>80%)及混合类型字段,需通过自动化规则统一格式并剔除可疑记录。此外,样本量仅58行(41维特征),极小的规模限制了复杂模型的训练,且数据仅覆盖孟加拉国,缺乏跨区域可比性,易导致模型过拟合与泛化能力不足。
常用场景
经典使用场景
asia-aid-flows-all数据集聚焦于孟加拉国的人道主义援助资金流动,收录了国际红十字与红新月联合会(IFRC)发布的紧急呼吁与灾害响应紧急基金(DREF)数据。该数据集以第一级行政单位为观察单元,记录了每项援助行动的请求金额、实际拨款、灾害类型、状态以及受益人数等关键信息。研究者可将其用于人道主义资金分配的效率评估、灾害响应模式识别,以及援助需求与实际拨款之间的缺口分析。经典的建模任务包括基于灾害特征预测资金到位率,或对援助行动进行分类与回归分析。
衍生相关工作
该数据集的发布催生了一系列以人道主义资金流分析为核心的相关工作。Electric Sheep Africa团队将其整理为ML-ready的Parquet格式,降低了机器学习应用于该领域的门槛。研究者可基于此数据复现或扩展IFRC全球呼吁数据集的分析方法,开发用于资金缺口预测、灾害严重性分级以及受益人数估计的基线模型。该数据的结构化特性也便于与地理空间数据、社会经济指标进行联合分析,从而衍生出跨模态的灾害脆弱性评估框架,推动人机协同的人道主义决策支持系统的发展。
数据集最近研究
最新研究方向
在数据驱动的全球人道主义响应日益受到重视的背景下,该数据集聚焦于孟加拉国国际红十字与红新月联合会(IFRC)的紧急援助资金流向,其最新研究方向在于利用机器学习方法对援助资金的请求与到位金额进行建模与预测。结合南亚区域频发的洪水与气旋灾害,该数据有助于探索灾害类型、行政区划等要素与资金缺口之间的关联规律,为优化人道主义资源的预先部署与动态调度提供数据支撑。此外,随着灾后重建中透明问责机制的强化,该数据集亦成为检验援助资金使用效率与调配合理性的关键工具,对提升区域抗灾能力与资金适配性具有深远意义。
以上内容由遇见数据集搜集并总结生成



