five

electricsheepafrica/africa-assessment-registry-mozambique

收藏
Hugging Face2026-04-06 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-assessment-registry-mozambique
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - no-annotation language_creators: - found language: - en license: cc-by-4.0 multilinguality: - monolingual size_categories: - n<1K source_datasets: - original task_categories: - other task_ids: [] tags: - africa - humanitarian - hdx - electric-sheep-africa - cyclones-hurricanes-typhoons - needs-assessment - moz pretty_name: "Assessment Registry Mozambique" dataset_info: splits: - name: train num_examples: 25 - name: test num_examples: 6 --- # Assessment Registry Mozambique **Publisher:** HDX · **Source:** [HDX](https://data.humdata.org/dataset/assessment-registry-mozambique) · **License:** `cc-by` · **Updated:** 2025-04-25 --- ## Abstract Rapid Assessments registry for Mozambique Each row in this dataset represents geolocated point observations. Temporal coverage is indicated by the `start_date`, `end_date` column(s). Geographic scope: **MOZ**. *Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).* --- ## Dataset Characteristics | | | |---|---| | **Domain** | Demographics and population | | **Unit of observation** | Geolocated point observations | | **Rows (total)** | 32 | | **Columns** | 16 (0 numeric, 14 categorical, 2 datetime) | | **Train split** | 25 rows | | **Test split** | 6 rows | | **Geographic scope** | MOZ | | **Publisher** | HDX | | **HDX last updated** | 2025-04-25 | --- ## Variables **Geographic** — `location` (Nhamatanda, Buzi, Cidade Da Beira), `other_location` (Chissinguana, Dondo, Mafambisse, Dombe, Inchope, Southern Sofala, Southern Manica, Northern Inhambane), `methodology` (Aerial, Aerial assessment, METODOLOGIA E LIMITAÇÕES: A avaliação foi realizada usando o formulário de Avaliação Rápida do INGC, versão de 2017. O formulário foi adaptado pelo IFRC para um formulário de recolha de dados móvel KoBo. O formulário foi depois partilhado com o INGC, as ONG participantes e as agências das NU para ser usado para a avaliação. O IFRC forneceu formação rápida sobre a utilização do formulário para assegurar a consistência da recolha de dados. O IOM usou um formulário em papel para a introdução dos dados e depois carregou o formulário no Kobo para a análise dos dados. Os campos do formulário Kobo não correspondiam exactamente ao formulário do IFRC derivado do Kobo, portanto procedeu-se a um processo de limpeza dos dados, necessário para fazer corresponder estes campos. Além disso, as discrepâncias na formação, enumeração e tradução do formulário entre o formulário e o processo do IOM e o multi-agências podem causar inexactidões. A composição das equipas foi de equipas de quatro x duas pessoas. Os dados foram recolhidos dos informadores-chave identificados pelas autoridades governamentais locais. Os dados foram limpos e analisados em Excel. Os resultados foram usados para elaborar um método de avaliação revisto que teve início a 1 de Abril. Tradução de Inglês para Português gentilmente cedido por Translators without Borders.), `population_type_s` (All affected population, Elderly, Displaced population), `report_accessibility` (Publicly Available, Available on Request, Not Available) and 2 others. **Temporal** — `start_date`, `end_date`. **Identifier / Metadata** — `title` (MRA Assessments, Site Profiles, Beira, Nhamatanda, Dondo (9 April 2019), Mozambique: Rapid Assessment Report - Tropical Cyclone IDAI, Beira City), `esa_source`, `esa_processed`. **Other** — `leading_organizations` (HelpAge International, Government of Mozambique - National Disaster Management Institute;International Federation of Red Cross and Red Crescent Societies;United Nations Office for the Coordination of Humanitarian Affairs;COSACA Consortium, Site Management & Site Development Sector - Cox's Bazar/Bangladesh), `cluster_s_sector_s` (Protection, Water Sanitation Hygiene (WASH);Education;Emergency Shelter and NFI;Food Security and Livelihoods;Health, Education;Emergency Shelter and NFI;Food Security and Livelihoods;Protection), `status` (Report completed, Draft / Preliminary Results, Planned), `report_file` (https://www.humanitarianresponse.info/sites/www.humanitarianresponse.info/files/2019/04/MOZ_Site_Profiles_Round_2_V1_Revised.pdf, https://www.humanitarianresponse.info/sites/www.humanitarianresponse.info/files/assessments/44_-_americares_assessment_report_-_chissiguana.pdf, https://www.humanitarianresponse.info/sites/www.humanitarianresponse.info/files/2019/04/2019-04-MOZ-IDAI-aerial_assessment_report.pdf). --- ## Quick Start ```python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-assessment-registry-mozambique") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() ``` --- ## Schema | Column | Type | Null % | Range / Sample Values | |---|---|---|---| | `title` | object | 0.0% | MRA Assessments, Site Profiles, Beira, Nhamatanda, Dondo (9 April 2019), Mozambique: Rapid Assessment Report - Tropical Cyclone IDAI, Beira City | | `location` | object | 0.0% | Nhamatanda, Buzi, Cidade Da Beira | | `other_location` | object | 53.1% | Chissinguana, Dondo, Mafambisse, Dombe, Inchope, Southern Sofala, Southern Manica, Northern Inhambane | | `leading_organizations` | object | 18.8% | HelpAge International, Government of Mozambique - National Disaster Management Institute;International Federation of Red Cross and Red Crescent Societies;United Nations Office for the Coordination of Humanitarian Affairs;COSACA Consortium, Site Management & Site Development Sector - Cox's Bazar/Bangladesh | | `cluster_s_sector_s` | object | 62.5% | Protection, Water Sanitation Hygiene (WASH);Education;Emergency Shelter and NFI;Food Security and Livelihoods;Health, Education;Emergency Shelter and NFI;Food Security and Livelihoods;Protection | | `start_date` | datetime64[ns] | 0.0% | | | `end_date` | datetime64[ns] | 0.0% | | | `status` | object | 0.0% | Report completed, Draft / Preliminary Results, Planned | | `methodology` | object | 75.0% | Aerial, Aerial assessment, METODOLOGIA E LIMITAÇÕES: A avaliação foi realizada usando o formulário de Avaliação Rápida do INGC, versão de 2017. O formulário foi adaptado pelo IFRC para um formulário de recolha de dados móvel KoBo. O formulário foi depois partilhado com o INGC, as ONG participantes e as agências das NU para ser usado para a avaliação. O IFRC forneceu formação rápida sobre a utilização do formulário para assegurar a consistência da recolha de dados. O IOM usou um formulário em papel para a introdução dos dados e depois carregou o formulário no Kobo para a análise dos dados. Os campos do formulário Kobo não correspondiam exactamente ao formulário do IFRC derivado do Kobo, portanto procedeu-se a um processo de limpeza dos dados, necessário para fazer corresponder estes campos. Além disso, as discrepâncias na formação, enumeração e tradução do formulário entre o formulário e o processo do IOM e o multi-agências podem causar inexactidões. A composição das equipas foi de equipas de quatro x duas pessoas. Os dados foram recolhidos dos informadores-chave identificados pelas autoridades governamentais locais. Os dados foram limpos e analisados em Excel. Os resultados foram usados para elaborar um método de avaliação revisto que teve início a 1 de Abril. Tradução de Inglês para Português gentilmente cedido por Translators without Borders. | | `population_type_s` | object | 0.0% | All affected population, Elderly, Displaced population | | `report_accessibility` | object | 0.0% | Publicly Available, Available on Request, Not Available | | `report_file` | object | 37.5% | https://www.humanitarianresponse.info/sites/www.humanitarianresponse.info/files/2019/04/MOZ_Site_Profiles_Round_2_V1_Revised.pdf, https://www.humanitarianresponse.info/sites/www.humanitarianresponse.info/files/assessments/44_-_americares_assessment_report_-_chissiguana.pdf, https://www.humanitarianresponse.info/sites/www.humanitarianresponse.info/files/2019/04/2019-04-MOZ-IDAI-aerial_assessment_report.pdf | | `questionnaire_accessibility` | object | 9.4% | | | `accessibility` | object | 0.0% | | | `esa_source` | object | 0.0% | | | `esa_processed` | object | 0.0% | | --- ## Numeric Summary | Column | Min | Max | Mean | Median | |---|---|---|---|---| _No numeric columns._ --- ## Curation Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. 16 column(s) with >80% missing values were removed: `participating_organization_s`, `collection_method_s`, `frequency`, `key_findings`, `sample_size`, `broken_handler_search_api_index_default_node_index_field_geographic_level`.... 2 column(s) were cast from string to numeric or datetime based on parse-success rate (>85% threshold). The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet. --- ## Limitations - Data originates from HDX and has not been independently validated by ESA. - Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection. - The following columns have >20% missing values and should be treated with caution in modelling: `other_location`, `cluster_s_sector_s`, `methodology`, `report_file`. - Refer to the [original HDX dataset page](https://data.humdata.org/dataset/assessment-registry-mozambique) for the publisher's own methodology notes and caveats. --- ## Citation ```bibtex @dataset{hdx_africa_assessment_registry_mozambique, title = {Assessment Registry Mozambique}, author = {HDX}, year = {2025}, url = {https://data.humdata.org/dataset/assessment-registry-mozambique}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } ``` --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
二维码
社区交流群
二维码
科研交流群
商业服务