five

electricsheepafrica/africa-ports-cote-divoire

收藏
Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-ports-cote-divoire
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为科特迪瓦:每日港口活动数据与货物运输估计,主要记录了科特迪瓦港口的日常活动数据,包括港口呼叫次数、进口和出口货物量(以公吨计)的估计。数据集中的每一行代表国家层面的汇总数据。数据最后更新于2026年4月21日,地理范围为科特迪瓦(CIV)。数据集由PortWatch发布,并通过HDX提供,由Electric Sheep Africa整理为适合机器学习的Parquet格式。数据集包含7,992行数据,分为6,393行的训练集和1,598行的测试集,共有31个特征列,包括地理、时间、标识符/元数据和其他类型的数据。

The dataset is named Côte dIvoire: Daily Port Activity Data and Shipment Estimates and primarily records daily port activity data for ports in Côte dIvoire, including estimates of port call counts and import/export shipment volumes (in metric tons). Each row in the dataset represents country-level aggregate data. The data was last updated on HDX on 2026-04-21, with a geographic scope of CIV. The dataset is published by PortWatch and made available via HDX, curated into an ML-ready Parquet format by Electric Sheep Africa. It contains 7,992 rows of data, split into 6,393 rows for training and 1,598 rows for testing, with a total of 31 feature columns including geographic, temporal, identifier/metadata, and other types of data.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自人道主义数据交换平台(HDX)上由PortWatch发布的科特迪瓦港口日活动数据与货运估算信息。Electric Sheep Africa团队通过CKAN API下载原始数据,并将其转换为Parquet格式。在数据清洗过程中,团队统一将列名转换为小写并标准化为蛇形命名法,同时将常见的缺失值标记如“N/A”、“null”等统一归并为NaN。基于超过85%的解析成功率,部分列从字符串转换为数值或日期时间类型。最终,数据集以固定随机种子(42)按80/20比例划分为训练集和测试集,并以Snappy压缩的Parquet格式存储,确保了数据的高效读取与复现性。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,仅需一行代码即可获取训练集和测试集,并将其转换为Pandas DataFrame进行后续分析。数据集预置的分类和回归任务标签使其适用于构建预测港口活动或货运量的机器学习模型。此外,用户可直接引用PortWatch的原始方法论说明,并结合ESA团队提供的清洗文档以确保使用时的准确性。推荐将数据应用于西非港口物流研究、人道主义供应链优化或经济指标预测等场景。
背景与挑战
背景概述
在非洲大陆经济转型与全球贸易深度融合的背景下,港口作为物流枢纽其运营效率直接影响区域供应链的稳定与发展。科特迪瓦作为西非重要经济体,其港口活动数据对于分析贸易模式、评估人道主义需求及制定发展政策至关重要。PortWatch于2026年发布了这一数据集,并由Electric Sheep Africa机构进行机器学习友好化处理,转化为包含每日港口停靠次数及进出口货物估计吨数等31个变量的结构化数据。该数据集覆盖2019年至2026年间的国家层面聚合信息,为研究西非贸易动态、预测港口流量以及构建人道主义响应模型提供了关键基础,对数据驱动的发展研究具有显著推动作用。
当前挑战
该数据集所解决的领域问题聚焦于将非结构化的港口活动原始观测转化为可用于机器学习建模的结构化数据,从而实现对科特迪瓦贸易流量的分析与预测。构建过程中面临多重挑战:首先,原始数据源自PortWatch的多元采集系统,存在定义不一致和潜在的采样偏差,自动清洗流程难以完全纠正这些系统性误差。其次,将不同格式的缺失值统一转化为NaN并完成数据类型推断时,需要权衡准确性与泛用性,尤其对数值型字段的边界值处理需格外谨慎。此外,数据集的时间跨度有限(2019–2026年),对长期趋势建模和极端事件预测构成约束。最后,数据未经过独立验证,模型依赖的可靠性需基于原始发布方的方法论说明进行审慎评估。
常用场景
经典使用场景
在非洲人道主义与发展数据研究领域,科特迪瓦港口日度活动数据集(africa-ports-cote-divoire)作为一项里程碑式的结构化资源,为学者提供了追踪阿比让、圣佩德罗及海上石油终端每日船舶停靠频次与进出口货物吨位变化的精炼面板数据。该数据集最经典的应用场景集中于构建时间序列预测模型与分类任务,研究者可基于2019年至2026年间涵盖31个字段的观测记录,利用港口调用次数、货物类型(如集装箱、干散货、滚装船)等特征,对次日或次月的港口吞吐量进行回归预测,或依据船舶活动模式对港口运营状态进行多类别分类。其每日颗粒度的国家层面聚合特性,使经济学、物流工程及灾害管理领域的实证分析得以在统一框架下展开,为西非区域贸易流动态势的量化刻画提供了坚实的数据基石。
解决学术问题
该数据集精准回应了关于发展中国家港口经济活动量化分析的学术诉求,尤其破解了科特迪瓦这一西非贸易枢纽长期缺乏公开、结构化港口运营时序数据的困境。通过整合PortWatch与HDX平台的原始记录并经由标准化清洗流程,研究得以系统性地探究港口船舶调用模式与进出口波动之间的动态关联,填补了传统宏观贸易统计在日度频率上的观测空白。其蕴含的15种船舶类型与对应货物运量字段,使学者能够突破既有研究依赖月均或年均数据的局限,以更高时间分辨率检验突发事件(如疫情、自然灾害)对供应链韧性的冲击效应。这一资源的持续更新机制(至2026年)更是保障了长周期因果推断与政策评估的可靠性,为西非经济与物流学科的实证革命注入了关键动力。
实际应用
在实际应用层面,该数据集为科特迪瓦政府、国际人道主义组织及物流企业提供了可操作的决策支持工具。港务管理部门可基于历史船舶调用频次与货物吞吐量的时序规律,优化港口锚地分配与泊位调度计划,提升基础设施利用效率;海关与贸易监管部门则能借助进出口吨位的实时估算模型,识别异常交易信号并强化风险预警能力。对于联合国人道主义事务协调厅等机构而言,通过分析散货船与集装箱船的活动趋势,可在粮食或医疗物资援助的航运规划中更精准地预判运力瓶颈。此外,物流供应链企业可通过该数据集训练运输需求预测算法,调整科特迪瓦至内陆国家的多式联运方案,从而降低运营成本并增强西非走廊的货物流通韧性。
数据集最近研究
最新研究方向
该数据集聚焦于科特迪瓦港口日常活动与货运量的时序估计,为西非区域物流动态与贸易流的量化分析提供了标准化、颗粒化的数据基础。当前前沿研究方向正深化利用该数据构建港口活动预测模型,尤其将港口挂靠频次、货种结构与进出口吨位等指标,与全球供应链中断、地缘政治波动及非洲大陆自贸区推进等热点事件关联,探索其对贸易韧性、港口效率及经济安全的影响机制。伴随人道主义数据开源运动与非洲数据基础设施建设浪潮,该数据集被Electric Sheep Africa转化为ML就绪格式,极大降低了机器学习在非洲物流与可持续发展研究中应用的门槛,对推动基于数据驱动的区域韧性规划和灾害应对能力评估具有深远的示范意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作