five

vinicius-souza/antaq

收藏
Hugging Face2026-04-18 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/vinicius-souza/antaq
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-4.0 task_categories: - tabular-regression - time-series-forecasting language: - pt tags: - ports - brazil - antaq - logistics - shipping - data-engineering - medallion-architecture size_categories: - 10M<n<100M --- # ANTAQ — Portos do Brasil (2010–2026) Dataset construído a partir dos dados abertos da **ANTAQ** (Agência Nacional de Transportes Aquaviários), cobrindo todas as atracações, cargas e operações nos portos brasileiros de 2010 a 2026. ## Estrutura (Medallion Architecture) ``` silver/ → Parquet por tipo e ano (Bronze → Silver) gold/ → Tabelas analíticas agregadas (Silver → Gold) features/ → Feature store para ML model/ → Modelos treinados + SHAP + model card ``` ## Tabelas Silver (12 tipos) | Tipo | Descrição | Disponível desde | |------|-----------|-----------------| | Atracacao | Eventos de atracação | 2010 | | TemposAtracacao | Tempos operacionais | 2010 | | TemposAtracacaoParalisacao | Paralisações | 2010 | | Carga | Movimentação de cargas | 2010 | | Carga_Conteinerizada | Cargas em contêineres | 2010 | | Carga_Hidrovia | Movimentação em hidrovias | 2010 | | Carga_Regiao | Cargas por região geográfica | 2010 | | Carga_Rio | Cargas em rios | 2010 | | TaxaOcupacao | Taxa de ocupação dos berços | 2020 | | TaxaOcupacaoComCarga | Taxa de ocupação com carga | 2020 | | TaxaOcupacaoTOAtracacao | Taxa de ocupação por atracação | 2020 | | CargaAreas | Cargas por área portuária | 2023 | ## Tabelas Gold | Tabela | Descrição | |--------|-----------| | atracacao_master | Tabela principal: atracação + tempos + carga | | carga_por_atracacao | Carga agregada por atracação | | taxa_ocupacao_anual | Taxa de ocupação anual por porto | | paralisacoes_por_atracacao | Paralisações por atracação | | carga_hidrovia_anual | Movimentação anual em hidrovias | | porto_perfil | Perfil operacional por porto | ## Modelo Preditivo - **Target 1**: `TEstadia` — tempo total de estadia (horas) - **Target 2**: `TOperacao` — tempo de operação (horas) - **Algoritmos**: XGBoost + LightGBM + Quantile Regression (P10/P90) - **Validação**: TimeSeriesSplit (5 folds, sem data leakage temporal) - **Explicabilidade**: SHAP values por feature ## Pipeline ```bash python pipeline/01_converter.py # TXT → Silver python pipeline/02_agregar.py # Silver → Gold python pipeline/03_features.py # Gold → Features python pipeline/04_treinar.py # Treina modelos python pipeline/05_upload_hub.py # Sobe tudo aqui ``` ## Fonte Dados públicos da ANTAQ: https://web3.antaq.gov.br/ea/ Atualizado em: 2026-04-18
提供机构:
vinicius-souza
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作