vinicius-souza/antaq
收藏Hugging Face2026-04-18 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/vinicius-souza/antaq
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-4.0
task_categories:
- tabular-regression
- time-series-forecasting
language:
- pt
tags:
- ports
- brazil
- antaq
- logistics
- shipping
- data-engineering
- medallion-architecture
size_categories:
- 10M<n<100M
---
# ANTAQ — Portos do Brasil (2010–2026)
Dataset construído a partir dos dados abertos da **ANTAQ** (Agência Nacional de Transportes
Aquaviários), cobrindo todas as atracações, cargas e operações nos portos brasileiros de 2010 a 2026.
## Estrutura (Medallion Architecture)
```
silver/ → Parquet por tipo e ano (Bronze → Silver)
gold/ → Tabelas analíticas agregadas (Silver → Gold)
features/ → Feature store para ML
model/ → Modelos treinados + SHAP + model card
```
## Tabelas Silver (12 tipos)
| Tipo | Descrição | Disponível desde |
|------|-----------|-----------------|
| Atracacao | Eventos de atracação | 2010 |
| TemposAtracacao | Tempos operacionais | 2010 |
| TemposAtracacaoParalisacao | Paralisações | 2010 |
| Carga | Movimentação de cargas | 2010 |
| Carga_Conteinerizada | Cargas em contêineres | 2010 |
| Carga_Hidrovia | Movimentação em hidrovias | 2010 |
| Carga_Regiao | Cargas por região geográfica | 2010 |
| Carga_Rio | Cargas em rios | 2010 |
| TaxaOcupacao | Taxa de ocupação dos berços | 2020 |
| TaxaOcupacaoComCarga | Taxa de ocupação com carga | 2020 |
| TaxaOcupacaoTOAtracacao | Taxa de ocupação por atracação | 2020 |
| CargaAreas | Cargas por área portuária | 2023 |
## Tabelas Gold
| Tabela | Descrição |
|--------|-----------|
| atracacao_master | Tabela principal: atracação + tempos + carga |
| carga_por_atracacao | Carga agregada por atracação |
| taxa_ocupacao_anual | Taxa de ocupação anual por porto |
| paralisacoes_por_atracacao | Paralisações por atracação |
| carga_hidrovia_anual | Movimentação anual em hidrovias |
| porto_perfil | Perfil operacional por porto |
## Modelo Preditivo
- **Target 1**: `TEstadia` — tempo total de estadia (horas)
- **Target 2**: `TOperacao` — tempo de operação (horas)
- **Algoritmos**: XGBoost + LightGBM + Quantile Regression (P10/P90)
- **Validação**: TimeSeriesSplit (5 folds, sem data leakage temporal)
- **Explicabilidade**: SHAP values por feature
## Pipeline
```bash
python pipeline/01_converter.py # TXT → Silver
python pipeline/02_agregar.py # Silver → Gold
python pipeline/03_features.py # Gold → Features
python pipeline/04_treinar.py # Treina modelos
python pipeline/05_upload_hub.py # Sobe tudo aqui
```
## Fonte
Dados públicos da ANTAQ: https://web3.antaq.gov.br/ea/
Atualizado em: 2026-04-18
提供机构:
vinicius-souza



