Dados de métricas de treinamento e dinâmica do plano de informação em Redes Neurais Profundas via Aprendizado por Reforço
收藏DataCite Commons2026-04-17 更新2026-05-07 收录
下载链接:
https://redu.unicamp.br/citation?persistentId=doi:10.25824/redu/KPCX2K
下载链接
链接失效反馈官方服务:
资源简介:
Este conjunto de dados compreende os registros brutos e processados obtidos durante o treinamento de agentes de Aprendizado por Reforço (Deep Reinforcement Learning). Os dados incluem valores de recompensa, funções de perda, pesos das camadas da rede neural e as estimativas de informação mútua calculadas entre as camadas de entrada, ocultas e de saída ao longo das épocas de treinamento. A metodologia consistiu na coleta sistemática de ativações neurais para a construção do plano de informação, visando analisar os processos de compressão e ajuste durante o aprendizado do agente. Os dados estão estruturados em formatos que permitem a reconstrução das trajetórias de aprendizado e a visualização da evolução das representações internas da rede frente aos estímulos do ambiente.
提供机构:
Repositório de Dados de Pesquisa da Unicamp
创建时间:
2025-08-25



