Dados de métricas de treinamento e dinâmica do plano de informação em Redes Neurais Profundas via Aprendizado por Reforço

Name: Dados de métricas de treinamento e dinâmica do plano de informação em Redes Neurais Profundas via Aprendizado por Reforço
Creator: Repositório de Dados de Pesquisa da Unicamp
Published: 2026-04-17 10:44:03
License: 暂无描述

DataCite Commons2026-04-17 更新2026-05-07 收录

下载链接：

https://redu.unicamp.br/citation?persistentId=doi:10.25824/redu/KPCX2K

下载链接

链接失效反馈

官方服务：

资源简介：

Este conjunto de dados compreende os registros brutos e processados obtidos durante o treinamento de agentes de Aprendizado por Reforço (Deep Reinforcement Learning). Os dados incluem valores de recompensa, funções de perda, pesos das camadas da rede neural e as estimativas de informação mútua calculadas entre as camadas de entrada, ocultas e de saída ao longo das épocas de treinamento. A metodologia consistiu na coleta sistemática de ativações neurais para a construção do plano de informação, visando analisar os processos de compressão e ajuste durante o aprendizado do agente. Os dados estão estruturados em formatos que permitem a reconstrução das trajetórias de aprendizado e a visualização da evolução das representações internas da rede frente aos estímulos do ambiente.

提供机构：

Repositório de Dados de Pesquisa da Unicamp

创建时间：

2025-08-25