majestrino-1.00-16xk5-sae-features
收藏Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/laion/majestrino-1.00-16xk5-sae-features
下载链接
链接失效反馈官方服务:
资源简介:
Majestrino 1.00 SAE特征音频样本数据集是一个多语言音频分类数据集,主要用于稀疏自编码器(SAE)的可解释性研究。数据集包含12,288个特征中的10,684个活跃特征,每个特征最多包含2,000个激活度最高的音频样本。音频采用Opus格式(24 kbps OGG容器)存储,总共有1,069个TAR文件。每个TAR文件包含10个特征的音频样本和元数据。元数据文件(metadata.json)包含特征ID、标题、描述、激活次数、音频文件列表及其激活分数等信息。数据集适用于音频特征分析、语音识别和自编码器可解释性研究等任务。
提供机构:
LAION eV
创建时间:
2026-03-16



