FFT-75
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/FFT-75
下载链接
链接失效反馈官方服务:
资源简介:
FFT-75 数据集包含来自 75 种流行文件类型的随机采样、可能重叠的文件片段。它是一个多样化且平衡的数据集,标有类 ID,可用于训练有监督的机器学习模型。我们区分了 6 种不同粒度的不同场景,并提供了 512 和 4096 字节块的变体。在每种情况下,我们都采样了一个平衡的数据集并将数据拆分如下:80% 用于训练,10% 用于测试,10% 用于验证。
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍

背景与挑战
背景概述
FFT-75数据集是一个多样化和平衡的数据集,包含75种流行文件类型的随机采样文件片段,并标注了类ID,适用于监督机器学习模型训练。它提供了6种不同粒度的场景和两种字节块变体(512和4096字节),数据按80%训练、10%测试和10%验证的比例划分。
以上内容由遇见数据集搜集并总结生成



