five

Mislabel-Detection

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=685817b3195d264c3e8220ff&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
此代码库用于测试实验。深度模型的性能可能受到训练集中标签错误或标签模糊样本的负面影响,而诊断数据集并识别错误标签的样本有助于提升模型的泛化能力。近年来,基于手工设计特征的训练动态(即优化算法迭代留下的痕迹)已被证明能有效定位错误标签的样本。本文进一步提出一种新颖的基于学习的解决方案,即通过一个由LSTM网络实现的噪声检测器,利用原始训练动态作为输入,学习预测样本是否被错误标注。具体而言,该方法通过带有合成标签噪声的数据集以监督方式训练噪声检测器,并能适应各种数据集(无论是自然标签噪声还是合成标签噪声)而无需重新训练。我们通过大量实验评估该方法,在基于合成标签噪声的CIFAR数据集上训练噪声检测器,并在Tiny ImageNet、CUB-200、Caltech-256、WebVision和Clothing1M等数据集上测试。结果表明,该方法在不进行额外适配的情况下能够精准检测各种数据集中的错误标签样本,并超越现有最先进的方法。此外,进一步实验表明,错误标签识别可以指导标签校正(即数据调试),从数据层面为基于算法的最先进技术提供互补提升。
提供机构:
北京百度网讯科技有限公司
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作