您所在的位置:首页 - 科学研究 - 科研动态

科研动态

用于对嘈杂和不平衡数据的元学习和类感知自适应阈值的协同稳健学习框架

中文题目:用于对嘈杂和不平衡数据的元学习和类感知自适应阈值的协同稳健学习框架

论文题目: Synergistic Framework of Meta-Learning and Class-Aware Adaptive Thresholding for Robust Learning on Noisy and Imbalanced Data

录用期刊/会议:CPCC2025 (CAA A类会议)

录用时间:2025.5.28

作者列表

1)刘芷含 中国天天色天天(北京)人工智能学院 控制科学与工程 研23级

2)刘建伟 中国天天色天天(北京)人工智能学院 自动化系 教师

摘要:

1) 提出了一种新的鲁棒学习框架ML-CAT(Meta-Learning and Class-Aware Adaptive Thresholding),该框架结合了元学习和基于类的自适应阈值生成方法,有效应对噪声标签和类别不平衡问题,显著提高了模型在复杂数据场景下的鲁棒性和泛化能力。

2) 通过构建基于类特征分布的高斯混合模型(GMM),实现了动态阈值的自适应调整,从而精准区分干净样本与噪声样本。结合元学习的动态样本重加权策略,ML-CAT能够根据样本损失动态优化训练权重,充分利用高置信度样本,抑制噪声样本的负面影响。

3) 研究进一步验证了动态阈值调整与元学习重加权策略的协同作用,表明两者在应对长尾分布和高噪声数据时具有互补性。实验结果证明,ML-CAT在多个长尾噪声数据集上的表现均优于现有方法,展现了其在复杂数据场景下的强大适应能力和稳健性。

背景与动机:

在实际的图像分类任务中,深度神经网络通常面临类别不平衡和标签噪声的双重挑战,这会导致模型预测的偏差和鲁棒性下降。这种问题在医疗影像分析、工业检测等应用领域尤为突出,因为这些领域很难获取大规模、高质量且类别分布平衡的标注数据集。现有研究通常分别针对类别不平衡和标签噪声问题提出解决方案,但在这两种问题同时存在的复杂场景下,现有方法的效果仍然有限。例如,传统的固定阈值方法在区分干净样本和噪声样本时缺乏灵活性,无法适应不同类别和训练阶段的动态变化。此外,现有的样本重加权方法大多依赖人工设计的权重分配策略,缺乏对数据动态分布的自适应能力。

主要内容:

image.png

1 ML-CAT结构图

结论:

本文提出了一种新颖的鲁棒训练框架,专为应对噪声标签和类别不平衡问题而设计。通过结合基于类别高斯混合模型的自适应阈值机制与基于元学习的动态样本重加权策略,该框架显著提升了模型的鲁棒性和性能。自适应阈值模块利用特征的统计分布,在类别层面动态识别高置信度的干净样本,为模型提供更可靠的监督信号;同时,元学习模块通过端到端的方式动态优化样本权重,使模型在训练过程中能够聚焦于更具信息价值和可靠性的样本。实验结果表明,所提出的框架在多个具有噪声标签和类别不平衡的基准数据集上均取得了显著的性能提升,展现出优越的鲁棒性和泛化能力。

展望未来,本文提出的鲁棒学习框架为解决数据质量不完美问题提供了重要的理论基础和实践工具。未来研究可以进一步探索该方法在大规模数据集、多模态场景中的扩展潜力,并将其应用于半监督学习、无监督学习等更复杂的学习范式。此外,如何在更广泛的实际应用中提升模型的适应性和泛化能力,也是值得关注的方向。我们相信,本文的研究成果将为数据质量受限场景下的稳健学习提供新的思路,推动相关领域的发展。 

作者简介:

刘建伟,教师。