近日,我院刘方青老师(校特聘副教授)在图像分类智能数据增广研究领域取得重要进展。其以第一作者、我校为第一完成单位的研究论文《Positive Data Augmentation Based on Manifold Heuristic Optimization for Image Classification》正式发表于人工智能领域国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(简称IEEE TPAMI)。该期刊是模式识别与人工智能领域公认的顶刊,为中科院一区TOP期刊、中国计算机学会(CCF)推荐A类国际期刊,在相关领域具有极高的学术影响力。
图1 IEEE官网论文信息
数据增广是解决深度学习训练数据不足、缓解模型过拟合的核心技术,是提升图像分类模型性能的关键支撑。然而,现有主流数据增广方法大多依赖神经网络的反馈信号设计策略(图2),普遍忽略了对数据特征分布的优化,难以保证增广样本与原始数据的分布一致性;基于生成式深度学习的增广方法则需要大规模训练数据支撑,在少样本场景下效果受限,成为制约图像分类模型泛化能力提升的核心瓶颈。
图2 现有数据增广方法与本论文方法框架对比
针对上述技术挑战,研究团队创新性地将正样本增广转化为特征分布优化问题,基于流形假设提出了全新的流形启发式优化算法(MHOA)。该算法流程如图3所示,其遵循“分布保持优先”的核心原则,聚焦图像目标轮廓的关键特征像素邻域构建低维搜索空间,通过优化二维熵等特征指标,精准生成与原始数据统计特征高度对齐的正样本,在保证样本语义一致性与可解释性的同时,大幅提升了增广样本的多样性,有效破解了少样本场景下数据增广的行业痛点。
图3 论文方法(MHOA)框架图
实验结果表明,MHOA算法在Mini-ImageNet、CUB200、CIFAR-FS三大国际通用图像分类基准数据集上,均能显著提升GoogleNet、ResNet18/50、EfficientNet-B1等主流分类网络的识别精度。其中在少样本特性突出的CUB200数据集上,该算法使ResNet50网络的Top-1分类精度提升幅度达24.03%,全面超越了CutMix、MixUp、AutoAugment等十余种国际主流数据增广方法,展现出极强的性能优势与工程应用价值。
论文链接:https://doi.org/10.1109/TPAMI.2026.3657249