我院刘方青团队在人工智能领域顶级期刊IEEE TPAMI上发表数据增广最新研究成果-广东工业大学管理学院

我院刘方青团队在人工智能领域顶级期刊IEEE TPAMI上发表数据增广最新研究成果

时间：2026-04-01点击数：打印

近日，我院刘方青老师（校特聘副教授）在图像分类智能数据增广研究领域取得重要进展。其以第一作者、我校为第一完成单位的研究论文《Positive Data Augmentation Based on Manifold Heuristic Optimization for Image Classification》正式发表于人工智能领域国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》（简称IEEE TPAMI）。该期刊是模式识别与人工智能领域公认的顶刊，为中科院一区TOP期刊、中国计算机学会（CCF）推荐A类国际期刊，在相关领域具有极高的学术影响力。

图1 IEEE官网论文信息

数据增广是解决深度学习训练数据不足、缓解模型过拟合的核心技术，是提升图像分类模型性能的关键支撑。然而，现有主流数据增广方法大多依赖神经网络的反馈信号设计策略（图2），普遍忽略了对数据特征分布的优化，难以保证增广样本与原始数据的分布一致性；基于生成式深度学习的增广方法则需要大规模训练数据支撑，在少样本场景下效果受限，成为制约图像分类模型泛化能力提升的核心瓶颈。

图2 现有数据增广方法与本论文方法框架对比

针对上述技术挑战，研究团队创新性地将正样本增广转化为特征分布优化问题，基于流形假设提出了全新的流形启发式优化算法（MHOA）。该算法流程如图3所示，其遵循“分布保持优先”的核心原则，聚焦图像目标轮廓的关键特征像素邻域构建低维搜索空间，通过优化二维熵等特征指标，精准生成与原始数据统计特征高度对齐的正样本，在保证样本语义一致性与可解释性的同时，大幅提升了增广样本的多样性，有效破解了少样本场景下数据增广的行业痛点。

图3 论文方法（MHOA）框架图

实验结果表明，MHOA算法在Mini-ImageNet、CUB200、CIFAR-FS三大国际通用图像分类基准数据集上，均能显著提升GoogleNet、ResNet18/50、EfficientNet-B1等主流分类网络的识别精度。其中在少样本特性突出的CUB200数据集上，该算法使ResNet50网络的Top-1分类精度提升幅度达24.03%，全面超越了CutMix、MixUp、AutoAugment等十余种国际主流数据增广方法，展现出极强的性能优势与工程应用价值。

论文链接：https://doi.org/10.1109/TPAMI.2026.3657249

上一篇：“四合一”精准帮扶揭阳校区电商专业毕业生就业

下一篇：喜报！我院教师张小日以第一作者在Review of Accounting Studies（FT50）上发表学术论文

学院新闻

学院新闻

我院刘方青团队在人工智能领域顶级期刊IEEE TPAMI上发表数据增广最新研究成果