李雄教授团队在虚拟样本生成技术理论方面取得新进展

发布人:本站编辑

      近日,博彩网址-博彩平台网址-最新博彩网址 李雄教授课题组在国际信息融合领域顶级期刊《Information Fusion》(中科院一区TOP期刊,影响因子14.8,位列计算机科学:硬件与架构、信号处理类期刊全球第一)发表题为“Towards virtual sample generation with various data conditions: A comprehensive review”的综述论文。该文深入研究了虚拟样本生成的基本原理,提出了一种通用的虚拟样本生成过程,构建了虚拟样本生成技术的理论框架,为破解制约人工智能发展的“小样本学习”世界难题提供了一种系统解决方案。

 

 

      在数据驱动技术浪潮席卷全球的当下,面对制约人工智能深度应用的“数据荒”关键瓶颈,研究团队突破性构建虚拟样本生成技术的两大方法论体系。基于对技术本质的系统解构,首次提出“统计学-深度学习”双轨范式理论,不仅明晰了两大技术路线的内在生成机理与适用疆界,更开创了面向不同数据条件的样本生成技术选择图谱。其中,统计学方法基于概率论与经典统计模型,通过数据分布近似或样本插值等生成虚拟样本,包括Bootstrap、合成少数类过采样技术(SMOTE)等经典算法;深度学习方法依托深度生成模型,利用其强大的非线性建模能力捕捉复杂数据模式,如变分自编码器(VAE)、生成对抗网络(GAN)、扩散模型(DM)等前沿模型。

 

     该文还深入分析了统计学方法与深度学习方法的数学差异:前者依赖先验假设与低维建模,后者则通过参数化网络实现高维数据表征。针对深度学习模型普遍依赖大数据训练的局限,创新性提出将深度生成技术进一步细分为充分数据与有限数据场景,并对这些技术开展了数据类型、计算复杂度、样本规模、应用场景等多维度的评估。通过对比分析主流生成技术的优势与局限性,为制造、医疗、金融等领域不同应用场景下的技术选型提供了科学决策依据。

 

      博彩网址 博士生蒋燕梅为第一作者,李雄教授为通讯作者。本研究标志着博彩网址 在人工智能基础理论和数据驱动建模技术研究领域取得新进展。


 


 

论文在线链接:

//doi.org/10.1016/j.inffus.2024.102874