围绕“感知—推理—交互”,博彩平台网址研究生三项成果被CVPR 2026接收
近年来,最新博彩平台网址面向人工智能与智能无人系统发展需求,持续布局机器视觉、多模态理解、智能感知与交互等前沿交叉方向。依托中山大学人工智能研究院与博彩网址相关科研平台建设“洋葱AI前沿学社”,并在此基础上形成面向研究生科研训练的人工智能基础研究小组,组织博彩网址研究生围绕人工智能前沿开展论文研读、组会交流、学术讨论和科研实践,推动研究生在真实科研问题中提升创新能力,也产出了一系列的成果,其中的三项研究成果被国际计算机视觉与模式识别会议 CVPR 2026 接收。CVPR 是全球计算机视觉领域公认的顶级学术会议之一,长期代表着该领域的重要前沿方向和研究水平。三项工作围绕智能系统“感知—推理—交互”能力链条展开,分别聚焦空地跨视角行人重识别、轻量级多模态大模型视频推理和在线微手势识别,为复杂场景下的智能感知、跨模态理解与鲁棒推理、细粒度自然交互提供了新的方法参考。
围绕复杂环境感知,硕士研究生蔡泽强的论文“View-Aware Semantic Alignment for Aerial-Ground Person Re-Identification”面向空地跨视角行人重识别任务,针对无人机与地面摄像头之间视角差异大、局部区域错位明显、身份判别信息难以稳定提取等问题,提出视角感知语义对齐框架 ViSA。该方法突破传统“视角不变”建模思路,通过构建视角相关专家机制与双分支局部融合模块,同时建模跨视角共享身份信息与视角相关细粒度线索,实现更加稳健、精细的跨视角特征对齐。

实验结果表明,该方法在 AG-ReID.v2、CARGO 和 LAGPeR 等多个空地行人重识别基准数据集上均取得了优异性能,尤其在具有代表性的 CARGO 跨视角协议下,mAP 提升达到 10.06%,展现出良好的方法有效性与应用潜力。该研究为空地协同场景下的智能感知与目标关联提供了新的技术思路。

围绕跨模态理解与鲁棒推理,硕士研究生吴竞择的论文“Beyond Perceptual Shortcuts: Causal-Inspired Debiasing Optimization for Generalizable Video Reasoning in Lightweight MLLMs”聚焦轻量级多模态大模型的视频推理问题。针对强化学习微调过程中模型容易受到数据偏差影响、倾向于依赖“感知捷径”而非真实推理能力的现象,该工作提出因果启发式去偏优化框架 VideoThinker。该方法首先通过偏差感知训练构建“偏差模型”,刻画数据中普遍存在的捷径行为;随后提出因果去偏策略优化算法,通过排斥式目标函数推动主模型远离偏差模型所代表的错误推理路径,同时朝向更具泛化性的正确解答方向优化,从而提升轻量级模型在复杂视频推理任务中的鲁棒性与泛化能力。

实验结果表明,VideoThinker-R1 作为 3B 规模模型,在同量级对比中取得领先表现,并在部分基准上超过更大规模的 7B 模型;其中,在 CLEVRER 数据集上仅使用少量训练样本即可达到 79.1% 的准确率,展现出因果去偏机制在抑制捷径学习、增强真实推理能力方面的显著效果。

面向细粒度智能交互,博士研究生常皓晨的论文“OMG-Bench: A New Challenging Benchmark for Skeleton-based Online Micro Hand Gesture Recognition”针对现有微手势研究中缺乏大规模公开基准、现有框架对连续微手势时序建模不足等问题,提出首个大规模公开的基于手部骨架的在线微手势识别数据集 OMG-Bench,并进一步设计端到端在线识别框架 HMATr。该方法通过构建分层记忆建模机制与位置感知查询,在统一检测与分类的同时,充分利用跨时间窗口的历史信息,有效提升对短时、细粒度、连续微手势的识别能力。

实验结果表明,HMATr 在 OMG-Bench 上取得了显著优于现有方法的性能,在多项指标上均表现突出。其中,检测率比 SOTA 方法高出 7.6%,同时具备更高的推理效率。该研究不仅填补了骨架在线微手势识别领域高质量公开基准的空白,也为实时人机交互场景中的细粒度动作理解提供了新的技术方案。

三项成果围绕智能系统“感知—推理—交互”能力链条展开,分别从跨视角视觉表征学习、轻量级多模态推理优化和在线微手势识别等方向回应复杂场景下的关键技术需求,为空天地协同感知、视频理解、智能推理与自然交互等研究提供了新的方法参考。这些成果的取得,既体现了博彩网址在视觉智能、多模态理解与智能无人系统等方向上的持续积累,也展现了博彩网址依托“洋葱AI前沿学社”和人工智能基础研究小组加强研究生科研训练、推动学生在前沿交叉领域成长成才的阶段性成效。未来,博彩网址将继续面向国家战略需求和学科前沿问题,推动科研平台、学术组织和研究生培养深度融合,引导研究生在高水平科研实践中拓宽视野、锤炼能力、提升本领。

