科研动态 | 中山大学张清凌教授团队在遥感顶刊IEEE J-STARS发文:少样本、强泛化,DFANet革新无人机果园智能监测

发布人:胡文清 责任审核人:罗愈业

摘要

        面向智慧农业中果树冠层精准管理的迫切需求,我院张清凌教授团队在遥感领域权威期刊IEEE J-STARS发表最新研究成果。该研究针对无人机影像果树树冠实例分割长期面临的“标注成本高昂”与“跨域迁移性能骤降”两大核心瓶颈,创新性地提出了DFANet框架。该方法在仅需10%目标域标注样本的极端条件下,通过半监督学习与双层域对齐机制,实现了模型在不同果园乃至不同树种间的稳定、高效迁移,并显著提升了密集树冠的边界分割精度。这项工作不仅为果园生产的精细化、智能化管理提供了强有力的算法工具,其“以少驭多、稳而弥坚”的核心思想,也为航天对地观测领域中处理海量、多样、标注稀缺的遥感数据提供了极具价值的解决范式。

 

正文

        近日,中山大学航空航天学院张清凌教授团队在遥感领域知名期刊《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》(IEEE J-STARS,中科院二区Top)上发表了题为“Dual-Level Domain Alignment and Boundary-Aware Optimization for Semi-Supervised Tree Crown Instance Segmentation in UAV Imagery”的研究论文。该研究直指无人机遥感农业应用落地中的关键痛点,为少标注、强泛化的树冠实例分割提供了创新性解决方案。

 

  • 从农业痛点出发/ 标注之困与域偏移之难

        利用高分辨率无人机影像实现单株树冠的精准提取,是进行果树产量预估、长势诊断、病虫害监测及水肥精准调控的基石。然而,在实际部署中,模型常遇到双重挑战:其一,标注成本极高。为每一个新的果园或树种绘制像素级实例标注,需耗费大量人力与时间,严重制约技术推广。其二,域偏移问题显著。当在一个果园训练好的模型直接应用于另一个光照条件、种植密度、树冠形态乃至背景环境不同的果园时,分割性能往往会急剧下降。

        传统完全监督学习方法严重依赖大量标注数据,无法解决新场景的标注短缺问题;而无监督域适应方法在树冠这类密集、边界模糊的目标上表现又不尽如人意。如何让模型既能“举一反三”(强泛化),又能“勤俭持家”(少标注),成为智慧果园乃至更广阔遥感应用场景中的共性难题。

图1 无人机果园树冠分割中的域偏移与标注稀缺问题示意图

 

  • DFANet / 三管齐下,破解双重难题

        针对以上挑战,研究团队提出了双焦点对齐网络(Dual-Focus and Alignment Network, DFANet)。该框架从学习范式、特征对齐与损失优化三个层面进行了协同创新设计:

        1.半监督学习范式,充分利用未标注数据:研究采用Mean Teacher框架,让模型在少量已标注样本和大量同果园未标注样本上协同训练。教师网络为未标注数据生成稳定的“伪标签”,使学生网络能够充分挖掘目标域数据自身的丰富信息,极大缓解了对昂贵标注的依赖。

图2 DFANet 总体框架

 

        2.双层对抗域对齐,穿透表象抓住本质:为克服不同果园间的域差异,团队创新性地设计了双层对抗域对齐网络。该方法不仅在全图层面(全局特征)上对齐光照、背景等整体风格差异,更在目标实例层面(实例特征)上对齐树冠本身的形态、纹理等本质特征。这种“由表及里”的对齐策略,使模型能够剥离场景干扰,学习到更具迁移泛化能力的树冠核心表征。

图3 双层对抗域对齐网络示意图

 

        3.边界感知双焦点损失,精细分割拒绝粘连:针对密集果园中树冠彼此粘连、边界难以划清的难题,团队设计了边界感知的双焦点Dice损失。该损失函数不仅关注树冠内部区域的分割质量,更专门强化对边界区域的优化,并通过非对称惩罚有效抑制分割结果向外“溢出”,从而在复杂场景下也能勾勒出清晰、独立的单株树冠。

图4 边界感知双焦点损失示意图

 

  • 实验验证 / 少样本条件下的卓越性能与强大泛化

        研究在包括荔枝园和针叶林在内的三套差异显著的无人机数据集上,构建了六种迁移场景进行系统验证。在所有实验中,仅使用10%的目标域标注数据

图5 实验使用的三类无人机树冠数据集,包括荔枝园和针叶林场景

 

        结果表明,DFANet展现出强大的性能优势与泛化稳健性。在同类果园(如iSCHID→灵山荔枝园)迁移任务中,DFANet的性能指标(AP)较传统监督基线提升超过130%。在极具挑战的跨物种迁移(如从荔枝园迁移至针叶林)场景下,许多对比方法近乎失效,而DFANet仍能保持有效的分割能力,显著优于现有方法。

        消融实验进一步证实了各模块的有效性与互补性:双层域对齐优于单层对齐;边界感知损失对解决粘连问题至关重要。这证明了DFANet框架设计的合理性与协同增益。

图6 不同目标域标注比例下的定量性能比较

 

图7 不同数据集与不同冠层密度条件下的定性分割结果对比

 

  • 结论与展望

        该研究针对无人机果树树冠实例分割中的实际瓶颈,提出了DFANet这一创新框架,在极少的标注成本下实现了跨域稳健的高精度分割,具备重要的实际应用价值。更重要的是,这项工作从具体问题中抽象出了一套应对“标注稀缺”和“分布差异”的联合学习方法,其核心思想可广泛启发于各类遥感影像的智能解译任务中,体现了航空航天学科与人工智能、农业科学深度交叉所产生的创新活力。

        未来,团队将继续探索结合多模态数据(如LiDAR、多光谱)与模型轻量化技术,进一步推动相关算法向更高精度、更低成本、更强实时性与更低部署门槛的方向发展,为智慧农业与智能对地观测贡献力量。


论文信息

        期刊:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing (IEEE J-STARS)

        题目:Dual-Level Domain Alignment and Boundary-Aware Optimization for Semi-Supervised Tree Crown Instance Segmentation in UAV Imagery

        作者:吴少航(航空航天工程2022级本科生), 庄博源, 王志盼, 张清凌*

        DOI: 10.1109/JSTARS.2026.3671096

        第一/通讯单位:中山大学航空航天学院
 


排版 | 梁靖靖

初审 | 张清凌 张怀钦

审核 | 张锦绣 赵晓江

审核发布 | 罗愈业

 

扫描此二维码分享