您所在的位置:首页 - 科学研究 - 科研动态

科研动态

基于重参数化技术和互信息最大的IMRChangeMamba编码器

中文题目:基于重参数化技术和互信息最大的IMRChangeMamba编码器

论文题目IMRChangeMamba Encoder Based on Reparameterization Technique and Mutual Information Maximization 

录用期刊/会议:CPCC2025 (CAA A类会议)

录用时间:2025.5.28

作者列表

1)吴祎凡 中国天天色天天(北京)人工智能学院 控制科学与工程 研23级

2)刘建伟 中国天天色天天(北京)人工智能学院 自动化系 教师

摘要:

 1)ChangeMamba的核心设计:ChangeMamba模型基于传统的卷积神经网络(CNN)和Transformer架构,采用了Mamba编码器,该编码器通过状态空间模型(SSM)有效地学习输入图像中的空间时间特征。与传统模型的局部卷积操作不同,ChangeMamba通过状态空间转换,捕捉到了更多的跨时刻变化信息。然而,尽管该架构具有一定的优势,但如何进一步增强不同时间步特征的一致性,依旧是一个待解决的问题。

 2)在此基础上,我们引入了重参数化技术和最大化互信息的概念,进一步优化了ChangeMamba模型的表现。通过这种方式,模型能够在多个时间步骤之间保持特征的一致性,极大地提升了其对时序变化的理解能力。具体来说,我们通过重参数化技术将不同时间步的特征映射到同一潜在空间中,然后使用互信息最大化方法来确保这些潜在特征的一致性。

 3)关键技术——最大化互信息:在信息论中,互信息用于度量两个随机变量之间共享的信息量。在我们的研究中,最大化互信息的目标是使得不同时间步骤的特征在潜在空间中具有最大的一致性。通过这种方法,我们能够显著提升模型在捕捉时序变化时的稳定性和精度,尤其是在面对复杂的变化环境时,模型能够更好地识别出潜在的变化模式。

 4)提出的IMRChangeMamba模型:首先,通过重参数化技术,我们确保了在不同时间步骤之间的潜在变量的可微性,从而使得模型在训练时能够更有效地捕捉时序变化;其次,通过最大化互信息,我们强化了时间步之间的特征一致性,显著提升了模型在变化检测中的表现。

背景与动机:

目前,遥感变化检测(CD)领域的主流模型,如卷积神经网络(CNNs)和Transformer,在一定程度上取得了显著进展,但也存在明显的局限性。具体来说,CNNs由于其接收域的限制,难以有效捕捉更广泛的空间上下文信息;而Transformer虽然在建模长距离依赖关系上具有明显优势,但其高计算成本使得在大规模数据集上的训练和部署面临较高的开销。近年来,基于状态空间模型(SSM)的Mamba架构在多种任务中取得了显著成果,有效地克服了CNNs和Transformer的这些限制。尽管ChangeMamba架构在遥感变化检测中展现了良好的性能,尤其在时序特征和空间上下文信息的捕捉方面,但在处理多个时间步的特征时,仍然面临如何增强不同时间步特征一致性的挑战。具体而言,模型在不同时间步提取的特征可能存在偏差,从而导致信息丢失或特征不稳定,这会影响变化区域的精确识别,尤其是在细微变化或复杂场景下。特征的不一致性不仅限制了潜在空间的有效表示,还增加了多时刻数据处理的难度,特别是在捕捉跨时间步的变化时更为突出。尽管现有的ChangeMamba模型在时序特征学习方面已有一定进展,但缺乏有效手段对潜在空间进行有效表征,也未通过有效的约束来确保不同时间步之间特征的一致性。因此,本研究提出了创新性的改进,通过引入重参数化技术和最大化互信息的方式,来解决这一问题,进一步提升模型的稳定性和准确性。

主要内容:

image.png 

图1 IMRChangeMamba结构图

结论:

针对遥感图像变化检测任务,我们通过引入重参数化技术和互信息最大化技术,改进了原始的ChangeMamba模型,增强了特征在多个时间步长上的一致性。这使得模型能够更准确、更稳健地捕捉时空变化,尤其适用于复杂的城市环境。实验结果显示,在二进制变化检测(BCD)方面,提出的IMRChangeMamba模型优于现有的基于CNN和Transformer的方法。此外,该模型在处理降质数据时也表现出更强的鲁棒性。通过引入互信息损失和重参数化技术,提高了特征在不同时间步长间的对齐度,从而在不采用复杂训练策略的情况下实现了更准确的变化检测。提出的IMRChangeMamba模型架构成为遥感变化检测的一个有前景的解决方案,并为未来的大规模应用提供了提高效率和可扩展性的潜力。

作者简介:

刘建伟,教师。