深度学习计算成像:数据驱动与物理驱动的较量与融合
在计算成像领域,深度学习方法正引发一场技术革命。其中,数据驱动和物理驱动作为两大主流策略,各自展现出独特的优势与挑战。本文将深入探讨这两种策略在深度学习相位恢复中的应用,以及它们的对比与融合,帮助读者更好地理解这一领域的最新进展。

一、背景介绍
相位恢复是计算成像中的一个经典逆问题,其目标是从强度测量中恢复光波相位,进而定量分析样品的生物物理特性。这一技术在生物医学成像、自适应光学、相干衍射成像和精密测量等多个领域都有着广泛的应用。近年来,深度学习方法为相位恢复带来了新的活力,数据驱动和物理驱动成为实现这一目标的两种主要策略。
二、数据驱动与物理驱动的原理
1.数据驱动(Data-driven,DD)
数据驱动方法通过实验或模拟获取的训练数据集,包含数千到数十万的全息图-相位配对数据,这些数据中隐含了从全息图到相位的隐式先验。在监督模式下,神经网络通过这些数据进行训练,通常需要数小时甚至数天的时间。训练完成后,待测样品的全息图输入到训练好的神经网络中,可以快速推断出光波相位。
2.物理驱动(Physics-driven,PD)
物理驱动方法使用数值传播方程作为显式先验,引导神经网络的收敛。与数据驱动不同,物理驱动方法通过数值传播方程将神经网络输出从相位域转换到全息图域后计算损失函数。物理驱动方法可以分为三种优化方式:未训练的PD(uPD)、训练的PD(tPD)和带有微调的tPD(tPDr)。
(1)未训练的PD(uPD):直接对初始化/未训练的神经网络进行迭代优化,从待测样品的全息图中推断光波相位,无需预训练。
(2)训练的PD(tPD):使用数值传播方程和纯全息图组成的数据集训练神经网络,然后使用训练好的神经网络从待测样品的全息图中快速推断光波相位。
(3)带有微调的tPD(tPDr):结合uPD和tPD的优势,使用待测样品的全息图和数值传播方程对预训练的神经网络进行迭代微调,进而推断光波相位。
三、数据驱动与物理驱动的对比
1.耗时
数据驱动(DD):需要数小时甚至数天的时间进行预训练。
训练的PD(tPD):同样需要数小时甚至数天的时间进行预训练。
带有微调的tPD(tPDr):需要数小时甚至数天的时间进行预训练,但微调过程相对较快。
未训练的PD(uPD):无需预训练,可以直接在初始化的神经网络上对待测样品进行推理,推断过程需要数分钟的迭代时间。
2.精度
数据驱动(DD):预训练后使用神经网络进行快速推断,精度较高。
训练的PD(tPD):预训练后使用神经网络进行快速推断,精度与DD基本相同。
带有微调的tPD(tPDr):由于引入了更多的先验知识,初始推断更接近目标解,以更少的推断周期获得与uPD相同的精度。
未训练的PD(uPD):通过迭代优化推断光波相位,精度较高,但推断过程需要数分钟的迭代时间。
3.泛化能力
数据驱动(DD):泛化能力受训练数据集的影响较大。使用ImageNet和LFW数据库训练的神经网络在多个测试数据集上表现较好,而使用MNIST数据库训练的神经网络在推断细节信息时表现较差。
物理驱动(PD):由于使用数值传播方程作为先验知识,uPD和tPDr适用于任何分布的待测样品,泛化能力较强。
病态适应能力
数据驱动(DD):可以同时推断相位和强度,因为从全息图到相位和强度的隐式映射关系完全包含在用于训练神经网络的配对数据集中。
物理驱动(PD):从全息图中同时推断相位和强度是严重不适定的,推断结果中会出现明显的伪影。通过引入更多物理约束可以一定程度上缓解这种不适定性。
4.先验容纳能力
数据驱动(DD):使用配对数据集训练神经网络,可以学习数据集中包含的所有隐式先验,即使这些先验位于数值传播之外。例如,在成像系统存在系统像差的情况下,DD可以在去除系统像差的同时推断出样本相位。
物理驱动(PD):推断结果中同时包括来自样品和系统像差的相位,无法有效分离系统像差。
三、数据与物理联合驱动策略
为了平衡高频和低频信息,研究人员提出了一种数据和物理联合驱动策略。通过在损失函数中加权联合配对数据集和数值传播方程,可以同时利用数据驱动的低频信息和物理驱动的高频信息,从而提高相位恢复的精度和鲁棒性。
深度学习相位恢复方法在计算成像领域展现出巨大的潜力。数据驱动和物理驱动策略各有优势,通过联合驱动策略可以更好地平衡高频和低频信息,提高相位恢复的精度和鲁棒性。未来,随着研究的不断深入,这两种策略的融合将为计算成像技术带来更多的创新和突破。
希望这篇文章能够满足您的需求,如果您有任何其他要求或需要进一步修改,请随时告诉我。
-
可见光变焦与中波制冷红外系统鬼像机制及工程抑制技术研究
鬼像(GhostImage)作为光学系统中典型的杂散光衍生问题,其本质是非成像光束经多次反射/散射后在像面形成的虚假像,严重影响系统成像对比度、调制传递函数(MTF)及目标识别精度,是光学工程领域项目交付阶段的核心风险点之一。本文针对可见光变焦镜头与中波制冷红外(MWIR)系统的鬼像问题,系统解析其物理成因、特性差异,并提出基于光线追迹仿真、结构优化与镀膜工艺改进的工程化抑制方案,为光学系统设计、研发及交付提供技术支撑。
2026-01-23
-
多光谱、高光谱与超光谱技术的原理特性及应用场景解析
光谱探测技术作为现代遥感、环境监测、资源勘探等领域的核心支撑,已逐步形成多光谱、高光谱、超光谱三个梯度分明的技术体系。三者的核心差异并非命名表述的细微区别,而是源于波段数量与光谱分辨率的本质不同,进而决定了其在观测精度、技术特性及应用场景上的梯度升级。本文系统阐述了三种光谱技术的定义、核心参数、技术特点、代表平台及典型应用,通过对比分析明确其各自的技术优势与适用范围,为相关领域的技术选型与应用实践提供参考。
2026-01-23
-
瑞士FEL实现超短X射线脉冲同步化,开辟阿秒科学新可能
2026年1月16日,约翰内斯堡保罗·谢勒研究所(PSI)的研究团队成功实现了瑞士自由电子激光器(FEL)中超短X射线脉冲的同步化。这项成果为人类以阿秒精度观测超快原子与分子过程开辟了新路径。瑞士FEL这类自由电子激光器虽能产生亮度高、脉冲短的X射线,可用于观测快速原子分子过程,但脉冲内部光线存在无序性——其时间结构随机分布,且每次发射都会发生变化,这一问题限制了部分实验的精度。
2026-01-22
-
声子激光技术问世,助力无线设备向小型化高效化升级
2026年1月20日,美国科罗拉多州博尔德消息——一种新型表面声波(SAW)声子激光技术正式亮相。该技术有望为高频片上表面声波源及微型化表面声波基系统奠定基础,使这类系统无需外部射频源即可独立运行。
这款固态、单芯片、电注入式表面声波声子激光器,由科罗拉多大学博尔德分校联合亚利桑那大学与桑迪亚国家实验室共同研发。其问世破解了传统表面声波产生设备的诸多瓶颈,为无线通信、传感等领域的技术迭代提供了新可能。2026-01-22
