深度学习计算成像:数据驱动与物理驱动的较量与融合
在计算成像领域,深度学习方法正引发一场技术革命。其中,数据驱动和物理驱动作为两大主流策略,各自展现出独特的优势与挑战。本文将深入探讨这两种策略在深度学习相位恢复中的应用,以及它们的对比与融合,帮助读者更好地理解这一领域的最新进展。

一、背景介绍
相位恢复是计算成像中的一个经典逆问题,其目标是从强度测量中恢复光波相位,进而定量分析样品的生物物理特性。这一技术在生物医学成像、自适应光学、相干衍射成像和精密测量等多个领域都有着广泛的应用。近年来,深度学习方法为相位恢复带来了新的活力,数据驱动和物理驱动成为实现这一目标的两种主要策略。
二、数据驱动与物理驱动的原理
1.数据驱动(Data-driven,DD)
数据驱动方法通过实验或模拟获取的训练数据集,包含数千到数十万的全息图-相位配对数据,这些数据中隐含了从全息图到相位的隐式先验。在监督模式下,神经网络通过这些数据进行训练,通常需要数小时甚至数天的时间。训练完成后,待测样品的全息图输入到训练好的神经网络中,可以快速推断出光波相位。
2.物理驱动(Physics-driven,PD)
物理驱动方法使用数值传播方程作为显式先验,引导神经网络的收敛。与数据驱动不同,物理驱动方法通过数值传播方程将神经网络输出从相位域转换到全息图域后计算损失函数。物理驱动方法可以分为三种优化方式:未训练的PD(uPD)、训练的PD(tPD)和带有微调的tPD(tPDr)。
(1)未训练的PD(uPD):直接对初始化/未训练的神经网络进行迭代优化,从待测样品的全息图中推断光波相位,无需预训练。
(2)训练的PD(tPD):使用数值传播方程和纯全息图组成的数据集训练神经网络,然后使用训练好的神经网络从待测样品的全息图中快速推断光波相位。
(3)带有微调的tPD(tPDr):结合uPD和tPD的优势,使用待测样品的全息图和数值传播方程对预训练的神经网络进行迭代微调,进而推断光波相位。
三、数据驱动与物理驱动的对比
1.耗时
数据驱动(DD):需要数小时甚至数天的时间进行预训练。
训练的PD(tPD):同样需要数小时甚至数天的时间进行预训练。
带有微调的tPD(tPDr):需要数小时甚至数天的时间进行预训练,但微调过程相对较快。
未训练的PD(uPD):无需预训练,可以直接在初始化的神经网络上对待测样品进行推理,推断过程需要数分钟的迭代时间。
2.精度
数据驱动(DD):预训练后使用神经网络进行快速推断,精度较高。
训练的PD(tPD):预训练后使用神经网络进行快速推断,精度与DD基本相同。
带有微调的tPD(tPDr):由于引入了更多的先验知识,初始推断更接近目标解,以更少的推断周期获得与uPD相同的精度。
未训练的PD(uPD):通过迭代优化推断光波相位,精度较高,但推断过程需要数分钟的迭代时间。
3.泛化能力
数据驱动(DD):泛化能力受训练数据集的影响较大。使用ImageNet和LFW数据库训练的神经网络在多个测试数据集上表现较好,而使用MNIST数据库训练的神经网络在推断细节信息时表现较差。
物理驱动(PD):由于使用数值传播方程作为先验知识,uPD和tPDr适用于任何分布的待测样品,泛化能力较强。
病态适应能力
数据驱动(DD):可以同时推断相位和强度,因为从全息图到相位和强度的隐式映射关系完全包含在用于训练神经网络的配对数据集中。
物理驱动(PD):从全息图中同时推断相位和强度是严重不适定的,推断结果中会出现明显的伪影。通过引入更多物理约束可以一定程度上缓解这种不适定性。
4.先验容纳能力
数据驱动(DD):使用配对数据集训练神经网络,可以学习数据集中包含的所有隐式先验,即使这些先验位于数值传播之外。例如,在成像系统存在系统像差的情况下,DD可以在去除系统像差的同时推断出样本相位。
物理驱动(PD):推断结果中同时包括来自样品和系统像差的相位,无法有效分离系统像差。
三、数据与物理联合驱动策略
为了平衡高频和低频信息,研究人员提出了一种数据和物理联合驱动策略。通过在损失函数中加权联合配对数据集和数值传播方程,可以同时利用数据驱动的低频信息和物理驱动的高频信息,从而提高相位恢复的精度和鲁棒性。
深度学习相位恢复方法在计算成像领域展现出巨大的潜力。数据驱动和物理驱动策略各有优势,通过联合驱动策略可以更好地平衡高频和低频信息,提高相位恢复的精度和鲁棒性。未来,随着研究的不断深入,这两种策略的融合将为计算成像技术带来更多的创新和突破。
希望这篇文章能够满足您的需求,如果您有任何其他要求或需要进一步修改,请随时告诉我。
-
光的干涉技术应用探析——从摩尔纹干扰到体全息显示的发展与挑战
光的干涉是光波动性的核心物理表征,既是现代显示领域中摩尔纹等光学干扰现象的本质成因,也是体全息等前沿光学技术的核心实现基础。本文从光的干涉基本物理条件出发,系统剖析干涉效应在显示行业中的负面表现与工程抑制思路,重点阐述体全息技术依托光干涉实现三维光学信息记录与还原的技术原理,梳理其在AR/VR、车载HUD、光学防伪等领域的应用场景,分析当前工业化推广面临的材料、工艺与系统调控难题,并对干涉光栅周期、介质厚度等核心设计参数进行技术梳理,为光干涉技术的正向工程化应用提供理论与实践参考。
2026-03-20
-
一文了解几何光学,光学工程的基石与发展新境
几何光学作为光学设计的第一原理,是光学工程领域的核心基础学科。尽管光的本质为电磁波,但在波长远小于光学元件尺寸的场景下,以“光线”为核心的几何光学近似,不仅能满足精度要求,更以简洁高效的分析方法,成为支撑光学工业体系构建的关键。从传统的眼镜镜片、望远镜,到现代的手机摄像头、光刻机,再到前沿的AR眼镜、光波导器件,几何光学的理论与方法始终贯穿其中。本文将系统阐述几何光学的基础理论体系、工程应用实践、设计方法演进,并探讨其在新技术融合下的未来发展方向,展现这一经典学科在现代光学工程中的核心价值与拓展潜力
2026-03-20
-
光学系统的衍射极限及相关特性分析
衍射极限是光学系统设计与应用中不可规避的固有物理限制,直接决定了系统成像的理论精度,其衍生的衍射模糊现象(艾里斑)更是红外光学系统性能设计的核心考量因素。本文将从衍射极限的本质成因出发,剖析艾里斑的能量分布、定量计算规律,进而阐述其对光学系统尤其是红外系统的性能制约,为相关系统的设计优化提供理论参考。
2026-03-20
-
一文读懂非线性光学晶体带隙该怎么测?
在非线性光学晶体的研发与应用中,带隙是一项核心参数,它直接决定了晶体的透光范围、抗激光损伤能力以及适用的工作波段。想要准确获得带隙数值,选择合适的测试方法至关重要。本文用通俗的语言,梳理出目前主流的晶体带隙测量方式、操作要点以及不同场景下的方法选择,帮你快速搞懂测试逻辑。
2026-03-20
-
一文读懂X线成像:它是如何“看见”人体内部的?
X线成像是医学放射诊断中最基础、最常用的技术之一,它的核心逻辑很简单:利用X线的穿透性,捕捉人体不同组织对X线的吸收差异,再将这种差异转化为我们能看到的影像。就像用手电筒照射一块有花纹的玻璃,光线穿透后,花纹的影子会投射在墙上,X线就是这束“特殊的手电筒光”,人体组织就是“带花纹的玻璃”,X光片就是“投射影子的墙”。
2026-03-19
