深度学习计算成像:数据驱动与物理驱动的较量与融合
在计算成像领域,深度学习方法正引发一场技术革命。其中,数据驱动和物理驱动作为两大主流策略,各自展现出独特的优势与挑战。本文将深入探讨这两种策略在深度学习相位恢复中的应用,以及它们的对比与融合,帮助读者更好地理解这一领域的最新进展。

一、背景介绍
相位恢复是计算成像中的一个经典逆问题,其目标是从强度测量中恢复光波相位,进而定量分析样品的生物物理特性。这一技术在生物医学成像、自适应光学、相干衍射成像和精密测量等多个领域都有着广泛的应用。近年来,深度学习方法为相位恢复带来了新的活力,数据驱动和物理驱动成为实现这一目标的两种主要策略。
二、数据驱动与物理驱动的原理
1.数据驱动(Data-driven,DD)
数据驱动方法通过实验或模拟获取的训练数据集,包含数千到数十万的全息图-相位配对数据,这些数据中隐含了从全息图到相位的隐式先验。在监督模式下,神经网络通过这些数据进行训练,通常需要数小时甚至数天的时间。训练完成后,待测样品的全息图输入到训练好的神经网络中,可以快速推断出光波相位。
2.物理驱动(Physics-driven,PD)
物理驱动方法使用数值传播方程作为显式先验,引导神经网络的收敛。与数据驱动不同,物理驱动方法通过数值传播方程将神经网络输出从相位域转换到全息图域后计算损失函数。物理驱动方法可以分为三种优化方式:未训练的PD(uPD)、训练的PD(tPD)和带有微调的tPD(tPDr)。
(1)未训练的PD(uPD):直接对初始化/未训练的神经网络进行迭代优化,从待测样品的全息图中推断光波相位,无需预训练。
(2)训练的PD(tPD):使用数值传播方程和纯全息图组成的数据集训练神经网络,然后使用训练好的神经网络从待测样品的全息图中快速推断光波相位。
(3)带有微调的tPD(tPDr):结合uPD和tPD的优势,使用待测样品的全息图和数值传播方程对预训练的神经网络进行迭代微调,进而推断光波相位。
三、数据驱动与物理驱动的对比
1.耗时
数据驱动(DD):需要数小时甚至数天的时间进行预训练。
训练的PD(tPD):同样需要数小时甚至数天的时间进行预训练。
带有微调的tPD(tPDr):需要数小时甚至数天的时间进行预训练,但微调过程相对较快。
未训练的PD(uPD):无需预训练,可以直接在初始化的神经网络上对待测样品进行推理,推断过程需要数分钟的迭代时间。
2.精度
数据驱动(DD):预训练后使用神经网络进行快速推断,精度较高。
训练的PD(tPD):预训练后使用神经网络进行快速推断,精度与DD基本相同。
带有微调的tPD(tPDr):由于引入了更多的先验知识,初始推断更接近目标解,以更少的推断周期获得与uPD相同的精度。
未训练的PD(uPD):通过迭代优化推断光波相位,精度较高,但推断过程需要数分钟的迭代时间。
3.泛化能力
数据驱动(DD):泛化能力受训练数据集的影响较大。使用ImageNet和LFW数据库训练的神经网络在多个测试数据集上表现较好,而使用MNIST数据库训练的神经网络在推断细节信息时表现较差。
物理驱动(PD):由于使用数值传播方程作为先验知识,uPD和tPDr适用于任何分布的待测样品,泛化能力较强。
病态适应能力
数据驱动(DD):可以同时推断相位和强度,因为从全息图到相位和强度的隐式映射关系完全包含在用于训练神经网络的配对数据集中。
物理驱动(PD):从全息图中同时推断相位和强度是严重不适定的,推断结果中会出现明显的伪影。通过引入更多物理约束可以一定程度上缓解这种不适定性。
4.先验容纳能力
数据驱动(DD):使用配对数据集训练神经网络,可以学习数据集中包含的所有隐式先验,即使这些先验位于数值传播之外。例如,在成像系统存在系统像差的情况下,DD可以在去除系统像差的同时推断出样本相位。
物理驱动(PD):推断结果中同时包括来自样品和系统像差的相位,无法有效分离系统像差。
三、数据与物理联合驱动策略
为了平衡高频和低频信息,研究人员提出了一种数据和物理联合驱动策略。通过在损失函数中加权联合配对数据集和数值传播方程,可以同时利用数据驱动的低频信息和物理驱动的高频信息,从而提高相位恢复的精度和鲁棒性。
深度学习相位恢复方法在计算成像领域展现出巨大的潜力。数据驱动和物理驱动策略各有优势,通过联合驱动策略可以更好地平衡高频和低频信息,提高相位恢复的精度和鲁棒性。未来,随着研究的不断深入,这两种策略的融合将为计算成像技术带来更多的创新和突破。
希望这篇文章能够满足您的需求,如果您有任何其他要求或需要进一步修改,请随时告诉我。
-
平的也能当透镜?一文看懂超表面透镜是什么
我们每天拿的手机,后置摄像头总是凸出来一块,放桌上都放不平。这是因为要想拍照清晰、夜景够亮、拍得够远,就得在里面塞好几片玻璃透镜,叠起来自然就厚了。
2026-06-18
-
光学镜头坎合工艺全解析:精密自定心组装的原理、技术难点与解决方案
随着光学镜头向高像素、高成像质量、小型化方向持续演进,多镜片架构成为行业主流,传统仅依靠镜筒内径约束同轴度的堆叠组装方式,已难以满足高端镜头的偏心控制与结构稳定性要求。在此背景下,坎合工艺凭借机械啮合自定心、低偏心误差、结构稳固等核心优势,逐渐成为精密光学镜头组装的主流技术方案。
2026-06-18
-
红外镜头偏心测量:为什么可见光测不准?——从材料特性到多波段直接测量
拿可见光定心仪去测红外镜头,数据看着"还行",装出来MTF就是不达标——这在红外光学行业不是个别现象。红外材料折射率高、热膨胀系数大、波段不透明,三重壁垒让传统的透射式定心方法处处翻车。这篇技术深潜,拆解红外偏心测量的四大难点,讲清楚为什么必须用"使用波长直接测",以及多波段反射式定心仪到底怎么选。
2026-06-18
-
纯高偶次色散主导光孤子研究取得重要进展 纯四次孤子为超快激光领域开辟新路径
近日,陕西师范大学物理学与信息技术学院李晓辉研究员团队在国际权威期刊《Laser & Photonics Reviews》发表题为"Optical solitons dominated by pure-high-even-order dispersion: research progress of pure-quartic solitons"的综述论文,系统总结了纯四次孤子在不同腔结构中的实验实现与数值模拟研究进展,深入阐述了纯高阶偶次色散孤子的核心特征、技术突破与应用潜力。该工作为超快激光科学领域的高阶色散调控研究提供了重要的理论参考与技术指引。
2026-06-17
-
MTF还是WFE?光学镜头品控指标的工程选择与协同应用 ——从物理定义、检测方法到产线决策的完整分析框架
在光学镜头制造中,MTF(调制传递函数)与WFE(波前误差)是质量控制的两种核心指标,但二者来自不同的物理体系。MTF属于成像评价语言,直接对接最终用户体验;WFE属于波前评价语言,擅长定位加工误差来源。选用不当,轻则检测数据与客户反馈不一致,重则导致批次性误判。本文从物理定义、检测方法、换算关系、产线适用性四个维度,系统分析两类指标的特性和互补关系,并结合手机镜头和干涉仪物镜的实际产线案例,提出分层协同的应用框架。
2026-06-17
