双波长差分衍射神经网络:全光目标分类的创新突破

    光学计算凭借并行处理、高吞吐量与高能效的固有优势,正引领下一代计算架构的变革,而衍射深度神经网络(D2NN)作为光学计算的核心框架,已在多领域展现应用潜力。针对传统单波长衍射网络空间频率覆盖范围窄、难以捕捉目标多尺度特征的局限,中国工程物理研究院耿远超等研究人员提出双波长差分衍射神经网络(DW-D2NN)。该框架通过协同整合两种波长的互补光学响应,结合端到端深度学习训练,在全光目标分类任务中实现了精度与鲁棒性的双重提升。实验表明,四层DW-D2NN在MNIST和Fashion-MNIST数据集上分类准确率分别达98.7%和90.1%,显著超越传统单波长方案;在含随机散射体的复杂光路中仍保持优异性能,为生物医学分析、工业检测等领域提供了全新技术路径。


    光子作为信息传输与处理的理想载体,使光学计算系统具备传统电子计算难以企及的效率优势。衍射深度神经网络(D2NN)以光子传播为核心,利用光衍射建立层间连接,在光学目标识别、成像、波前传感等领域实现了突破性应用。这类技术尤其适用于需实时处理海量空间数据的场景,其低功耗特性更使其在自主系统、工业边缘计算中极具吸引力。
    然而,传统衍射网络普遍采用单波长照明设计,受瑞利准则制约,空间频率覆盖范围被限制在窄带内,导致目标傅里叶域频谱稀疏,难以捕捉区分细微结构差异的关键特征。这一局限严重影响了复杂任务中的分类精度与鲁棒性。多波长照明凭借波长与空间分辨率的内在关联,为拓宽空间频率响应、增强多尺度特征捕获能力提供了有效思路。在此背景下,双波长差分衍射神经网络(DW-D2NN)应运而生,通过双波长互补响应与差分计算的创新结合,为全光目标分类难题提供了系统性解决方案。该研究成果已发表于《Laser&PhotonicsReviews》期刊,为光学计算的实际部署奠定了重要理论基础。

 

双波长差分衍射神经网络:全光目标分类的创新突破


    1.双波长差分衍射神经网络设计与工作机制
    网络结构设计
    DW-D2NN采用四层衍射层架构,各层关键参数经过精密优化以确保高效光学互连。相邻衍射层间轴向间距设定为5厘米,输入平面尺寸为168×168像素,网格尺寸8μm,与第一层衍射调制层间距5厘米。每层衍射调制层包含200×200个可调神经元,单个神经元尺寸8μm,神经元间通过瑞利-索末菲衍射原理实现光学互连,全网络互连数量级达数百亿,支撑高密度信息处理。输出平面位于最后一层衍射层后方4厘米处,探测平面被划分为10个子区域,分别对应10类目标类别。
    在光源选择上,研究采用两种特定波长的相干平面波:λa=532nm(正信号)与λb=640nm(负信号)。这一波长组合经优化验证,能有效覆盖目标物体的关键空间频率特征,为差分计算提供稳定且互补的光学响应基础。
    核心工作原理
    DW-D2NN的核心创新在于双波长协同编码与差分推理机制。振幅编码的输入目标(手写数字或时尚单品)经双波长相干光照射后,进入衍射网络进行传播与调制。光信号在经历自由空间衍射及各层相位调制后,在探测平面形成两种波长对应的强度分布。
    探测阶段通过无源电子电路执行差分计算,首先将两种波长的强度信号归一化为Ia=[I₀,a,I₁,a,…,I₉,a]与Ib=[I₀,b,I₁,b,…,I₉,b],再通过公式计算归一化差分分数:


   双波长差分衍射神经网络:全光目标分类的创新突破


    其中ε为极小值(10⁻⁶)以确保数值稳定性,温度参数T设为0.1以平衡优化过程。最终通过Max(⋅)操作选取最大差分分数对应的类别作为分类结果,该差分计算方式能有效放大双波长响应的特征差异,提升分类辨识度。
    训练流程优化
    训练过程基于MNIST和Fashion-MNIST数据集展开,两类数据集各包含60000张训练图像与10000张测试图像,分别用于训练独立的DW-D2NN模型。原始28×28像素图像经最近邻插值法上采样至168×168像素,并进行零填充以匹配网络输入尺寸。
    训练采用端到端深度学习方法,以Softmax交叉熵损失函数最小化预测差分分数与独热编码标签的差异,通过误差反向传播算法调整衍射层神经元的复振幅值(约束在0-2π范围内)。每次迭代中,60000个样本在双波长下完成前向传播,输出强度信号经光学滤波器分离后用于差分计算。训练周期设定为50个,此时损失值趋于稳定,网络实现对数据集基础特征的有效学习。


    2.实验结果与性能验证
    分类精度显著提升
    在标准测试集评估中,四层DW-D2NN展现出卓越的分类性能。在MNIST手写数字数据集上,准确率达到98.7%,较传统单波长四层衍射网络(87.3%)提升11.4%,甚至超过单波长五层衍射网络(90.6%);在Fashion-MNIST时尚单品数据集上,准确率达90.1%,较单波长四层网络(82.3%)提升7.8%,超越单波长五层网络(84.6%)。
    性能提升的核心原因在于双波长方案对空间频率响应的拓宽效应。两种波长编码的独特空间频率信息,使模型能捕捉单波长系统无法察觉的细微结构差异,尤其在区分视觉相似类别时表现突出。例如,传统单波长网络易将手写数字“2”误分类,而DW-D2NN通过双波长差分信号的特征增强,实现了精准识别。
    复杂场景鲁棒性验证
    为测试模型在实际应用中的适应性,研究将DW-D2NN拓展至含随机散射体的复杂光路场景。散射体置于输入层与第一衍射层之间,引入波前畸变以模拟真实环境中的光学干扰。经50个周期训练后,模型在含未见散射体的测试集中,MNIST数据集盲测准确率达94.6%,Fashion-MNIST数据集达84.3%,显著优于单波长方案(分别为82.5%和73.4%)。
    这一结果证实,双波长差分计算能增强网络提取畸变不变特征的能力,即使目标光场经散射体严重畸变,模型仍能通过互补波长信息的差分运算恢复关键特征。此外,实验还验证了模型对部分遮挡的耐受性,即使存在不透明遮挡物,目标的光学特征仍可通过衍射传输并被准确识别。


    3.技术挑战与解决方案
    核心挑战:机械对准与相位误差
    DW-D2NN的实际部署面临两大关键挑战:一是对机械对准的严苛要求,层间在x、y、z方向的微小错位(尤其横向位移)会导致光传播偏离理想光路,显著降低分类精度;二是制造工艺限制引发的随机相位误差,会破坏衍射层的调制精度,影响光学响应的稳定性。
    实验测试表明,当衍射层横向位移超过16μm(两个神经元尺寸)时,未优化的模型准确率会大幅下降,而相位误差的增大也会导致性能持续衰减。
    有效缓解策略
    针对机械对准问题,研究提出在训练过程中引入随机位移扰动的鲁棒性训练方法。每次迭代中,允许各衍射层在x、y方向最大位移16μm,z方向相应范围位移,位移量服从均匀分布。通过这种方式,网络在训练阶段即学习适应微小错位,显著降低了对实际部署中机械对准的敏感度。
    对于相位误差,采用预引入误差的训练策略,在训练前向传播中为每个衍射层的神经元添加0-2π范围内的随机相位扰动,使网络同时学习目标特征与误差补偿机制。测试结果显示,经优化后的模型在存在相位误差时,准确率下降幅度较未补偿模型降低60%以上。此外,Lin等人提出的原位训练方法也可进一步解决衍射网络组装过程中的可靠性难题。


    4.局限与未来展望
    当前技术局限
    尽管DW-D2NN取得显著突破,但仍存在一定局限:其一,缺乏电子神经网络中的卷积模块与非线性激活函数,导致测试准确率难以突破99%,与Transformer等先进电子网络(99.8%)存在差距;其二,全连接光学网络的泛化能力有限,训练准确率接近100%时,测试准确率易进入平台期;其三,多波长扩展受限于光学系统的复杂度与信号串扰问题。
    未来发展方向
    未来研究可从三方面突破现有局限:一是结合相变材料等新型器件,实现光学非线性激活函数,增强网络的特征表达能力;二是拓展至多波长差分方案,通过增加波长通道数进一步提升特征提取的丰富度,适配更复杂的目标分类任务;三是优化网络架构设计,引入光学卷积模块,提升模型的泛化能力与分类精度。
    应用场景方面,DW-D2NN的高速计算与高鲁棒性优势,使其在生物医学组织分析、工业精密检测、自动驾驶环境感知等领域具有广阔前景。例如,在工业检测中,可实现对微小缺陷的实时识别;在生物医学领域,能高效处理医学影像的特征提取与分类,为诊断提供快速支持。


    双波长差分衍射神经网络(DW-D2NN)通过创新的双波长协同编码与差分推理机制,成功突破了传统单波长衍射网络的固有局限,在全光目标分类任务中实现了精度与鲁棒性的双重飞跃。四层架构在标准数据集上的分类准确率显著超越传统方案,且在含散射体的复杂场景中展现出优异的环境适应性。尽管面临机械对准与相位误差等实际部署挑战,但通过鲁棒性训练策略已实现有效缓解。
    该研究不仅为光学计算提供了全新的网络设计思路,更推动了全光目标分类技术向实用化迈进。随着新型光学材料、精密制造技术的发展,DW-D2NN有望在更多复杂场景中发挥作用,为下一代高速、低功耗计算系统的研发奠定坚实基础,助力光学计算在各行业的规模化应用。

创建时间:2026-01-15 10:14
浏览量:0

▍最新资讯