全息存储具有极高的存储密度和极快的数据转换率,因此被视作最具潜力的下一代存储技术。全息存储可以利用振幅、相位和偏振实现一维或多维调制。同时,各种复用技术能够进一步提高全息存储的存储密度。传统的相位探测方法复杂,耗时且准确度不高,目前常使用的深度学习相位恢复方法能够快速、准确的完成数据页的相位重建,且具有一定的噪声抑制能力。尽管神经网络具有强大的噪声处理能力,但噪声仍然是全息存储中的一个问题。目前,噪声无法从数据页中分离出来。全息存储领域的大多数研究都将神经网络视为“黑箱”,因此试图用具有更优异噪声处理能力的替代方案来取代原始的网络架构。 本文基于网络瘦身的思想,提出了一种定位并消除神经网络中噪声的方法。我们使用卷积自编码器——它更适用于图像处理任务(例如特征提取和图像去噪),利用自编码器的特性来分析神经网络是如何实现噪声数据页的降噪功能的。通过网络中批归一化层的权重参数γ,我们能够定位隐藏在通道中的噪声特征,并且移除这些噪声通道后,输出的峰值信噪比(PSNR)大约提高了 2%。 我们选择卷积自编码器(CAE)作为我们的神经网络。卷积自编码器将原来自编码器中的全连接层改为卷积层,以增强图像处理能力,但其具体结构相对灵活。卷积自编码器由三个部分组成:编码器、瓶颈层和解码器。通常,编码器和解码器各包含3个卷积层(或转置卷积层)。编码器接收单通道输入,最终输出 128 个通道;尺寸为 128×128 像素的输入图像经过处理后,会生成 128 个 32×32 像素的特征图,然后解码器部分执行与编码器相反的操作。图1 是本研究中使用的卷积自编码器(CAE)模型的结构;瓶颈部分将包含 128 个通道,这将是后续实验中的关键参数。 |
|
| 图1. 卷积自编码器的结构 |
网络训练使用的数据页如图 2(a) 所示。图 2(c) 显示,它们都是规格为 128×128 像素的灰度图像,数据集中总共有 4439 个数据页。图 2(b) 是测试数据集中的四种不同噪声水平,该测试数据集使用与训练数据集不重叠的无噪声数据页,并模拟了 15 组带有高斯噪声的数据。高斯噪声的概率密度函数如下: |
|
其中 μ 是信号,σ 是噪声大小。我们将 σ 设为噪声系数,σ 的值越大,添加到数据页上的噪声就越强。图2(b) 中的噪声范围为 1 到 70,除第一个外,所有噪声因子都是 5 的倍数。为了训练恢复原始数据的能力,训练中使用的图2(a) 数据集是无噪声的。在本文中,我们只讨论高斯噪声,因为其他噪声的实验和分析是相同的。 |
|
| 图2. (a) 训练数据集;(b) 不同噪声大小的测试数据集;(c) 数据页的尺寸 |
首先,我们在测试中使用 σ=30 的噪声水平,并随机将一定数量的通道置零(该数量在 10 到 30 之间),以测试通道置零是否会影响神经网络的输出。我们总共随机置零 5 次。图3(a) 展示了峰值信噪比(PSNR)的平均值和标准差。其次,我们随机将 15 个通道置零,以测试通道置零后重建结果是否会更好。我们推测噪声强度会影响通道中的噪声特征。因此,我们用 15 种不同程度的噪声进行测试,以增强通道中的噪声特征。图3(b) 中删除 15 个通道的重建的峰值信噪比在 σ=25 时超过了未修改不删除通道的结果。而在 σ=20 及以下时,结果则相反。我们推测,当噪声水平较低时,噪声对重建的影响较小,但当噪声水平超过 σ=25 时,噪声可能会对网络产生更大的影响,而将通道置零可能会减弱这种影响。当我们持续增加噪声时,通道置零会有一个优势期,其界限约为 σ=70。因此,我们得出结论:通道置零的方法是可行的,并且当输入噪声达到一定水平时,一些被随机置零的通道会被噪声特征所覆盖。 |
|
| 图3. (a) 随机将 10-30 个通道置零的结果;红线以上表示比未做修改时的重建效果更好;(b) 随机删除 15 个通道的结果与不删除通道重建和原始数据页的对比 |
最后,我们对比了删除人工筛选出的噪声通道和通过批归一化层的权重参数γ直接定位的噪声通道的结果。图4(a) 展示了删除 15 个 γ < 1 的通道的结果,而图4(b) 对比了删除 15 个 γ < 1 的通道与删除 15 个人工筛选出的通道的情况。图4(b) 显示,随着噪声的加入,删除 15 个 γ < 1 通道会表现出更高的重建峰值信噪比,且两者在 σ = 20 左右都达到了一个转折点。在中等噪声水平下(σ 范围为 25-45),与删除人工筛选的通道相比,删除 γ < 1 的通道大约能够获得 0.5dB 的优势。在所有三个实验中,无噪声组由于通道置零,重建质量有所下降,而有噪声组在噪声达到一定水平时,重建质量得到了改善。因此可以得出结论,在基于神经网络的数据页重建过程中,一些通道会提取噪声特征,从而降低网络的重建质量。这些与噪声相关的特征可以通过批归一化层的权重 γ 筛选出来。 |
|
| 图4. (a) 删除 15 个权重参数 γ < 1 的通道与不删除通道重建和原始数据页的对比;(b) σ 在 20 到 50 之间,删除 15 个人工筛选通道与删除 15 个权重参数 γ < 1 通道的结果对比 |
上述研究成果以“Noise-Correlated Neural Network Channel Selection for Signal-to-Noise Ratio Enhancement in Holographic Data Storage”为题,发表在多学科数字出版机构(Multidisciplinary Digital Publishing Institute)主办的英文期刊《Photonics》,Vol.11, No.2, 126(11p) (2026) 上。 论文的相关链接:https://doi.org/10.3390/photonics13020126 |
|