图像降噪算法——低秩聚类：WNNM算法

图像降噪算法——低秩聚类：WNNM算法图像降噪算法——低秩聚类：WNNM算法基本原理python代码结论图像降噪算法——低秩聚类：WNNM算法同样是为了完善自己知识版图的完整性，我决定再补充下低秩聚类算法的相关算法，低秩聚类算法同样是一大类算法，这篇博客是挑选了其中最经典的一种算法WNNM算法进行展开学习，由于没有在这方面做过太多相关的工作，因此可能理解相对肤浅，还请读者见谅基本原理python代

Leo-Peng

16381人浏览 · 2021-02-26 21:08:36

Leo-Peng · 2021-02-26 21:08:36 发布

图像降噪算法——低秩聚类：WNNM算法

图像降噪算法——低秩聚类：WNNM算法

图像降噪算法——低秩聚类：WNNM算法

同样是为了完善自己知识版图的完整性，我决定再补充下低秩聚类算法的相关算法，低秩聚类算法同样是一大类算法，这篇博客是挑选了其中最经典的一种算法WNNM算法进行展开学习，由于没有在这方面做过太多相关的工作，因此可能理解相对肤浅，还请读者见谅

1. 基本原理

在写这篇博客之前，我先学习了稀疏表达相关的知识，这里我从稀疏表达算法出发，引入低秩聚类算法的相关解释：

在稀疏表达相关算法中，将图像建模成 $\mathbf{Y}=\mathbf{D}\mathbf{X}$ 的形式，其中 $\mathbf{Y}$ 是有单个样本按列组成而成的样本矩阵，注意这里的样本并没有要求是相似的， $\mathbf{D}$ 是字典矩阵，矩阵中每一列为一个基向量或者子空间， $\mathbf{X}$ 则为系数矩阵，在系数表达中给定的限制条件是要求系数矩阵是稀疏的。我们通过一个过完备的字典和稀疏的系数矩阵就可以还原样本，而噪声不行，因此可以通过稀疏表达进行去噪。

而在低秩聚类相关算法中，是将图像建模成 $\mathbf{Y}=\mathbf{X} - \mathbf{N}$ ，其中 $\mathbf{Y}$ 同样是由带有噪声的相似样本组成而成的样本矩阵。 $\mathbf{X}$ 和 $\mathbf{N}$ 分别为对应的的无噪声的样本矩阵以及噪声。我们给出的限制条件是 $\mathbf{X}$ 是低秩矩阵。由于相似样本组成的矩阵具备低秩性，噪声不具备低秩性，因此通过低秩聚类可以实现图像降噪的效果。

由此可见，从降噪的本质上来将，稀疏表达的稀疏和低秩聚类中的聚类是具有一定相关性的。

为什么相似样本具备低秩性呢？参考图像降噪方法综述中的说法，当我们拍摄一张大草原的图片时，草原是由草组成的，而草是相似的，如果图片上全是草，那么这张图片实际包含的信息是很少的，因此可以理解为草是草的复制品，这就是低秩性的一个直观理解。

那么接下来就开始具体将WNNM算法的实现，主要参考
非局部相似性去噪算法研究
 Weighted Nuclear Norm Minimization with Application to Image Denoising

WNNM的全称是Weighted Nuclear Norm Minimization，中文翻译成加权核范数最小化方法，算法的流程如下图所示：
在这里插入图片描述
如果在图像上搜索相似patch的流程就不用赘述了，方法多种多样，重要的是，假定我们要降噪的图像块为 $\boldsymbol{P_i}$ ，由该图像块以及图像上与其相似的图像块组成的矩阵为 $\boldsymbol{Y_i}$ ，对应的降噪后的矩阵为 $\boldsymbol{X_i}$ ，低秩矩阵最小化可以用来求矩阵的解，于是我们得到目标函数： $\boldsymbol{X}_{i}=\operatorname{argmin}_{x_{i}}\left\|\boldsymbol{Y}_{i}-\boldsymbol{X}_{i}\right\|_{F}^{2}+\operatorname{rank}\left(\boldsymbol{X}_{i}\right)$ 但是，其中 $\left\|\boldsymbol{X}\right\|_F$ 是F范数，F范数的定义是矩阵 $\boldsymbol{X}$ 各项元素的绝对值平方的总和，即 $\|\mathbf{X}\|_{F} \equiv \sqrt{\sum_{i=1}^{m} \sum_{j=1}^{n}\left|x_{i j}\right|^{2}}$ 上式是一个非凸函数，求解过程将是一个NP问题，因此需要对该问题转为凸优化问题后再求解，为此，前辈提出了标准核范数最小化的求解方法，也就是NNM——本文要介绍的WNNM算法的前身，NNM的目标函数如下： $\boldsymbol{X}_{i}=\operatorname{argmin}_{X_{i}}\left\|\boldsymbol{Y}_{i}-\boldsymbol{X}_{i}\right\|_{F}^{2}+\lambda\left\|\boldsymbol{X}_{i}\right\|_*$ 式中， $\lambda$ 是一个正数， $\left\|\boldsymbol{X}_{i}\right\|_*$ 是核范数，核范数的定义为 $\|\boldsymbol{X}\|_{*}=\operatorname{tr}\left(\sqrt{\boldsymbol{X}^{T} \boldsymbol{X}}\right)=\operatorname{tr}(\boldsymbol{\Sigma})$

求解方法是对 $\boldsymbol{Y_i}$ 进行奇异值分解为 $\boldsymbol{Y}_{j}=\boldsymbol{U \Sigma V}$ ，然后对奇异值进行软阈值收缩： $\mathcal{S}_{\lambda}(\boldsymbol{\Sigma})_{i i}=\max \left(\boldsymbol{\Sigma}_{i i}-\lambda, 0\right)$ 其中， $\boldsymbol{\Sigma}_{i i}$ 为奇异矩阵 $\boldsymbol{\Sigma}$ 对角线元素，于是得到目标函数的解： $\boldsymbol{X}_{i}=\boldsymbol{U}\mathcal{S}_{\lambda}\left(\boldsymbol{\Sigma}\right) \boldsymbol{V}$ 在NNM算法中，是使用同一个 $\lambda$ 值对所有奇异值进行软阈值收缩，这样做没有考虑到图像的信息主要集中在数值较大的上这个特点，因此会导致图像细节过度平滑而变得模糊，为了解决这个问题，于是就诞生了WNNM算法，使用不同的 $\lambda$ 值对奇异值进行软阈值收缩，数值大的奇异值对应数值小的 $\lambda$ 。由此我们得到目标函数： $\hat{\boldsymbol{X}}_{i}=\operatorname{argmin}_{X_{i}} \frac{1}{\sigma_{n}^{2}}\left\|\boldsymbol{Y}_{i}-\boldsymbol{X}_{i}\right\|_{F}^{2}+\left\|\boldsymbol{X}_{i}\right\|_{\boldsymbol{w},*}$ 其中 $\sigma_{n}^{2}$ 为噪声方差，用于归一化F范数，而其中 $\boldsymbol{w}=\left[w_{1}, \ldots, w_{n}\right]$ 中的每一项都为非负数，对应每一个奇异值，如下： ${w}_{i}=c \sqrt{k} /\left(\sigma_{i}\left(\boldsymbol{X}\right)+\varepsilon\right)$ $其中，\sigma_{i}\left(\boldsymbol{X}\right)$ 为 $\boldsymbol{X}$ 的第 $i$ 奇异值，可以观察到，当奇异值越大时权重越小。 $k$ w为相似图像patch的数量， $\varepsilon$ 为防止被零正常的小参数。但是这里有个问题是， $\sigma_{i}\left(\boldsymbol{X}\right)$ 是未知的呀，我们可以假设在初始时刻，噪声能量是在各个特征上分布是均匀的，因此初始化 $\sigma_{i}\left(\boldsymbol{X}\right)$ 为： $\sigma_{i}\left(\boldsymbol{X}\right)=\sqrt{\max \left(\sigma_{i}^{2}\left(\boldsymbol{Y}\right)-k \sigma_{n}^{2}, 0\right)}$ 最后同样我们对 $\boldsymbol{Y_i}$ 进行奇异值分解为 $\boldsymbol{Y}_{j}=\boldsymbol{U \Sigma V}$ ，然后目标函数的解为： $\boldsymbol{X}_{i}=\boldsymbol{U}\mathcal{S}_{\boldsymbol{w}}\left(\boldsymbol{\Sigma}\right) \boldsymbol{V}$

2. matlab代码

matlab代码我就直接贴上链接好了 csjunxu/WNNM_CVPR2014 ，这份matlab代码我也没有细读，仅仅跑了一下，感兴趣的同学可以多画时间研究研究。

3. 结论

低秩聚类不仅仅可以用在图像降噪，在图像分割、分类等方面也有广泛的应用。
论文中的图像效果如下：
我测试的结果也差不多，相对BM3D其文理细节保留会更好一些，但是一些纹理密集的区域会出现一些artifact，至于好不好，就要看大家对图片质量的要求了，这篇文章写的比较浅显，有问题欢迎交流

此外，这里我写一个各种算法的总结目录图像降噪算法——图像降噪算法总结，对图像降噪算法感兴趣的同学欢迎参考

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

一文解决Cellphonedb单细胞互作分析及可视化作图（2）

开放原子开发者工作坊

[工具使用]——时序图与UML类图

开放原子开发者工作坊

CTFHub技能树 Web-SQL注入详解

整数型注入我们输入 1不断尝试发现闭合方式就是 1 ，整数型存在两列order by 2存在两个注入点/?id=-1 union select 8,9爆库，当前数据库为sqli/?id=-1 union select 8,database()爆出所有表名,这里我们需要吧sqli转换为16进制/?id=-1 union select 8,group_concat(table_name) from i