《principal component analysis based cataract grading and classification》学习笔记

Abstract

A cataract is lens opacification caused by protein denaturation which leads to a decrease in vision and even results in complete blindness at later stages. The concept of a classification system of automatic cataract detecting based on retinal fundus images has been proposed in previous research work which consists of fundus image preprocessing, feature extraction and the building of classifier .This paper proposes to make use of the method of PCA (principal component analysis) to reduce the dimensionality of two sets of features extracted from fundus images which are wavelet features and sketch features, respectively. We find the classification accuracy rate based on new features after PCA transformation is nearly the same with the original ones, but the computation cost can really be decreased a lot. Experiment results provide a bright foresight in later practical application of classification system of automatic cataract detecting.

白内障是蛋白质变性导致晶状体混浊，它的基本特征就是视力下降，甚至在最后阶段完全失明。白内障的视网膜眼底图像自动检测分类系统的概念已经在以前的研究工作提出，它主要包括眼底图像预处理，特征提取和分类器的构建。本文提出了利用PCA方法（主成分分析）降维从眼底图像分别提取两个特征集，这两个特征是小波特征和轮辐特征。我们发现分类的准确率在基于PCA的新的特征后，其结果与之前的方法准确率相似，但计算效率却有很大的提高。实验结果为白内障自动检测分类系统的实际应用提供了实际应用参考。

I. Introduction

首先介绍成因，并且白内障被认为是最普遍的致盲疾病。传统的诊断就是有经验的眼科医生凭借肉眼，通过查看眼底图像来判断患病程度，但是效率很低，所以自动化的分类系统就被提出了。
在之前的步骤中加入了降维这一步骤，同时介绍了各个流程的具体实现方法：第一步是图像预处理，主要使用了改进的高低帽变换，三边滤波。第二步是特征提取，这一步至关重要，提取了两个特征集，分别是小波特征和轮辐特征。第三步PCA降维处理。第四步就是分类，主要使用了SVMs(support vector machines),Bagging（套袋，投票法）, Random forests（随机森林）,Gradient Boosting Decision Tree（迭代的决策树算法）。最后说明虽然准确率稍微有所下降，但是效率有极大的提高，所以是非常有意义的。

《principal component analysis based cataract grading and classification》学习笔记

II. Related Work

介绍了视网膜相关研究的研究进展。

III. Implementation

A.特征提取

1.哈尔小波变换

 小波变换的基本思想是用一组小波函数或者基函数表示一个函数或者信号，例如图像信号。为了理解什么是小波变换，下面用一个具体的例子来说明小波变换的过程。

 . 求有限信号的均值和差值

    [例8. ] 假设有一幅分辨率只有4个像素 的一维图像，对应的像素值或者叫做图像位置的系数分别为：

                   [      ]

  计算它的哈尔小波变换系数。

 计算步骤如下：

     步骤1：求均值(averaging)。计算相邻像素对的平均值，得到一幅分辨率比较低的新图像，它的像素数目变成了2个，即新的图像的分辨率是原来的1/，相应的像素值为：

             [ ]

 步骤2：求差值(differencing)。很明显，用2个像素表示这幅图像时，图像的信息已经部分丢失。为了能够从由2个像素组成的图像重构出由4个像素组成的原始图像，就需要存储一些图像的细节系数(detail coefficient)，以便在重构时找回丢失的信息。方法是把像素对的第一个像素值减去这个像素对的平均值，或者使用这个像素对的差值除以2。在这个例子中，第一个细节系数是(-)=，因为计算得到的平均值是8,它比9小1而比7大1，存储这个细节系数就可以恢复原始图像的前两个像素值。使用同样的方法，第二个细节系数是(-)=-，存储这个细节系数就可以恢复后2个像素值。因此，原始图像就可以用下面的两个平均值和两个细节系数表示，

                [   -]

 步骤3：重复第1，2步，把由第一步分解得到的图像进一步分解成分辨率更低的图像和细节系数。在这个例子中，分解到最后，就用一个像素的平均值6和三个细节系数2,1和-1表示整幅图像。

                [      -]

 这个分解过程如表8-1所示。

 表8- 哈尔变换过程

 分辨率

 平均值

 细节系数

 [      ]

 [  ]

 [  -]

 []

 []

     由此可见，通过上述分解就把由4像素组成的一幅图像用一个平均像素值和三个细节系数表示，这个过程就叫做哈尔小波变换(Haar wavelet transform)，也称哈尔小波分解(Haar wavelet decomposition)。这个概念可以推广到使用其他小波基的变换。

     从这个例子中我们可以看到：

   ① 变换过程中没有丢失信息，因为能够从所记录的数据中重构出原始图像。

   ② 对这个给定的变换，我们可以从所记录的数据中重构出各种分辨率的图像。例如，在分辨率为1的图像基础上重构出分辨率为2的图像，在分辨率为2的图像基础上重构出分辨率为4的图像。

   ③ 通过变换之后产生的细节系数的幅度值比较小，这就为图像压缩提供了一种途径，例如去掉一些微不足道的细节系数并不影响对重构图像的理解。

哈尔小波变换

2.轮辐方法配合离散余弦变换

B.四个流行的算法

1.SVMs是一种有监督学习模型，它被广泛应用在机器学习的分类和线性回归分析中。

2.Bagging的核心就是使多个弱分类器结合称强分类器。

3.Random forests是针对分类，回归和其它任务的集成方法。随机森林能有效防止过拟合。

4.GBDT，短梯度升压决策树。

C.实验结果

《principal component analysis based cataract grading and classification》学习笔记

D.实验结果分析

PCA最好

IV. Conclusion

本研究增加了PCA这一个步骤，虽然精确度有所下降，但是计算速度有很大提升，这是很有意义的，所以有很大的发展前景。

问题

1 轮辐特征是什么？

2 交叉验证是什么？

秒客网

《principal component analysis based cataract grading and classification》学习笔记

Abstract

I. Introduction

II. Related Work

III. Implementation

IV. Conclusion

问题

相关文章