基于近红外成像高光谱技术的海苔杂质分析研究
基于近红外成像高光谱技术的海苔杂质分析研究
四川双利合谱科技有限公司-黄宇
一、测试原理及方法:
高光谱成像技术是近二十年来发展起来的基于非常多窄波段的影像数据技术,其*突出的应用是遥感探测领域,并在越来越多的民用领域有着更大的应用前景。它集中了光学、光电子学、电子学、信息处理、计算机科学等领域的先进技术,是传统的二维成像技术和光谱技术有机的结合在一起的一门新兴技术。
高光谱成像技术的定义是在多光谱成像的基础上,在从紫外到近红外(200-2500nm)的光谱范围内,利用成像光谱仪,在光谱覆盖范围内的数十或数百条光谱波段对目标物体连续成像。在获得物体空间特征成像的同时,也获得了被测物体的光谱信息。
目标物体-成像物镜-入射狭缝-准直透镜-PGP-聚焦透镜-CCD棱镜-光栅-棱镜:PGP
图1 成像原理图
光谱仪的光谱分辨率由狭缝的宽度和光学光谱仪产生的线性色散确定。*小光谱分辨率是由光学系统的成像性能确定的(点扩展大小)。
成像过程为:每次成一条线上的像后(X方向),在检测系统输送带前进的过程中,排列的探测器扫出一条带状轨迹从而完成纵向扫描(Y方向)。综合横纵扫描信息就可以得到样品的三维高光谱图像数据。
图2 像立方体
二、材料与分析:
1、实验设备与材料
本文以市场上购买的海苔为研究对象,参杂了少量沙石、木块、木炭、塑料绳等杂质,利用四川双利合谱科技有限公司的近红外高光谱成像仪GaiaSorter-N17E(光谱范围900 nm - 1700 nm)采集测试对象的高光谱影像数据,并从获取的高光谱影像数据中分析参杂的杂质。表1为近红外高光谱成像仪GaiaSorter-N17E系统参数。
表1 近红外高光谱成像仪GaiaSorter-N17E系统参数
序号 |
相关参数 |
N17E |
1 |
光谱范围 |
900-1700 nm |
2 |
光谱分辨率 |
4-5 nm |
3 |
像面尺寸 |
7.6×14.2 |
4 |
倒线色散 |
110 nm/mm |
5 |
相对孔径 |
F/2.0 |
6 |
杂散光 |
<0.5% |
7 |
波段数 |
256 |
2、高光谱影像数据预处理
对成像光谱仪获取的原始影像数据进行数据的预处理,预处理过程主要包括两部分。**部分是辐射定标;**部分为噪声去除。
首先进行辐射定标。辐射定标的计算公式如1所示。
(1)
其中,Reftarget为目标物的反射率,Refpanel为标准参考板的反射率,DNtarget为原始影像中目标物的的数值,DNpanel为原始影像中标准参考板的数值,DNdark为成像光谱仪系统误差。
其次是噪声去除,常用的方法有小波降噪、S-G降噪、均值滤波、*小噪声分离等方法。本研究则运用国外较为常用的*小噪声分离方法(Minimum Noise Fraction Rotation, MNF)进行噪声去除。*小噪声分离工具用于判定图像数据内在的维数(即波段数),分离数据中的噪声,减少随后处理中的计算需求量。MNF本质上是两次层叠的主成分变换。**次变换(基于估计的噪声协方差矩阵)用于分离和重新调节数据中的噪声,这步操作使变换后的噪声数据只有*小的方差且没有波段间的相关。**步是对噪声白化数据(Noise-whitened)的标准主成分变换。为了进一步进行波谱处理,通过检查*终特征值和相关图像来判定数据的内在维数。数据空间可被分为两部分:一部分与较大特征值和相对应的特征图像相关,其余部分与近似相同的特征值以及噪声占主导地位的图像相关。由于此次采集的高光谱影像没有白板校正,因此数据预处理的**步辐射定标没有进行分析处理,直接作MNF降噪分析。图3为MNF降噪前后的成像高光谱数据中DN值的变化。
图3 MNF变换前(左)后(右)高光谱影像DN值的变化
三、结果与分析
1、 海苔高光谱影像中各杂质的高光谱反射率
图4为海苔在900-1700 nm范围内,其与背景、木块、木炭、塑料绳以及其他杂质的高光谱反射率曲线图。从图中可知,海苔与杂质间的光谱差异显著,因而可以考虑运用阈值分割的方法提取海苔,或分析各杂质。
图4 海苔高光谱影像中各杂质的高光谱反射率
2、*小噪声分离变换
对原始高光谱数据进行 MNF 变换,分别得到以有效信息为主的波段和以噪声为主的波段,并且按照信噪比从大到小的顺序排列。原始数据的主要信息都集中在前面特征值大的波段,后面特征值小的波段主要以噪声为主。特征值接近于1的多数是噪声,*好选择特征值高的波段。图5分别列举了前9个MNF波段影像。从图5可知,第2个MNF波段数据能较好地识别出海苔及其背景、杂质,然而杂质间却无法区别开;第3个MNF较亮的部分来杂质,较暗的一部分也是杂质,这两种杂质显然不是同一类别,第4个MNF与第3个MNF图像相似。其他几个MNF并无明显的图像区分度。
图5海苔高光谱图像前9个MNF波段数据(从左往右依次为MNF1-9)
3、海苔、杂质高光谱图像监督分类研究
高光谱遥感图像分类是高光谱遥感图像分析和应用的重要内容,根据是否使用类别的先验知识,可分为监督分类和非监督分类,常用的监督分类方法有*大似然分类法、光谱匹配法和神经网络法等,非监督分类常用的方法有K-Means和ISODATA法。本研究运用监督分类方法中的*大似然分类法、神经网络法、光谱角匹配法来研究海苔、杂质、背景的区分,分类结果如图6所示。图6中绿色和紫色为海苔,红色为背景,其他颜色为杂质。从图6所知,这三种监督分类方法中,神经网络的分类效果*好,能识别出几种不同杂质,然而塑料绳并未清晰的识别出来,而且神经网络分类方法分类速度较慢,需要选择训练样本,费时费力,不利于产业化的应用。
图6 运用不同监督分类方法区分海苔、杂质、背景
4、基于海苔、杂质高光谱图像决策树分类研究
根据2和3可知,运用MNF和监督分类方法虽然能较好地识别出海苔,但是单个MNF波段只能识别出少量的杂质,且位置杂质属性,监督分类虽然能识别较多的杂质,但是需要选择训练样本,且运行时间较长,并不适合未来产业化的发展。因为本研究探讨综合使用不同物质的光谱特征及其MNF波段,运用决策树分类方法快速识别海苔、杂质、背景。
决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。
图7为决策树的分叉图,主要运用了MNF变化的MNF2、3、4、5波段,以及高光谱图像数据的第15、80、104波段做决策树分类,该阈值是运用*大类间方差法获取。图8为利用该决策树的分类效果图,从图中可知,原图无法用肉眼识别的塑料绳、杂质等,运用决策树分类后能较为清晰的识别出来,而且图像处理速度大大提高。
图7 决策树分叉图
图8 决策树分类效果图