基于高光譜分選設備的關鍵技術——分類算法
發(fā)布時間:2023-10-10
瀏覽次數(shù):535
分類算法是高光譜分選設備的關鍵技術之一。高光譜數(shù)據(jù)的分類算法可以分為基于光譜相似度匹配的分類方法和基于機器學習的分類方法2類。本文根據(jù)現(xiàn)有技術和研究資料,進行了簡單總結。
分類算法是高光譜分選設備的關鍵技術之一。高光譜數(shù)據(jù)的分類算法可以分為基于光譜相似度匹配的分類方法和基于機器學習的分類方法2類。本文根據(jù)現(xiàn)有技術和研究資料,進行了簡單總結。
?
高光譜相機原理
高光譜相機采集物體的反射光譜,典型的高光譜相機的原理是,光源投射到待測物體上,反射后經(jīng)過相機鏡頭前端的狹縫進人高光譜相機內部的核心元件一—分光儀。分光儀將每一束光分成多束單色光,投到面陣相機上。面陣相機狹縫的長度方向w為像素維度,與狹縫垂直方向h為光譜維度,面陣相機w和h2個方向的分辨率決定著高光譜數(shù)據(jù)的像素分辨率和光譜分辨率。該高光譜相機的使用和線陣相機類似,一行一行的掃描,每一行的數(shù)據(jù)都是面陣相機的數(shù)據(jù),代表的是w方向上每個像素點上的h個光譜數(shù)據(jù),根據(jù)光譜信息進行光譜分析可以確定其化學組成,以此來鑒別物體的材質。
?
高光譜相機數(shù)據(jù)獲取
根據(jù)高光譜相機原理可知,高光譜相機每一幀數(shù)據(jù)都是面陣相機的二維數(shù)據(jù),而高光譜數(shù)據(jù)是三維的數(shù)據(jù),需要對相機采集到的數(shù)據(jù)進行相應的處理后才能獲得。高光譜相機數(shù)據(jù)獲取分為面陣相機數(shù)據(jù)獲取和數(shù)據(jù)拼接2個部分。面陣相機數(shù)據(jù)的獲取與普通2D相機數(shù)據(jù)的獲取過程并無差異,即先調整圖像質量,然后獲取圖像。調整圖像質量時,需要調節(jié)光源的亮度、相機光圈、焦距大小以及曝光時間等,以獲得最優(yōu)的圖像效果。獲取圖像一般是連續(xù)獲取數(shù)據(jù),可以按時間間隔觸發(fā),也可以由外部I0信號觸發(fā)。如果這個10信號是編碼器,就可以實現(xiàn)按照距離觸發(fā)。觸發(fā)間隔有嚴格的要求,以保證拼接后的圖像與實際物體比例一致。
面陣相機數(shù)據(jù)的獲取完成后,還需要對數(shù)據(jù)進行拼接,從而得到高光譜數(shù)據(jù)。高光譜數(shù)據(jù)的格式有3種,分別為BSQ,BIL和BIP。BSQ(Band Sequential Format)格式是按波段保存,1個波段保存后接著保存第2個波段。這種格式適合對單個光譜波段中任何部分的空間(X,Y)存取。BIL(Band interleaved by line format)格式是按行保存,保存第1個波段的第1行后,接著保存第2個波段的第1行,這種格式提供了空間和光譜處理之間的一種折衷方式。BIP(Band interleaved by pixel format)格式是按像元保存,先保存第1個波段的第1個像元,然后保存第2波段的第1個像元。該格式為圖像數(shù)據(jù)光譜(Z)的存取提供了最佳性能。高光譜數(shù)據(jù)拼接完成后,通常還需要1個描述文件,然后可以導入光譜分析軟件進行數(shù)據(jù)處理了。
?
基于光譜相似度匹配的分類方法
光譜相似度的匹配算法是通過計算測試光譜向量與參考光譜向量之間的相似度來進行分類。光譜相似度的度量標準包括最小距離、光譜角度、光譜信息散度以及光譜相關性等,其中最小距離度量標準包括曼式距離和歐式距離等。光譜最小距離越小,相似性越大。光譜角度余弦值越大,相似性越大。光譜信息散度值越接近于0,相似性越大。光譜相關系數(shù)越大,相似性越大。
光譜相似度的匹配算法首先要建立待測物體的光譜庫,然后計算測試光譜與光譜庫中光譜數(shù)據(jù)的相似度,最后根據(jù)相似度數(shù)值以及相似度閥值來判斷物體的類別。光譜相似度匹配算法的重點在于待測物體光譜庫的建立,光譜庫可以是來自標準的光譜庫,也可以是根據(jù)待測物體建立的自定義光譜庫。標準的光譜庫對相機和光源的一致性要求較高,實際上不同的相機、不同的光源、不同的校準條件,得到的光譜曲線并不完全一致,所以標準光譜庫中的數(shù)據(jù)一般只作為參考,工業(yè)應用上需要自定義光譜庫。自定義光譜庫時,首先采集待測物體的光譜數(shù)據(jù),選取感興趣區(qū)域(ROI),并對ROI中的數(shù)據(jù)進行端元提取,得到純凈像元,并將該像元的光譜數(shù)據(jù)存入光譜庫。常用的端元提取方法包括內部最大體積法(N-FINDER)、純像素索引法(PPl)、凸錐分析(CCA)、頂點成分分析法(VCA)等。
?
基于機器學習的分類方法
基于機器學習的分類方法分為非監(jiān)督分類和監(jiān)督分類。非監(jiān)督分類是指在沒有任何分類先驗知識的情況下,僅依據(jù)數(shù)據(jù)本身的統(tǒng)計特征及自然點群的分布情況來劃分類別的分類方法,代表性的非監(jiān)督分類包括均值聚類算法(K-Means)、選代自組織數(shù)據(jù)分析算法(Iterative Self?Organizing Data Analysis Technique)"。監(jiān)督分類是指以先前提取的訓練樣本作為先驗知識,以對訓練樣本的學習構建分類模型,并對其他數(shù)據(jù)進行分類的過程"。監(jiān)督分類算法常用的包括高斯最大似然分類法、最小距離分類、K近鄰、決策樹以及支持向量機等。
由于高光譜數(shù)據(jù)的波段數(shù)通常有200多個以上,包含豐富的信息,但有很多數(shù)據(jù)冗余,在進行監(jiān)督分類之前,需要對數(shù)據(jù)進行特征提取,選取包含信息量大的波段或者特征來降低數(shù)據(jù)的冗余程度。將原始高維數(shù)據(jù)投影到一個新的低維空間,從而獲得原始數(shù)據(jù)的更精簡的表示,即降維,可以有效減少運算量,提高運算速度。常用的降維方法包括主成分分析(PCA)、線性判別分析(LDA)、回歸系數(shù)法、連續(xù)投影法等。以PV、PS、PP、PE和PC等塑料材質的分選為例,對比效果如圖1所示。
分類算法加速
由于高光譜數(shù)據(jù)包含3個維度的信息,是個數(shù)據(jù)立方體,數(shù)據(jù)量很大,因此需要對算法進行優(yōu)化加速,這樣才能滿足工業(yè)上實時分選的需求。分類算法是基于每個像素的光譜數(shù)據(jù)進行運算的,算法加速主要是通過并行運算進行加速。
NVIDIAGPU Computing Toolkit提供了豐富的教程,可以根據(jù)CUDA提供的矩陣運算應用開發(fā)庫CUBLAS_Library進行并行運算加速,也可以參考CUDACProgramming Guide,編寫并行執(zhí)行的核函數(shù),直接操作GPU進行并行計算加速。相比于CPU的串行運算,GPU的并行運算能夠提高5~10倍的運算速度。
并行加速的另一種平臺是FPGA,F(xiàn)PGA器件屬于專用集成電路中的一種半定制電路——可編程的邏輯列陣?;诠庾V相似性匹配算法,可以通過硬件描述語言(HDL)寫入FPGA,實現(xiàn)硬件上的并行,其運算的速度更快。FPGA的開發(fā)難度較大,并行占用的FPGA資源較多,需要大容量的FPGA。
?
相關產品
-
高光譜知識:高光譜圖像處理技術
高光譜圖像處理技術是一種集圖像與光譜信息于一體的高分辨率技術,廣泛應用于航天、農業(yè)、食品安全、醫(yī)學診斷及工業(yè)分類質檢等領域,展現(xiàn)出強大的應用潛力和價值。..
-
高光譜成像技術方案怎么選擇?
探索高光譜成像技術,精準檢測水果品質,從源頭把控,讓每一顆果實都展現(xiàn)最佳風味!..
-
基于多種光學技術的食品無損檢測:保障食品安全質量
隨著科技的發(fā)展,如今有了更先進的食品檢測方法,其中基于光學的不同波段檢測方法結合光譜技術大放異彩。這些方法包括可見光、紅外、太赫茲以及 X 射線等波段的檢測,它..
-
高光譜成像技術在紡織品回收分類中的應用
利用高光譜相機對紡織品進行分類以便回收,在眾多節(jié)約和減少浪費的努力中,紡織品仍然是最大的挑戰(zhàn)之一。只有 15% 被回收和再利用,而其余 85% 最終被填埋。紡織..