中藥材是中醫藥的核心組成部分。近年來,中藥材在生產與流通環節出現了摻雜、摻假和混淆等情況。中藥材當歸與獨活在外觀上較為相似,經驗不豐富的檢測人員較難區分。當歸具有補血活血、調經止痛、潤腸通便等功效;獨活具有止痛、解表等功效。若誤將當歸與獨活混淆,不僅減弱治療效果,還可能引發副作用或藥物反應。
隨著高光譜圖像的光譜分辨率不斷提高,數據處理能力不斷增強,高光譜成像技術廣泛應用于中藥材分選、食品安全、藥物檢測和飼料營養成分鑒別等領域。
1、高光譜圖像采集與處理
利用高光譜實驗平臺采集當歸與獨活樣本的高光譜圖像。
圖1 當歸與獨活樣本
2、高光譜圖像預處理
為降低光源強度分布不均勻和相機暗電流對高光譜圖像的干擾,對采集的當歸與獨活樣本高光譜圖像進行黑白校正,校正公式為
式中:為Rλ校正后的高光譜圖像,Iλ為采集的高光譜圖像,Bλ為反射率為99%標準白板圖像,Hλ為鏡頭遮擋采集的暗場圖像。
為了獲取當歸與獨活樣本的平均光譜數據,利用圖像掩模逐個提取當歸與獨活樣本的感興趣區域(regionofinterest,ROI),并將每個樣本所有像素點的平均光譜反射值作為一條光譜曲線,共有963條平均光譜曲線。
圖2 平均光譜數據提取過程
利用高光譜相機采集當歸與獨活樣本的三通道彩圖;然后,通過閾值處理將高光譜相機采集的1364nm波段的灰度圖作為掩模圖像;最后,根據掩模圖像中單個樣本的掩模坐標,從高光譜圖像中提取去除背景的部分高光譜圖像作為感興趣區域,并計算其平均光譜。
當歸與獨活樣本的平均光譜曲線如圖:
圖3 當歸與獨活樣本的平均光譜曲線
由圖4可知,當歸與獨活樣本的平均光譜曲線在兩端邊緣處光譜反射值波動較劇烈,受干擾較大,數據失真嚴重,影響后期的分類效果,需進行噪聲裁剪,即剔除噪聲較大的936~1012nm和1652~1720nm邊緣波段,保留1016~1648nm中間波段(對應224波段中的23~204,共計181個波段)進行建模分析。
3、分類流程
3.1一維卷積
卷積神經網絡是一種端到端的深度神經網絡,主要包括輸入層、卷積層、池化層、全連接層和輸出層。本文基于LeNet-5卷積神經網絡建立當歸與獨活一維卷積神經網絡(1D-CNN)分類模型,主要包括3個卷積層、3個平均池化層和1個全連接層,模型框架如圖5所示。
圖4 當歸與獨活1D-CNN分類模型框架
表1 當歸與獨活1D-CNN分類模型參數
3.2分類流程
當歸與獨活分類流程圖如圖所示。
圖5 當歸與獨活分類流程圖
首先,采用高光譜相機獲取當歸與獨活樣本的高光譜圖像,確定高光譜圖像預處理的方法并計算其平均光譜;然后,分別利用當歸與獨活1D-CNN分類模型和SVM分類模型對當歸與獨活進行分類;接著,通過顯著圖選擇當歸與獨活的特征波段,減少數據計算量;最后,在當歸與獨活數據集上基于所選的特征波段,分別采用1D-CNN分類模型和SVM分類模型實現當歸與獨活的分類。
4、高光譜數據
全部當歸與獨活樣本的平均光譜如圖:
圖6 全部當歸與獨活樣本的平均光譜
由圖 7 可知,當歸與獨活光譜曲線相似性高,不 易區分,但在某些波段存在細微的差異。
圖7 輸入光譜數據的顯著波段
由上圖可知,波段貢獻度較大的區域分別集中在 1 120 nm、1 262 nm 和 1 548 nm 波長附近,因此選擇 1 108 ~1 136 nm、1 260 ~1 284 nm 和 1 542 ~1 560 nm 共 20 個波段作為特征波段。
推薦:
便攜式高光譜成像系統 iSpecHyper-VS1000
專門用于刑偵、物證鑒定、醫學醫療、精準農業、礦物地質勘探等領域的產品,主要優勢具有體積小、幀率高、高光譜分辨率高、高像質等性價比特點采用了透射光柵內推掃原理高光譜成像,系統集成高性能數據采集與分析處理系統,高速USB3.0接口傳輸,全靶面高成像質量光學設計,物鏡接口為標準C-Mount,可根據用戶需求更換物鏡。