資源描述:
《基于煙葉化學(xué)成分烤煙香型分類模型的建立》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、基于煙葉化學(xué)成分烤煙香型分類模型的建立申欽鵬,張霞,張濤,雷萍,段沅杏,楊光宇,韓敬美,趙偉,陳永寬,繆明明,劉志華(云南中煙工業(yè)有限責(zé)任公司技術(shù)中心/云南省煙草化學(xué)重點(diǎn)實(shí)驗(yàn)室,昆明650231)摘要:基于煙葉化學(xué)數(shù)據(jù)建立烤煙香型分類模型,然后對(duì)各模型進(jìn)行篩選比較選出最優(yōu)模型。首先對(duì)142個(gè)烤煙煙葉樣品中的9類成分的63個(gè)指標(biāo)采用行業(yè)標(biāo)準(zhǔn)進(jìn)行檢測(cè),然后采用逐步回歸法篩選出19個(gè)煙葉化學(xué)成分,依據(jù)這19個(gè)指標(biāo)采用線性判別分析法、Logistic回歸、高斯混合模型、分類樹(shù)、K最鄰近法、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)
2、七種方法進(jìn)行建模。通過(guò)對(duì)不同方法建立的模型采用100次隨機(jī)抽取訓(xùn)練集樣本和測(cè)試樣本計(jì)算錯(cuò)誤分類率,選擇錯(cuò)誤分類率較低的模型作為優(yōu)選模型。經(jīng)比較發(fā)現(xiàn),線性判別法和高斯混合模型建立的兩種香型函數(shù)能較好地對(duì)未知樣品的香型進(jìn)行正確分類,且效果較好。篩選出的兩種優(yōu)選模型對(duì)于烤煙香型分類研究具有一定的應(yīng)用價(jià)值。.jyqkS的聯(lián)用及其在卷煙煙氣香氣成分中的應(yīng)用研究”(JSZX2014JC04)簡(jiǎn)介:申欽鵬(1984-),男,湖南衡陽(yáng)人,助理研究員,博士,主要從事煙草化學(xué)研究,()18687540024(電子信箱)ash
3、b345@126.com;通信,劉志華(1974-),男,云南勐臘人,研究員,碩士,主要從事煙草化學(xué)研究,()0871-65869792(電子信箱)zhihualiu@163.com。目前利用烤煙中化學(xué)成分、致香成分對(duì)三種烤煙香型進(jìn)行模式識(shí)別已有相關(guān)文獻(xiàn)報(bào)道[1-4]。在國(guó)內(nèi)的研究中,朱立軍等[2]對(duì)112份市售卷煙樣品中20種化學(xué)成分采用逐步判別方法進(jìn)行判別分析取得了較好的分類結(jié)果,Zhan等[4]以63個(gè)中部和65個(gè)上部煙葉為材料,基于其中的67種致香物質(zhì)對(duì)三種香型進(jìn)行逐步判別分析也取得較好的分類結(jié)果
4、并得到很好的應(yīng)用。目前在利用化學(xué)計(jì)量學(xué)進(jìn)行模式識(shí)別的過(guò)程中,已發(fā)展出了各種各樣的方法[5],采用其他類型的方法是否與經(jīng)典的判別分析方法具有同樣的效果,或是效果要好于經(jīng)典方法,此方面的研究還未見(jiàn)相關(guān)的報(bào)道。為此,采用目前較為成熟的經(jīng)典判別分析方法(LDA)、Logistic回歸(LR)、高斯混合模型(Mix)、分類樹(shù)(Tree)、K最鄰近法(KNN)、人工神經(jīng)網(wǎng)絡(luò)(CANN)和支持向量機(jī)(SVM)七種化學(xué)計(jì)量學(xué)方法,隨機(jī)抽取不同的訓(xùn)練集和測(cè)試集進(jìn)行分析,擬篩選出分類效果較優(yōu)且精度較為穩(wěn)健的模型,以期為烤煙香
5、型分類優(yōu)化模型的選擇提供理論依據(jù)。1材料與方法1.1材料2011年收集142份烤煙樣品,分別來(lái)自中國(guó)14個(gè)省份,16個(gè)品種。其中清香型(簡(jiǎn)稱“清”)50個(gè),中間香型簡(jiǎn)稱“中”40個(gè),濃香型(簡(jiǎn)稱“濃”)52個(gè)。本次收集的樣品均由全國(guó)評(píng)煙委員會(huì)委員組成的評(píng)吸專家組對(duì)烤煙香型(清香型、濃香型和中間香型)進(jìn)行鑒定。1.2方法1.2.1分析檢測(cè)在煙葉化學(xué)成分中主要對(duì)9類成分中的63個(gè)指標(biāo)采用行業(yè)標(biāo)準(zhǔn)進(jìn)行檢測(cè)。63個(gè)指標(biāo)具體是總糖、還原糖、氯、鉀、氮、總植物堿、石油醚提取物、粗纖維素、揮發(fā)酸、揮發(fā)堿、葡萄糖、果糖、
6、蔗糖、綠原酸、莨菪亭、蕓香苷、鐵、錳、銅、鋅、鈉、硼、鈣、鎂、硝酸根、硫酸根、磷酸根、草酸、丙二酸、蘋果酸、棕櫚酸、硬脂酸、檸檬酸、亞油酸、亞麻酸、煙堿、降煙堿、麥斯明、假木賊堿、新煙草堿、2,3-聯(lián)吡啶、葉黃素、胡蘿卜素、天冬酰胺酸、組氨酸、絲氨酸、谷氨酰胺酸、精氨酸、甘氨酸、高絲氨酸、天冬氨酸、谷氨酸、蘇氨酸、丙氨酸、γ-氨基丁酸、脯氨酸、賴氨酸、酪氨酸、纈氨酸、異亮氨酸、亮氨酸、苯丙氨酸、色氨酸。1.2.2統(tǒng)計(jì)分析方法主要的統(tǒng)計(jì)分析程序采用R-2.15.3進(jìn)行。1)自變量篩選方法。變量篩選方法采用逐
7、步方法,該方法與逐步回歸方法較為一致[6,7]。主要通過(guò)計(jì)算每一逐步過(guò)程中所得的F值與指定值進(jìn)行判斷變量移除或進(jìn)入,并獲得每個(gè)變量的Wilks’lambda統(tǒng)計(jì)量。2)建模及評(píng)估方法。主要采用了判別分析法[8,9]、Logistic回歸[10]、高斯混合模型[11]、分類樹(shù)[12]、K最鄰近法[13-15]、人工神經(jīng)網(wǎng)絡(luò)[16]和支持向量機(jī)[17,18]七種方法進(jìn)行建模。通過(guò)對(duì)不同方法建立的模型采用100次隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本計(jì)算錯(cuò)誤分類率[19],選擇錯(cuò)誤分類率較低的方法所建模型作為優(yōu)選模型。3)
8、隱含層計(jì)算。在采用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行建模的過(guò)程中,涉及到兩個(gè)參數(shù)的優(yōu)化,一個(gè)是隱含層單元數(shù)的確定,另一個(gè)是權(quán)衰減系數(shù)的確定。對(duì)于權(quán)衰減系數(shù)的確定主要參看下面“參數(shù)優(yōu)化選擇”中的內(nèi)容進(jìn)行優(yōu)化選擇,而隱含層單元數(shù)的確定主要采用以下公式進(jìn)行計(jì)算:其中,s為隱含層節(jié)點(diǎn)數(shù),m為輸入層節(jié)點(diǎn)數(shù),n為輸出層節(jié)點(diǎn)數(shù)。通過(guò)式(1)可對(duì)各化學(xué)成分、致香成分和近紅外光譜信息的隱含層數(shù)進(jìn)行選擇。4)參數(shù)優(yōu)化選擇。在分類樹(shù)、K最鄰近法、人工神經(jīng)網(wǎng)絡(luò)和支持向