基于支持向量回歸機(jī)的復(fù)雜產(chǎn)品費(fèi)用估算技術(shù)發(fā)展研究論文
摘 要: 傳統(tǒng)的費(fèi)用估算算法需要大量的樣本數(shù)據(jù)來(lái)保證其估算的準(zhǔn)確性,但在實(shí)際應(yīng)用中,由于樣本數(shù)據(jù)的有限性,其準(zhǔn)確性無(wú)法得到保證,針對(duì)這種情況提出使用基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量回歸機(jī)(SVR)進(jìn)行費(fèi)用估算,并通過(guò)具體實(shí)例詳細(xì)闡述基于SVR的費(fèi)用估算具體步驟,包括數(shù)據(jù)預(yù)處理、基于SVR的訓(xùn)練、估算和后處理過(guò)程,通過(guò)與神經(jīng)網(wǎng)絡(luò)方法相比,實(shí)驗(yàn)結(jié)果驗(yàn)證了SVR在小樣本情況下具有更好的估算精度。最后實(shí)現(xiàn)了基于SVR的復(fù)雜產(chǎn)品費(fèi)用估算方法,并集成于復(fù)雜產(chǎn)品費(fèi)用估算系統(tǒng)。
關(guān)鍵詞: 復(fù)雜產(chǎn)品; 支持向量回歸機(jī); 小樣本; 費(fèi)用估算
中圖分類號(hào): TN711?34; TP319 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2015)09?0038?05
Abstract: Since plenty of sample data is required to ensure the accuracy of traditional cost estimation algorithm, and it is hard to ensure the accuracy of estimation due to the limitation of sample data in practical application, the support vector regression (SVR) based on statistical learning theory is proposed to make cost estimation. The specific steps of cost estimation is described in detail based on SVR, including data preprocessing, training based on SVR, estimation and post?processing. The experiment result verifies that the estimation accuracy based on SVR in small sample data is better than the method of neural network. Finally, the method of complex product cost estimation based on SVR is implemented, and is integrated in the system of complex product cost estimation.
Keywords: complex product; support vector regression; small sample; cost estimation
0 引 言
隨著高新技術(shù)及現(xiàn)代生產(chǎn)的發(fā)展,復(fù)雜產(chǎn)品(如導(dǎo)彈、艦船、飛機(jī)等)的性能和復(fù)雜性越來(lái)越高,其在使用以及維修保障過(guò)程中的各種費(fèi)用也不斷增加,若不提前對(duì)復(fù)雜產(chǎn)品的費(fèi)用進(jìn)行有效地預(yù)估和判斷,將會(huì)影響到對(duì)復(fù)雜產(chǎn)品做出合理性和經(jīng)濟(jì)性的生產(chǎn)決策,由此而導(dǎo)致的費(fèi)用的增長(zhǎng)不但會(huì)成為沉重的經(jīng)濟(jì)負(fù)擔(dān),而且還會(huì)影響到對(duì)新型產(chǎn)品的預(yù)研和投資。因此,有必要采用科學(xué)的費(fèi)用估算方法,及時(shí)準(zhǔn)確地對(duì)產(chǎn)品未來(lái)的費(fèi)用進(jìn)行估算,做出合理的費(fèi)用計(jì)劃,節(jié)約有限的成本費(fèi)用。
傳統(tǒng)的費(fèi)用估算方法主要有工程法、參數(shù)法、類比法和專家判斷法,這些方法都存在著一些不足之處。一些比較新的理論包括偏最小二乘回歸法、灰色理論、神經(jīng)網(wǎng)絡(luò)、遺傳算法也已應(yīng)用于費(fèi)用估算,取得了不錯(cuò)的效果,如文獻(xiàn)。然而,這些統(tǒng)計(jì)理論只有在費(fèi)用樣本數(shù)量趨于無(wú)窮大時(shí)才能有理論上的保證,但在實(shí)際應(yīng)用中,受到各種條件的限制,很多用于費(fèi)用估算問(wèn)題的產(chǎn)品費(fèi)用樣本容量很小,信息不足,不能反映整個(gè)產(chǎn)品費(fèi)用樣本空間的分布,故而這些理論在實(shí)際應(yīng)用中往往難以取得理想的效果。因此建立適合于小樣本情況下的復(fù)雜產(chǎn)品估算模型顯得尤為重要。在此背景下,Vapnik等人基于統(tǒng)計(jì)學(xué)習(xí)理論提出一種借助于最優(yōu)化方法解決機(jī)器學(xué)習(xí)問(wèn)題的新工具,即支持向量機(jī)(Support Vector Machine,SVM),它根據(jù)有限的樣本信息,采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,對(duì)獨(dú)立的測(cè)試樣本能夠得到較小的誤差,包括支持向量分類機(jī)(Support Vector Classification,SVC)和支持向量回歸機(jī)(Support Vector Regression,SVR),被認(rèn)為是目前針對(duì)小樣本的分類和回歸問(wèn)題的最佳方法。本文推廣應(yīng)用了支持向量機(jī)中的回歸部分,將支持向量機(jī)算法應(yīng)用于復(fù)雜產(chǎn)品的費(fèi)用估算,利用支持向量機(jī)對(duì)歷史費(fèi)用數(shù)據(jù)進(jìn)行訓(xùn)練,逼近費(fèi)用數(shù)據(jù)所隱含的函數(shù)關(guān)系,完成費(fèi)用與影響參數(shù)之間的映射關(guān)系,進(jìn)而完成對(duì)復(fù)雜產(chǎn)品未來(lái)費(fèi)用的估算。
1 SVR原理
SVM最初是用來(lái)解決模式識(shí)別的問(wèn)題,在模式識(shí)別中,為了發(fā)現(xiàn)具有好的推廣能力的決策規(guī)則,將所選擇的訓(xùn)練數(shù)據(jù)的一些子集,稱做支持向量機(jī)。支持向量機(jī)的方法也可以應(yīng)用到回歸問(wèn)題中,標(biāo)準(zhǔn)的SVR算法,分為線性和非線性兩種,其基本思想是:通過(guò)非線性變換將輸入空間向量映射到高維特征空間中,運(yùn)用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則在這個(gè)特征空間構(gòu)造回歸估計(jì)函數(shù),這種非線性變換是通過(guò)定義適當(dāng)?shù)暮撕瘮?shù)來(lái)實(shí)現(xiàn)的。其中是指由輸入空間到特征空間的非線性映射。
步驟1:收集樣本數(shù)據(jù),將樣本數(shù)據(jù)分為訓(xùn)練樣本數(shù)據(jù)集和待估算測(cè)試樣本數(shù)據(jù)集,選擇輸入?yún)?shù)、輸出變量:其中輸入?yún)?shù)主要是指影響到產(chǎn)品最終費(fèi)用的參數(shù),包括對(duì)時(shí)間敏感參數(shù)(如年份、月份等)和對(duì)時(shí)間不敏感參數(shù)(如質(zhì)量、體積等),輸出變量主要是指所關(guān)注的產(chǎn)品費(fèi)用(如產(chǎn)品整體的費(fèi)用或者由輸入?yún)?shù)影響的產(chǎn)品某一部分的費(fèi)用等);
步驟2:將訓(xùn)練樣本數(shù)據(jù)集中隨時(shí)間變化的費(fèi)用參數(shù)數(shù)值用居民消費(fèi)價(jià)格指數(shù)(Consumer Price Index,CPI)統(tǒng)一轉(zhuǎn)換到基準(zhǔn)時(shí)間段的費(fèi)用數(shù)值;
步驟3:對(duì)統(tǒng)一轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行歸一化預(yù)處理,將參數(shù)數(shù)值及費(fèi)用數(shù)值限制在之間,形成歸一化后的訓(xùn)練樣本數(shù)據(jù)集;
步驟4:選擇核函數(shù),設(shè)置訓(xùn)練參數(shù),利用SVR對(duì)費(fèi)用樣本數(shù)據(jù)進(jìn)行訓(xùn)練:訓(xùn)練過(guò)程經(jīng)常采用基于凸優(yōu)化的對(duì)偶理論,來(lái)求解式(5),得到解
步驟5:根據(jù)訓(xùn)練結(jié)果構(gòu)造回歸估計(jì)函數(shù):通過(guò)訓(xùn)練計(jì)算得出的以及選擇的核函數(shù),回歸估計(jì)函數(shù)可表示為
步驟6:用回歸估計(jì)函數(shù)對(duì)預(yù)處理后的待估算費(fèi)用樣本進(jìn)行估算,計(jì)算出估算費(fèi)用值;
步驟7:將估算出的費(fèi)用值通過(guò)預(yù)處理過(guò)程的逆處理過(guò)程得到估算費(fèi)用的精確值。
2.2 費(fèi)用數(shù)據(jù)預(yù)處理
為了提高數(shù)據(jù)計(jì)算效率和保證訓(xùn)練和估算準(zhǔn)確度,需要將費(fèi)用樣本數(shù)據(jù)進(jìn)行預(yù)處理。費(fèi)用樣本數(shù)據(jù)的預(yù)處理包含兩部分:費(fèi)用數(shù)據(jù)的統(tǒng)一轉(zhuǎn)換與歸一化處理。
2.2.1 費(fèi)用數(shù)據(jù)的統(tǒng)一轉(zhuǎn)換
隨著時(shí)間的變化,由于通貨膨脹或收縮、物價(jià)上漲或下降等原因,相同的費(fèi)用值在另一個(gè)時(shí)間段的實(shí)際經(jīng)濟(jì)價(jià)值會(huì)有所不同,因此需要把對(duì)時(shí)間變化敏感的費(fèi)用數(shù)據(jù)統(tǒng)一轉(zhuǎn)換到統(tǒng)一的幣制和相同基準(zhǔn)時(shí)間段(在此時(shí)間段里 ,物價(jià)相對(duì)比較平穩(wěn),費(fèi)用的實(shí)際經(jīng)濟(jì)價(jià)值浮動(dòng)變化很。M(fèi)用的時(shí)間價(jià)值采用年或月為基準(zhǔn),并考慮使用CPI指數(shù)進(jìn)行轉(zhuǎn)換,在以往的研究中,對(duì)于復(fù)雜產(chǎn)品如導(dǎo)彈等的費(fèi)用估算,相關(guān)的時(shí)間因素只是作為訓(xùn)練參數(shù)進(jìn)行計(jì)算,對(duì)受時(shí)間影響的費(fèi)用并沒(méi)有做轉(zhuǎn)換,因此而訓(xùn)練出的回歸估計(jì)函數(shù)并不能真正反映費(fèi)用變化規(guī)律,如文獻(xiàn)中對(duì)所需要進(jìn)行費(fèi)用估算的產(chǎn)品沒(méi)有考慮到時(shí)間因素的影響,文獻(xiàn)中數(shù)據(jù)所呈現(xiàn)的不同產(chǎn)品的研制年份不同,其費(fèi)用的真實(shí)經(jīng)濟(jì)價(jià)值是不同的,因此需要將不同時(shí)間段(年份或月份)的費(fèi)用值轉(zhuǎn)換到基準(zhǔn)時(shí)間段的數(shù)值,對(duì)費(fèi)用真實(shí)變化規(guī)律進(jìn)行函數(shù)擬合,費(fèi)用數(shù)據(jù)統(tǒng)一轉(zhuǎn)換的'具體轉(zhuǎn)換規(guī)則如下:
2.4 訓(xùn)練結(jié)果及誤差
SVR對(duì)費(fèi)用數(shù)據(jù)的訓(xùn)練停止后,其訓(xùn)練費(fèi)用值與實(shí)際值對(duì)應(yīng)如表5所示,其中神經(jīng)網(wǎng)絡(luò)訓(xùn)練費(fèi)用值采自文獻(xiàn),費(fèi)用價(jià)格以1985財(cái)年為基準(zhǔn)。
2.5 費(fèi)用估算及后處理
對(duì)待估算樣本數(shù)據(jù)進(jìn)行預(yù)處理后使用上述SVR進(jìn)行費(fèi)用估算,待估算樣本數(shù)據(jù)的預(yù)處理以訓(xùn)練樣本各特征參數(shù)的最大值和最小值為參照進(jìn)行類似歸一化處理,其值可不必在區(qū)間之內(nèi),估算費(fèi)用結(jié)果如表6所示,其中神經(jīng)網(wǎng)絡(luò)費(fèi)用估算值采自文獻(xiàn)進(jìn)行對(duì)比,費(fèi)用價(jià)值以1985財(cái)年為基準(zhǔn)。估算出產(chǎn)品在基準(zhǔn)財(cái)年的經(jīng)濟(jì)價(jià)格之后,可根據(jù)需要按CPI指數(shù)將其轉(zhuǎn)換到所需要的財(cái)年的價(jià)格,便于比較和決策。由實(shí)驗(yàn)統(tǒng)計(jì)數(shù)據(jù)可見(jiàn),相比于神經(jīng)網(wǎng)絡(luò)算法,SVR在小樣本條件下進(jìn)行費(fèi)用數(shù)據(jù)估算時(shí),其訓(xùn)練誤差可能不比神經(jīng)網(wǎng)絡(luò)小,但其估算的費(fèi)用誤差要遠(yuǎn)遠(yuǎn)小于神經(jīng)網(wǎng)絡(luò)的估算費(fèi)用值,這說(shuō)明在小樣本條件情況下,SVR的推廣能力要強(qiáng)于神經(jīng)網(wǎng)絡(luò)。
3 系統(tǒng)說(shuō)明及展示
基于本文描述的算法所依賴的項(xiàng)目背景,使用C#.NET基于B/S架構(gòu)實(shí)現(xiàn)一個(gè)復(fù)雜產(chǎn)品費(fèi)用估算系統(tǒng),系統(tǒng)提供了對(duì)復(fù)雜產(chǎn)品全生命周期中費(fèi)用不同維度上的分析和管理,以及對(duì)復(fù)雜產(chǎn)品未來(lái)型號(hào)的費(fèi)用估算等功能,將本文實(shí)現(xiàn)算法與實(shí)際應(yīng)用項(xiàng)目進(jìn)行了良好的集成,該系統(tǒng)主要由5個(gè)模塊組成,分別是基礎(chǔ)維度管理模塊、參數(shù)管理模塊、費(fèi)用分解結(jié)構(gòu)模塊、費(fèi)用估算模塊以及費(fèi)用計(jì)算分析模塊。圖2展示了復(fù)雜產(chǎn)品費(fèi)用模塊估算參數(shù)數(shù)據(jù)輸入、訓(xùn)練及估算界面。
4 結(jié) 語(yǔ)
本文充分利用支持向量機(jī)的優(yōu)點(diǎn),通過(guò)建立支持向量機(jī)回歸模型對(duì)實(shí)際復(fù)雜產(chǎn)品的統(tǒng)計(jì)資料進(jìn)行實(shí)驗(yàn)驗(yàn)證并與神經(jīng)網(wǎng)絡(luò)算法比較,實(shí)驗(yàn)結(jié)果表明,在較少的費(fèi)用樣本情況下,SVR能較好地反映產(chǎn)品費(fèi)用與各主要影響參數(shù)的復(fù)雜非線性映射關(guān)系,具有較高的估算精度,并在此基礎(chǔ)上實(shí)現(xiàn)了一個(gè)通用的復(fù)雜產(chǎn)品費(fèi)用估算系統(tǒng),通過(guò)對(duì)指定復(fù)雜產(chǎn)品進(jìn)行結(jié)構(gòu)分析及參數(shù)設(shè)定,即可對(duì)其進(jìn)行費(fèi)用估算,便于對(duì)復(fù)雜產(chǎn)品進(jìn)行費(fèi)用分析和采辦決策。
用支持向量機(jī)對(duì)非線性組合估算函數(shù)進(jìn)行擬合,可以在小費(fèi)用樣本條件下達(dá)到較好的估算精度和較強(qiáng)的推廣能力,適用復(fù)雜產(chǎn)品費(fèi)用的估算問(wèn)題。由于目前還沒(méi)有一定的理論指導(dǎo),支持向量機(jī)核函數(shù)的選取仍是一個(gè)比較困難的問(wèn)題。同時(shí),費(fèi)用影響參數(shù)的選取對(duì)估算結(jié)果也有一定影響,如何在具體條件下對(duì)特定的系統(tǒng)確定合適的參數(shù)還有待進(jìn)一步研究。
參考文獻(xiàn)
李海軍,劉霄,孫偉瑋,等.反艦導(dǎo)彈維修費(fèi)用偏最小二乘估算方法.海軍航空工程學(xué)院學(xué)報(bào),2012,27(1):27?31.
曹廣生,樂(lè)光,陶金亮,等.基于RBF神經(jīng)網(wǎng)絡(luò)的大型客機(jī)制造成本分析.電子設(shè)計(jì)工程,2013,21(1):41?46.
VAPNIK V N. The nature of statistical learning theory . New York: Springer?Verlag, 1995.
劉芳,趙建印,宋貴寶,等.基于CAIV的導(dǎo)彈低成本保障性指標(biāo)論證技術(shù).海軍航空工程學(xué)院學(xué)報(bào),2012,27(2):171?175.
徐子彬,汪民樂(lè),翟龍剛.基于神經(jīng)網(wǎng)絡(luò)的武器系統(tǒng)壽命費(fèi)用分析方法研究.科教前沿,2011(29):476?477.
冀海燕,張笑,王瑞臣.潛射導(dǎo)彈武器系統(tǒng)維修保障費(fèi)用灰色預(yù)測(cè).青島大學(xué)學(xué)報(bào):工程技術(shù)版,2013,28(1):72?75.
楊志剛,王海濤,彭紹雄,等.艦空導(dǎo)彈武器裝備壽命周期費(fèi)用分析.兵工自動(dòng)化,2013,32(10):4?7.
【基于支持向量回歸機(jī)的復(fù)雜產(chǎn)品費(fèi)用估算技術(shù)發(fā)展研究論文】相關(guān)文章:
讓復(fù)雜回歸簡(jiǎn)單美文11-23
基于遺傳學(xué)的產(chǎn)品開(kāi)發(fā)與基因研究論文04-15
基于單片機(jī)溫控智能風(fēng)扇的設(shè)計(jì)研究論文04-15
基于RFID的農(nóng)產(chǎn)品設(shè)計(jì)與實(shí)現(xiàn)研究論文04-15
基于仿生學(xué)的產(chǎn)品設(shè)計(jì)應(yīng)用研究論文04-16
基于現(xiàn)代工業(yè)技術(shù)發(fā)展的實(shí)訓(xùn)基地建設(shè)研究論文05-26