- 相關(guān)推薦
基于廣義回歸神經(jīng)網(wǎng)絡(luò)的黃金價(jià)格預(yù)測研究
黃金價(jià)格按重量計(jì)算。在貴金屬和寶石市場中有幾種稱重的方法。最常用的就是金衡制(TROY),一個(gè)金衡制(TROY)盎司約等于31.10克;而一個(gè)常衡盎司約等于28.35克。黃金的價(jià)格按重量計(jì)算。這個(gè)價(jià)格為每盎司黃金的美元價(jià)格。金價(jià)的上揚(yáng)會(huì)影響到一些國家的貨幣價(jià)格。
摘要:文章選取紐約商品交易所共計(jì)205天的黃金期貨價(jià)格數(shù)據(jù)和相應(yīng)的影響因素指標(biāo)數(shù)據(jù),結(jié)合歐氏距離將樣本數(shù)據(jù)合理分組為訓(xùn)練樣本、檢驗(yàn)樣本和測試樣本三類,建立廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)模型用于預(yù)測黃金價(jià)格。建模結(jié)果表明:建立的黃金價(jià)格模型預(yù)測精度高,對(duì)未來5天黃金價(jià)格的預(yù)測相對(duì)誤差絕對(duì)值都在1%以內(nèi),模型的泛化能力、可靠性和魯棒性均較強(qiáng),具有實(shí)用價(jià)值。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);預(yù)測;黃金價(jià)格
一、引言
黃金具有商品和貨幣的雙重屬性,作為一種投資品種,黃金價(jià)格的預(yù)測更是眾多投資者和學(xué)者討論的熱點(diǎn)話題。國內(nèi)外學(xué)者在黃金價(jià)格預(yù)測研究方面做出了眾多成果,主要可以分為三類,第一類采用定性分析方法,通過理論分析預(yù)測黃金價(jià)格未來一段時(shí)間的整體走向,此類方法無法得出具體的預(yù)測數(shù)值,實(shí)用性不強(qiáng)。第二類是建立時(shí)間序列相關(guān)模型預(yù)測黃金價(jià)格,此類模型僅以黃金價(jià)格本身作為建;A(chǔ),而黃金價(jià)格的變化是眾多因素作用下的結(jié)果,其變化過程是非線性的復(fù)雜系統(tǒng),因此時(shí)間序列模型在預(yù)測受眾多因素影響的黃金價(jià)格方面具有局限性。第三類采用多變量關(guān)系的預(yù)測方法建模,將黃金價(jià)格及其主要影響因素共同納入建模過程中,彌補(bǔ)了時(shí)間序列模型的不足。該類模型又分為線性多變量關(guān)系預(yù)測模型和非線性多變量關(guān)系預(yù)測模型, BP神經(jīng)網(wǎng)絡(luò)模型具有良好的自學(xué)習(xí)性、非線性逼近能力和泛化能力,但這些特性并不是網(wǎng)絡(luò)模型本身固有的,而是在滿足建模條件的情況下特有的,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中極易出現(xiàn)“過訓(xùn)練”現(xiàn)象,為避免該現(xiàn)象的發(fā)生,需從總樣本中隨機(jī)抽取檢驗(yàn)樣本來實(shí)時(shí)監(jiān)控訓(xùn)練過程,但以上研究建立的BP神經(jīng)網(wǎng)絡(luò)模型均沒有采用檢驗(yàn)樣本,訓(xùn)練過程中是否發(fā)生“過訓(xùn)練”不得而知,同時(shí),BP神經(jīng)網(wǎng)絡(luò)建模要求訓(xùn)練樣本數(shù)量必須大于模型的連接權(quán)重,在3~5倍以上才可以取得較好的效果,以上BP神經(jīng)網(wǎng)絡(luò)模型均不滿足該建模要求,模型泛化能力和可靠性有待商榷。
相較BP神經(jīng)網(wǎng)絡(luò),廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)在逼近能力、分類能力和學(xué)習(xí)速度方面都具有較強(qiáng)的優(yōu)勢,且達(dá)到相同的預(yù)測精度所需的訓(xùn)練樣本較BP神經(jīng)網(wǎng)絡(luò)少的多,模型訓(xùn)練過程中也不會(huì)發(fā)生“過訓(xùn)練”現(xiàn)象,因此將GRNN引入黃金價(jià)格預(yù)測的建模中,以期得到更可靠更有效的模型。
二、GRNN的基本結(jié)構(gòu)
廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network, GRNN)最早由Specht于1991年提出,它建立在數(shù)理統(tǒng)計(jì)的基礎(chǔ)上,通過激活神經(jīng)元來逼近函數(shù)。人為調(diào)節(jié)的參數(shù)只有一個(gè)閾值是GRNN網(wǎng)絡(luò)的特點(diǎn),網(wǎng)絡(luò)的學(xué)習(xí)全部依賴數(shù)據(jù)樣本,并且即使樣本數(shù)據(jù)較少,網(wǎng)絡(luò)的輸出結(jié)果也能夠收斂于最優(yōu)回歸表面,因此一旦學(xué)習(xí)樣本確定,則相應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu)和各神經(jīng)元之間的連接權(quán)值也隨之確定,網(wǎng)絡(luò)訓(xùn)練過程實(shí)際上只是確定光滑因子的過程,這個(gè)特點(diǎn)決定了網(wǎng)絡(luò)得以最大限度地避免人為主觀假定對(duì)預(yù)測結(jié)果的影響。
σ是 GRNN模型中唯一需要確定合理值的光滑因子,對(duì)模型的預(yù)測性能影響較大,光滑因子過大或過小都不能將所有樣本觀測值計(jì)算在內(nèi),降低模型預(yù)測性,只有適中的光滑因子,能將所有樣本觀測值計(jì)算在內(nèi)。光滑因子的合理值可以通過采用逐步增加或者減小其值, 根據(jù)測試樣本均方根誤差大小來判定。
三、黃金價(jià)格預(yù)測的GRNN模型及實(shí)例分析
(1)建模樣本數(shù)據(jù)選取
黃金價(jià)格的變化是多重因素共同作用下的結(jié)果,其中包括政治局勢變動(dòng)等不可量化的因素,而預(yù)測時(shí)間間隔越長此類因素的影響就越難以控制,因此為了盡可能降低不可量化因素對(duì)預(yù)測結(jié)果的影響,選擇黃金日價(jià)格作為建模和預(yù)測樣本,預(yù)測滯后期選擇1天,即模型中輸入樣本數(shù)據(jù)的日期比輸出樣本數(shù)據(jù)提前1天。從紐約商品交易所黃金期貨日價(jià)格歷史數(shù)據(jù)中隨機(jī)選取一個(gè)時(shí)間段的數(shù)據(jù)用于預(yù)測模型的建立,所選數(shù)據(jù)日期為2013年12月24日至2014年9月30日(周末及節(jié)假日休市除外),共205天的數(shù)據(jù)作為GRNN模型的樣本。
圖1所示為2013年12月24日到2014年9月29日的黃金期貨價(jià)格,可以看出,黃金價(jià)格的變化為非線性變化,無周期性及規(guī)律性,因此建立線性模型預(yù)測黃金價(jià)格具有局限性。
GRNN模型的輸入變量為若干影響黃金價(jià)格的因素,根據(jù)已有對(duì)黃金價(jià)格影響因素的研究成果,本文選取以下指標(biāo)作為GRNN的輸入變量:美元指數(shù)X1,原油期貨價(jià)格X2,美國十年期國債收益率X3,銀價(jià)格X4,黃金期貨價(jià)格X5,(建模數(shù)據(jù)來源: http://www.resset.cn/cn/、http://cn.investing.com/)。
調(diào)用SPSS軟件,分析得出選用的輸入變量與黃金期貨價(jià)格的相關(guān)性,結(jié)果表明所選各影響因素與黃金價(jià)格均顯著相關(guān),黃金價(jià)格影響因素的選擇是合理的。
(2)建模數(shù)據(jù)預(yù)處理
選取的205組樣本數(shù)據(jù)中,200組作為建模數(shù)據(jù), 5組用于預(yù)測。為了提高模型的可靠性,將200組建模樣本分成三類,即訓(xùn)練樣本(Tr)、檢驗(yàn)樣本(Ve)和測試樣本(Te),訓(xùn)練樣本根據(jù)誤差平方和最小的原則調(diào)整GRNN模型的權(quán)重,從而訓(xùn)練GRNN模型,檢驗(yàn)樣本和測試樣本用于判斷和評(píng)價(jià)選取的光滑因子是否合理,同時(shí)也是判斷模型泛化能力的依據(jù)。本例中設(shè)定訓(xùn)練樣本的比例為60%,檢驗(yàn)樣本和測試樣本比例各為20%,對(duì)于GRNN模型,其訓(xùn)練樣本不同,得到的建模結(jié)果通常也不同。為了使樣本數(shù)據(jù)的分組更合理,將樣本之間的歐氏距離作為分組的依據(jù),具體分組步驟見文獻(xiàn)。分組之后的樣本具有相似的統(tǒng)計(jì)特性,可以提高模型的預(yù)測精度,為使數(shù)據(jù)分組的計(jì)算更便捷精準(zhǔn),調(diào)用Matlab軟件編寫分組程序,運(yùn)行程序得到分組結(jié)果。
(3)建立GRNN模型
本文采用StatSoft公司的神經(jīng)網(wǎng)絡(luò)軟件Statistic Neural Network(以下簡稱SNN)建立GRNN模型,由于該軟件本身自帶數(shù)據(jù)歸一化功能,因此可以直接將所選數(shù)據(jù)輸入SNN軟件中用于模型建立。依照GRNN建模原理及本例的數(shù)據(jù)樣本情況,設(shè)定GRNN模型的輸入層節(jié)點(diǎn)個(gè)數(shù)為5,模式層節(jié)點(diǎn)個(gè)數(shù)為120,求和層節(jié)點(diǎn)個(gè)數(shù)為2,輸出層節(jié)點(diǎn)個(gè)數(shù)為1。
對(duì)于GRNN模型,光滑因子σ值是唯一需要人為確定的值,因此模型的訓(xùn)練過程即是確定光滑因子的過程,建模訓(xùn)練過程中,在0.01~0.5范圍內(nèi)以0.01為單位依次遞增取值作為光滑因子σ值,通過訓(xùn)練樣本,檢驗(yàn)樣本和測試樣本的絕對(duì)誤差平均值(AAE)以及均方根誤差值(RMSE)判斷模型的可靠性,三類樣本的AAE和RMSE越接近,表明模型的可靠性越強(qiáng)。
圖2所示是GRNN模型訓(xùn)練過程中,σ取不同值時(shí),訓(xùn)練樣本、檢驗(yàn)樣本和測試樣本的AAE和RMSE(由于σ>0.3時(shí),三類樣本的AAE和RMSE均過大,因此圖中未列出),從圖3可以看出,σ>0.22時(shí),三類樣本的AAE和RMSE 明顯過大,模型的預(yù)測精度過低,當(dāng)σ<0.15時(shí),雖然三類樣本的AAE和RMSE數(shù)值小但相差過大,模型的可靠性得不到保證,只有在0.15<σ<0.22時(shí),模型同時(shí)具有較高的預(yù)測精度和可靠性,其中,當(dāng)σ=0.18時(shí),三類樣本的AAE分別為8.78、8.86和8.47, RMSE分別為10.98、11.28和11.11,此時(shí)三類樣本的AAE和RMSE均最為接近,因此取0.18為本例GRNN模型的合理光滑因子值。
(4)基于GRNN模型的黃金價(jià)格預(yù)測結(jié)果
基于上述GRNN模型,對(duì)2014年9月24日至2014年9月30日周末除外共5天的黃金價(jià)格進(jìn)行預(yù)測,結(jié)果如表1所示。從表1可以看出,建立的GRNN模型具有很好的預(yù)測精度,在未來5天的黃金價(jià)格預(yù)測結(jié)果中,絕對(duì)誤差最大值為7.602美元,絕對(duì)誤差最小值為1.822美元,相對(duì)誤差絕對(duì)值最大值為0.626%,最小值為0.149%,預(yù)測誤差絕對(duì)值平均為4.729美元,平均相對(duì)誤差絕對(duì)值為0.388%,充分說明建立的GRNN模型能夠很好地預(yù)測黃金價(jià)格,具有實(shí)用性。
四、結(jié)果和討論
(1)關(guān)于建模數(shù)據(jù)分組
雖然根據(jù)GRNN建模原理,即使樣本數(shù)據(jù)較少,網(wǎng)絡(luò)的輸出結(jié)果也能夠收斂于最優(yōu)回歸表面,然而樣本數(shù)據(jù)較少時(shí),無法隨機(jī)選取部分樣本作為訓(xùn)練樣本來進(jìn)行建模,若固定某些樣本作為訓(xùn)練樣本,則模型的可靠性和預(yù)測精度取決于樣本數(shù)據(jù)中的訓(xùn)練樣本是否合理,這種情況下根據(jù)樣本數(shù)據(jù)間的歐氏距離對(duì)樣本數(shù)據(jù)進(jìn)行合理分組,可以保證最大程度避免了因訓(xùn)練樣本的選取不合理對(duì)建模預(yù)測結(jié)果造成的影響,保證了預(yù)測模型的可靠性。
(2)GRNN模型用于黃金價(jià)格預(yù)測的精度及其適用性
圖3所示為訓(xùn)練樣本、檢驗(yàn)樣本和測試樣本的相對(duì)誤差,訓(xùn)練樣本的相對(duì)誤差絕對(duì)值平均為0.68%,120個(gè)訓(xùn)練樣本中,64個(gè)樣本的預(yù)測誤差大于0,118個(gè)樣本的相對(duì)誤差絕對(duì)值小于2%,23個(gè)樣本的相對(duì)誤差絕對(duì)值介于1%和2%之間,檢驗(yàn)樣本的相對(duì)誤差絕對(duì)值平均為0.67%,40個(gè)檢驗(yàn)樣本中,19個(gè)樣本的預(yù)測誤差大于0,39個(gè)樣本的相對(duì)誤差絕對(duì)值小于2%,7個(gè)樣本的相對(duì)誤差絕對(duì)值介于1%和2%之間,測試樣本的相對(duì)誤差絕對(duì)值平均為0.63%,40個(gè)測試樣本中,21個(gè)樣本的預(yù)測誤差大于0,39個(gè)樣本的相對(duì)誤差絕對(duì)值小于2%,5個(gè)樣本的相對(duì)誤差絕對(duì)值介于1%和2%之間,可見建立的GRNN模型不僅具有相當(dāng)高的預(yù)測精度,而且可靠性和魯棒性均較好,具有較高的實(shí)用價(jià)值。
實(shí)證研究結(jié)果表明: GRNN模型可以很好地預(yù)測黃金價(jià)格,預(yù)測相對(duì)誤差絕對(duì)值可以控制在3%以內(nèi),其中有97.5%的樣本預(yù)測相對(duì)誤差在2%以內(nèi),同時(shí)模型的泛化能力和魯棒性也較好,模型具有實(shí)用價(jià)值,可以運(yùn)用到對(duì)黃金價(jià)格的經(jīng)濟(jì)及投資預(yù)測中。
參考文獻(xiàn):
[1]樓文高,喬龍.基于神經(jīng)網(wǎng)絡(luò)的金融風(fēng)險(xiǎn)預(yù)警模型及其實(shí)證研究[J].金融論壇,2011(11).
[2]王雨,劉國彬,屠傳豹.基于遺傳-GRNN在深基坑地連墻側(cè)斜預(yù)測中的研究[J].巖土工程學(xué)報(bào),2012(34).
[3]SPECHT D F. A general regression neural network[J].IEEE Trans on Neural Networks,1991(06).
[4]RONALD D S. Validation of regression models: methods and examples[J].Technometrics,1977(11).
[5]Statsoft Inc. Electronic Statistics Textbook[EB/OL],Tulsa(http://www.statsoft.com/textbook), 2011.
【基于廣義回歸神經(jīng)網(wǎng)絡(luò)的黃金價(jià)格預(yù)測研究】相關(guān)文章:
基于戰(zhàn)略治理的企業(yè)環(huán)境風(fēng)險(xiǎn)研究08-28
基于BP網(wǎng)遙感影像分類研究與應(yīng)用08-10
基于軍網(wǎng)的雷達(dá)遠(yuǎn)程診斷技術(shù)研究08-10
基于web的異地并行設(shè)計(jì)與制造系統(tǒng)研究06-02
基于知網(wǎng)的翻譯研究方向碩士畢業(yè)論文寫作06-25
《基于繪本的小學(xué)低段激趣作文的研究》開題報(bào)告08-10
基于價(jià)值網(wǎng)的企業(yè)集群式供給鏈治理模式研究04-28