前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)回歸問題主題范文,僅供參考,歡迎閱讀并收藏。
自20世紀(jì)50年代以來,世界旅游業(yè)發(fā)展迅速。蓬勃發(fā)展的旅游業(yè)給目的地帶來經(jīng)濟效益與社會效益的同時,也給旅游風(fēng)景區(qū)的自然生態(tài)環(huán)境造成了威脅。怎樣協(xié)調(diào)好經(jīng)濟效益、社會效益和生態(tài)環(huán)境三者的關(guān)系,是我們亟待解決的問題。許多旅游景點的游客量呈現(xiàn)持續(xù)增長的趨勢,但這種增長并不是一條直線,往往表現(xiàn)為在旺季人滿為患,在淡季卻門庭冷落。游客數(shù)量在時間上的不均衡波動給景區(qū)管理帶來很大挑戰(zhàn)。要實現(xiàn)風(fēng)景區(qū)科學(xué)規(guī)劃與永續(xù)利用,需要把握游客的時空變化規(guī)律,準(zhǔn)確預(yù)測游客數(shù)量。其中短期游客量的預(yù)測是景區(qū)進行資源科學(xué)管理與合理調(diào)度的基本依據(jù),對此進行深入研究有重要的現(xiàn)實意義。
2問題提出與解決框架
2.1研究區(qū)域九寨溝位于四川省阿壩藏族羌族自治州九寨溝縣境內(nèi),海拔在2000米以上,溝內(nèi)遍布原始森林,分布了108個湖泊,是我國被列入世界遺產(chǎn)名錄的著名旅游風(fēng)景區(qū)之一。九寨溝一年四季景色都十分迷人,各個季節(jié)有不同的景致,因此游客絡(luò)繹不絕,其中以4月至11月游客量最多(章小平,朱忠福,2007)。圖1研究路徑
2.2問題提出國內(nèi)外學(xué)者對旅游景區(qū)容量及游客量預(yù)測問題的研究始于20世紀(jì)60年代,幾十年的發(fā)展取得了豐富的成果,如Law(1999)利用神經(jīng)網(wǎng)絡(luò)模型預(yù)測游客需求,Mello(2001)使用向量自回歸方法預(yù)測英國旅游者的長期旅游需求及目的地份額,Stucka(2002)使用了計量經(jīng)濟學(xué)中普通最小二乘法(OLS)與相似非相關(guān)模型(SUR)來預(yù)測克羅地亞的旅游需求。國內(nèi)學(xué)者的研究成果也比較豐富,如楚方林研究發(fā)現(xiàn)非季節(jié)性自回歸移動平均結(jié)合模型能獲得較優(yōu)的預(yù)測結(jié)果(ChuFonglin,1998),王朝宏使用模糊時間序列與混合灰色理論預(yù)測到臺灣的美國和香港游客的旅游需求(WangChao-Hung,2004),曾忠祿、鄭勇(2009)使用計量經(jīng)濟學(xué)模型預(yù)測了內(nèi)地赴澳門的游客量,雷可為、陳瑛(2007)應(yīng)用了BP神經(jīng)網(wǎng)絡(luò)和ARIMA組合模型預(yù)測中國入境游客量,顏磊等(2009)提出了小波分析法并用此方法分析了九寨溝景區(qū)游客旅游時間流的特征,胡小猛等(2006)通過研究得出三個主要阻礙上海居民去崇明島旅游的障礙因素,得出了游客量與潛在游客規(guī)模及各類阻礙相關(guān)的預(yù)測模型。這些方法大多以預(yù)測某地游客量的發(fā)展趨勢以及分析影響這些地區(qū)游客量的因素為主。雖然國內(nèi)外學(xué)者對年際游客量的預(yù)測形成了豐富的成果,但是對日游客量的預(yù)測問題鮮有研究。隨著游客的旅游方式的變化,影響一個地區(qū)游客量的因素已經(jīng)不僅僅是由旅游的季節(jié)性因子和景區(qū)基礎(chǔ)條件所決定,各種社會因素、自然突發(fā)狀況也會對一個景區(qū)的游客量產(chǎn)生重要影響(吳耀宇,黃震方,2010)。本文研究日游客量的預(yù)測問題正是基于對上述變化的思考。考慮季節(jié)與季節(jié)之間的
2.3解決框架本研究通過實地調(diào)查和數(shù)據(jù)采集獲得研究數(shù)據(jù)。采用逐步回歸法對日游客量預(yù)測建立回歸模型,再利用BP神經(jīng)網(wǎng)絡(luò)對回歸模型計算出的預(yù)測結(jié)果進行誤差的修正,最后將修正出來的結(jié)果作為最終預(yù)測的日游客量。圖1為本文的研究路徑。
3實證研究
3.1多元線性回歸模型本研究通過實地調(diào)研采集了大量數(shù)據(jù),其中包括九寨溝2009年和2010年上半年日游客量數(shù)據(jù)、九寨溝2009年和2010年每日的氣象數(shù)據(jù),全國2009年和2010年法定假日的數(shù)據(jù)等。有研究表明氣候的季節(jié)性固然會一個景區(qū)游客量的大小產(chǎn)生重要的影響,但是也應(yīng)該加大對社會因素、自然突發(fā)狀況的關(guān)注。因此本文重點考慮社會因素和自然突發(fā)狀況對游客量的影響,設(shè)定出與游客量波動有關(guān)的主要因子。影響游客量的因子在季節(jié)與季節(jié)之間差異大,在相鄰兩日之間差異小,因此在考慮到景區(qū)前后兩日季節(jié)性因子相差不大的情況下,設(shè)定出前日游客數(shù)量級、前日溫度、前日降雨等因子,再考慮到前后兩日的社會因子可能會因為放假等原因而產(chǎn)生差異的情況,設(shè)定出法定假日、寒暑假、旅游淡旺季等幾個因子。由于自然突發(fā)狀況無法準(zhǔn)確預(yù)測以及定量,因此將其作為影響隨機誤差的一個因子。綜合考慮上述因素對景區(qū)游客量的影響之后,得出了可能影響九寨溝日游客量的因子。本文通過研究2009年數(shù)據(jù)來建立模型。首先利用SPSS軟件分別對設(shè)定的因子與九寨溝游客量之間進行相關(guān)性分析,得到前日溫度、前日降雨、法定假日、前日游客數(shù)量級、寒暑假、旅游淡旺季幾個與九寨溝游客量相關(guān)性較高的因子。然后將九寨溝實際游客量的數(shù)據(jù)和因子導(dǎo)入SPSS,通過模塊—逐步回歸建立回歸模型。逐步回歸的基本思想是,在考慮對Y已知的一群變量(X1…Xk)回歸時,從變量X1,…,Xk中,逐步選出對已解釋變差的貢獻最大的變量進入回歸方程,并且同時滿足偏解釋變差的F統(tǒng)計量的值fj的顯著性概率p小于等于選定的顯著性水平α。采用逐步回歸法,在顯著性水平α為0.05水平下,一共有4個因子依次進入回歸方程,依次是前日游客數(shù)量級、法定假期、前日溫度和旅游淡旺季,從模型匯總表中可以看出,最后一個包含了以上4個因子的回歸模型的判定系數(shù)R=0.919,校正判定系數(shù)R2=0.918,各種影響因子對實際游客量的回歸效果良好。檢驗?zāi)P偷亩嘀毓簿€性、異方差性和序列相關(guān)性,三個問題均不存在。模型方差檢驗、回歸系數(shù)檢驗也都通過。根據(jù)高斯-馬爾柯夫(BLUE)定理,回歸系數(shù)表所求得的回歸系數(shù)具有最優(yōu)性、線性和無偏性。以上從SPSS中獲取的結(jié)果證明通過多元回歸得出的模型擬合度比較高,結(jié)果比較理想。最后根據(jù)回歸系數(shù)得出的多元回歸方程為:y=-14394.805+781.351x1+1143.616x2+45.851x3+416.860x4+μ(1)其中y為預(yù)測的日游客量,x1為前日游客數(shù)量級,x2為法定假期,x3為前日溫度,x4為旅游淡旺季,μ為隨機誤差。
3.2BP神經(jīng)網(wǎng)絡(luò)修正理論已證明,三層BP網(wǎng)絡(luò)可以以任意精度逼近任何連續(xù)函數(shù)(張興會,等,2004)。以多元回歸模型的預(yù)測誤差作為輸入的學(xué)習(xí)樣本,在神經(jīng)網(wǎng)絡(luò)中經(jīng)過不斷修正可以得到更好的預(yù)測結(jié)果。BP神經(jīng)網(wǎng)絡(luò)可以從大量的離散實驗數(shù)據(jù)中,經(jīng)過學(xué)習(xí)訓(xùn)練,提取其領(lǐng)域知識,并將知識表示為網(wǎng)絡(luò)連接權(quán)值的大小與分布,建立起反映實際過程內(nèi)在規(guī)律的系統(tǒng)模型。BP網(wǎng)絡(luò)可以包含不同的隱層,理論上已經(jīng)證明,在不限制隱層節(jié)點數(shù)的情況下,只有一個隱層的BP網(wǎng)絡(luò)可以實現(xiàn)任意非線性映射。在模式樣本相對較多的情況下,較多的隱層節(jié)點,可以實現(xiàn)模式樣本空間的超平面劃分,因此本文使用具有單隱層的BP網(wǎng)絡(luò)來實現(xiàn)對多元線性回歸模型的修正(陳如云,2007)。圖2為BP神經(jīng)網(wǎng)絡(luò)原理示意圖,其中Wij是輸入層到隱層的權(quán)重,Wjl是隱單元層到輸出層的權(quán)重。
3.2.1訓(xùn)練樣本歸一化原始樣本中數(shù)據(jù)為預(yù)測游客量的誤差均大于1,而BP神經(jīng)網(wǎng)絡(luò)所處理的是數(shù)值在[-1,1]區(qū)間的數(shù)據(jù),因此這些樣本數(shù)據(jù)在研究中都需要將它們轉(zhuǎn)化為區(qū)間之間的數(shù)據(jù)。本文對樣本數(shù)據(jù)采用的歸一化公式如下:式中I為原始誤差輸入數(shù)據(jù),I^為歸一化后的輸入數(shù)據(jù),g為原始樣本期望目標(biāo)數(shù)據(jù)即實際游客量,g^為歸一化后的期望目標(biāo)數(shù)據(jù)。
3.2.2網(wǎng)絡(luò)訓(xùn)練本文采用三層的神經(jīng)網(wǎng)絡(luò)進行建模,對游客數(shù)量預(yù)測誤差進行修正。采用2009年數(shù)據(jù)作為訓(xùn)練樣本,因數(shù)據(jù)量比較大,隱層神經(jīng)元的節(jié)點個數(shù)n2要盡量多,故本文選擇n2=150,這里的隱層神經(jīng)元節(jié)點個數(shù)不是固定的,要根據(jù)實際訓(xùn)練的檢驗修正。輸入層神經(jīng)元節(jié)點個數(shù)n1=5,輸出層神經(jīng)節(jié)點個數(shù)n3=1,將1月1日-5日、2日-6日、3日-7日等的游客數(shù)量預(yù)測實際誤差作為網(wǎng)絡(luò)輸入,以6日、7日、8日等的實際游客量作為網(wǎng)絡(luò)輸出,組成樣本數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練,最后得出預(yù)測誤差。采用MATLAB測試,輸入層到中間層和中間層到輸出層的傳遞函數(shù)均受用正切函數(shù),學(xué)習(xí)率設(shè)為0.5,訓(xùn)練次數(shù)設(shè)為5000,訓(xùn)練目標(biāo)誤差為1×1010。使用MATLAB進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到歸一化處理過的輸出層數(shù)據(jù),首先需要對輸出層數(shù)據(jù)還原,根據(jù)歸一化公式得到還原公式:式中I為還原的神經(jīng)網(wǎng)絡(luò)輸出數(shù)據(jù),I*為神經(jīng)網(wǎng)絡(luò)原始輸出數(shù)據(jù)。經(jīng)過MATLAB的處理,將預(yù)測誤差與回歸模型預(yù)測值相加,得到最終預(yù)測值。
3.3模型驗證
3.3.1回歸部分將2010年數(shù)據(jù)帶入回歸方程,通過計算得出游客量預(yù)測值。下圖3所示為根據(jù)回歸方程(1)計算得到的2010年上半年日游客量的實際值與預(yù)測值之間的對比圖,其中y為預(yù)測游客量,g為期望目標(biāo)數(shù)據(jù),即實際游客量,橫坐標(biāo)為日期的序列值,縱坐標(biāo)為游客數(shù)。
3.3.2BP神經(jīng)網(wǎng)絡(luò)部分要預(yù)測某天的游客數(shù)量誤差,應(yīng)該將回歸模型預(yù)測的前五日實際誤差作為神經(jīng)網(wǎng)絡(luò)輸入,經(jīng)過神經(jīng)網(wǎng)絡(luò)的運算之后得到輸出為當(dāng)日游客量預(yù)測誤差,將此輸出的預(yù)測誤差與回歸模型的當(dāng)日游客量值進行相加或相減,得到最終游客量預(yù)測值。圖4是經(jīng)過BP神經(jīng)網(wǎng)絡(luò)修正前后的兩個日游客量預(yù)測值的對比圖,其中,y為多元回歸預(yù)測值,Y為BP神經(jīng)網(wǎng)絡(luò)修正值,橫坐標(biāo)為日期的序列值,縱坐標(biāo)為游客數(shù)。由圖4可以看到經(jīng)過BP神經(jīng)網(wǎng)絡(luò)修正前后的游客數(shù)變化趨勢是基本一致的,只是在游客數(shù)的多少上存在差別。下圖5為經(jīng)多元回歸模型預(yù)測,BP神經(jīng)網(wǎng)絡(luò)修正后的最終預(yù)測到達人數(shù)(Y)與九寨溝實際到達人數(shù)(g)對比圖,橫坐標(biāo)為日期的序列值,縱坐標(biāo)為游客數(shù)。從多元回歸模型的預(yù)測到BP神經(jīng)網(wǎng)絡(luò)的修正,預(yù)測值與實際值的變化趨勢是基本一致的,從圖2與圖5的對比可以看出:九寨溝游客每年實際到達人數(shù)呈現(xiàn)出多峰性;實際到達人數(shù)與預(yù)測到達人數(shù)所呈現(xiàn)出的峰值是基本一致的;二者的對比圖顯示二者在數(shù)量上的預(yù)測也基本準(zhǔn)確。而且經(jīng)BP神經(jīng)網(wǎng)絡(luò)修正后,游客到達預(yù)測值與游客實際到達值之間更為接近,通過計算,可以得到神經(jīng)網(wǎng)絡(luò)模型對預(yù)測值修正后誤差顯著變小,經(jīng)計算得修正預(yù)測值與實際值的平均誤差率為2.05%。其中誤差在1%以內(nèi)的占總預(yù)測量的33.5%。誤差在2%以內(nèi)的占65.9%,誤差在10%以上的占0.6%。分析有如下幾個可能產(chǎn)生誤差的原因:(1)由于回歸模型選擇的影響因子而造成的預(yù)測誤差。影響一個地區(qū)游客量的因素眾多,并不能全部被挑選出來,因此影響因子的選擇是造成誤差的一個最主要原因。(2)自然突發(fā)狀況。由于自然突發(fā)狀況存在突發(fā)性和偶然性,事先很難準(zhǔn)確預(yù)測,也是一個誤差來源。(3)除法定假日以外的周末。由于周末多是九寨溝周邊城鎮(zhèn)的游客去旅游,而去九寨溝所花的時間可能較多,因此周末可能不是一周當(dāng)中游客最多的時候,但是周末會對游客量有一定影響。(4)單位組織旅游。現(xiàn)在許多單位都會選擇一個相對于自身合適的時間組織員工集體旅游。(5)地震的殘留影響。
【關(guān)鍵詞】BP神經(jīng)網(wǎng)絡(luò);預(yù)測;誤差
1.引言
許多金融學(xué)家和計量學(xué)家對發(fā)達國家成熟市場的波動性進行了廣泛的研究,但是在對股市的預(yù)測上,由于人們在知識、能力、經(jīng)驗上存在著較大的差異,加之問題本身又具有很大的隨機性和高度的非線性,即使是一些金融專家、炒股高手對出現(xiàn)的同一復(fù)雜行情進行分析,往往也會得出不同的結(jié)論。此外,傳統(tǒng)方法還要事先知道各種參數(shù),以及這些參數(shù)在什么情況下應(yīng)作怎樣的修正。這都給預(yù)測股市帶來一定的困難。
基于以上股市預(yù)測的困難性,本文提出了人工神經(jīng)網(wǎng)絡(luò)的預(yù)測方法。隨著計算機、人工智能尤其是專家系統(tǒng)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)技術(shù)逐漸成熟并開始應(yīng)用于各個領(lǐng)域。人工神經(jīng)網(wǎng)絡(luò)(ANN,簡稱神經(jīng)網(wǎng)絡(luò))作為一種由大量簡單神經(jīng)元廣泛相互聯(lián)接而成的非線性映射或自適應(yīng)動力系統(tǒng),恰好能有效解決股市預(yù)測處理中常見的困難,因此它很快在股市預(yù)測分析與處理領(lǐng)域得到了廣泛的應(yīng)用。
2.BP神經(jīng)網(wǎng)絡(luò)介紹
2.1 BP 網(wǎng)絡(luò)算法的基本原理
2.1.1 標(biāo)準(zhǔn)的BP 網(wǎng)絡(luò)算法的基本原理
BP(Back Propagation)網(wǎng)絡(luò)是反向傳播的多層前饋式網(wǎng)絡(luò),是目前使用最為廣泛的一種人工神經(jīng)網(wǎng)絡(luò)。它的核心是BP算法,一種對于多基本子系統(tǒng)構(gòu)成的大系統(tǒng)進行微商計算的嚴(yán)格而有效的方法,采用最小均方差學(xué)習(xí)方式。BP 神經(jīng)網(wǎng)絡(luò)的原理說到底就是給它一些輸入變量,然后就有一個輸出,輸出值的情況與實際的情況進行比較,差多少,然后再進行網(wǎng)絡(luò)的內(nèi)部調(diào)整,屬于有導(dǎo)師的學(xué)習(xí)規(guī)則,使得網(wǎng)絡(luò)輸出與實際逼近。
神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)和存貯大量的輸入―輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學(xué)方程。人工神經(jīng)網(wǎng)絡(luò)由非線性函數(shù)組成,而由一系列不同權(quán)重的線性過濾器組合而成:
2.1.2 BP網(wǎng)絡(luò)算法的優(yōu)化
由于常用的BP算法主要缺點為收斂速度慢,局部極值,難以確定隱含層和隱含層的個數(shù),使得在實際應(yīng)用中BP算法很難應(yīng)用,因此,出現(xiàn)了許多改進算法。BP算法的改進主要有兩種途徑,一種是采用啟發(fā)式學(xué)習(xí)方法;另一種則是采用更有效的優(yōu)化算法,本文采用了動量法和學(xué)習(xí)率自適應(yīng)調(diào)整的策略,從而提高了學(xué)習(xí)速度并增加了算法的可靠性。動量法降低了網(wǎng)絡(luò)對于誤差曲面局部極值的敏感性,有效地抑制了網(wǎng)絡(luò)陷于局部極小。
2.2 BP神經(jīng)網(wǎng)絡(luò)的模型識別及步驟
模式通常指對事物的一種定量描述或結(jié)構(gòu)描述,“識別”是指對客觀事物按其物理特征進行分類。模式識別的基本原理就是從待識別對象和理想標(biāo)本之間若干特征的相似性推斷它們之間總體的相似性。BP神經(jīng)網(wǎng)絡(luò)模式識別過程分為訓(xùn)練階段和模式分類階段,分為初始化、數(shù)據(jù)與處理、網(wǎng)絡(luò)訓(xùn)練以及模式分類四個步驟。以下利用實證分析來進行著四個步驟。
3.實例分析
下面以上證的某股600個交易日的股票價格收盤指數(shù)作為原始樣本數(shù)據(jù),對上述神經(jīng)網(wǎng)絡(luò)模型進行求解,預(yù)測20天的收盤價,與實際收盤價進行比較,并求出其誤差:
式中,表示第日的實際收盤指數(shù),表示第日的預(yù)測值,表示誤差。主要按照如下幾部分來處理:(1)準(zhǔn)備600個數(shù)據(jù)的時間序列,進行歸一化。BP神經(jīng)網(wǎng)絡(luò)中每個神經(jīng)元的輸出值由傳遞函數(shù)Sigmoid函數(shù)來計算,其輸出值的范圍是(0,1);(2)留出最后20個數(shù)據(jù),作為預(yù)測檢驗使用;(3)繪制圖像,包括實際值和預(yù)測值,能量函數(shù);(4)分析實際和預(yù)測兩曲線的趨勢。
采用I-J-K學(xué)習(xí)模型,該模型是輸入層I個神經(jīng)元,隱層J 個神經(jīng)元,輸出層K個神經(jīng)元。利用BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練500次、800次、1000次的輸出值和期望值以及能量函數(shù)(或者叫誤差函數(shù))E,結(jié)果見圖1到圖3。
通過上面的圖示,可以看到用BP神經(jīng)網(wǎng)絡(luò)預(yù)測的效果比較明顯,這說明該模型適用于短期預(yù)測嗎,股市的波動在很多地區(qū)都是非常劇烈的,各種因素的綜合作用也使得長期股指的變動具有極大的不確定性,使得預(yù)測變得很困難。而BP網(wǎng)絡(luò)的算法原理和自學(xué)習(xí)的特點使其能夠充分挖掘出隱含在樣本數(shù)據(jù)中的規(guī)律性,實現(xiàn)從輸入空間到輸出空間的非線性映射,對樣本數(shù)據(jù)進行精確的擬合。從而BP神經(jīng)網(wǎng)絡(luò)的方法對于股市上的一些很難看出規(guī)律的數(shù)據(jù)列的預(yù)測而言,無疑是一個比較精確的預(yù)測方法。
4.結(jié)論
本文介紹了股市的特點以及股市預(yù)測的困難性,提出了利用BP神經(jīng)網(wǎng)絡(luò)的方法來解決股市預(yù)測問題。文章介紹了BP神經(jīng)網(wǎng)絡(luò)算法的基本原理,BP神經(jīng)網(wǎng)絡(luò)算法的優(yōu)化,BP神經(jīng)網(wǎng)絡(luò)模型識別及步驟,最后后以上海證券交易所每日股票價格收盤指數(shù)為分析對象,把原理應(yīng)用于實際,利用BP神經(jīng)網(wǎng)絡(luò)對股票價格收盤指數(shù)進行了短期預(yù)測,并計算出預(yù)測值和實際值的誤差。通過實驗發(fā)現(xiàn)該模型收斂速度快,預(yù)測精度非常高,對預(yù)測短周期內(nèi)股指波動具有較強的適用性。
參考文獻
[1]高琴.人工神經(jīng)網(wǎng)絡(luò)在股市預(yù)測模型中的應(yīng)用[J].微電子學(xué)與計算機,2007年第24卷第11期.
[2]周翠紅,路邁西.線性回歸與人工神經(jīng)網(wǎng)絡(luò)預(yù)測煤炭發(fā)熱量[J].煤炭科學(xué)技術(shù),第37卷第12期.
[3]尹慶雙,奉瑩.人工神經(jīng)網(wǎng)絡(luò)在第三產(chǎn)業(yè)就業(yè)分析中的應(yīng)用[J].人口與經(jīng)濟,2009年第6期.
[4]鄒文安,劉寶,姜波,楊春生.基于Excel 技術(shù)平臺人工神經(jīng)網(wǎng)絡(luò)BP模型及應(yīng)用[J].水文,第30卷第1期.
[5]康進,劉敬偉.非參數(shù)回歸估計與人工神經(jīng)網(wǎng)絡(luò)方法的預(yù)測效果比較[J].統(tǒng)計與決策,2009年第23 期.
[6]楊本昭,田耕.基于人工神經(jīng)網(wǎng)絡(luò)的客戶價值分類研究[J].科技管理研究,2007年第12期.
[關(guān)鍵詞]多元線性回歸;BP神經(jīng)網(wǎng)絡(luò);預(yù)測模型
[DOI]10.13939/ki.zgsc.2017.06.098
1 引 言
HN省林業(yè)發(fā)展雖然迅速,但總體規(guī)模小,林業(yè)產(chǎn)業(yè)化水平低,林產(chǎn)品沒有規(guī)模化的發(fā)展。預(yù)測林產(chǎn)品的物流需求,能夠探索出HN省林產(chǎn)品的發(fā)展規(guī)律,發(fā)現(xiàn)林業(yè)轉(zhuǎn)型升級過程中存在的問題。本文運用與林產(chǎn)品物流運輸需求有強相關(guān)性的經(jīng)濟指標(biāo)來預(yù)測HN省林產(chǎn)品物流運輸需求量。
2 多元線性回歸模型
2.1 多元線性回歸
確定兩種及以上變量間相互定量關(guān)系的統(tǒng)計方法稱為回歸分析。在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸分析,如果自變量與因變量間存在線性關(guān)系,就稱為多元線性回歸。其模型的一般形式為:
2.2 多元線性回歸模型構(gòu)建
設(shè)物流運輸需求量[JB((]Y[JB))]與影響因素[JB((]X1,X2,…,XP[JB))]存在線性相關(guān),可建立回歸函數(shù)模型Y=F[JB((]X1,X2,…,Xp[JB))],以此為基礎(chǔ),對林產(chǎn)品物流運輸需求做出預(yù)測。
3 BP神經(jīng)網(wǎng)絡(luò)模型
3.1 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)j是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),BP網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)包括輸入層、隱含層和輸出層。
3.2 構(gòu)建物流運輸需求預(yù)測模型
利用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建林產(chǎn)品物流運輸需求預(yù)測模型,強相關(guān)性的經(jīng)濟指標(biāo)是輸入變量,林產(chǎn)品物流運輸需求量是輸出變量。
3.2.1 設(shè)計網(wǎng)絡(luò)輸入、輸出樣本
設(shè)Xi=[JB((]Xi1,Xi2,…,Xin[JB))]表示第i年的經(jīng)濟指標(biāo)向量,Yi=[JB((]yi[JB))]表示第i年的物流運輸需求量向量。以第1年至第n-1年的經(jīng)濟指標(biāo)值作為輸入樣本P,以第2年至第n年的物流運輸需求量作為輸出樣本T,用輸入樣本P和輸出樣本T對BP網(wǎng)絡(luò)進行訓(xùn)練,訓(xùn)練完成后,輸入第n年的輸入指標(biāo)Xn來預(yù)測第n+1年需求量。
3.2.2 確定網(wǎng)絡(luò)層數(shù)、隱層節(jié)點數(shù)
本文選用典型的三層BP網(wǎng)絡(luò)。根據(jù)Kolmogorov定理n1=2n+1確定隱含層節(jié)點數(shù)。
4 HN省林產(chǎn)品物流運輸需求預(yù)測實證分析
貨運量能反映出物流運輸需求的變化規(guī)律,HN省鐵路網(wǎng)發(fā)達,故選擇“林產(chǎn)品鐵路貨運量”作為輸出指標(biāo),設(shè)為Y。依據(jù)預(yù)測指標(biāo)選取原則,選取“人均生產(chǎn)總值、居民消費水平、林業(yè)生產(chǎn)總值、林業(yè)固定資產(chǎn)投資、鐵路營業(yè)里程”作為輸入指標(biāo),分別設(shè)為X1,X2,X3,X4,X5。本文選取的原始數(shù)據(jù)來源于歷年HN省統(tǒng)計年鑒,選取2005―2013年的數(shù)據(jù)作為樣本數(shù)據(jù),如表1所示。2014年的數(shù)據(jù)作為預(yù)測數(shù)據(jù)加以驗證。本文以木材作為木產(chǎn)品的代表。
4.1 多元線性回歸模型算例分析
本文借助SPSS軟件對五個經(jīng)濟指標(biāo)和林產(chǎn)品鐵路貨運量指標(biāo)之間進行相關(guān)性分析和線性回歸分析,從而對林產(chǎn)品物流運輸需求進行預(yù)測。
4.1.1 相關(guān)性分析
本文依據(jù)數(shù)據(jù)特點,對其采用Pearson相關(guān)系數(shù),如表2所示。
4.1.2 線性回歸分析
選擇X1、X2、X3、X4、X5作為自變量,Y作為因變量。在SPSS軟件的計算下,根據(jù)SPSS的輸出結(jié)果得到林產(chǎn)品物流運輸需求量多元線性回歸模型為:Y=550.119+0.009X1-0.047X2-0.230X3-2.060X4+0.017X5
4.2 BP神經(jīng)網(wǎng)絡(luò)模型算例分析
本文借助MATLAB軟件的神經(jīng)網(wǎng)絡(luò)工具箱,通過編程來建立林產(chǎn)品物流運輸需求神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
4.2.1 對數(shù)據(jù)歸一化處理
4.2.2 設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
通過試驗,隱含層節(jié)點數(shù)目為2×7+1=15個最為合適。訓(xùn)練函數(shù)設(shè)為traingdx函數(shù),傳遞函數(shù)第一層設(shè)為tansig函數(shù),第二層設(shè)為logsig函數(shù),學(xué)習(xí)率設(shè)為0.1,動量因子設(shè)為0.9,學(xué)習(xí)誤差設(shè)為10-5。
4.2.3 網(wǎng)絡(luò)訓(xùn)練與測試
取歸一化后2005―2010年的輸入指標(biāo)值作為訓(xùn)練樣本輸入p-train,2006―2011年的輸出指標(biāo)作為訓(xùn)練樣本輸出t-train。在MATLAB軟件中編輯訓(xùn)練語句,結(jié)果如下圖所示。
訓(xùn)練結(jié)果曲線
經(jīng)過了146次訓(xùn)練后,網(wǎng)絡(luò)達到設(shè)定學(xué)習(xí)誤差,訓(xùn)練效果較好。
4.3 模型預(yù)測對比
多元線性回歸方程及BP神經(jīng)網(wǎng)絡(luò)對2014年的數(shù)據(jù)進行預(yù)測的結(jié)果如表3所示。
由表3知,BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型對2014年預(yù)測誤差為7.9%,多元線性回歸預(yù)測模型誤差為8.1%。相比而言,BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的預(yù)測精度更高,更穩(wěn)定。
通過模型可以預(yù)測到未來幾年林產(chǎn)品物流運輸需求量呈遞減趨勢,說明對樹木的砍伐在逐年遞減。
5 結(jié) 論
本文介紹及建立了多元線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型,以HN省林產(chǎn)品物流運輸需求量為算例,得出的研究結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)在對新數(shù)據(jù)的預(yù)測能力方面有略微的優(yōu)勢,但是BP神經(jīng)網(wǎng)絡(luò)每一次訓(xùn)練運行的結(jié)果都是不同的,具有一定的不確定性,因此并不能簡單地以此判斷兩者之間在預(yù)測能力方面哪個更有優(yōu)勢,但總的來說,BP神經(jīng)網(wǎng)絡(luò)較多元線性回歸模型的預(yù)測精度更高。
參考文獻:
[1]陳思遠,郭奕崇.基于BP神經(jīng)網(wǎng)絡(luò)的安徽省物流需求預(yù)測研究[J].物流技術(shù),2012(17):231-233.
關(guān)鍵詞:卡爾曼濾波,BP神經(jīng)網(wǎng)絡(luò),狀態(tài)估計,導(dǎo)航系統(tǒng)
1 引言
捷聯(lián)慣導(dǎo)系統(tǒng)(SINS)和GPS組合而成的導(dǎo)航系統(tǒng)是當(dāng)今導(dǎo)航領(lǐng)域最主要的組合方式,它有效的減少了系統(tǒng)誤差,提高精度,降低了導(dǎo)航系統(tǒng)的成本,這種組合方式已在航天航空、航海、陸地平臺導(dǎo)航、測繪等領(lǐng)域得到了廣泛應(yīng)用。在傳統(tǒng)的SINS/GPS組合狀態(tài)估計中,經(jīng)典卡爾曼濾波器[3]發(fā)揮重要作用,但其要求條件苛刻,主要體現(xiàn)在要求模型的狀態(tài)方程和量測方程精確、系統(tǒng)噪聲和量測噪聲的統(tǒng)計模型為零均值的高斯白噪聲;但在復(fù)雜環(huán)境下,噪聲的統(tǒng)計信息不可能預(yù)見,更不可能是理想的高斯白噪聲,因此,許多在仿真條件下表現(xiàn)非常好的系統(tǒng)運用到實際環(huán)境中就容易出現(xiàn)精度下降甚至發(fā)散現(xiàn)象。而回歸BP神經(jīng)網(wǎng)絡(luò)具有較強的并行計算能力,容錯性好,在神經(jīng)元數(shù)量足夠時,逼近非線性函數(shù)的程度比較好。本文在經(jīng)典濾波的基礎(chǔ)上引入回歸BP神經(jīng)網(wǎng)絡(luò)[4]對組合導(dǎo)航系統(tǒng)進行狀態(tài)估計,盡可能減少非線性噪聲對系統(tǒng)的影響;首先利用經(jīng)典卡爾曼濾波對不同特性的噪聲輸入下的系統(tǒng)進行估計,得到各條件下的狀態(tài)后,將各條件下的狀態(tài)估計均值作為樣本輸出,以各種噪聲集對網(wǎng)絡(luò)進行訓(xùn)練;在訓(xùn)練結(jié)束后,將訓(xùn)練后的回歸BP神經(jīng)網(wǎng)絡(luò)作為狀態(tài)估計器輸出組合導(dǎo)航系統(tǒng)估計值。
2 回歸BP神經(jīng)網(wǎng)絡(luò)算法
誤差反向傳播BP算法是前向網(wǎng)絡(luò)學(xué)習(xí)算法中應(yīng)用最為廣泛的算法,回歸BP網(wǎng)絡(luò)是在BP算法中采用的梯度下降法推廣到回歸網(wǎng)絡(luò)中,其具有反饋和前饋機制,即在網(wǎng)絡(luò)的一個訓(xùn)練周期中,網(wǎng)絡(luò)的輸出同時反饋給網(wǎng)絡(luò)的輸入神經(jīng)單元作為網(wǎng)絡(luò)的外部輸入。如圖1所示為一個典型的三層回歸BP網(wǎng)絡(luò)。
圖1回歸BP網(wǎng)示意圖
在圖1中有一個關(guān)聯(lián)層,每一個隱含的結(jié)點都有一個相應(yīng)的關(guān)聯(lián)層結(jié)點與之連接,并且連線的權(quán)值可調(diào),而關(guān)聯(lián)層的信號來自于輸出,關(guān)聯(lián)層節(jié)點起到了存儲網(wǎng)絡(luò)內(nèi)部狀態(tài)的作用,當(dāng)關(guān)聯(lián)層與中間層連接后,起到了狀態(tài)反饋的作用,這為組合導(dǎo)航系統(tǒng)這種典型的時間序列信號分析提高了有力的工具,具有“記憶”功能的回歸BP網(wǎng)絡(luò)能夠?qū)σ浑A馬爾科夫序列很好的濾波和預(yù)報。反饋網(wǎng)絡(luò)的反饋激勵的加入使得局部的記憶特性被放大易造成傳統(tǒng)的梯度下降學(xué)習(xí)方法過早的收斂,本文采用可修正速率的梯度下降學(xué)習(xí)法,其本質(zhì)是綜合考慮當(dāng)前和前一時刻的梯度向量,調(diào)整其具有適應(yīng)性,不因為某一時刻的梯度變化而改變網(wǎng)絡(luò)的收斂狀態(tài)。算法的基本要求與傳統(tǒng)梯度法基本相同,學(xué)習(xí)的準(zhǔn)則是讓網(wǎng)絡(luò)實際輸出與樣本比較,直至誤差平方和達到最小。在算法中加入速率因子,使神經(jīng)網(wǎng)絡(luò)權(quán)值的更新不僅考慮了當(dāng)前梯度方向,還考慮了前一時刻的梯度方向,減少網(wǎng)絡(luò)反饋對闡述調(diào)整的敏感性,有效抑制了局部最優(yōu);速率因子的取值應(yīng)當(dāng)根據(jù)網(wǎng)絡(luò)可能陷入局部最優(yōu)的程度而定。
3 導(dǎo)航系統(tǒng)的狀態(tài)表達與組合濾波
根據(jù)SINS/GPS組合導(dǎo)航系統(tǒng)得理論,可以得到如下組合誤差的狀態(tài)方程:
F(t)為系統(tǒng)的動態(tài)矩陣;G(T)為系統(tǒng)噪聲系數(shù)矩陣;W(t)為系統(tǒng)噪聲。
本文中對系統(tǒng)噪聲仍確定為高斯白噪聲,這是由于系統(tǒng)噪聲的統(tǒng)計特性一般不會劇烈變化,而系統(tǒng)量測噪聲的統(tǒng)計特性變換是引起卡爾曼濾波器性能下降的主要因素。系統(tǒng)量測噪聲容易受到外界環(huán)境的干擾,如溫度、電磁場、濕度等等,因此本文主要針對卡爾曼濾波中的量測噪聲統(tǒng)計特性變化進行研究。
4 回歸BP神經(jīng)網(wǎng)絡(luò)對組合導(dǎo)航系統(tǒng)的狀態(tài)估計
4.1 回歸BP神經(jīng)網(wǎng)絡(luò)對組合導(dǎo)航系統(tǒng)狀態(tài)估計模型設(shè)計
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是神經(jīng)網(wǎng)絡(luò)能夠應(yīng)用的前提。在樣本訓(xùn)練中對同一狀態(tài)量輸入X,選取不同的噪聲集合,通過卡爾曼濾波器,取得一系列的不同條件下的最優(yōu)估計,將這些最優(yōu)估計的狀態(tài)均值作為神經(jīng)網(wǎng)絡(luò)期望樣本輸出的真實值,構(gòu)成了不同噪聲集合下得輸入樣本和卡爾曼濾波器得到的輸出樣本;通過不同噪聲集合樣本的訓(xùn)練,使得神經(jīng)網(wǎng)絡(luò)具有處理各種統(tǒng)計特性噪聲的自適應(yīng)能力。訓(xùn)練結(jié)束后,就可以利用普通的無偏卡爾曼濾波器和訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進行狀態(tài)估計。圖2為卡爾曼濾波和神經(jīng)網(wǎng)絡(luò)組合的示意圖。
圖2 卡爾曼濾波與回歸BP神經(jīng)網(wǎng)絡(luò)組合示意圖
在實際的參數(shù)選取和設(shè)計中,本文采用卡爾曼濾波器的初始估計和SINS/GPS的參數(shù)誤差作為回歸BP神經(jīng)網(wǎng)絡(luò)的狀態(tài)變量。選取參數(shù)誤差X作為回歸BP網(wǎng)絡(luò)的狀態(tài)變量。
以上參數(shù)依次為:緯度誤差、經(jīng)度誤差、高程誤差、東向速度誤差、北向速度誤差、垂直速度誤差,三個姿態(tài)角誤差。將普通卡爾曼濾波器的輸出作為初始值。
4.2 仿真實驗與分析
1)不進行任何濾波的SINS位置誤差曲線
圖4 不加濾波器的SINS位置誤差曲線 圖5 組合濾波后北向位置估計誤差曲線
圖4是斷開卡爾曼濾波器和神經(jīng)網(wǎng)絡(luò)的結(jié)果。沒有GPS和濾波器的輔助,在很短的時間內(nèi),單純的SINS輸出就會偏移很多。。。
2)進行組合濾波后的誤差曲線
在加入GPS和濾波器后,從圖5可以看出,濾波器狀態(tài)估值與真實值之間的誤差變化保持在較高的水準(zhǔn),說明濾波器明顯減少了SINS的漂移和積累誤差,并且在噪聲復(fù)雜多變的情況下仍然表現(xiàn)出了平滑過渡的狀態(tài)。需要說明的是由于GPS的位置精度從長期看是高于SINS的,本文在進行位置估計的時候,出于以SINS為主的思想,給予GPS的權(quán)值較小。
圖6 組合濾波后滾動角估計誤差曲線 圖7卡爾曼濾波滾動角估計誤差曲線圖
從姿態(tài)角的誤差分析可以看出,濾波器能夠很快的收斂。。SINS的姿態(tài)誤差受到外界條件影響是比較大的,即量測噪聲的影響超過系統(tǒng)噪聲,從圖6中可以看出,在噪聲統(tǒng)計特性變化的條件下,誤差值仍然很小,說明神經(jīng)網(wǎng)絡(luò)系統(tǒng)能夠有效地對量測噪聲進行濾波。
3)組合誤差與普通卡爾曼濾波誤差的比較
對單純卡爾曼濾波系統(tǒng)和組合系統(tǒng)分別輸出的姿態(tài)角的比較。對實測數(shù)據(jù)中SINS和GPS原始數(shù)據(jù)加載入濾波器。誤差圖進行了部分的放大,如圖7所示,從圖7中可以明顯看出,單純的卡爾曼濾波系統(tǒng)對復(fù)雜噪聲的濾波能力遠遠差于組合系統(tǒng),表現(xiàn)在數(shù)據(jù)曲線上就是跳動很明顯,也驗證了組合系統(tǒng)具有較好的對不同統(tǒng)計特性的復(fù)雜噪聲的適應(yīng)能力。
5 結(jié)論
本文探討了采用神經(jīng)網(wǎng)絡(luò)系統(tǒng)對導(dǎo)航系統(tǒng)濾波的問題。采用卡爾曼濾波器與回歸BP神經(jīng)網(wǎng)絡(luò)系統(tǒng)的組合能夠有效地提高導(dǎo)航系統(tǒng)在復(fù)雜環(huán)境下的導(dǎo)航精度,并且能夠做到較快的收斂。但是這種方法的缺點在于需要大量的樣本輸入和需要完善的噪聲組合選擇,同時也受到計算能力的限制。此外,隱含層層數(shù)的選擇和結(jié)點個數(shù)的選擇應(yīng)當(dāng)如何優(yōu)化,也是一個需要探索的問題。
參考文獻:
[1] 以光衢,慣性導(dǎo)航原理[M],航空工業(yè)出版社,1987
[2] 張守信,GPS衛(wèi)星測量定位理論與應(yīng)用[M],國防科技大學(xué)出版社,1996
[3] 張玲,張鈸,人工神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[M],浙江科學(xué)技術(shù)出版社,1997
[4] 秦永元,卡爾曼濾波與組合導(dǎo)航原理[M],西北工業(yè)大學(xué)出版社,1998
[5] Kanckar A J , Fellachi A. State estimation using artificial neural networks[A]. Proceedings of the 1994 IEEE Int.Conf. on Robotics and Automation[C],1994
[6] 周鑫,船用慣導(dǎo)衛(wèi)星全組合技術(shù)[D], 長沙,國防科技大學(xué)碩士學(xué)位論文,2005
[7] 劉志儉,GPS載波相位差分技術(shù)、捷聯(lián)慣性導(dǎo)航系統(tǒng)初始對準(zhǔn)技術(shù)及其組合技術(shù)研究[D],長沙,國防科學(xué)技術(shù)大學(xué)博士學(xué)位論文,2003.3
【關(guān)鍵詞】zeta電位 Elman神經(jīng)網(wǎng)絡(luò) BP神經(jīng)網(wǎng)絡(luò) 建模
1 實驗數(shù)據(jù)的測量
本文所使用的藥劑PAC和PAM都取自廣西博世科環(huán)保技術(shù)有限公司,使用Nano-ZS90型Zeta電位測定儀(英國Malvern Instrument Ltd.)測量廢水中的Zeta電位值,測量原理是根據(jù)經(jīng)典Helmholtz―Smoluchowski(H-S)方法計算Zeta電位。
2 神經(jīng)網(wǎng)絡(luò)
由于廢水處理的復(fù)雜性,系統(tǒng)參數(shù)較多,各參數(shù)之間又相互耦合,以及非線性等特點,使得很難建立其精確有效的數(shù)學(xué)模型。然而神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、自組織和自適應(yīng)能力等優(yōu)點,從而為廢水處理絮凝劑工段的建模提供了新的手段。
2.1 BP神經(jīng)網(wǎng)絡(luò)
采用的BP神經(jīng)網(wǎng)絡(luò)由三層組成。一個輸入層,一個隱層和一個輸出層。如圖2-1所示:
2.2 Elman神經(jīng)網(wǎng)絡(luò)
Elman網(wǎng)絡(luò)是 J. L. Elman于 1990年首先針對語音處理問題而提出來的, 它是一種典型的局部回歸網(wǎng)絡(luò)( global feed for ward local recurrent)。Elman神經(jīng)網(wǎng)絡(luò)是兩層反向傳播網(wǎng)絡(luò),隱層神經(jīng)元的輸出不僅作為輸出層的輸入,還反饋至隱層的輸入,如圖2-2所示。
3 網(wǎng)絡(luò)建模
3.1 模型結(jié)構(gòu)
系統(tǒng)的下一個階段的狀態(tài)是由系統(tǒng)當(dāng)前狀態(tài)和當(dāng)前階段的控制量決定的。因此,將系統(tǒng)的藥劑PAC和PAM作為系統(tǒng)模型的輸入量,將Zeta電位值作為系統(tǒng)的模型的輸出量。此系統(tǒng)模型為2個輸入向量,1個輸出向量的神經(jīng)網(wǎng)絡(luò)模型。
3.2 BP神經(jīng)網(wǎng)絡(luò)建模
由于單隱層神經(jīng)網(wǎng)絡(luò)即可實現(xiàn)對任意函數(shù)的任意逼近,故對于廢水處理投放絮凝劑工段的模型采用單隱層BP神經(jīng)網(wǎng)絡(luò),進行擬合能力和泛化能力的測試。由于數(shù)據(jù)自身的原因,選用其他轉(zhuǎn)移函數(shù)效果都不如雙曲正切S型傳遞函數(shù),因此隱層轉(zhuǎn)移函數(shù)選用tansig函數(shù)(雙曲正切S型傳遞函數(shù));學(xué)習(xí)率選擇太小會使得訓(xùn)練次數(shù)增加,太大會使得訓(xùn)練出現(xiàn)震蕩,經(jīng)過多次試湊,選用學(xué)習(xí)率為0.01;選用不同的訓(xùn)練次數(shù)作對比,最后選用最大訓(xùn)練次數(shù)為200次。
隱層節(jié)點數(shù)的多少與樣本數(shù)的多少及樣本蘊含規(guī)律的復(fù)雜程度有關(guān)。當(dāng)選取不同的隱層節(jié)點數(shù)時,對比其擬合泛化能力。
BP神經(jīng)網(wǎng)絡(luò)隱層節(jié)點數(shù)分別為10,30,50時都達到了較好的泛化效果。其節(jié)點數(shù)依次增多時,該網(wǎng)絡(luò)的泛化能力對于整個泛化數(shù)組來說沒有明顯的增強,但是對于個別的數(shù)據(jù)點卻有一定的影響,如對于第五個數(shù)據(jù)點,隨著隱層節(jié)點數(shù)的增加,它的泛化能力越差,對于第20個數(shù)據(jù)點,隨著隱層節(jié)點數(shù)的增加,它的泛化能力越好。雖然其隱層節(jié)點數(shù)的不同會對個別的數(shù)據(jù)點產(chǎn)生微小的影響,考慮到訓(xùn)練時間的問題和數(shù)據(jù)整體泛化效果,對于BP神經(jīng)網(wǎng)絡(luò)來說,選取10個隱層節(jié)點數(shù)為最佳。
3.3 Elman神經(jīng)網(wǎng)絡(luò)建模
Elman神經(jīng)網(wǎng)絡(luò)采用MATLAB系統(tǒng)工具箱建模和訓(xùn)練,其MATLAB語句實現(xiàn)如下:
其中,newelm函數(shù)是用來建立Elman神經(jīng)網(wǎng)絡(luò)模型,而訓(xùn)練算法有很多種,經(jīng)過多次選取不同的訓(xùn)練函數(shù)對比,最后本文采用trainscg函數(shù)(SCG算法的變梯度反向傳播算法),隱層轉(zhuǎn)移函數(shù)為tansig函數(shù)(雙曲正切S形傳輸函數(shù)),輸出層轉(zhuǎn)移函數(shù)為purelin函數(shù)(線性傳輸函數(shù))。
學(xué)習(xí)率為0.01,訓(xùn)練次數(shù)為200,選取的方法與BP網(wǎng)絡(luò)相似。誤差訓(xùn)練目標(biāo)為0.005。
當(dāng)隱層節(jié)點數(shù)為10時,其擬合泛化圖形如圖3-7,3-8所示。
當(dāng)隱層節(jié)點數(shù)為50時,其擬合泛化圖形如圖3-9,3-10所示。
網(wǎng)絡(luò)性能的好壞主要是看它的泛化能力。由圖3-8,3-10,可知,隨著Elman神經(jīng)網(wǎng)絡(luò)隱層節(jié)點數(shù)的增加,其泛化能力得到了比較明顯的提高。當(dāng)Elman神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點數(shù)為50時,其泛化能力更強,由圖3-10所示,其泛化效果與實際值基本相同。之所以Elman神經(jīng)網(wǎng)絡(luò)的泛化擬合能力比BP神經(jīng)網(wǎng)絡(luò)的強,就是由于Elman神經(jīng)網(wǎng)絡(luò)比BP神經(jīng)網(wǎng)絡(luò)多了一個承接層,即隱層具有反饋連接功能。
4 結(jié)論
綜上所述,盡管目前BP神經(jīng)網(wǎng)絡(luò)得到了比較廣泛的應(yīng)用,但是由于它沒有反饋連接,其收斂速度較慢,又容易收斂到局部最小值。相比之下,動態(tài)回歸神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)效率高,逼近速度快、泛化能力強的特點,能夠更好地反映系統(tǒng)的動態(tài)特性。
(1)神經(jīng)網(wǎng)絡(luò)的非線性映射能力,保證了對廢水處理投放絮凝劑工段建模的可行性(2)神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)能力,在建模過程中能夠自動解耦各參數(shù)之間的關(guān)系。(3)神經(jīng)網(wǎng)絡(luò)的并行協(xié)同處理能力,使得網(wǎng)絡(luò)具有很強的實時性。(4)神經(jīng)網(wǎng)絡(luò)的分布式存儲信息的能力,使得其在建模方面具有很好的容錯性和魯棒性。
參考文獻
[1]王國勇.4萬噸污水處理廠自動化監(jiān)控系統(tǒng)設(shè)計與研究[D].山東大學(xué),2008.
[2]孫體昌等.水污染控制工程[M].北京:機械工業(yè)出版社,2009.
[3]李闖.水處理濾料表面的zeta電位及其過濾除油性能研究[D].蘭州:蘭州交通大學(xué),2009(06).
[4]王利平等.水中膠體Zeta電位及影響混凝效果的研究[J].包頭鋼鐵學(xué)院學(xué)報,1999,18(04):484-486.
[5]王曉敏等.混凝劑對膠體電動電位的影響研究[J].工業(yè)安全與環(huán)保,2006,32(02):7-9.
[6]韓立群.人工神經(jīng)網(wǎng)絡(luò)理論、設(shè)計及應(yīng)用[M].北京:化學(xué)工業(yè)出版社,2007.
Abstract: In this paper, a model combining BP neural network and Hopfield is proposed to obtain the tropospheric delay fusion model HBPF by using sounding data and CORS base station observation data. By comparing the results of the fusion model with GAMIT, it shows that the HBPF model is reliable and highly accurate.
關(guān)鍵詞:對流層延遲;Hopfield模型;BP神經(jīng)網(wǎng)絡(luò);融合模型
Key words: troposphere delay;Hopfield model;BP neural network;fusion model
中圖分類號:P228.4 文獻標(biāo)識碼:A 文章編號:1006-4311(2017)15-0227-03
0 引言
當(dāng)今社會,用戶對GPS精度以及可靠性的要求越來越高,影響GPS高程精度有關(guān)的誤差主要來自傳播路徑折射誤差中的對流層折射誤差。建立一個適用于多種導(dǎo)航定位用戶精度需求的高精度對流層延遲改正模型,有著很重要的戰(zhàn)略及現(xiàn)實意義[1]。
目前,國際上對流層延遲改正的方法主要是模型函數(shù)法,包括Hopfield模型、Saastamoinen模型、Black模型、UNB系列模型和EGNOS模型等。但是,由于對流層本身的復(fù)雜性,現(xiàn)存模型對于水汽在對流層空間的分布情況以及在時間上的變化規(guī)律仍然很難確切地描述[2]。人工神經(jīng)網(wǎng)絡(luò)模型具有學(xué)習(xí)、記憶、計算和智能處理功能[3],在地球科學(xué)與測繪工程中發(fā)揮了重要作用。本文分析研究線性回歸模型、Hopfield模型、神經(jīng)網(wǎng)絡(luò)融合模型(BP模型)、線性回歸模型與神經(jīng)網(wǎng)絡(luò)融合模型(F1模型)、Hopfield模型與神經(jīng)網(wǎng)絡(luò)融合模型(HBPF模型)共五種模型對研究區(qū)域的改正效果,以期建立較高精度的區(qū)域?qū)α鲗友舆t改正模型。
1 Hopfield模型原理
Hopfield模型僅將大氣層分為對流層和電離層兩層。在對流層中,其主要分析對流層中各個氣象參數(shù)與海拔高度之間的關(guān)系,然后經(jīng)過推導(dǎo)分別得出折射率干分量和濕分量與高程之間的關(guān)系,進而后通過地面氣象參數(shù)來推演整個對流層延遲。
完整的Hopfield模型的計算公式如下:
式(1)中前半部分為干延遲,后半部分為濕延遲。其中T0為測站氣溫,h0為測站高度,e0是地面的水汽分壓,P0與T0分別為測站的地面氣壓與絕對溫度,Hw為濕對流層頂,一般取Hw=11000m;而HT為折射率為0處的大氣層高度,k1(K?mbar-1)、k2(K?mbar-1)、k3(105K2?mbar-1)為大氣折射率試驗常數(shù)。
Hopfield模型干延遲精度為2cm,濕延遲為5cm,另外地區(qū)和季節(jié)性變化會對模型產(chǎn)生3cm以上的延t變化。歐吉坤[4]指出,在我國Hopfield模型的誤差有時可達10cm以上,而且存在系統(tǒng)誤差。
2 用于計算對流層延遲BP神經(jīng)網(wǎng)絡(luò)模型的建立
影響對流層濕延遲的水汽是一個有著極復(fù)雜變化的非線性的物理量,那么利用在處理非線性問題上有獨特優(yōu)勢的神經(jīng)網(wǎng)絡(luò)技術(shù)來討論延遲的變化,應(yīng)該比傳統(tǒng)的方法更有效。
在眾多神經(jīng)網(wǎng)絡(luò)模型中,BP神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最廣泛的模型[5]。BP神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu)包括輸入層、隱含層和輸出層三個部分(見圖1)。
BP算法計算過程分為兩個階段:信號正向傳播以及誤差反向傳播。這個過程引導(dǎo)各層權(quán)值調(diào)整,即網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程,這兩個階段的反復(fù)運用,在誤差達到所希望的精度時,網(wǎng)絡(luò)的學(xué)習(xí)過程就結(jié)束。
用于計算對流層延遲BP神經(jīng)網(wǎng)絡(luò)的建立主要分兩個步驟:
2.1 網(wǎng)絡(luò)結(jié)構(gòu)的確定
網(wǎng)絡(luò)結(jié)構(gòu)的確定是BP神經(jīng)網(wǎng)絡(luò)在工程中應(yīng)用的重要工作。需要我們確定的內(nèi)容有:①輸入層節(jié)點個數(shù);為與Hopfield模型進行比較,文章采用和Hopfield模型一樣的輸入?yún)?shù),即:測站的地面氣壓與絕對溫度P0與T0、測站海拔高度h0以及測站的地面水汽分壓e0。②輸出層節(jié)點個數(shù);輸出層節(jié)點數(shù)為1,為對流層延遲δ。③隱含層節(jié)點數(shù)的選取;本文采取遺傳算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,將隱含層節(jié)點設(shè)置為從10~30,每次計算均輸出最佳計算結(jié)果。
2.2 網(wǎng)絡(luò)參數(shù)的設(shè)置
BP神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)包括:學(xué)習(xí)速率η、平滑因子α、學(xué)習(xí)誤差E。通過試算,學(xué)習(xí)速率η取值范圍為[0.5,2.5],平滑因子α取值范圍為[0.5,0.9],學(xué)習(xí)誤差控制E在[0.005,0.01]。
通過以上兩個步驟,即建立用于計算對流層延遲的神經(jīng)網(wǎng)絡(luò)模型。
3 對流層天頂延遲的融合模型的建立
考慮到模型的應(yīng)用簡便特性和獲取數(shù)據(jù)的限制,在此,選擇Hopfield模型來與BP神經(jīng)網(wǎng)絡(luò)進行融合來建立區(qū)域?qū)α鲗友舆t融合模型(HBPF模型)。BP神經(jīng)網(wǎng)絡(luò)具有強大的誤差補償能力,可用來補償Hopfield模型的系統(tǒng)誤差,然后將所得出的誤差返加到Hopfield模型上,即可求得精確的對流層延遲值。為了與HBPF模型進行對比驗證,同時用BP神經(jīng)網(wǎng)絡(luò)對多元線性回歸模型進行誤差補償,所得到的融合模型簡稱為F1模型。兩融合模型具體的網(wǎng)型結(jié)構(gòu)如下:
將地面測站的氣壓P0、絕對溫度T0、海拔高度h0、地面露點溫度td,另加Hopfield模型或多元線性回歸模型計算的對流層延遲δH作為輸入層,將Hopfield模型或多元線性回歸模型計算延遲的誤差ΔδH作為輸出層,建立一個5×N×1的神經(jīng)網(wǎng)絡(luò)模型(N為隱含層節(jié)點數(shù))。那么模型所得到的值為Hopfield模型或多元線性回歸模型所得值與對流層延遲真值的誤差ΔδH'。融合模型所求得的延遲δ2可通過δ2=δH+ΔδH'來計算。在具體的計算時,采用與BP神經(jīng)網(wǎng)絡(luò)相同的計算步驟。
經(jīng)過上述過程,我們就建立了與BP神經(jīng)網(wǎng)絡(luò)相融合的融合模型。
4 工程及實例分析
為精確確定測站的氣象參數(shù),本文采用氣象站的探空氣球采集的實時大氣參數(shù)作為計算數(shù)據(jù),計算各個等壓面的大氣干、濕折射率,描述出測站上空對流層的折射率變化情況,再通過路徑積分精確的求出探空數(shù)據(jù)在海拔高程范圍內(nèi)的對流層延遲值。
本文所選取的探空數(shù)據(jù)為徐州地區(qū)2010年全年的氣象數(shù)據(jù),限于篇幅問題,這里僅僅將由2010年7月1號8點的探空數(shù)據(jù)計算的部分?jǐn)?shù)據(jù)列于表1。
由于氣象探空數(shù)據(jù)的真實性,再加上探空數(shù)據(jù)最高高度之上所采用的中緯度大氣模型與大氣的真實輪廓近似,即氣象探空數(shù)據(jù)高度之上延遲的無差異性,我們可以認(rèn)為通過路徑積分計算出來的對流層延遲與其真值無異。
4.1 對流層天頂延遲的多元線性回歸模型算例
根據(jù)探空氣球數(shù)據(jù)的格式,本文中的多元線性回歸中自變量X將包括四個參數(shù),分別為測站的地面氣壓與絕對溫度P0與T0、測站海拔高度h0以及測站地面露點溫度td,分別表示為X1、X2、X3、X4,待求參數(shù)就有5個,分別是a0、a1、a2、a3、a4,具體公式表達見式(2):
然后通過最小二乘法求解出參數(shù),得出對流層延遲與大氣參數(shù)之間的多元線性關(guān)系。以表1中的數(shù)據(jù)作為學(xué)習(xí)樣本,經(jīng)計算得到的模型參數(shù)值如表2。
4.2 各模型檢驗精度匯總
為了各模型間的對比分析,每個模型均選取2010年7月1日8點的20個探空站觀測數(shù)據(jù)作為學(xué)習(xí)樣本,以探空數(shù)據(jù)計算得到的對流層延遲值作為基準(zhǔn),分別選取當(dāng)天8點剩余對流層延遲樣本和20點對流層延遲樣本來進行檢驗,進而比較檢驗樣本的精度。檢驗樣本的精度匯總見表3。
從表3中,我們可以看出,Hopfield模型在研究區(qū)域內(nèi)精度最差,線性回歸模型和常規(guī)BP神經(jīng)網(wǎng)絡(luò)模型、F1模型的精度都比Hopfield模型要高,HBPF模型精度最高。這是因為,線性回歸模型和常規(guī)BP神經(jīng)網(wǎng)絡(luò)模型都是對獲取的四個氣象參數(shù)的數(shù)學(xué)分析,沒有實際的物理意義。而Hopfield模型是基于全球氣象參數(shù)建立的經(jīng)驗物理模型,是對全球?qū)α鲗友舆t的模擬,在針對特定的區(qū)域應(yīng)用時,會出現(xiàn)相應(yīng)的系統(tǒng)誤差。由于BP神經(jīng)網(wǎng)絡(luò)強大的誤差補償能力,在Hopfield模型較大系統(tǒng)誤差下,HBPF模型能夠達到最優(yōu)的精度,相比其他模型,極大地提高了對流層延遲的精度。
4.3 模型計算對流層延遲精度驗證
由于GAMIT軟件的對流層天頂延遲參數(shù)估計精度好于±1cm[6],因此在應(yīng)用中比較公認(rèn)的看法是可將GAMIT軟件計算出來的對流層延遲值視為真值。本文上述融合模型是建立在探空數(shù)據(jù)的基礎(chǔ)上的,為了進一步驗證HBPF模型的有效性,將其計算結(jié)果與GAMIT計算的“真值”進行對比分析。
利用GAMIT軟件對徐州地區(qū)5個CORS基站2010年7月份的數(shù)據(jù)進行了高精度基線解算,并得到了時間步長為2小時的對流層延遲。采用融合模型同樣的計算結(jié)構(gòu),在計算CORS基站天頂對流層延遲時,學(xué)習(xí)樣本依然是探空站地面氣象數(shù)據(jù)(見表1)。為了進一步分析融合模型方法計算得到對流層延遲的可靠性,本文選取2010年7月25日到7月29日連續(xù)五天的數(shù)據(jù),每天選取兩個時刻(8點,20點),以GAMIT計算得到的對流層天頂延遲數(shù)據(jù)作為對比樣本,并與現(xiàn)今常用的UNB3m模型相比。三種模型解求的某個CORS基站天頂對流層延遲值對比列表如表4。
將表4中數(shù)據(jù)繪制成圖,模型數(shù)據(jù)圖見圖2。從圖2可以看出,本文中求出的融合模型與GAMIT解算出來的結(jié)果在7月25日到7月29日期間具有相同的變化規(guī)律,兩者之間的差值都在1cm左右。UNB3m模型由于是采用的差值格網(wǎng)模型,在選定經(jīng)緯度和年積日之后,計算結(jié)果在相當(dāng)長的一段時間內(nèi)大致相同。
綜合這幾種常規(guī)模型,可以得出結(jié)論:本文得出的HBPF模型具有最高的精度,而且結(jié)果穩(wěn)定可信,能夠滿足較高精度的GPS定位等需求。
5 結(jié)束語
近年來,GPS技術(shù)已經(jīng)應(yīng)用到人們生活的許多方面,要提高GPS定位精度,必須要建立一個高效、可靠的對流層延遲模型來實現(xiàn)對對流層延遲的反演。本文利用區(qū)域?qū)崪y的氣象探空數(shù)據(jù)求得具有較高精度的區(qū)域融合模型HBPF模型,經(jīng)驗證表明其在反演區(qū)域?qū)α鲗友舆t方面,相對于傳統(tǒng)模型有著更加良好的效果。但本文所選取的探空數(shù)據(jù)僅局限在徐州地區(qū),所提出的“HBPF模型”在本區(qū)域內(nèi)能取得很高的改正效果,能否在其他地區(qū)進行推廣應(yīng)用,也還有待于進一步驗證分析。
參考文獻:
[1]徐酃Γ徐宗秋,隋心.精密單點定位中衛(wèi)星星歷對天頂對流層延遲估計的影響[J].測繪科學(xué),2013,38(02):19-21.
[2]戴吾蛟,陳招華,匡翠林等.區(qū)域精密對流層延遲建模[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2011,36(04):392-396.
[3]胡伍生.神經(jīng)網(wǎng)絡(luò)理論及其工程應(yīng)用[M].測繪出版社,2006.
[4]歐吉坤.GPS測量的中性大氣折射改正的研究[J].測繪學(xué)報,1998,27(01):34-39.
關(guān)鍵詞:應(yīng)急; 預(yù)測; 支持向量機; 人工神經(jīng)網(wǎng)絡(luò) ;案例推理法
一、引言
“預(yù)測”這一件事,從古到今都是人們苦苦追求與探索的話題:從“先知三日,富貴十年”到“凡事預(yù)則立,不預(yù)則廢”;從活躍在中國民間的算命先生,再到西方觀測星象的占卜師,無不寄予著世人對未知的好奇和對未來的向往。隨著科技進步與時展,特別是計算機技術(shù)的飛躍,給予人們更強大、更客觀的手段和方法進行預(yù)測。本文以應(yīng)急物資需求為背景,通過對各類預(yù)測方法的介紹和對比,為應(yīng)急物資的需求預(yù)測尋求最佳途徑。
二、預(yù)測方法分類及研究現(xiàn)狀
由于預(yù)測的對象、目標(biāo)、內(nèi)容和期限的不同,近幾十年來形成了多種多樣的預(yù)測方法。據(jù)不完全統(tǒng)計,目前世界上有近千種預(yù)測方法,其中較為成熟的有150多種,常用的有30多種,用得最為普遍的有10多種,但目前為止還沒有一個完整、統(tǒng)一、系統(tǒng)的分類體系。本文依照我國常用的分類方法,將預(yù)測方法分為定性分析和定量分析兩大類。
1. 定性分析預(yù)測法
定性分析預(yù)測法是指預(yù)測者根據(jù)歷史與現(xiàn)實的觀察資料,依賴個人或集體的經(jīng)驗及智慧,對未來的發(fā)展?fàn)顟B(tài)和趨勢做出判斷的預(yù)測方法。其主要方法包括專家意見法、頭腦風(fēng)暴法和德爾菲法等。定性預(yù)測的優(yōu)點在于,能夠較大程度地發(fā)揮人的主觀能動作用,簡單迅速,省時省力,具有較大的靈活性;同時它的缺點也是顯而易見的:由于它較為依賴于人的經(jīng)驗和主觀判斷能力,從而易受人的知識、經(jīng)驗和能力的多少大小的束縛和限制,尤其缺乏對事物發(fā)展作數(shù)量上的精確描述。因此,定性分析預(yù)測法在現(xiàn)代預(yù)測技術(shù)中逐漸淡出,定量分析預(yù)測法成為預(yù)測的主要手段。
2. 定量分析預(yù)測法
定量分析預(yù)測法主要依據(jù)調(diào)查研究所獲取的數(shù)據(jù)資料,運用統(tǒng)計方法和數(shù)學(xué)模型,近似地揭示預(yù)測對象及其影響因素的數(shù)量變動關(guān)系,建立對應(yīng)的預(yù)測模型,據(jù)此對預(yù)測目標(biāo)做出定量測算的預(yù)測方法。它通常可分為時間序列分析預(yù)測法和因果分析預(yù)測法。
(1)時間序列分析預(yù)測法
時間序列分析預(yù)測法是以連續(xù)性預(yù)測原理作指導(dǎo),利用歷史觀察值形成的時間數(shù)列,對預(yù)測目標(biāo)未來狀態(tài)和發(fā)展趨勢做出定量判斷的預(yù)測方法。較為常用的時間序列分析預(yù)測法主要有指數(shù)平滑法(包括雙指數(shù)平滑、三次指數(shù)平滑和無季節(jié)指數(shù)平滑等)、移動平均法、ARIMA模型(也稱Box-Jenkins法)等。
(2)因果分析預(yù)測法
因果分析預(yù)測法是以因果性預(yù)測原理作指導(dǎo),以分析預(yù)測目標(biāo)同其他相關(guān)事件及現(xiàn)象之間的因果聯(lián)系,對事件未來狀態(tài)與發(fā)展趨勢做出預(yù)測的定量分析方法。較為常用的主要有回歸分析預(yù)測法、計量經(jīng)濟模型預(yù)測法和投入――產(chǎn)出分析預(yù)測法等。隨著數(shù)學(xué)方法在計算機上的運用和實現(xiàn),經(jīng)濟學(xué)的研究與數(shù)學(xué)和計算機科學(xué)的聯(lián)系更為緊密。近年來,許多人工智能預(yù)測模型層出不窮,極大豐富了預(yù)測的方法和手段。
三、應(yīng)急物資需求預(yù)測的研究現(xiàn)狀
應(yīng)急物資是指為應(yīng)對自然災(zāi)害、事故災(zāi)難、公共安全事件和社會安全等突發(fā)性公共事件應(yīng)急處置過程中所必需的保障性物資。應(yīng)急物資的需求是應(yīng)急物資保障的首要環(huán)節(jié),它具有時間上和數(shù)量上的不確定性等特點。因此,做好應(yīng)急物資的需求預(yù)測有著重要的現(xiàn)實意義。就國內(nèi)目前的研究來看,主要體現(xiàn)在運用人工智能方法構(gòu)建預(yù)測模型,時下最流行、使用最廣泛的方法有CBR(案例推理法),ANN(神經(jīng)網(wǎng)絡(luò)模型),SVM(支持向量機模型)等。
1.案例推理法(CBR)
案例推理法(Case―Based Reasoning,簡稱CBR)最早是由耶魯大學(xué)Schank 教授在Dynamic Memory:A Theory of Reminding and Learning in Computers and People(1982)一文中提出的,它是人工智能領(lǐng)域的一項重要推理方法。國外自上世紀(jì) 8O 年代后期對 CBR 的理論和方法進行了系統(tǒng)研究,在通用問題求解、法律案例分析、設(shè)備故障診斷、輔助工程設(shè)計、輔助計劃制定等領(lǐng)域取得實用性成果[1];國內(nèi)運用CBR方法對應(yīng)急物資需求進行預(yù)測,取得了一定的進展:傅志妍,陳堅[2]運用歐氏算法尋求最佳相似源案例,建立案例推理――關(guān)鍵因素模型對目標(biāo)案例進行需求預(yù)測,并通過實例驗證了模型的科學(xué)有效;王曉、莊亞明[3]將模糊集理論、神經(jīng)網(wǎng)絡(luò)Hebb學(xué)習(xí)規(guī)則和多元線性回歸與案例推理法相結(jié)合,較為準(zhǔn)確地預(yù)測出非常規(guī)突發(fā)事件的資源需求;Fu Deqiang[4]等人使用了一種基于案例推理和BP神經(jīng)網(wǎng)絡(luò)的精度預(yù)測法,同樣通過目標(biāo)案例證實了模型的可靠性。
雖然案例推理法出現(xiàn)的時間較早,且在各領(lǐng)域得到了廣泛的運用,但是這種預(yù)測方法有著較大的經(jīng)驗成分,且案例庫的建立是進行案例推理分析的首要步驟和困難之處。而目前對于案例庫的建立存在著數(shù)據(jù)不全,缺失以及無系統(tǒng)整理歸檔的問題。
2.人工神經(jīng)網(wǎng)絡(luò)(ANN)
人工神經(jīng)網(wǎng)絡(luò)最早是由Lapedes和Farber于1987年在《運用神經(jīng)網(wǎng)絡(luò)進行非線性信號處理:預(yù)測和系統(tǒng)模型》[5]一文中提出并使用的,他們用非線性神經(jīng)網(wǎng)絡(luò)對計算機生成的時間序列仿真數(shù)據(jù)進行訓(xùn)練和預(yù)測。王其文[6]等人和Chin Kuo[7]等分別通過對神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)回歸預(yù)測方法的比較,證明了神經(jīng)網(wǎng)絡(luò)在預(yù)測中的優(yōu)越性。
對于神經(jīng)網(wǎng)絡(luò)在應(yīng)急物資需求預(yù)測中的使用,國內(nèi)相關(guān)文獻較少。筆者認(rèn)為具有啟發(fā)性的是在《大型地震應(yīng)急物資需求預(yù)測方法研究》[8]一文中,郭金芬和周剛先利用 BP 神經(jīng)網(wǎng)絡(luò)算法對災(zāi)后人員傷亡人數(shù)進行預(yù)測,然后結(jié)合庫存管理知識估算出災(zāi)區(qū)應(yīng)急物資的需求量;隨后,郭在其碩士論文中對該問題做出較為系統(tǒng)的研究[9]。而神經(jīng)網(wǎng)絡(luò)在物流需求預(yù)測中的運用,對應(yīng)急物資需求預(yù)測是同樣具有借鑒意義的:后銳、張畢西[10]提出基于MLP 神經(jīng)網(wǎng)絡(luò)的區(qū)域物流需求預(yù)測模型,揭示了區(qū)域經(jīng)濟與區(qū)域物流需求之間的非線性映射關(guān)系, 為區(qū)域物流需求預(yù)測提供了一種新思路和新方法;苗鑫[11]等人用擴展卡爾曼濾波和人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的復(fù)合算法對物流需求進行預(yù)測,并在與常規(guī)BP神經(jīng)網(wǎng)絡(luò)算法的預(yù)測誤差比較中,顯示出其較高的可靠性;牛忠遠[12]依據(jù)物流需求的時間序列統(tǒng)計數(shù)據(jù),應(yīng)用人工神經(jīng)網(wǎng)絡(luò)多步預(yù)測和滾動預(yù)測方法建立預(yù)測模型,對我國物流需求進行實證分析研究。
3. 支持向量機(SVM)
支持向量機是建立在統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以求獲得最好推廣能力的一種方法。它是由Vapnik等人于1995年提出的[13][14],現(xiàn)已廣泛地應(yīng)用于模式識別、語音識別、時間序列分析、生物信息學(xué)及經(jīng)濟學(xué)等領(lǐng)域。
支持向量機在應(yīng)急物資和物流需求預(yù)測中的研究,國內(nèi)文獻一般集中在以下幾個方面:趙一兵[15]等人運用支持向量機回歸算法建立了地震中人員傷亡預(yù)測模型,而后結(jié)合庫存管理模型對應(yīng)急物資進行了估算,并在實例中驗證了模型的有效性;吳潔明[16]等運用支持向量機對歷史物流需求量的數(shù)據(jù)進行學(xué)習(xí),而后通過粒子群算法獲得模型最優(yōu)參數(shù)對物流需求進行預(yù)測;何滿輝[17]等針對支持向量機在處理數(shù)據(jù)時無法將數(shù)據(jù)簡化的問題,提出了基于模糊粗糙集與支持向量機的區(qū)域物流量預(yù)測方法;朱莎[18]提出了基于小波分析和支持向量機的組合預(yù)測方法,建立了針對緊急救援階段和后續(xù)救援階段的血液需求預(yù)測模型,并在汶川地震的案例中體現(xiàn)出該模型較高的精度。
從以上文獻中我們可以發(fā)現(xiàn),案例推理法,人工神經(jīng)網(wǎng)絡(luò)和支持向量機的應(yīng)用,都體現(xiàn)出跨學(xué)科,跨專業(yè)的特點,它們將生物學(xué)或計算機科學(xué)等自然科學(xué)的研究方法推廣到經(jīng)濟管理等社會科學(xué)中,并很好地解決了現(xiàn)實問題。
四、結(jié)束語
本文首先通過對現(xiàn)有預(yù)測方法的簡要介紹,提出運用近年來興起的人工智能方法對預(yù)測問題的研究;而后從應(yīng)急物資需求的視角出發(fā),對國內(nèi)外解決應(yīng)急物資需求預(yù)測方法做出總結(jié)回顧。通過分析,筆者認(rèn)為支持向量機(SVM)更適合運用于對歷史數(shù)據(jù)較少或不全的應(yīng)急物資需求進行預(yù)測。下一步的工作將是對預(yù)測指標(biāo)的選取和影響因子的量化,以及對輸入SVM訓(xùn)練數(shù)據(jù)的處理,并在實例中驗證該預(yù)測方法的精確度和有效性。
參考文獻:
[1]侯玉梅,許成媛. 基于案例推理法研究綜述[J]. 燕山大學(xué)學(xué)報(哲學(xué)社會科學(xué)版), 2011, 12(4): 102-108.
[2]傅志妍,陳堅.災(zāi)害應(yīng)急物資需求預(yù)測模型研究[J].物流科技,2009(10):11-13.
[3]王曉,莊亞明.基于案例推理的非常規(guī)突發(fā)事件資源需求預(yù)測[J].西安電子科技大學(xué)學(xué)報,2010,12(7):22-26.
[4]Fu Deqiang, Liu Yun, Li Changbing, Forecasting the Demand of Emergency Supplies: Based on the CBR Theory and BP Neural Network, Proceedings of the 8th International Conference on Innovation & Management. Fukuoka, Japan, November, 2011.
[5]Lapedes A, Farber. Nonlinear signal processing using neural networks: prediction and system modeling [R]. Technical Report LA-UR-87-2662,Los Alamos National Laboratory. Los Alamos. NM,1987.
[6]王其文, 呂景峰, 劉廣靈等. 人工神經(jīng)網(wǎng)絡(luò)與線性回歸的比較[J]. 決策與決策支持系統(tǒng), 1993, 3 (3) : 205-210.
[7]Chin, Kuo, Arthur, Reitsch. Neural networks vs. conventional methods of forecasting, The Journal of Business Forecasting Methods & Systems, Winter 1995/1996 17-22.
[8]郭金芬,周剛.大型地震應(yīng)急物資需求預(yù)測方法研究[J].價值工程,2011(22).27-29.
[9]郭金芬.面向大型地震的應(yīng)急物資需求預(yù)測方法研究[D]. 天津:天津大學(xué),2011.
[10]后銳,張畢西. 基于MLP神經(jīng)網(wǎng)絡(luò)的區(qū)域物流需求預(yù)測方法及其應(yīng)用[J]. 系統(tǒng)工程理論與實踐,2005, 25(12): 43-47.
[11]苗鑫,西寶,鄒慧敏. 物流需求的動態(tài)預(yù)測方法.哈爾濱工業(yè)大學(xué)學(xué)報[J]. 2008, 40(10): 1613-1616.
[12]牛忠遠. 我國物流需求預(yù)測的神經(jīng)網(wǎng)絡(luò)模型和實證分析研究[D]. 浙江:浙江大學(xué), 2006.
[13]VAPNIKV. The Nature of Statistical Learning Theory [M].New York : Spring Verlag,1995.
[14]VAPNIKV,張學(xué)工譯.《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》 [M]. 北京:清華大學(xué)出版社,2000.
[15]趙一兵,高虹霓,馮少博. 基于支持向量機回歸的應(yīng)急物資需求預(yù)測[J]. 2013, 30(8): 408-412.
[16]吳潔明,李余琪,萬勵. 物流需求預(yù)測算法的仿真研究[J]. 2011, 28(9): 246-249.
[17]何滿輝,逯林,劉拴宏. 基于模糊粗糙集與支持向量機的區(qū)域物流量預(yù)測[J]. 2012,12(3):129-134.
關(guān)鍵詞:計算機 網(wǎng)絡(luò)預(yù)警 信息安全
中圖分類號:U441 文獻標(biāo)識碼:A 文章編號:1007-9416(2012)05-0101-01
隨著網(wǎng)絡(luò)安全事件的不斷升級,網(wǎng)絡(luò)安全問題引起了人們的高度重視,人們開始反思導(dǎo)致網(wǎng)絡(luò)安全事件發(fā)生的原因,開始探索防御各類攻擊事件和入侵行為的手段,網(wǎng)絡(luò)預(yù)警技術(shù)應(yīng)運而生。網(wǎng)絡(luò)預(yù)警技術(shù)是近年來發(fā)展起來的新一代安全防范技術(shù),是一種集檢測、記錄和報警于一身的網(wǎng)絡(luò)安全技術(shù),對計算機網(wǎng)絡(luò)或系統(tǒng)中的信息進行收集和分析,判斷其是否具有威脅性,如果有則立即發(fā)出警報,使操作人員提前做好防御準(zhǔn)備,確保網(wǎng)絡(luò)安全。
1、預(yù)警的概念
從應(yīng)用角度,預(yù)警可以理解為在災(zāi)難或其他具有威脅性的事件發(fā)生前,根據(jù)事物的發(fā)展規(guī)律和以往的經(jīng)驗總結(jié),運用現(xiàn)有技術(shù)手段判斷目標(biāo)事件是否存在問題或威脅,并向相關(guān)部門發(fā)出相應(yīng)的信號提示,讓相關(guān)部門提前做好應(yīng)對準(zhǔn)備,從而將危害可能造成的損失降至最低[1]。本文研究的主要是網(wǎng)絡(luò)預(yù)警技術(shù),即通過對計算機網(wǎng)絡(luò)或系統(tǒng)內(nèi)的信息進行搜集分析,對其威脅性進行判斷,一旦發(fā)現(xiàn)威脅立即發(fā)出警報,使操作人員做好防御準(zhǔn)備,維護網(wǎng)絡(luò)信息安全。
2、網(wǎng)絡(luò)預(yù)警的意義
網(wǎng)絡(luò)預(yù)警的意義主要表現(xiàn)在以下幾個方面:
(1)有效預(yù)警系統(tǒng)內(nèi)部的入侵行為:據(jù)統(tǒng)計,約有80%的入侵行為發(fā)生于系統(tǒng)內(nèi)部,網(wǎng)絡(luò)預(yù)警技術(shù)對于內(nèi)部用戶的越權(quán)行為和內(nèi)部用戶泄密行為具有較強的預(yù)警功能,因而對于防御內(nèi)部入侵行為具有重要意義[2]。
(2)最大限度地減少攻擊事件造成的損失:網(wǎng)絡(luò)預(yù)警技術(shù)能夠監(jiān)控、分析系統(tǒng)和用戶的行為、評估關(guān)鍵數(shù)據(jù)文件的完整性、核查并恢復(fù)系統(tǒng)漏洞、預(yù)警入侵行為的發(fā)生等[3]。一旦發(fā)現(xiàn)目標(biāo)事件具有威脅性,系統(tǒng)立即發(fā)出警報信號,使操作人員及時做好防御準(zhǔn)備,最大限度的減少了入侵行為造成的損失。
(3)最大限度的避免同樣的攻擊事件再次發(fā)生:當(dāng)攻擊事件發(fā)生后,網(wǎng)絡(luò)預(yù)警系統(tǒng)會自動收集相關(guān)信息并添加到數(shù)據(jù)庫中,一旦發(fā)現(xiàn)相似攻擊事件信息,系統(tǒng)將自動檢索數(shù)據(jù)庫并立即調(diào)取相關(guān)信息作為操作人員防御參考,增強了系統(tǒng)的防范能力,最大限度的避免同樣的攻擊事件的再次發(fā)生。
(4)入侵行為發(fā)生后,系統(tǒng)自動保留入侵者的信息:網(wǎng)絡(luò)預(yù)警系統(tǒng)能夠在入侵行為發(fā)生的同時,記錄并保留入侵行為相關(guān)信息,作為可以指證入侵者非法行為的證據(jù)。
3、網(wǎng)絡(luò)預(yù)警技術(shù)的方法及其比較
3.1 網(wǎng)絡(luò)預(yù)警技術(shù)的四種主要方法
一個完整的預(yù)警過程通常要歷經(jīng)預(yù)警指標(biāo)選擇和確定、預(yù)警方法選擇和確定、警限界定確定、報警這幾個階段。目前,預(yù)警方法和理論有很多,本文主要介紹4種:Logistic回歸法、案例推理預(yù)警法、失敗樹預(yù)警法和基于神經(jīng)網(wǎng)絡(luò)預(yù)警法。
(1)Logistic回歸法:Logistic回歸常用于流行病學(xué),較為常見的情況是探尋某疾病的危險因素,并根據(jù)危險因素預(yù)測疾病發(fā)生率,目前Logistic回歸被預(yù)警領(lǐng)域廣泛應(yīng)用,如金融危機預(yù)警、財務(wù)預(yù)警等。Logistic回歸通過目標(biāo)事件影響因素分析來創(chuàng)建分析模型:首先對預(yù)警目標(biāo)進行驗證,根據(jù)驗證結(jié)果對指標(biāo)進行相關(guān)性分析,確定并剔除相關(guān)度較高的指標(biāo),根據(jù)目標(biāo)事件具體情況確定警界點,對這一過程中利用的分析方法進行分析并檢驗,創(chuàng)建Logistic回歸模型。
(2)案例推理預(yù)警法:案例推理首先要創(chuàng)建一個案例庫,當(dāng)新的案例發(fā)生時,對該案例進行特征描述,根據(jù)其特征從案例庫中檢索具有相似特征的案例并進行對比分析,最終實現(xiàn)預(yù)警的效果。
(3)失敗樹預(yù)警法:失敗樹分析法具有易理解、直觀、高效的特點,被廣泛應(yīng)用于預(yù)警領(lǐng)域,如工程預(yù)警。失敗樹預(yù)警法的實現(xiàn)過程首先要對已發(fā)生的失敗事件進行分析歸納,確定其失敗的影響因素、控制條件和路徑等,之后根據(jù)失敗路線和分析結(jié)果創(chuàng)建模型。
(4)基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的預(yù)警法:基于人工神經(jīng)網(wǎng)絡(luò)的預(yù)警法的工作原理是將同系列的樣本輸入和理想輸出作為訓(xùn)練的“樣本”,并根據(jù)一定的訓(xùn)練算法對神經(jīng)網(wǎng)絡(luò)進行充分訓(xùn)練,直至神經(jīng)網(wǎng)絡(luò)發(fā)掘蘊含在“解”中的隱含關(guān)系,之后利用訓(xùn)練完的人工神經(jīng)網(wǎng)絡(luò)對相同問題進行求解,從而實現(xiàn)預(yù)警目的[4]。
3.2 網(wǎng)絡(luò)預(yù)警技術(shù)方法比較
Logistic回歸分析法具有操作簡單的優(yōu)點,只需較少的變量就能實現(xiàn)預(yù)警目的,但是,Logistic回歸分析法是一種靜態(tài)預(yù)警法,無法處理遺漏信息的狀況,且缺乏自我調(diào)整力、自我學(xué)習(xí)力以及容錯能力;
案例推理預(yù)警法具有強大的記憶功能,只要檢索案例庫就能實現(xiàn)對相似問題的預(yù)警,無需重復(fù)預(yù)警過程。目前,案例推理預(yù)警法尚處于不斷完善階段,未能充分認(rèn)識很多預(yù)警對象的知識;
失敗樹預(yù)警法具有簡單、直觀、易理解、針對性強等特點,對特定的問題能夠產(chǎn)生實質(zhì)性的預(yù)警。但是,由于目標(biāo)對象的失敗事件影響因素是多方面的,使失敗樹模型的建立受到目標(biāo)對象的約束;
基于人工神經(jīng)網(wǎng)絡(luò)預(yù)警法具較強的自我學(xué)習(xí)能力、聯(lián)想記憶能力,極佳的并行性、非線性、模糊性、全局性以及容錯性。
目前,存在多種神經(jīng)網(wǎng)絡(luò)預(yù)警模型,每一種都存在自己的優(yōu)勢和弊端,因此在選擇預(yù)警方法時,要根據(jù)具體情況慎重選擇網(wǎng)絡(luò)模型。
4、結(jié)語
隨著網(wǎng)絡(luò)安全事故的升級,網(wǎng)絡(luò)安全問題成為信息社會一個極為重要的研究課題,網(wǎng)絡(luò)預(yù)警技術(shù)應(yīng)運而生,對于維護網(wǎng)絡(luò)信息安全具有積極意義。網(wǎng)絡(luò)預(yù)警方法和理論有很多,主要有Logistic回歸法、案例推理預(yù)警法、失敗樹預(yù)警法和基于神經(jīng)網(wǎng)絡(luò)預(yù)警法四種,且每一種預(yù)警方法都有各自的優(yōu)勢和弊端,因此要根據(jù)具體情況選擇網(wǎng)絡(luò)預(yù)警模型。
參考文獻
[1] 李翔,馬嘉川.信息網(wǎng)絡(luò)安全預(yù)警技術(shù)[J].辦公自動化,2010(16).
[2] 孫紅霞.計算機網(wǎng)絡(luò)安全探討[J].信息與電腦(理論版),2010(04).
關(guān)鍵詞:長株潭城市群;數(shù)據(jù)挖掘;逐步線性回歸;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號:F207文獻標(biāo)識碼:A文章編號:1672-3309(2008)05-0026-05
1.引言
消費、投資和凈出口共同構(gòu)成整個國民經(jīng)濟,消費對國民經(jīng)濟起著支撐作用。2004年統(tǒng)計數(shù)據(jù)顯示,7個主要工業(yè)化發(fā)達國家消費率英國最高達86.53%,其次是美國86.13%,平均比例達到79.93%,消費對經(jīng)濟貢獻相當(dāng)顯著,4個新興經(jīng)濟體中俄羅斯、印度、巴西消費比重分別為65.19%、70.88%、79%,中國的這一比例為54.44%。就地區(qū)而言,2006年湖南消費率為60.95%,長株潭城市群總體消費率僅為46.33%,提升消費對中國經(jīng)濟的貢獻空間廣闊。中國的經(jīng)濟發(fā)展由粗放的產(chǎn)值增長和供應(yīng)推動型,向集約化、需求拉動型轉(zhuǎn)移,將是我國城市經(jīng)濟發(fā)展的必由之路。
城市群這一區(qū)域經(jīng)濟模式對國民經(jīng)濟發(fā)展起著重要作用。美國三大城市群對美國經(jīng)濟整體貢獻率為67%;日本三大城市群對日本經(jīng)濟整體貢獻率超過70%;而中國的珠江三角洲、長江三角洲、京津唐環(huán)渤海灣地區(qū)三大城市群對中國經(jīng)濟整體貢獻率僅達35%。從地區(qū)來看,目前長株潭城市群占全省經(jīng)濟比重為37.9%,影響力、吸引力和輻射力有很大的成長空間。城市群消費水平不僅是人民生活水平的體現(xiàn),也是區(qū)域經(jīng)濟實力和城市群競爭力的重要因素。
當(dāng)前城市群研究,針對城市主要有城市化、城市開發(fā)區(qū)、產(chǎn)業(yè)結(jié)構(gòu)、房地產(chǎn)經(jīng)濟、城市基礎(chǔ)設(shè)施、城市可持續(xù)發(fā)展、城市競爭力、城市發(fā)展戰(zhàn)略等方面,而作為城市集合體的城市群其研究則包含城市群概念與內(nèi)涵、城市群類型和模式、城市群形成機制、城市群空間結(jié)構(gòu)、城市群規(guī)劃、城市群協(xié)調(diào)發(fā)展、城市群發(fā)展階段等領(lǐng)域。總的來說,由于城市和城市群的系統(tǒng)特征,使得該領(lǐng)域的研究具有系統(tǒng)性和復(fù)雜性,目前對于城市競爭力、城市產(chǎn)業(yè)以及城市可持續(xù)發(fā)展研究等方面有著較多關(guān)注。
本文運用數(shù)據(jù)挖掘方法研究城市群消費,以SAS的Enterprise Miner及SEMMA方法為工具,對長株潭城市群消費進行分析。研究發(fā)現(xiàn),影響長株潭城市群消費顯著性因素在于財政、農(nóng)業(yè)和人口因素,分地域影響因素則具多樣性。研究先采用雙重逐步線性回歸對各區(qū)域?qū)哟蜗M的顯著性因素進行篩選,分析其特征及問題;然后參考城市群回歸方程所提取變量,運用BP神經(jīng)網(wǎng)絡(luò)模型對線性回歸模型的預(yù)測進行優(yōu)化;通過回歸模型和神經(jīng)網(wǎng)絡(luò)模型建立城市群問題發(fā)現(xiàn)和預(yù)測模型,對城市群消費進行監(jiān)測。
2.影響消費的顯著性因素分析
研究的目標(biāo)變量為社會消費品零售總額,分15個地區(qū)、3個地級市轄區(qū)以及城市群總體的層次進行系統(tǒng)分析。考慮到各縣市有其各自特征,各統(tǒng)計指標(biāo)對于社會消費品零售總額的貢獻度存在差異,因此在變量選取上應(yīng)盡量考慮到多種因素的共同影響。數(shù)據(jù)樣本來源于1990-2007年《湖南統(tǒng)計年鑒》,由于數(shù)據(jù)統(tǒng)計口徑、一致性、完整性等因素,主要從數(shù)據(jù)源中抽取以下指標(biāo),指標(biāo)及變量說明見表1。
2.1 逐步回歸方法
要考察各因素增長對消費的貢獻度,則采用線性――對數(shù)多元回歸模型。變量同時進入模型可提高擬合優(yōu)度,但解釋變量之間可能存在共線性,估計結(jié)果無法通過顯著性檢驗。綜上,采用逐步回歸分析對多種影響因素中的主要影響因素進行篩選。回歸方法選擇逐步篩選法(Stepwise),逐步篩選法每次引入模型一個最顯著變量,然后考慮從模型中剔除一個最不顯著變量,直到既無變量引入也無變量剔除為止,也稱雙重逐步回歸。模型選擇標(biāo)準(zhǔn)交叉驗證誤差,從驗證數(shù)據(jù)集中選擇最小誤差,這種方法類似于以SSE為標(biāo)準(zhǔn)選擇最佳模型。
2.2 逐步回歸結(jié)果
城市群總體:
Y=-16671192.36+3942965.34lnX10
+3331453.3lnX12-11630474.75lnX15
t= (-2.201590) (3.169381) (5.204872) (-5.789535)
p= (0.0031)(0.0068) (0.0001) (0.0000)
R2=0.989067;R2=0.986725;F=422.1905
按地級市轄區(qū)分長沙、株洲、湘潭三市:
長沙市:Y=-305296767.4+53288202.23lnX1-7664702.56lnX15
t= (-18.53315) ( 22.77283)(-4.635727)
p= (0.0000)(0.0000) (0.0003)
R2=0.973299; R2= 0.969739; F=273.3870
株洲市:Y=-10402017.23+914793.66lnX10
+173356.02lnX11+397082.87lnX12
t= (-22.11772) (5.467101) (3.590788) (3.160809)
p= (0.0000)(0.0001) (0.0030)(0.0069)
R2=0.991155; R2= 0.989259; F=522.9165
湘潭市:Y= 345212.81lnX13-876304.47lnX17
t= (44.09447) (-37.10352)
p= (0.0000) (0.0000)
R2= 0.991513; R2= 0.990983; F= 1869.232
分縣市區(qū)域結(jié)果歸納如表2,變量順序按貢獻度降序排列。
以上回歸截距變量及偏回歸系數(shù)均具有顯著性,縣市域方程省略了方程具體形式。望城縣、炎陵縣與湘潭市地市一級方程采用了逐步回歸建立NOINT方程的方法。
2.3 實驗結(jié)果評價
分縣市區(qū)域結(jié)果中,中心城市長沙市區(qū)、株洲市區(qū)、湘潭市區(qū)模型變量與Y全部正相關(guān)。長沙市區(qū)方程變量貢獻度X18>X12>X17;株洲市區(qū)方程變量貢獻度X1>X12;湘潭市區(qū)的方程X3>X12>X7>X16。所有正相關(guān)變量中,X3對消費均存在正相關(guān)特征,相對突出的是湘潭市區(qū);收入因素X4和X5對消費均產(chǎn)生正向影響;財政因素X12和X13對居民收入、經(jīng)濟和消費環(huán)境產(chǎn)生影響,均與消費呈正相關(guān);所有負(fù)相關(guān)變量中,X2均顯示出與消費顯著負(fù)相關(guān)的性質(zhì),變量見于寧鄉(xiāng)縣、茶陵縣和炎陵縣的方程中,從經(jīng)濟學(xué)角度理解,從業(yè)人員增加可能降低平均工資而影響消費。X14-X18這5個變量主要是教育和醫(yī)療相關(guān)變量,呈現(xiàn)出中心城市正相關(guān),縣域城市負(fù)相關(guān)的特點。
地級市轄區(qū)模型中,從貢獻度看,長沙市X1>X15,株洲市X10>X12>X11,湘潭市X13>X17。從相關(guān)性來看,除株洲市全部正相關(guān)外,長沙市與湘潭市分別存在負(fù)相關(guān)變量X15、X17,長沙市中等學(xué)校教師和湘潭市醫(yī)務(wù)工作人員其人口比例增加將降低消費。值得注意的是,對比長沙市方程與所轄縣市方程發(fā)現(xiàn),X15未進入縣市地區(qū)回歸模型中,湘潭市的X17也未在轄區(qū)方程中出現(xiàn),可見,由于分析的區(qū)域?qū)哟尾煌承┮蛩乜赡鼙谎谏w。
城市群總體方程中,貢獻度X10>X12>X15。農(nóng)業(yè)機械動力貢獻度較高,提高農(nóng)業(yè)機械化程度,會對消費產(chǎn)生較大影響;財政收入構(gòu)成因素較多,它包括國內(nèi)增值稅、企業(yè)所得稅、營業(yè)稅、增值稅和消費稅、個人所得稅等,財政收入增長,會影響社會消費;與財政收入對應(yīng),財政支出包括公務(wù)支出、國防、教育、衛(wèi)生、社會保障及福利、住房和公共環(huán)境等,對消費環(huán)境具有廣泛影響,其本身與消費相關(guān)度較高,但未進入模型;負(fù)相關(guān)變量X15其數(shù)量變化對消費影響相對較大,應(yīng)考慮中等教育隊伍質(zhì)的提升而不是量的增加。
總的來說,雙重逐步回歸所得到的模型,對顯著性變量的篩選是有效的,回歸方程線性擬合和預(yù)測的特征,使其預(yù)測相對誤差較大,以下將通過非線性擬合的方式對城市群消費總量進行擬合預(yù)測。
3.基于BP神經(jīng)網(wǎng)絡(luò)的消費預(yù)測
3.1 BP神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)模擬人腦工作,它由網(wǎng)絡(luò)分布的神經(jīng)元構(gòu)成,神經(jīng)元層次連接成知識處理和表達系統(tǒng)。BP神經(jīng)網(wǎng)絡(luò)屬于前饋神經(jīng)網(wǎng)絡(luò),是多層感知器(MLP)系統(tǒng),它采用反向傳播學(xué)習(xí)的方式對前饋神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。其原理是,對于每個訓(xùn)練實例,反向傳播首先通過網(wǎng)絡(luò)反饋實例,并計算網(wǎng)絡(luò)輸出,輸出節(jié)點的誤差反向傳播到與其相關(guān)的節(jié)點并修改其網(wǎng)絡(luò)權(quán)重值,進行充分迭代后,反向?qū)W習(xí)一定收斂。BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如下所示:
一般而言,隱層的數(shù)量主要要考慮到輸入變量的數(shù)量、訓(xùn)練數(shù)據(jù)中觀測值的數(shù)量、訓(xùn)練數(shù)據(jù)潛在分布的噪聲等級因素等。
3.2 結(jié)構(gòu)與方法
BP神經(jīng)網(wǎng)絡(luò)具備很強的非線性映射能力,模型輸入變量的選取以城市群回歸模型及其變量作為參考,實驗過程中根據(jù)模型擬合效果考慮變量的去留。備選變量主要考慮與目標(biāo)變量的相關(guān)程度,根據(jù)模型需要選擇,最終輸入變量為X6、X10、X12、X13、X19,輸出變量為Y。理論和實踐證明,在數(shù)據(jù)顯著性和可靠性的保證之下,僅含一個隱層的BP神經(jīng)網(wǎng)絡(luò)通過調(diào)整隱層神經(jīng)元的數(shù)量足以解決許多復(fù)雜問題,因此優(yōu)先使用三層網(wǎng)絡(luò)結(jié)構(gòu)。通過實驗,網(wǎng)絡(luò)結(jié)構(gòu)最終選擇5-14-1,即隱層含14個神經(jīng)元,學(xué)習(xí)率0.022。
歸一化采用標(biāo)準(zhǔn)差方法,它通過標(biāo)準(zhǔn)差來除以輸入值減去樣本均值將輸入變量轉(zhuǎn)換到[0,1]之內(nèi),為EM的默認(rèn)方式。激活函數(shù)采用雙曲線Tanh函數(shù),其函數(shù)形式為:f(x)=(exex)/(ex +ex),該函數(shù)值域
[-1,1],符合神經(jīng)網(wǎng)絡(luò)特性,且比其它函數(shù)具有更快的收斂性能。模型選擇采用平均誤差方法選擇平均誤差較小的模型,目標(biāo)變量為區(qū)間型變量適合采用這種方法。考慮對模型進行泛化,將數(shù)據(jù)分區(qū)為訓(xùn)練數(shù)據(jù)、檢驗數(shù)據(jù)、測試數(shù)據(jù),分區(qū)比例為80%、10%、10%,綜合考慮訓(xùn)練數(shù)據(jù)與非訓(xùn)練數(shù)據(jù)的平均誤差大小來選擇模型。
3.3 預(yù)測結(jié)果評價
模型平均誤差參數(shù)及輸出值對照如下:
神經(jīng)網(wǎng)絡(luò)模型中分析模型對樣本規(guī)律的逼近情況,即泛化能力,要考慮訓(xùn)練數(shù)據(jù)與非訓(xùn)練數(shù)據(jù)之間誤差的大小,不能只考慮擬合能力。若非訓(xùn)練數(shù)據(jù)平均誤差小于或接近于訓(xùn)練數(shù)據(jù)平均誤差,則模型反映了數(shù)據(jù)所蘊涵的規(guī)律。在誤差參數(shù)中,檢驗數(shù)據(jù)和測試數(shù)據(jù)平均誤差小于訓(xùn)練數(shù)據(jù)平均誤差,同時模型中預(yù)測值相對誤差小于10%,模型基本上反映出數(shù)據(jù)內(nèi)在的規(guī)律,認(rèn)為該神經(jīng)網(wǎng)絡(luò)模型是合理的。
4.結(jié)論與展望
通過以上研究,可以得出以下結(jié)論:
(1)從消費增長的角度觀察,影響因素存在區(qū)域?qū)哟尾町悾碳はM要注意總體和個體區(qū)別,靈活采取策略。城市群區(qū)域總體要注重農(nóng)業(yè)機械動力的投入、擴大財政收入以及促進中等教育者素質(zhì)和效率的提高;對于收入因素,城市在崗人均工資和農(nóng)民人均純收入對消費均有正向影響,提高城鄉(xiāng)居民收入有利于提高消費;財政收入和支出包含對收入影響因素,也包含影響消費環(huán)境的成分,增加財政收入,加大財政對教育、醫(yī)療、社會保障、環(huán)境等方面的投入,有助于提升消費,從建設(shè)和諧社會的層面來說也是必要措施。固定資產(chǎn)投資對消費影響較小,在結(jié)果中也未得到體現(xiàn)。
(2)從城市發(fā)展的角度看,城市化、工業(yè)化是城市發(fā)展的重要特征,城市人口數(shù)與消費全部正相關(guān),城市化對消費有明顯作用;工業(yè)對消費的影響存在地區(qū)差異,并出現(xiàn)負(fù)相關(guān)項,工業(yè)發(fā)展要注重惠及廣大人民。農(nóng)業(yè)因素中農(nóng)業(yè)機械動力投入均正相關(guān),并表現(xiàn)在城市群方程中,在城市化導(dǎo)致耕地面積減少的情況下,推進城市化與工業(yè)化要更注重提高農(nóng)業(yè)生產(chǎn)率,農(nóng)業(yè)機械化值得重視。教育、醫(yī)療相關(guān)因素共有5個變量,在縣域、長沙市與城市群的模型中全部負(fù)相關(guān),而地級市區(qū)方程則全部正相關(guān),可以認(rèn)為,中心城市醫(yī)療和教育水平高于縣域城市,縣域城市需要針對性地提高醫(yī)療、教育水準(zhǔn)。
(3)從所采用方法來分析,雙重逐步線性回歸具有半自動的提取顯著變量特點,能夠保證顯著性水平,但預(yù)測結(jié)果相對誤差較大,BP神經(jīng)網(wǎng)絡(luò)具有良好的預(yù)測能力,兩者結(jié)合能夠較好的對問題進行認(rèn)識,同時根據(jù)需要可通過遞推方法,對未來數(shù)據(jù)進行預(yù)測。
長株潭城市群的發(fā)展要注重借鑒與實踐相結(jié)合。首先,長株潭城市群具備區(qū)位優(yōu)勢,擁有城市區(qū)域發(fā)展的基本條件,也存在管理體制、重復(fù)建設(shè)、能源和原材料短缺,基礎(chǔ)設(shè)施滯后、污染嚴(yán)重等制約因素。吸取國外城市群發(fā)展經(jīng)驗,不但注重產(chǎn)業(yè)集聚的成本效應(yīng),更注重產(chǎn)業(yè)發(fā)展的質(zhì)量;關(guān)注公共設(shè)施建設(shè),完善公共交通體系;強調(diào)城市群區(qū)域競爭力乃至國際競爭力的發(fā)展,建設(shè)學(xué)習(xí)型城市和城市群;注重提高城市群內(nèi)人民生活質(zhì)量等。其次,長株潭城市群總體消費率發(fā)展空間大。促進消費水平的提高,有利于城市第三產(chǎn)業(yè)的發(fā)展,能推動產(chǎn)業(yè)結(jié)構(gòu)調(diào)整。提高城市群消費的成功經(jīng)驗主要有提高最低工資標(biāo)準(zhǔn)、減免稅收、低收入者消費補貼、拓展信用卡消費、解決住房問題等措施。
隨著長株潭城市群建設(shè)兩型社會展開以及交通同環(huán)、電力同網(wǎng)、金融同城、信息同享、環(huán)境同治“五同”專項規(guī)劃的持續(xù)推進,將使城市群發(fā)展步入一個新的臺階,城市群內(nèi)聯(lián)系將進一步加強,促進城市和經(jīng)濟和諧發(fā)展、人民消費和生活水平將不斷提高。
參考文獻:
[1] 姚士謀、朱英明、陳振光.中國城市群[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2001.
[2] 中國科學(xué)院可持續(xù)發(fā)展戰(zhàn)略研究組編. 2004中國可持續(xù)發(fā)展戰(zhàn)略報告[M].北京:科學(xué)出版社,2004.
[3] 趙勇、白永秀.城市群國內(nèi)研究文獻綜述[J].城市問題.2007,(07):6-11.
[4] 趙偉.城市經(jīng)濟理論與中國城市發(fā)展[M].武漢:武漢大學(xué)出版社,2005.
[5] Roiger?Geatz著、翁敬農(nóng)譯.數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2003.
[6] Randall Matignon. Neural Network Modeling Using Sas Enterprise Miner[M]. Authorhouse,2005.