水產品是冷鏈物流運輸重要對象之一。隨著居民對水產品需求量的增加,也給水產品冷鏈物流行業帶來了諸多挑戰。目前水產品冷鏈物流發展面臨著流通率低,運輸途中損耗高[1]等問題,為了加快水產品冷鏈物流的發展和保證水產品行業的供需平衡,對水產品冷鏈物流需求預測尤為重要。目前用于水產品冷鏈物流需求預測方法有灰色預測、BP神經網絡等[2][3]。但水產品冷鏈物流系統是一個復雜的非線性系統,水產品冷鏈物流的需求量往往受多重因素的影響。過往研究只用單一的預測模型進行研究,不能夠充分挖掘原始數據之間的潛在規律,存在一定的局限性,并未針對單一模型的預測優缺點進行組合創新,而組合模型在其他領域已經表現出較好的優越性[4][5]。
目前的需求預測方法上可以大致分為傳統的統計模型和機器學習模型兩大類[6]。傳統的統計模型結構簡單,無法挖掘數據之間的潛在規律,而機器學習恰恰能夠彌補以往方法的不足。因此基于過往研究的啟發,采用一種殘差優化的BP-SVR組合模型對水產品冷鏈物流的需求量進行預測,首先BP神經網絡能夠通過強大的學習能力挖掘非線性數據之間的規律,再利用SVR模型對重構的殘差序列進行處理[7]。
灰色關聯度方法是用來分析系統內各個要素之間相關程度的方法。其基本思想是通過預測指標數列與其他影響因素數列之間曲線的相似程度,用關聯度來判定各個要素之間關系是否密切,其計算公式如下:

其中:Y(k)為預測指標序列,Xi為影響因素序列,分辨系數ρ的取值范圍在[0,1],一般取ρ=0.5,最后計算預測指標序列和影響因素序列之間的關聯度,計算公式如下:

其中:相關系數的取值區間為[0,1]之間,并按相關程度排序,其值越大,代表二者之間的相關性越強。
BP神經網絡是一種基于誤差進行反向傳遞的多層前饋神經網絡模型,由輸入、隱藏和輸出三層網絡結構組成[8]。它的基本思想是通過反向傳播算法不斷修正多層連接權值和閾值,使網絡的實際輸出值和期望輸出值的誤差平方和最小。BP神經網絡作為機器學習領域中比較重要算法,其優勢在于通過誤差進行前向反饋,使預測值不斷接近真實值。同時BP神經網絡模型清晰,適用于多特征輸入的數據類型。其原理如圖1所示。
其中:Pt為輸入值,Wt為輸入層到隱藏層的連接權值,Vj為隱藏層到輸出層的連接權值,Q是輸出值。

SVR模型作為機器學習中比較流行的監督算法。它根據結構風險最小化原則,可以識別輸入和輸出變量之間的任何聯系,常用于分析數據的預測和分類[9]。SVR由于能較好地解決小樣本、非線性、局部極小值等問題,在物流需求預測中得到成功應用[10]。常用的徑向基高斯函數表達式如下:

最后添加非負松弛因子和拉格朗日乘子ai*和ai,并經過相應變化后,回歸函數為:

其中:
本文選取湖北省2002到2021年相關數據來進行水產品冷鏈物流需求預測。根據供需關系,預測指標選取湖北省居民水產品的消費量(水產品的消費量Y=城鎮常住人口*城鎮水產品人均消費量+農村常住人口*農村水產品人均消費量)[11],影響需求量因素主要劃分為4類:區域經濟因素、供給因素、冷鏈物流技術因素和社會因素,具體如表1所示:

本文數據收集均來源于湖北省統計年鑒、中國漁業年鑒以及中國互聯網絡信息中心。其中互聯網普及率部分年份數據缺失以年平均增長率的方式進行填補,城鎮水產品人均消費量部分年份數據的缺失采取其與城鎮人口進行最小二乘法擬合的方式進行填補,經檢驗擬合誤差為0.22,效果良好,各指標統計數據如表2所示。

由于各個指標之間的計量單位和數量級不同,為了減小誤差,采用最大最小值化方式對數據進行預處理,把各項數據轉化到0,[1]之間,轉化公式為:

對數據進行預處理后,用灰色關聯度法分析預測指標和各個影響因素的相關性,分析結果如表3所示。結果顯示水產品需求量與10個影響因素的相關系數均大于0.8,判定具有強相關性。

組合預測思想是讓每個單一模型充分發揮各自優勢,以提高預測精度[12]。目前使用較多的組合方式是修正單一模型的預測結果[13],另外組合模型的效果好壞也由數據的類型和樣本大小來決定的。由于水產品冷鏈物流需求量具有隨機性和時變性的特點,本文將BP神經網絡和SVR兩種機器學習模型進行組合,以發揮組合模型的優勢。BP神經網絡在對原始數據進行預測時,在訓練時實際值與預測值兩者之間會產生一定的偏差[7],針對產生的偏差值,再采用SVR模型對殘差序列進行訓練,利用SVR模型對BP神經網絡產生的誤差進行修正,預測的效果會更好,圖2是BP-SVR模型建模流程圖。
基于BP-SVR組合預測建模流程:

步驟1:將2002—2021的數據集作為原始序列
步驟2:用BP神經網絡模型對前15年的數據進行訓練和預測,得到預測值
步驟3:令訓練集真實值和其預測值做差,得到殘差序列:Rt=Yt-Yi。
步驟4:用SVR模型對殘差序列Rt進行訓練,再使用SVR模型進行建模,得到殘差序列的預測結果。
步驟5:將BP模型對未來的預測值和SVR預測的誤差Rt*相加,最終得到組合模型的預測結果。
本文共選用兩種不同的模型性能評價指標,包括MAE(平均絕對誤差)、MSE(均方誤差),其表達式如下:

其中:yt和
通過使用Python軟件,調用Sklearn模型庫中的BP神經網絡模型進行訓練,在不斷調試后選擇relu作為激活函數,訓練精度為0.001。由于水產品冷鏈物流需求受10個因素的影響,因此輸入層結點為10,輸出層節點數為1,經調試,隱含層神經元為8個時,訓練效果最佳。數據集一般按照7∶3的比例進行劃分,本文選前15年的數據作為訓練集,后5年作為是驗證集。經過反復的訓練模型,當訓練次數達到100時,誤差幾乎下降到最小。將后5年的數據輸入訓練好的BP神經網絡模型中,得到2017—2021年4年水產品需求量的預測值,從驗證集的擬合曲線可以看到兩者變化趨勢一致,但預測值總是小于真實值,存在一定的滯后性。


同樣還是使用Python軟件,首先調用Sklearn模型庫中的SVR預測模型,用SVR模型對重構的殘差序列進行訓練尋優,核函數為高斯徑向基函數,確定SVR模型中的最優懲罰因子和容忍因子,圖5為測試樣本的誤差變化曲線。
通過上述SVR模型對誤差進行訓練后,把誤差值加到真實值進行殘差修正,得到BP-SVR預測結果,圖6是BP-SVR組合模型擬合圖,可以看到通過SVR模型進行誤差修正后[15],兩者變化的趨勢不僅保持一致,且預測結果更加接近真實值。


為了驗證模型的有效性,將GM模型、BP和SVR模型作為對照組進行模型評價。其中GM模型使用SPSSPRO軟件進行預測,從表4中4項指標中,在單一模型預測中,雖然GM的模型優于BP模型,但GM模型只能預測相關影響因素未來變化趨勢,不能挖掘相關因素和需求量之間的規律。最終,通過實驗證明,BP-SVR模型的4項誤差評價指標均小于其他對照組的模型,其中平均絕對誤差降低了0.56~0.61。這是因為在訓練主體部分的殘差時,針對這一非線性且無規律樣本時,發現SVR模型的預測效果要優于其他模型,且BP神經網絡模型能夠把需求量的影響因素考慮進去,所以BP-SVR這一組合模型更適合水產品需求量的預測。
使用構建好的BP-SVR組合模型對湖北省未來5年水產品需求量進行預測,首先要預測其影響因素的數據作為輸入變量。在這里采用兩階段預測,第一階段先用GM模型對其影響因素進行趨勢預測,第二階段將前20年的歷史數據放入訓練好的BP-SVR模型進行預測,可得到未來5年的水產品需求量。結果如表5所示,可以看到在經濟保持相對穩定的前提下,湖北省未來幾年的水產品冷鏈需求量仍會繼續增長,為了保持水產品冷鏈健康有序發展,需要加大當地冷庫等基礎設施的建設[15],進一步優化和整合冷鏈物流現有的資源,減少運輸途中水產品的流通損耗,以實現物流行業降本增效的目標。


水產品冷鏈物流需求量預測是受外界多種因素影響的系統,對其需求量進行有效預測,不僅可以為相關企業、政府制定發展戰略提供有效的數據依據,且對當地重大冷鏈物流設施樞紐和鐵路冷藏運輸進行合理的布局和統籌規劃提供可靠性的數據。本文在BP神經網絡模型基礎上運用灰色關聯度選取對需求量影響較大的因素作為輸入變量,構建SVR模型對BP神經網絡模型進行誤差修正,根據誤差性能指標結果可知,BP-SVR模型的精度均比單一模型精度高。因此BP-SVR組合模型可有效用于水產品的需求預測中,后續研究可以通過增加新的影響因素指標和別的模型對比來探究新方法。