老熟妇视频,99久久综合欧美精品二区,国产视屏精品系统分享,伊人婷婷激情在线

浙江國檢檢測

首頁 檢測百科

分享:基于粒子群優(yōu)化后隨機森林模型的管道內(nèi)腐蝕風(fēng)險預(yù)測

2025-05-27 12:38:34 

隨著國家經(jīng)濟的高速發(fā)展,對油氣資源的需求越來越大,油氣田開采力度不斷擴大,油氣井?dāng)?shù)量不斷增加,集輸管道里程持續(xù)增加,管道內(nèi)部輸送介質(zhì)的腐蝕性加劇,使得與此相關(guān)的管道腐蝕問題越來越嚴重。腐蝕帶來的管道爆裂、原油泄漏等問題嚴重影響了國家和企業(yè)的發(fā)展。原油和天然氣為易燃、易爆物質(zhì),有時還含有硫化氫等有毒氣體,石油與天然氣管道始終是能源行業(yè)安全監(jiān)管的重點領(lǐng)域之一。油氣集輸管道輸送工藝和介質(zhì)復(fù)雜、內(nèi)腐蝕影響因素眾多,腐蝕發(fā)生發(fā)展機制類型多樣,例如塔河油田管道所處工況環(huán)境復(fù)雜,具有“五高一低”特點(高H2O、高CO2、高H2S、高Cl-、高礦化度、低pH),極易造成管道腐蝕與穿孔[1]。在管道軸向里程位置、管道環(huán)向時鐘位置上,腐蝕的發(fā)生各具特點,多數(shù)情況下局部腐蝕的出現(xiàn)由多個因素或機制協(xié)同作用引起,這使得內(nèi)腐蝕風(fēng)險預(yù)測更為困難。

近年來,隨著機器學(xué)習(xí)、人工智能等大數(shù)據(jù)技術(shù)的發(fā)展,機器學(xué)習(xí)技術(shù)逐漸進入工業(yè)領(lǐng)域,并在油氣管道缺陷智能識別[2]、管道漏磁內(nèi)檢測、管道剩余壽命預(yù)測[3]等方面發(fā)揮著重要作用。MICHAEL等[4]基于油氣田集輸管道在線內(nèi)檢測數(shù)據(jù)訓(xùn)練貝葉斯網(wǎng)絡(luò),使用訓(xùn)練好的模型對沒有在線檢測數(shù)據(jù)的管道進行預(yù)測,結(jié)果表明,該貝葉斯網(wǎng)絡(luò)模型可以對管道的內(nèi)部腐蝕進行準確的預(yù)測。凌曉等[5]充分利用某輸油管道檢測數(shù)據(jù)集,針對反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)模型的起始權(quán)值和閾值的優(yōu)化問題,采用遺傳算法(GA)進行參數(shù)尋優(yōu),有效克服了單一BPNN模型易陷入局部極值的問題,大幅提升預(yù)測精度,為管道完整性管理提供可靠的理論依據(jù)和決策支持。

作者以塔河油田歷史失效數(shù)據(jù)為基礎(chǔ),利用皮爾遜(Pearson)相關(guān)系數(shù)和灰色關(guān)聯(lián)度分析的方法明確管道內(nèi)腐蝕主控因素,通過粒子群(PSO)算法對隨機森林(RF)算法進行超參數(shù)優(yōu)化,基于優(yōu)化后的算法建立塔河油田管道內(nèi)腐蝕風(fēng)險預(yù)測模型,為油氣田管道的腐蝕預(yù)警與防護提供幫助。

油氣集輸管道腐蝕的影響因素主要包括溫度、CO2/H2S含量、水化學(xué)、流速、鋼的成分和表面狀態(tài)等,鋼表面腐蝕產(chǎn)物性質(zhì)會隨著影響因素的變化而改變,從而對腐蝕速率產(chǎn)生顯著影響[6]

當(dāng)H2S和CO2同時存在時,H2S腐蝕和CO2腐蝕之間存在協(xié)同和競爭關(guān)系,腐蝕過程比較復(fù)雜[7]。SKILBRED等[8]認為,當(dāng)系統(tǒng)中同時存在H2S和CO2時,可以根據(jù)其分壓比p(CO2)/p(H2S)大致判斷腐蝕主導(dǎo)因素是H2S還是CO2。當(dāng)腐蝕過程以H2S的腐蝕反應(yīng)為主時,主要產(chǎn)生各種類型的鐵硫化物;當(dāng)腐蝕反應(yīng)由CO2腐蝕反應(yīng)控制時,主要產(chǎn)生FeCO3;當(dāng)腐蝕反應(yīng)是兩種氣體腐蝕共同控制時,會同時生成各種鐵硫化物和FeCO3。

溫度對腐蝕的影響主要通過影響腐蝕產(chǎn)物的形成來實現(xiàn)。在不同環(huán)境條件下,隨著溫度升高,鋼表面生成的腐蝕產(chǎn)物膜可能對腐蝕有促進作用,也可能有抑制作用。ABD等[9]使用HYSYS軟件模擬了濕氣管道的CO2腐蝕。當(dāng)溫度低于40 ℃時,由于碳酸鐵層的高溶解度,管道表面沒有形成保護膜,腐蝕速率隨溫度的升高而增大;當(dāng)溫度超過40 ℃時,管壁上形成致密的腐蝕產(chǎn)物膜,對基體起到保護作用,腐蝕速率降低。

SUN等[10]研究發(fā)現(xiàn),pH可以通過影響電化學(xué)機制和表面保護性FeCO3膜的形成來影響碳鋼的CO2腐蝕。在多相流工況下,當(dāng)pH高于6.2時,鋼表面能夠形成保護性的腐蝕產(chǎn)物膜,因此pH升高能夠明顯降低腐蝕速率。MORAES等[11]的研究表明,pH升高會抑制H+的陰極反應(yīng),使Fe的陽極溶解減緩,因此腐蝕速率降低。此外,鋼表面形成的碳酸鹽腐蝕產(chǎn)物膜能夠?qū)︿摶w起到保護作用,而溶液pH升高會抑制碳酸鹽的溶解,進而降低腐蝕速率。

作者采用粒子群優(yōu)化算法對隨機森林模型的超參數(shù)進行優(yōu)化,該算法受鳥類捕食行為的啟發(fā),依靠群體智能隨機搜索,通過粒子之間相互合作共享位置和適應(yīng)度信息逐漸收斂到全局最優(yōu)解[12]。如果將參數(shù)的最優(yōu)解假設(shè)為其值域空間中一個兼具位置和速度屬性的粒子,且尋優(yōu)過程中的最優(yōu)解由適應(yīng)值(Fitness value)決定[13],具體迭代公式如下:

式中:分別為粒子i在第j次迭代過程中第n維的速度和位置;是粒子i在第n維中自身最優(yōu)解的位置,是群體在第n維中全局最優(yōu)解的位置,每個粒子通過不斷追蹤這兩個最優(yōu)解進行更新;c1c2為學(xué)習(xí)因子;rand(0,1)為由計算過程隨機生成的(0,1)區(qū)間的隨機數(shù);w為慣性權(quán)重。

隨機森林算法是一種高效且用戶友好的集成機器學(xué)習(xí)技術(shù),可用于開發(fā)預(yù)測模型,通常用于回歸、分類以及特征選擇問題。隨機森林的概念最早在1995年由HO[14]提出,隨后BREIMAN[15]在2001年提出隨機森林算法并對該算法進行了系統(tǒng)闡述。隨機森林模型在回歸問題上應(yīng)用廣泛,可有效解決傳統(tǒng)機器學(xué)習(xí)模型在訓(xùn)練和預(yù)測過程中容易出現(xiàn)的過擬合問題,與其他機器學(xué)習(xí)模型相比,其訓(xùn)練速度更快、魯棒性更強、預(yù)測效果更好[16]圖1為隨機森林算法的模型。

圖 1隨機森林算法的模型
Figure 1.Model of random forest algorithm

基于PSO-RF算法的管道內(nèi)腐蝕風(fēng)險預(yù)測模型(以下簡稱PSO-RF模型)的建模流程如圖2所示。建模主要步驟包括:確定模型的輸入輸出變量;劃分數(shù)據(jù)集為訓(xùn)練集和測試集;模型參數(shù)的優(yōu)選和優(yōu)化;模型訓(xùn)練和評估。

圖 2基于PSO-RF算法的管道內(nèi)腐蝕風(fēng)險預(yù)測模型的構(gòu)建流程
Figure 2.Construction process of pipeline internal corrosion risk prediction model based on PSO-RF algorithm

在建立的PSO-RF模型中,選擇管道腐蝕速率作為模型輸出變量,管道腐蝕影響因素作為輸入變量。值得注意的是,樣本數(shù)據(jù)在使用之前需經(jīng)過歸一化處理,以消除管道腐蝕因素數(shù)據(jù)集單位和維度的影響,提高獲得最優(yōu)解的速度,防止數(shù)據(jù)爆炸[17]。另外,考慮到某些特征如腐蝕影響因素與腐蝕速率的相關(guān)性較弱,即對腐蝕速率的貢獻率較小,這些弱相關(guān)特征的存在會對模型的訓(xùn)練產(chǎn)生一定的干擾,導(dǎo)致模型泛化能力差,預(yù)測精度變低。故利用Pearson相關(guān)性分析和灰色關(guān)聯(lián)度分析來確定影響腐蝕速率的主控因素,進而確定模型的輸入變量。

數(shù)據(jù)集的劃分對模型的訓(xùn)練和測試至關(guān)重要。在訓(xùn)練模型之前,首先使用sklearn庫中的數(shù)據(jù)集劃分函數(shù)train_test_split()對數(shù)據(jù)樣本進行隨機劃分,訓(xùn)練集和測試集樣本分別占總樣本數(shù)的80%和20%,其中訓(xùn)練集用于訓(xùn)練和構(gòu)建模型,測試集用于模型的預(yù)測和評估檢驗。

對于隨機森林算法而言,其超參數(shù)的選擇將直接影響模型預(yù)測的準確性,而一般的網(wǎng)格搜索方法有一定的局限性,尋優(yōu)次數(shù)較多且容易陷入局部最優(yōu)解。為了盡可能縮小預(yù)測誤差,找到全局最優(yōu)解,作者選擇粒子群算法對參數(shù)進行優(yōu)選和優(yōu)化,然后再使用隨機森林算法對相關(guān)數(shù)據(jù)進行訓(xùn)練和預(yù)測。

最后使用訓(xùn)練集對PSO-RF模型進行訓(xùn)練,并使用測試數(shù)據(jù)集來評估模型的準確性。作者選擇決定系數(shù)(R2)、平均絕對誤差(σMAE)和均方根誤差(σRMSE)來評估模型的預(yù)測精度[18],計算公式分別見式(3)~(5)。決定系數(shù)R2的值介于0~1,其值越接近于1,表示模型的擬合度越好,模型預(yù)測結(jié)果越準確[19]。

式中:n表示樣本總量;yi分別表示測試樣本的預(yù)測值和實際值。

作者以Python編程語言為基礎(chǔ),使用Spyder.8軟件進行編程。從塔河油田歷年失效分析報告中的失效數(shù)據(jù)中共收集了603組數(shù)據(jù)作為預(yù)測模型的數(shù)據(jù)集。預(yù)測模型的輸入變量為影響管道腐蝕的因素,包括以下六個方面:總壓力、溫度、H2S分壓、CO2分壓、Cl-含量和含水率。輸出變量為管道在服役期間的平均腐蝕速率,利用首次穿孔刺漏時間、管線投產(chǎn)時間以及管線壁厚計算得到。表1為所有數(shù)據(jù)的范圍及統(tǒng)計特性,使用最大值、最小值和平均值來描述。

表 1PSO-RF模型的特征數(shù)據(jù)
Table 1.Characteristic data of PSO-RF model

利用Pearson相關(guān)性分析以及灰色關(guān)聯(lián)度分析方法對油田管道腐蝕的主控因素進行研究,對輸入數(shù)據(jù)進行數(shù)據(jù)降維,提高模型的準確性。其中,Pearson相關(guān)系數(shù)(r)廣泛用于評估兩個變量之間的相關(guān)程度,其定義為協(xié)方差和標準差的商,它的值介于-1~+1。正值表示正線性相關(guān),負值表示負線性相關(guān)。該值越接近+1或-1,線性相關(guān)性越強。而灰色關(guān)聯(lián)度分析是根據(jù)各因素之間相似或者相異的發(fā)展趨勢,也就是“灰色關(guān)聯(lián)度”來衡量各因素或系統(tǒng)之間的關(guān)聯(lián)程度[20]。

塔河油田輸油管道腐蝕因素與腐蝕速率的Pearson相關(guān)性分析結(jié)果如圖3所示。圖中用藍色表示正相關(guān),紅色表示負相關(guān),顏色的深淺表示相關(guān)性的強弱(完全不相關(guān)時為白色,完全相關(guān)時為深藍或深紅)。從圖3中可以看出,CO2分壓、溫度、Cl-含量和H2S分壓與腐蝕速率的相關(guān)性為強相關(guān);含水率和壓力與腐蝕速率的相關(guān)性為弱相關(guān)。

圖 3腐蝕因素與腐蝕速率的Pearson相關(guān)性分析結(jié)果
Figure 3.Analysis result of Pearson correlation between corrosion factors and corrosion rate

塔河油田輸油管道腐蝕因素與腐蝕速率的灰色關(guān)聯(lián)度分析結(jié)果如圖4所示。從圖4中可以看出,管道內(nèi)腐蝕速率與溫度、壓力、H2S分壓、CO2分壓、Cl-含量和含水率等影響因素的灰色關(guān)聯(lián)度從大到小排序為:CO2分壓(0.29)、溫度(0.233)、Cl-含量(0.218)、H2S分壓(0.211)、含水率(0.031)、壓力(0.017)。

圖 4腐蝕因素與腐蝕速率的灰色關(guān)聯(lián)度
Figure 4.Gray correlation degree between corrosion factors and corrosion rate

綜合以上分析結(jié)果,確定CO2分壓、溫度、Cl-含量和H2S分壓這4個因素作為塔河油田管道內(nèi)腐蝕因素的主控因素。

超參數(shù)的選擇將直接影響模型預(yù)測的準確性,為提高隨機隨機森林模型的預(yù)測精度,使用粒子群優(yōu)化算法尋求模型參數(shù)的最優(yōu)值,在參數(shù)尋優(yōu)過程中,使用R2作為粒子群優(yōu)化算法的適應(yīng)度值。RODRIGUEZ-GALIANO等[21]通過優(yōu)化隨機森林中決策樹的個數(shù)(n_estimators)和構(gòu)建最優(yōu)決策樹模型時考慮的最大特征數(shù)(max_features)來提高模型的準確性;除此之外,還有一些學(xué)者將決策樹最大深度(max_depth)[22]作為優(yōu)化參數(shù)。本文中使用粒子群優(yōu)化的隨機森林超參數(shù)包括:n_estimators、max_features和max_depth。設(shè)置參數(shù)的搜索區(qū)間如下:n_estimators∈[10,5000],max_features∈[0,5],max_depth∈[10,1000]。粒子群規(guī)模N=10,最大迭代次數(shù)K=200,慣性權(quán)重因子w=0.4,學(xué)習(xí)因子c1=c2=2。通過2 000次尋優(yōu)最終確定隨機森林模型的最佳參數(shù)組合為[n_estimators:1656,max_features:,max_depth:96]。

將Pearson相關(guān)性分析和灰色關(guān)聯(lián)度分析后得到的4個腐蝕主控因素CO2分壓、溫度、Cl-含量和H2S分壓作為隨機森林模型的輸入?yún)?shù),結(jié)合前面所得的參數(shù)最優(yōu)值,通過訓(xùn)練集數(shù)據(jù)訓(xùn)練并建立塔河油田金屬管道腐蝕風(fēng)險預(yù)測模型,使用測試集數(shù)據(jù)對模型的精度和可靠性進行評估。

首先為驗證使用Pearson相關(guān)性分析和灰色關(guān)聯(lián)度分析進行腐蝕主控因素選擇即特征降維的有效性,將特征降維前后PSO-RF模型的預(yù)測結(jié)果進行對比,如圖5所示。從圖5中可以看出,在特征降維之前即模型輸入特征為所有腐蝕因素時,模型預(yù)測的腐蝕速率與實際腐蝕速率差別較大,R2為0.81,模型預(yù)測精度較低。這是因為輸入特征中存在弱相關(guān)因素,其對模型的預(yù)測造成了干擾,導(dǎo)致模型預(yù)測精度變低。特征降維后,僅以腐蝕主控因素作為模型的輸入特征,此時模型的R2提升至0.97,預(yù)測精度有了大幅提升,模型預(yù)測的腐蝕速率更接近于實際值,預(yù)測誤差大大降低。這表明Pearson相關(guān)性分析和灰色關(guān)聯(lián)度分析相結(jié)合得到的腐蝕主控因素包含了影響腐蝕的主要信息,且該方法從腐蝕影響因素中去除了冗余信息,有效提高了模型預(yù)測精度。

圖 5特征降維前后PSO-RF模型的預(yù)測結(jié)果對比
Figure 5.Comparison of prediction results of PSO-RF model before and after feature dimension reduction

在復(fù)雜的機器學(xué)習(xí)模型訓(xùn)練的過程中,經(jīng)常會出現(xiàn)過擬合現(xiàn)象,從而導(dǎo)致模型泛化能力差。為驗證該PSO-RF模型是否存在過擬合問題,將訓(xùn)練集和測試集數(shù)據(jù)輸入該模型進行預(yù)測,結(jié)果如圖6所示。表2列出了該模型在訓(xùn)練集和測試集上的預(yù)測誤差及擬合情況??梢园l(fā)現(xiàn),PSO-RF模型在訓(xùn)練和測試過程中都有較好的擬合效果,R2分別為0.99和0.97,且訓(xùn)練集和預(yù)測集誤差相差不大,表明該模型在對未知數(shù)據(jù)的預(yù)測過程中也有很好的表現(xiàn),沒有出現(xiàn)過擬合現(xiàn)象。

圖 6PSO-RF模型對訓(xùn)練集和測試集的預(yù)測結(jié)果
Figure 6.PSO-RF model prediction results of training and testing samples
表 2PSO-RF模型訓(xùn)練集和測試集的預(yù)測誤差
Table 2.PSO-RF model prediction errors of training and testing samples

為驗證PSO-RF模型的預(yù)測效果,另外設(shè)置三個對比模型:BP神經(jīng)網(wǎng)絡(luò)(BPNN)模型、網(wǎng)格搜索優(yōu)化的隨機森林(GS-RF)模型以及遺傳算法優(yōu)化的隨機森林(GA-RF)模型。所有模型的輸入特征均為降維后的特征,模型預(yù)測對比結(jié)果如圖7所示。

圖 7不同模型預(yù)測結(jié)果對比
Figure 7.Comparison of prediction results of different models

圖7可知,BPNN模型的預(yù)測效果最差,R2僅為0.83,腐蝕速率預(yù)測值與實際值差別較大,誤差最大,σRMSEσMAE分別達到0.381和0.179。其原因在于BPNN模型易陷入局部最小值,從而影響模型的預(yù)測精度。相對于BPNN模型,GS-RF模型和GA-RF模型的預(yù)測效果有了顯著的提升,R2分別達到0.87和0.92,其預(yù)測誤差也明顯減小,σRMSE分別降為0.337和0.251,σMAE分別降為0.127和0.063,預(yù)測精度明顯提升。其中GA-RF模型的尋優(yōu)次數(shù)遠少于GS-RF模型,且能夠發(fā)揮遺傳算法的全局尋優(yōu)能力。PSO-RF模型的預(yù)測結(jié)果最優(yōu),R2達到0.97,且誤差最小,σRMSEσMAE分別為0.161和0.027,模型的預(yù)測準確度大大提升,相比于GA-RF模型,PSO-RF模型除了具有全局尋優(yōu)能力,同時擁有高效的信息共享機制,因此能夠快速收斂至全局最優(yōu)值,使隨機森林模型獲得最優(yōu)超參數(shù)組合。

4種模型的腐蝕速率預(yù)測值與實際值的相關(guān)性分析分別如圖8所示。結(jié)果表明,在這4種模型中,PSO-RF模型的預(yù)測值與實際值最接近,除個別數(shù)據(jù)點之外,其余數(shù)據(jù)點基本可以擬合為一條直線。經(jīng)計算得BPNN、GS-RF、GA-RF和PSO-RF模型的腐蝕速率預(yù)測值與實際值的決定系數(shù)R2分別為0.83、0.87、0.92和0.97。其中,PSO-RF模型的R2最接近1,因此其預(yù)測效果最優(yōu)。

圖 8各模型的腐蝕速率預(yù)測值與實際值的相關(guān)性分析
Figure 8.Correlation analysis between the predicted corrosion rates of different models and the actual values

隨機森林模型作為數(shù)據(jù)驅(qū)動的集成類模型,比一般的淺層模型層數(shù)更多,在預(yù)測過程中能夠綜合考慮多個環(huán)境因素對腐蝕速率的影響,對于復(fù)雜結(jié)構(gòu)的腐蝕數(shù)據(jù)集預(yù)測有較好的適用性;而粒子群優(yōu)化算法不僅具有全局尋優(yōu)能力,還擁有高效的信息共享機制。因此集成粒子群優(yōu)化算法和隨機森林算法建立的PSO-RF模型泛化能力最強,預(yù)測性能最優(yōu),這一模型的建立可為塔河油田集輸管道的智能腐蝕風(fēng)險管理提供思路和方法,以實現(xiàn)更好的安全管理,從而避免潛在事故。

(1)通過Pearson相關(guān)性分析和灰色關(guān)聯(lián)度分析,得到塔河油田集輸管道內(nèi)腐蝕的4個主控因素:CO2分壓、溫度、Cl-含量和H2S分壓,以此作為模型輸入特征使得模型預(yù)測精度大幅提升。

(2)采用PSO算法對RF的超參數(shù)進行優(yōu)化,通過實例研究,證明該方法可有效避免模型尋優(yōu)過程中陷入局部極值的問題,快速獲得全局最優(yōu)解,并大幅提升預(yù)測精度。在尋優(yōu)次數(shù)相同的情況下,PSO的收斂速度比GA快,且PSO的尋優(yōu)次數(shù)僅需2 000次,遠低于網(wǎng)格搜索的尋優(yōu)次數(shù)。

(3)針對塔河油田管道復(fù)雜的腐蝕數(shù)據(jù),PSO-RF模型的整體預(yù)測誤差較小,σRMSEσMAE分別為0.161和0.027,R2等于0.97,與BPNN、GS-RF和GA-RF模型相比,該模型預(yù)測精度最高,在預(yù)測油氣管道腐蝕速率方面具有良好的性能。



文章來源——材料與測試網(wǎng)