本文摘要:摘要:針對材料服役性能預測存在誤差大、計算復雜、適用性差等問題,提出了基于數據挖掘的機器學習預測方法。首先闡述了機器學習的應用流程,并總結了常用模型原理及其在材料性能預測中的應用。然后采用多種機器學習模型對RPV鋼的輻照性能進行預測,并通過St
摘要:針對材料服役性能預測存在誤差大、計算復雜、適用性差等問題,提出了基于數據挖掘的機器學習預測方法。首先闡述了機器學習的應用流程,并總結了常用模型原理及其在材料性能預測中的應用。然后采用多種機器學習模型對RPV鋼的輻照性能進行預測,并通過Stacking集成方法提高了模型的預測精度。結果表明,機器學習可用于材料服役性能預測,具有較高的預測精度和可靠性。根據材料服役數據的不同特征選擇合適的學習模型,同時進行模型融合和參數優化,可有效提高模型的預測精度及運算速度。
關鍵詞:數據挖掘;機器學習;服役性能;材料工程;模型預測
引言
材料在服役過程中,由于受光照、熱能、機械能、輻照、潮濕等因素的影響,會逐步發生老化,進而導致材料性能下降甚至失效[1]。材料失效不僅帶來巨大的經濟損失,造成環境污染和資源浪費,甚至可能釀成安全事故,引發各種社會問題。因此,材料服役性能研究和服役壽命預測一直是材料領域的研究熱點之一。在早期研究中,通常將材料放置在自然環境或人工模擬環境中進行大量性能試驗,并在試驗過程中監測材料性能變化情況。
然后找出試驗條件和材料性能之間的關系,進而預測材料服役性能的變化趨勢和服役壽命。但這種方法通常需要投放大量的試樣,試驗周期漫長,無法真實反映出實際環境中不同因素之間的協同作用和綜合效應,在客觀性和普適性方面存在不足[2]。目前,材料服役性能研究主要分為四個方向:加速模擬實驗[3]、力學性能研究[4]、數學模型[5]和數據挖掘[6]。
人工智能論文: 機器學習技術在現代農業氣象中的應用
其中,加速模擬實驗是最簡便可行的方案,但加速過程會掩蓋材料服役的關鍵細節,很難區分不同條件對材料性能影響的細微差別。力學性能研究通過經典力學、斷裂力學、疲勞力學、損傷力學等方法建立材料力學方程,然后進行力學分析和服役性能預測。但對于受力復雜的情況,建立的力學方程非常復雜,并且很難反映材料的真實受力情況。數學模型通過短期試驗推測長期服役條件下材料的性能變化情況,但該方法預測誤差較大、計算復雜、普適性有待進一步研究。數據挖掘通過機器學習對大量材料服役數據進行學習和規律總結,然后對材料服役性能進行預測,目前已經在醫藥[7]、生物信息[8]、圖像識別[9]、故障診斷[10]等領域取得了應用成果。
本文首先闡述了機器學習在材料服役性能預測中的一般流程及常用機器學習模型原理,并對各種模型在材料服役性能研究應用中的特點進行總結。然后具體研究了機器學習在RPV鋼輻照性能預測中的應用,研究結果為材料服役性能預測提供新的方法和參考。
基于機器學習的材料服役性能預測機器學習在材料服役性能預測的一般流程如圖所示,其主要包括兩個過程:1)從材料基因數據庫中選擇要處理的數據并進行預處理、特征選擇和樣本劃分,然后通過機器學習模型進行訓練、測試和評估,并獲得最優模型及模型參數;2)通過最優模型對新數據進行服役性能預測,獲得最終結果。材料基因數據庫為源數據,可源于試驗、測試、仿真計算或其他數據庫。數據庫中數據的來源、格式、完整度等存在差異,需要進行數據清洗使其符合機器學習模型的輸入要求,數據清洗包括異常值剔除、缺失值填充、重復樣本刪除、數字化等。對于量綱不同或存在數量級差異的特征值,還需要進行歸一化或標準化處理,消除量綱帶來的偏差。
數據清洗和預處理后需要進行特征選擇,找出和目標相關度高的特征進行學習和訓練,消除無關特征帶來的噪聲偏差。常用的特征選擇方法有過濾式、包裹式和嵌入式,篩選后的特征子集可提高模型的訓練效率和預測精度。獲得特征子集后,通過分層抽樣將其劃分為訓練集和測試集,測試集約占總樣本的20%~30%。然后選擇合適的模型,并在訓練集上進行模型訓練和參數調優。模型訓練后,根據預測結果進行模型評估,常用的評估指標有平均絕對誤差、均方根誤差和決定系數等。
2機器學習模型
材料服役性能預測屬于有監督學習,常用的機器學習模型有支持向量機、人工神經網絡、決策樹和隨機森林等。
2.1支持向量機
支持向量機的目的是獲得維空間的最優超平面[11]。支持向量機可解決三類問題:1)樣本線性可分,通過硬間隔最大學習一個分類器;2)樣本近似線性可分,通過軟間隔最大學習一個分類器;3)樣本線性不可分,通過核技法將低維非線性問題轉化為高維線性問題,然后學習一個非線性支持向量機。
3機器學習在材料服役性能預測中的應用
材料服役性能與其結構、成分、環境條件等密切相關,不同因素之間相互作用復雜。機器學習可以從大量服役數據中獲得各因素之間的影響規律,并對服役性能進行預測。材料的服役性能主要包括腐蝕、磨損、輻照能和疲勞等。
3.1腐蝕性能預測
材料腐蝕的因素包括化學成分、組織結構、加工工藝、服役條件等,并且不同因素又包含多個維度信息,通常采用人工神經網絡、支持向量機等擬合能力強、適用緯度高的模型進行腐蝕性能預測。杜翠微等[13]采用人工神經網絡建立了碳鋼和低合金鋼的腐蝕速率預測模型,探究了化學成分、環境因素及多因素耦合作用對海水中金屬材料腐蝕性能的影響。訓練數據為我國典型海水區域長達16年的腐蝕樣本,模型輸入為合金主要元素成分、溫度、溶解氧、鹽度、生物附著物等。
當僅考慮環境因素時,模型的預測精度達到75%;當同時考慮環境因素和材料元素含量時,模型的預測精度可提高到90%以上。LY12CZ鋁合金是飛機承重構件的主要材料,劉延利等[14]通過鹽霧試驗獲得了鋁合金材料的腐蝕試樣,并對試樣進行疲勞試驗和腐蝕深度測量。然后建立了基于腐蝕溫度、腐蝕時間、最大點蝕深度及疲勞額定強度的人工神經網絡模型,模型對試樣最大腐蝕深度的預測誤差為7.24%,對疲勞額定強度的預測誤差為1.63%。
為驗證RENiCu合金鑄鐵在堿液中的腐蝕性能,王玉榮等[15]通過靜態質量損失腐蝕試驗獲得了35組腐蝕樣本數據,然后建立了合金成分、腐蝕時間、堿液溫度與合金鑄鐵腐蝕深度的RBF神經網絡模型。RBF神經網絡對合金鑄鐵腐蝕深度的預測誤差為8.09%,對樣本的耐腐蝕等級和耐腐蝕評價準確率達到100%。海底管道腐蝕速率的有效預測可減少管道失效風險,李響等[16]基于Q235鋼材海洋掛片的腐蝕數據建立了環境溫度、含氧量、含鹽量、PH和腐蝕速率之間的SVM模型。
首先采用遺傳算法對模型參數進行優化,優化后的模型對試樣腐蝕速率的預測誤差小于3%,優于BP神經網絡模型。針對長輸管道腐蝕速率的預測,馬鋼等[17]建立了PSOSVM模型,模型輸入為
4基于模型融合的RPV鋼輻照性能預測
4.1輻照數據
本文所用的RPV鋼輻照數據來源于文獻數據[30,31]及試驗數據,共有390條有效樣本,數據分布如圖所示。首先剔除與輻照性能相關性較弱的特征,最終選擇中子注量、注量率、輻照溫度、Cu含量、Ni含量、Mn含量、Si含量、含量作為模型輸入,輻照后的轉變溫度增量ΔRTNDT作為模型輸出。
4.2數據劃分
由于RPV鋼輻照數據樣本較小且離散性大,因此需要保證數據劃分后仍保持原始數據的分布規律,避免數據不均衡造成預測偏差。首先對相關性較高的Cu含量進行區間劃分并標記為個類別,然后按類別進行分層抽樣,抽樣結果如表所示。其中分層抽樣后的樣本分布與原數據基本相同,最大誤差為4.76%,小于隨機抽樣的8.57%。分層抽樣后,將80%的數據用作訓練,20%用作測試。
5總結與展望
本文從機器學習流程出發,首先概括了常用機器學習模型的原理及其在材料服役性能預測中的應用。然后采用多種機器學習模型對RPV鋼的輻照性能進行預測,并采用Stacking方法提高了模型的預測精度,主要結論如下:(1)機器學習可用于材料服役性能預測,具有較高的預測精度和可靠性;(2)模型選擇應考慮材料服役數據的質量、模型特點及樣本數量;(3)重要特征提取、模型融合和參數優化算法可提高模型的精度和運算效率。目前,機器學習在材料服役性能預測中的應用仍處于初級階段,大量工作仍需進一步開展。如豐富完善已有的材料基因數據庫、開展更高精度機器學習算法研究、優化機器學習模型參數,提高運算效率、結合物理模型及相關理論,增強機器學習模型的解釋性。
作者:王紅珂,劉嘯天,林磊,孫海濤,呂云鶴,張晏瑋,薛飛
轉載請注明來自發表學術論文網:http://www.cnzjbx.cn/dzlw/27796.html