摘要:本文介紹了發(fā)生在某電廠的一例西門子epermXP控制系統(tǒng)非典型故障;分析了其原因并介紹了處理過(guò)程。
火電廠熱控技術(shù)規(guī)范要求:機(jī)組DCS控制器必須冗余配置;主控制器接收輸入信號(hào),經(jīng)過(guò)邏輯運(yùn)算后,輸出控制指令至現(xiàn)場(chǎng)執(zhí)行機(jī)構(gòu);而從控制器處于熱備用狀態(tài),它同時(shí)接收輸入信號(hào),其CPU邏輯運(yùn)算后,輸出指令跟蹤主控制器的輸出,一旦主控制器故障,主控制器的所有邏輯功能立即無(wú)擾切換到從控制器上,以確保該控制器的控制對(duì)象正常運(yùn)行。
一、非典型故障
8月24日,某電廠3號(hào)機(jī)組穩(wěn)定在250MW負(fù)荷上以協(xié)調(diào)方式運(yùn)行,23:13運(yùn)行突然發(fā)現(xiàn):報(bào)警窗上出現(xiàn)“AP計(jì)算機(jī)總線故障”等眾多報(bào)警,機(jī)組協(xié)調(diào)隨即退出。電廠DCS值班人員檢查發(fā)現(xiàn)AP34計(jì)算機(jī)原主機(jī)(上層機(jī))故障燈亮,AP34負(fù)責(zé)主機(jī)功頻控制器SIMADYN及ETS主機(jī)保護(hù)SIEMENSS5-95F控制器與其它控制器的通訊,主機(jī)抗燃油泵的控制邏輯也在此AP中。AP34計(jì)算機(jī)原主機(jī)(上層機(jī))故障后,自動(dòng)切為原備用機(jī)(下層機(jī))為主機(jī)運(yùn)行,SIEMENSS5-95F控制器控制的所有主機(jī)主汽門及調(diào)門電磁閥雙線圈的一個(gè)線圈失電;原為主的左側(cè)IM614鏈路的IM614模塊的F綠燈(Function)滅、GLE紅燈(GroupLevelError)亮;原為從的右側(cè)IM614鏈路切為主,即:F綠燈亮。DCS值班人員于次日凌晨00:11手動(dòng)復(fù)位上層AP,但故障無(wú)法消除,00:25停電拔插CPU模塊后,CPU恢復(fù)運(yùn)行3秒左右自動(dòng)停止,同時(shí)作為主且起作用的右側(cè)IM614模件的GLE紅燈全亮,主機(jī)控制油畫面元件變紅,所有I/O模塊紅燈閃亮。電廠檢修在電氣開(kāi)關(guān)側(cè)的二次控制回路做好模擬措施(主要針對(duì)抗燃油泵)后,拔出所有的I/O模件,然后再停運(yùn)更換上層控制器的CPU、IM614等模塊,故障仍無(wú)法消除。至此,只有下層控制器AP仍在運(yùn)行,其余I/O模塊、IM614均退出運(yùn)行,機(jī)組保持在故障發(fā)生時(shí)的250MW運(yùn)行。
二、故障原因分析
由于AP34控制器的下層機(jī)(原備用機(jī)、現(xiàn)為主機(jī))處于主運(yùn)行狀態(tài),且運(yùn)行正常,所以在ES680工程師站上利用pgmaster指令對(duì)其進(jìn)行連接,執(zhí)行21和22選項(xiàng)(分別是DiagnosticH-Errorblock及DiagnosticDX4),生成診斷文件hdberror.txt和dx4.txt。
查看診斷文件hdberror.txt,有以下記錄:
464:Err35Reserve-Master-UmschaltungwegenMasterausfallZeitstempel=09.08.2423:13:57(這條信息表明AP34在23:13發(fā)生了主從切換)
472:Err33ParallelkopplungsfehlerZeitstempel=09.08.2500:11:36(這條信息表明AP34在00:11發(fā)生主從切換之后,出現(xiàn)了并口連接錯(cuò)誤)
488:Err32Synchronisationsfehler32im
Anwenderprogramm
Zeitstempel=09.08.2500:25:32
(這條信息表明AP34在00:25發(fā)生并口連接錯(cuò)誤之后,接著又出現(xiàn)了CPU的同步連接故障)
查看診斷文件dx4.txt,有以下記錄:
1292009.08.2423:13:57Err1037040dh:OB37-Aufruf->EintraginH-FehlerDB
(此條信息表明AP34的故障CPU在23:13發(fā)生故障時(shí)調(diào)用OB37組織塊)
1322009.08.2423:13:57Err2189088dh:Redundanz-Umschaltungim614.2
1352009.08.2423:13:57Err2190088eh:Redundanz-Umschaltungim614.3
(這兩條信息表明AP34的IM614在23:13發(fā)生主從切換)
1892009.08.240:25:24Err24000960h:FehlerbeiZeit-Synchronisation
(此條信息表明在0:25時(shí)間同步發(fā)生錯(cuò)誤)
2042009.08.250:25:32Err371299109h:OB026UeberschreitenderOB1Zykluszeit
(此條信息表明在0:25系統(tǒng)對(duì)組織塊OB26進(jìn)行調(diào)用)
2102009.08.250:25:32Err21770881h:TotalAusfahlim614.2
2162009.08.250:25:32Err21780882h:TotalAusfahlim614.3
(此兩條信息表明在0:2P34的兩路IM614均發(fā)生故障,所有I/O模件與AP34控制器的通訊中斷)
根據(jù)上述信息得知,AP34控制器發(fā)生主從切換是因?yàn)檐浖?duì)組織塊OB37調(diào)用所致。OB37屬于系統(tǒng)程序,它在軟件運(yùn)行過(guò)程中,檢查到有錯(cuò)誤發(fā)生時(shí)被調(diào)用。其結(jié)果是向CPU本身發(fā)出一條STOP指令,使其停止運(yùn)行,同時(shí)將發(fā)生的*個(gè)錯(cuò)誤作為錯(cuò)誤記錄被CPU記錄下來(lái)。之后,下層主控制器又進(jìn)行了OB26的組織塊調(diào)用。在上層從控制器進(jìn)行啟動(dòng)的時(shí)候與下層主控制器進(jìn)行同步連接,當(dāng)這一同步連接超出系統(tǒng)所設(shè)定的循環(huán)周期時(shí),系統(tǒng)認(rèn)為同步連接故障,發(fā)生ZYK錯(cuò)誤,此時(shí)調(diào)用OB26組織塊。因此,總結(jié)如下:上層主控制器在運(yùn)行過(guò)程中檢測(cè)到發(fā)生錯(cuò)誤,從而調(diào)用OB37程序使其停止運(yùn)行,切換到下層控制器運(yùn)行。在切換之后,IM614也發(fā)生了相應(yīng)的切換(右側(cè)IM614鏈路為主且在正常運(yùn)行狀態(tài)),且切換正常。之后,在維護(hù)人員試圖重啟上層原主控制器的時(shí)候,由于并口連接錯(cuò)誤的存在,導(dǎo)致主從控制器發(fā)生了同步連接錯(cuò)誤,從而系統(tǒng)調(diào)用OB26組織塊,發(fā)生了右側(cè)IM614與下層的主AP控制器通訊中斷的故障。
西門子專家在收集epermXP使用故障匯總經(jīng)驗(yàn)認(rèn)為:epermXP控制系統(tǒng)的主從AP控制器在使用硬件版本<9的IM324-3UR11主從控制器通訊模件時(shí),或者在使用版本為1的IM304-3UB11的主從控制器通訊模件時(shí)可能會(huì)發(fā)生此類故障。
三、故障處理
此類故障由軟件故障引起,只有通過(guò)離線下載*代碼才能解決問(wèn)題。由于機(jī)組處于運(yùn)行狀態(tài)AP34負(fù)責(zé)主機(jī)功頻控制器SIMADYN及主機(jī)保護(hù)S5-95F控制器與其它控制器的通訊、以及主機(jī)抗燃油泵的控制,為降低消除缺陷帶來(lái)的機(jī)組運(yùn)行風(fēng)險(xiǎn),電廠方面計(jì)劃利用深夜電網(wǎng)低負(fù)荷時(shí),向省電網(wǎng)調(diào)度申請(qǐng)低谷停機(jī)消缺。
電廠方面以停機(jī)不停爐為宗旨進(jìn)行消缺。在代碼傳送過(guò)程中,為保證主機(jī)控制油泵的正常運(yùn)行,故保持了先前在電氣開(kāi)關(guān)側(cè)的二次控制回路做的針對(duì)抗燃油泵的模擬措施;為防止鍋爐滅火,將高低旁邏輯進(jìn)行適當(dāng)修改和信號(hào)強(qiáng)制,以避免在代碼傳送過(guò)程中,由于信號(hào)的丟失造成高低旁的關(guān)閉。
做好上述安全措施后,電廠DCS在ES680上生成AP34的硬件、軟件和LAN代碼;
發(fā)電機(jī)解列、汽機(jī)打閘后,更換AP34上層控制器的CPU模件;
將AP34下層主控制器停止運(yùn)行,之后再將其重啟,它及其鏈路上的IM614通訊恢復(fù)正常;
將AP34控制器的上層故障控制器重新啟動(dòng),在等待約3分鐘之后,它及其鏈路上的IM614通訊恢復(fù)正常;
將AP34所管轄的所有FUM模件插入并送電,均正常啟動(dòng);
下載AP34的LAN代碼;
離線下載AP34的*代碼。
代碼下載完成之后,控制器正常啟動(dòng)。利用pgmaster指令連接主從控制器,連接正常。在通訊服務(wù)器PU2A/2B上,利用rdb指令,檢查PU與AP34的通訊狀態(tài)正常。對(duì)AP34主從控制器進(jìn)行冗余切換試驗(yàn),均切換正常,zui后維持下層機(jī)為主控制器,檢查邏輯圖動(dòng)態(tài)工作正常,運(yùn)行人員檢查OM畫面,各通訊點(diǎn)顯示和操作恢復(fù)到正常狀態(tài)。
恢復(fù)DCS、電氣專業(yè)相關(guān)模擬措施,運(yùn)行人員重新啟動(dòng)機(jī)組。
四、消缺總結(jié)
西門子專家認(rèn)為此次故障原因是由于IM324和IM304版本較低所致,建議在以后的維護(hù)過(guò)程中,將這些主從控制器通訊模件和CPU模件進(jìn)行重啟,它及其鏈路上的IM614通訊恢復(fù)正常;
將AP34控制器的上層故障控制器重新啟動(dòng),在等待約3分鐘之后,它及其鏈路上的IM614通訊恢復(fù)正常;
將AP34所管轄的所有FUM模件插入并送電,均正常啟動(dòng);
下載AP34的LAN代碼;
離線下載AP34的*代碼。
代碼下載完成之后,控制器正常啟動(dòng)。利用pgmaster指令連接主從控制器,連接正常。在通訊服務(wù)器PU2A/2B上,利用rdb指令,檢查PU與AP34的通訊狀態(tài)正常。AP34主從控制器進(jìn)行冗余切換試驗(yàn),均切換正常,zui后維持下層機(jī)為主控制器,檢查邏輯圖動(dòng)態(tài)工作正常,運(yùn)行人員檢查OM畫面,各通訊點(diǎn)顯示和操作恢復(fù)到正常狀態(tài)。
恢復(fù)DCS、電氣專業(yè)相關(guān)模擬措施,運(yùn)行人員重新啟動(dòng)機(jī)組。