版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-持久故障

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

簡(jiǎn)介

故障是系統(tǒng)不能執(zhí)行規(guī)定功能的狀態(tài)。通常而言,故障是指系統(tǒng)中部分元器件功能失效而導(dǎo)致整個(gè)系統(tǒng)功能惡化的事件。持久故障是指在完成修復(fù)性維護(hù)活動(dòng)之前,產(chǎn)品(裝備)一直持續(xù)存在的一種故障。與之相對(duì)應(yīng)的臨時(shí)性故障是指產(chǎn)品(裝備)在很短時(shí)間內(nèi)發(fā)生的喪失某些局部功能的故障。這種故障發(fā)生后不需要修復(fù)或更換零部件,只需對(duì)故障部位進(jìn)行調(diào)整即可恢復(fù)器喪失的功能。

故障的分類及特征分類1.按故障的持續(xù)時(shí)間分類

按故障的持續(xù)時(shí)問可將故障分為永久故障、瞬時(shí)故障和間歇故障。永久故障由元器件的不可逆變化所引發(fā),其永久地改變?cè)骷脑羞壿嫛V钡讲扇〈胧┫收蠟橹?;瞬時(shí)故障的持續(xù)時(shí)間不超過(guò)一個(gè)指定的值。并只引起元器件當(dāng)前參數(shù)值的變化,而不會(huì)導(dǎo)致不可逆的變化;間歇故障是可重復(fù)出現(xiàn)的故障,主要由元件參數(shù)的變化、不正確的設(shè)計(jì)和工藝方面的原因所引發(fā)。

2.按故障的發(fā)生和發(fā)展進(jìn)程分類

按故障的發(fā)生和發(fā)展過(guò)程可將故障分為突發(fā)性故障和漸發(fā)性故障。突發(fā)性故障出現(xiàn)前無(wú)明顯的征兆,很難通過(guò)早期試驗(yàn)或測(cè)試來(lái)預(yù)測(cè);漸發(fā)性故障是由于元器件老化等其他原因,導(dǎo)致設(shè)備性能逐漸下降并最終超出正確值而引發(fā)的故障。因此具有一定的規(guī)律性,可進(jìn)行狀態(tài)監(jiān)測(cè)和故障預(yù)防。

3.按故障發(fā)生的原因分類

按故障發(fā)生的原因?qū)⒐收戏譃橥庖蚬收虾蛢?nèi)因故障。外因故障是因人為操作不當(dāng)或環(huán)境條件惡化等外部因素造成的故障;內(nèi)因故障是因沒計(jì)或生產(chǎn)方面存在的缺陷和隱患而導(dǎo)致的故障。

4.按故障的部件分類

按故障的部件可將故障分為硬件故障和軟件故障。硬件故障是指故障因硬件系統(tǒng)失效。

5.按故障的嚴(yán)重程度分類

按故障的嚴(yán)重程度可將故障分為破壞性故障和非破壞性故障。破壞性故障既是突發(fā)性的又是永久性的.故障發(fā)生后往往危及設(shè)備和人身的安全:而非破壞性的故障一般是漸發(fā)性的又是局部的,故障發(fā)生后暫時(shí)不會(huì)危及設(shè)備和人身的安全。

6.按故障的相關(guān)性分類

按故障相關(guān)性可將故障分為相關(guān)故障和非相關(guān)故障。相關(guān)故障也稱間接故障,因設(shè)備其他元器件而引發(fā)。比較難診斷;非相關(guān)故障也稱直接故障,由元器件本身直接因素所引起。相對(duì)相關(guān)故障而言比較容易診斷。

除此之外。還可以按照故障的因果關(guān)系分成物理性故障和邏輯性故障,按故障的表征分為靜態(tài)故障和動(dòng)態(tài)故障。按故障變量的值分為確定值故障和非確定值故障等。2

特征設(shè)備的故障一般具有如下五個(gè)基本特征:

(1)層次性。復(fù)雜的設(shè)備,可劃分為系統(tǒng)、子系統(tǒng)、部件、元件,表現(xiàn)一定的層次性,與之相關(guān)聯(lián),設(shè)備的故障也具有層次性的特征,即設(shè)備的故障可能出現(xiàn)在系統(tǒng)、子系統(tǒng)、部件、元件等不同的層次上。

(2)傳播性。元件的故障會(huì)導(dǎo)致部件的故障,部件的故障會(huì)引起系統(tǒng)的故障,故障會(huì)沿著部件一子系統(tǒng)一系統(tǒng)的路徑傳播。

(3)放射性。某一部件的故障可能會(huì)引起與之相關(guān)聯(lián)的部件發(fā)生故障。

(4)延時(shí)性。設(shè)備故障的發(fā)生、發(fā)展和傳播有一定的時(shí)間過(guò)程,設(shè)備故障的這種延時(shí)性特征為故障的前期預(yù)測(cè)預(yù)報(bào)提供了條件。

(5)不確定性。設(shè)備故障的發(fā)生具有隨機(jī)性、模糊性、不可確知性。3

SAP DB的持久性故障定義持久性故障的標(biāo)準(zhǔn)為了盡可能地降低由于資源中的瞬態(tài)故障引起的中斷所帶來(lái)的影響,故障監(jiān)視器將重新啟動(dòng)資源以響應(yīng)這類故障。 對(duì)于持久性故障,需要比重新啟動(dòng)資源更具破壞性的操作:

對(duì)于 SAP DB 資源,故障監(jiān)視器將資源故障切換到其它節(jié)點(diǎn)。 SAP DB 資源是故障切換資源。

對(duì)于 SAP xserver 資源,故障監(jiān)視器將使該資源脫機(jī)。 SAP xserver 是可伸縮資源。

如果在指定的重試間隔內(nèi)嘗試重新啟動(dòng)資源的次數(shù)超過(guò)了指定的閾值,則故障監(jiān)視器將認(rèn)為故障是持久性的。 為持久性故障定義標(biāo)準(zhǔn)使您能夠根據(jù)群集的性能特點(diǎn)和可用性要求來(lái)設(shè)置閾值和重試間隔。

閾值和重試間隔與其它特性的相關(guān)性重新啟動(dòng)一次出現(xiàn)故障的資源所需的最長(zhǎng)時(shí)間是以下特性的值的總和:

Thorough_probe_interval 系統(tǒng)特性

Probe_timeout 擴(kuò)展特性

為了確保在重試間隔內(nèi)達(dá)到閾值之前您具有足夠的時(shí)間,請(qǐng)使用以下表達(dá)式來(lái)計(jì)算重試間隔和閾值:

retry-interval ≥ threshold × (thorough-probe-interval + probe-timeout)

用來(lái)設(shè)置閾值和重試間隔的系統(tǒng)特性要設(shè)置閾值和重試間隔,請(qǐng)?jiān)O(shè)置以下系統(tǒng)特性:

要設(shè)置閾值,請(qǐng)將 Retry_count 系統(tǒng)特性設(shè)置為允許的最大重啟次數(shù)。

要設(shè)置重試間隔,請(qǐng)將 Retry_interval 系統(tǒng)特性設(shè)置為所需的間隔(以秒為單位)。

為每個(gè)包含需要調(diào)節(jié)的 Sun Cluster HA for SAP DB 故障監(jiān)視器的資源設(shè)置這些特性。表中顯示了這些資源的資源類型。

|| ||

重試間隔的其它影響除了定義持久性故障標(biāo)準(zhǔn)以外,重試間隔還影響故障監(jiān)視器對(duì)以下故障做出的響應(yīng):

SAP DB 故障監(jiān)視器檢測(cè)到 SAP xserver 不可用。 如果 SAP DB 故障監(jiān)視器在重試間隔內(nèi)兩次檢測(cè)到 SAP xserver 不可用,則 SAP DB 故障監(jiān)視器將重新啟動(dòng) SAP xserver。

持久性系統(tǒng)錯(cuò)誤。持久性系統(tǒng)錯(cuò)誤是指在重試間隔內(nèi)發(fā)生四次的系統(tǒng)錯(cuò)誤。 如果發(fā)生持久性系統(tǒng)錯(cuò)誤,故障監(jiān)視器將重新啟動(dòng) SAP xserver。4