可用性

信頼性工学において、可用性という用語には次のような意味があります。

  • ミッションが未知の、つまりランダムな時間に要求された場合、システムサブシステム、または機器がミッションの開始時に指定された操作可能かつコミット可能な状態にある度合い。
  • 理想的なサポート環境において、規定の条件下で使用された場合、特定の時点でアイテムが正常に動作する確率。

通常、高可用性システムは99.98%、99.999%、または99.9996%と指定されます。逆に、非可用性は可用性から1を引いた値です。

表現

可用性A )の最も単純な表現は、システムの稼働時間の期待値と稼働時間と停止時間の期待値の合計(観測ウィンドウの 「合計時間」Cになる)の比率です。

E[あなたptメートルe]E[あなたptメートルe]+E[dontメートルe]E[あなたptメートルe]C{\displaystyle A={\frac {E[\mathrm {稼働時間} ]}{E[\mathrm {稼働時間} ]+E[\mathrm {ダウンタイム} ]}}={\frac {E[\mathrm {稼働時間} ]}{C}}}

可用性A )の別の式は、平均故障時間(MTTF)と平均故障間隔(MTBF)の比、つまり

MTTFMTTF+MTTRMTTFMTBF{\displaystyle A={\frac {MTTF}{MTTF+MTTR}}={\frac {MTTF}{MTBF}}}

ステータス関数を次のように 定義するとXt{\displaystyle X(t)}

Xt{1sys関数の時間 t0メンテナンス{\displaystyle X(t)={\begin{cases}1,&{\text{sys functions at time }}t\\0,&{\text{maintenance}}\end{cases}}}

したがって、時刻t > 0における可用性A ( t ) は次のように表される。

t広報[Xt1]E[Xt]{\displaystyle A(t)=\Pr[X(t)=1]=E[X(t)].\,}

平均可用性は実数直線上の区間上で定義される必要がある。任意の定数 を考えると、平均可用性は次のように表される。 c>0{\displaystyle c>0}

c1c0ctdt{\displaystyle A_{c}={\frac {1}{c}}\int _{0}^{c}A(t)\,dt.}

限界(または定常状態)可用性は[ 1 ]で表される。

リムcc{\displaystyle A=\lim _{c\rightarrow \infty }A_{c}.}

限界平均可用性は次のように定義されます。 [0c]{\displaystyle [0,c]}

リムccリムc1c0ctdtc>0。{\displaystyle A_{\infty}=\lim _{c\rightarrow \infty}A_{c}=\lim _{c\rightarrow \infty}{\frac {1}{c}}\int _{0}^{c}A(t)\,dt,\quad c>0.}

可用性とは、ミッションがランダムな時間に呼び出された場合に、そのミッションの開始時にアイテムが操作可能かつコミット可能な状態にある確率であり、通常は、稼働時間を合計時間 (稼働時間と停止時間の合計) で割ったものとして定義されます。

直列コンポーネントと並列コンポーネント

直列部品と並列部品
直列部品と並列部品

シリーズコンポーネントがコンポーネント A、B、C で構成されているとします。その場合、次の式が適用されます。

シリーズ部品の可用性 = (部品Aの可用性)x (部品Bの可用性)x (部品Cの可用性)[ 2 ] [ 3 ]

したがって、シリーズ内の複数のコンポーネントを組み合わせた可用性は、個々のコンポーネントの可用性よりも常に低くなります。

一方、平行成分には次の式が適用されます。

並列コンポーネントの可用性 = 1 - (1 - コンポーネントAの可用性) X (1 - コンポーネントBの可用性) X (1 - コンポーネントCの可用性) [ 2 ] [ 3 ]

10台のホストがあり、それぞれの可用性は50%です。しかし、これらを並列で使用し、個別に障害が発生した場合、高い可用性を実現できます。
10台のホストがあり、それぞれの可用性は50%です。しかし、これらを並列で使用し、個別に障害が発生した場合、高い可用性を実現できます。

同様に、それぞれ X 個の可用性を持つ N 個の並列コンポーネントがある場合は、次のようになります。

並列コンポーネントの可用性 = 1 - (1 - X)^N [ 3 ]

並列コンポーネントを使用すると、システム全体の可用性を飛躍的に向上させることができます。[ 2 ] たとえば、各ホストの可用性が50%しかない場合、10台のホストを並列に使用することで、99.9023%の可用性を実現できます。[ 3 ]

冗長性は必ずしも可用性の向上につながるわけではないことに注意してください。実際、冗長性は複雑さを増大させ、結果として可用性を低下させます。Marc Brooker氏によると、冗長性を最大限に活用するには、以下の点に注意する必要があります。[ 4 ]

  1. システム全体の可用性が正味で向上します
  2. 冗長コンポーネントは独立して故障する
  3. システムは正常な冗長コンポーネントを確実に検出できます
  4. システムは冗長コンポーネントを確実にスケールアウトおよびスケールインできます。

可用性をモデル化するための方法と技術

信頼性ブロック図またはフォールト ツリー解析は、次のような多くの要因を含むシステムの可用性またはシステム内の機能障害状態を計算するために開発されています。

  • 信頼性モデル
  • 保守性モデル
  • メンテナンスの概念
  • 冗長性
  • 共通原因故障
  • 診断
  • 修復レベル
  • 修理状況
  • 休眠中の失敗
  • テスト範囲
  • アクティブな運用時間 / ミッション / サブシステムの状態
  • 物流上の側面としては、さまざまな倉庫でのスペアパーツ(在庫)レベル、輸送時間、さまざまな修理ラインでの修理時間、人員の可用性などがあります。
  • パラメータの不確実性

さらに、これらの方法は、可用性に影響を与える最も重要な項目や障害モードまたはイベントを識別することができます。

システム工学における定義

固有可用性(A i[ 5 ] 理想的なサポート環境において、規定の条件下で使用された場合、ある時点において製品が適切に動作する確率。物流時間、待機時間または管理作業によるダウンタイム、予防保守によるダウンタイムは含まれない。是正保守によるダウンタイムは含まれる。固有可用性は、一般的にエンジニアリング設計の分析から導かれる。

  1. 修理可能な要素 (改修/再製造は修理ではなく交換) が、それが動作するシステムの可用性に与える影響は、平均故障間隔MTBF/(MTBF +平均修復時間MTTR) に等しくなります。
  2. 一度限りまたは修理不可能な要素(改修または再製造可能)が、それが動作するシステムの可用性に与える影響は、平均故障時間(MTTF)/(MTTF +平均修復時間MTTR)に等しくなります。

設計者が管理する数量に基づきます。

達成可用性(Aa)[ 6 ] 理想的なサポート環境(すなわち、人員、工具、スペアパーツなどが即座に利用可能であること)において、規定の条件下で使用された場合、ある時点において製品が適切に動作する確率。物流時間、待機時間、または管理作業によるダウンタイムは含まれない。予防保守および是正保守のためのダウンタイムは含まれる。

運用可用性(Ao)[ 7 ] 実際の、または現実的な運用・サポート環境で使用された場合、ある時点において機器が正常に動作する確率。これには、物流時間、準備時間、待機時間または管理ダウンタイム、予防保守と是正保守の両方のダウンタイムが含まれます。この値は、平均故障間隔(MTBF)を平均故障間隔と平均ダウンタイム(MDT)の合計で割った値に等しくなります。この指標は、可用性の定義を、スペアパーツ、ツール、およびハードウェア機器への人員の量や距離など、物流担当者やミッションプランナーが管理する要素にまで拡張します。

詳細については システムエンジニアリングを参照してください

基本的な例

平均故障時間(MTTF) が 81.5 年、平均修理時間(MTTR) が 1 時間の 機器を使用している場合:

MTTF(時間)= 81.5 × 365 × 24 = 713940(これは信頼性パラメータであり、多くの場合、不確実性のレベルが高くなります。)
固有可用性(Ai)= 713940 / (713940+1) = 713940 / 713941 = 99.999860%
固有の非可用性= 1 / 713940 = 0.000140%

機器による年間停止時間 (時間) = 1/レート = 1/MTTF = 年間 0.01235 時間。

文学

可用性は、確率モデル最適保守に関する文献において確立されています。BarlowとProschan [1975]は、修理可能なシステムの可用性を「システムが特定の時刻tに稼働している確率」と定義しています。Blanchard [1998]は、可用性を「未知のランダムな時点でミッションが要求された際に、ミッション開始時にシステムが運用可能かつコミット可能な状態にある度合いの尺度」と定性的に定義しています。この定義はMIL-STD-721に由来しています。Lie、Hwang、およびTillman [1977]は、可用性の包括的な調査と体系的な分類を開発しました。

可用性の尺度は、対象となる時間間隔、またはシステムのダウンタイムの発生メカニズムによって分類されます。対象となる時間間隔が主な関心事である場合、瞬間可用性、限界可用性、平均可用性、限界平均可用性を検討します。上記の定義は、Barlow and Proschan [1975]、Lie, Hwang, and Tillman [1977]、およびNachlas [1998]によって提唱されています。可用性の2つ目の主要な分類は、ダウンタイムの発生メカニズム(固有可用性、達成可用性、運用可用性など)に依存します(Blanchard [1998]、Lie, Hwang, and Tillman [1977])。Mi [1998]は、固有可用性を考慮した可用性の比較結果をいくつか示しています。

保守モデルにおける可用性については、交換モデルについてはBarlow and Proschan [1975]、予備品と修理を含むR-out-of-NシステムについてはFawzi and Hawkes [1991]、交換と修理を含むシリーズシステムについてはFawzi and Hawkes [1990]、不完全修理モデルについてはIyer [1992]、経年交換予防保守モデルについてはMurdock [1995]、予防保守モデルについてはNachlas [1998, 1989]、不完全保守モデルについてはWang and Pham [1996]が参考になります。最近出版された非常に包括的な書籍としては、Trivedi and Bobbio [2017]があります。

アプリケーション

稼働率は発電所工学において広く用いられています。例えば、北米電力信頼性協会は1982年に発電稼働率データシステムを導入しました。[ 8 ]

参照

参考文献

  1. ^ Elsayed, E.,信頼性工学、Addison Wesley、Reading、MA、1996
  2. ^ a b c Sandborn, Peter; Lucyshyn, William (2022).システムサステナビリティ:クリティカルシステムとレガシーシステムのサステナビリティのための調達とエンジニアリングプロセス. World Scientific. ISBN 9789811256868
  3. ^ a b c d Trivedi, Kishor S.; Bobbio, Andrea (2017).信頼性・可用性エンジニアリング:モデリング、分析、およびアプリケーション. Cambridge University Press. ISBN 978-1107099500
  4. ^ Vitillo, Roberto (2022年2月23日). 『分散システムを理解する 第2版:大規模分散アプリケーションについてすべての開発者が知っておくべきこと』 Roberto Vitillo. ISBN 978-1838430214
  5. ^ 「固有の可用性(AI)」国防調達略語・用語集。国防総省。2014年4月13日時点のオリジナルよりアーカイブ。 2014年4月10日閲覧
  6. ^ 「Achieved Availability (AI)」 .国防調達用語集. 国防総省. 2014年4月13日時点のオリジナルよりアーカイブ。 2014年4月10日閲覧
  7. ^ 「運用可用性(AI)」国防調達略語・用語集。国防総省。2013年3月12日時点のオリジナルよりアーカイブ。 2014年4月10日閲覧
  8. ^ 「従来型発電性能データの報告義務」(PDF) .発電可用性データシステム. 北米電力信頼性協会 . 2011年7月 . 7、17ページ . 2022年10月9日時点のオリジナルよりアーカイブ(PDF) . 2014年3月13日閲覧.

出典