JPH09231017A

JPH09231017A - データ記憶装置

Info

Publication number: JPH09231017A
Application number: JP9002533A
Authority: JP
Inventors: Andrew John Wilkes; アンドリュー・ジョン・ウィルケス; Stefan Savage; ステファン・サヴェジ
Original assignee: Hewlett Packard Co
Current assignee: HP Inc
Priority date: 1996-01-18
Filing date: 1997-01-10
Publication date: 1997-09-05
Also published as: US5720025A; EP0785512A2

Abstract

(57)【要約】【課題】フォールト・トレラント記憶装置における処
理性能の向上を図る。【解決手段】データが書き込まれるべきアレイ内のブロ
ックすなわちストライプの目標領域を先ず識別する。次
に、目標領域にある古いデータを読み取ることなく新し
いデータを直接目標領域に書き込む。その際、書き込ま
れたデータが非保護であることを示すためＮＰＲＢすな
わちパリティ再構築必要ビットを不揮発性メモリに書き
込む。現在存在するＮＰＲＢの数を基にＭＴＴＤＬすな
わち平均データ損失時間を動的に計算し、ＭＴＴＤＬが
所定の範囲内にある限り、アレイがアイドルになるまで
パリティ更新を延期する。ディスク・アレイがアイドル
になると、パリティ情報を生成してストライプの該当す
る目標領域に書き込む。ＭＴＴＤＬ条件が充足されない
場合、更新は従来技術のＲＭＷ更新プロトコールに従っ
て行われる。このようにしてパリティ情報生成および書
き込みの無駄を省く。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータのデ
ータ記憶システムに関するもので、特に、独立ディスク
の冗長アレイに適するフォールト・トレラント記憶装置
アーキテクチャに関するものである。

【０００２】

【従来の技術】コンピュータ産業において、現在使用さ
れているパーソナル・コンピュータは、現在より大型で
高価な１０年前のメインフレームおよびミニコンピュー
タの能力を越える能力を有する。このような処理性能の
向上は、部分的にはバス・サイズの増大とマイクロプロ
セッサの高速化に起因している。コンピュータの処理性
能を向上させる努力における１つの要因は、データ損失
に対する懸念を持つことなく大容量不揮発性記憶装置と
マイクロプロセッサの間のデータ転送時間を短縮する点
である。

【０００３】元来、高性能大容量記憶装置は、単一の大
規模で高価なディスク(Single Large Expensive Diskを
略称してＳＬＥＤとも呼ばれる)を使った。ＳＬＥＤ
は、１２ないし１４インチの範囲の典型的な形状係数を
持っていて、データ損失を非常に懸念しなければならな
いことが判明している。例えば、ＳＬＥＤが故障する
と、そこに記憶されていた情報はもはやコンピュータに
とって使用できなくなる。

【０００４】ＳＬＥＤの欠点を克服するため、ＲＡＩＤ
(Redundant Arrays of IndependentDisksの略称)が開発
された。ＲＡＩＤアーキテクチャは、並列的にデータの
読み書きが行われる標準的ディスク集団アレイを含む。

【０００５】ＲＡＩＤアーキテクチャの１つであるＲＡ
ＩＤ５は、パリティ・エラー訂正技術を使用して冗長情
報を作成し、それによってディスク故障の際のデータ損
失を防止する。ＲＡＩＤ５アーキテクチャにおいては、
集合的Ｎ＋１個のディスク(冗長度グループとしても呼
ばれる)が、ブロックと呼ばれる複数の等サイズのアド
レス領域に分割される。各ディスクは一般的に同数のブ
ロックを含む。同じディスク・アドレス範囲を持つ冗長
度グループの各ディスクのブロックは、「ストライプ
(帯)」と呼ばれる。各ストライプは、Ｎ個のデータ・ブ
ロックと該Ｎ個のデータ・ブロック部分に関するパリテ
ィ情報を保持する１つのディスク上の１つのパリティ・
ブロックを持つ。パリティ情報は、ディスク故障の事象
の際のデータ損失を防止する。各アレイは、複数のスト
ライプとそれに対応する複数のパリティ・ブロックを持
ち、パリティ・ブロックには、アレイを形成する異なる
ディスク上に典型的に記録される複数のストライプに関
するパリティ・データが保持される。

【０００６】ＲＡＩＤ５の欠点は、現在時パリティ情報
を維持するため、複数の入出力要求を伴う読み取り−修
正−書き込み命令(Read-Modify-Writeを略してＲＭＷと
呼ばれる)更新プロトコールを必要とする点である。Ｒ
ＭＷ更新プロトコールは、古いパリティおよびデータの
ブロックを読み取りそのブロックと新しいデータのＸＯ
Ｒ(排他的論理和)演算を行うことを必要とする。その
後、新しいデータおよびパリティ・ブロックがアレイに
書き込まれなければならない。結果として、このような
動作は、予備読み取り命令を必要としないＳＬＥＤに比
較して、より長い回転待ち時間を必要とする。古いデー
タの予備読み取りは、書き込み命令を実行する前にディ
スクが適切な位置に再度回転するまでの待機期間を必要
とさせる。待機時間は、部分的ストライプを伴う多数の
小規模ファイル更新を行う場合に特に厄介である。これ
は、小規模更新問題として知られているものである。回
転待機時間が、典型的ＲＭＷについて必要とされる時間
の約５０％にも達することもあるので、複数の部分的ス
トライプ更新は、膨大なアクセス時間量という結果を生
じることがある。

【０００７】多数の従来技術が小規模更新問題を克服す
ることを試みてきた。Stodosky氏その他著の"Parity lo
gging:overcoming the small write problem in redund
antdisk arrays, "Proceedings 20th international Sy
mposium on Computer Architecture, May 16-19 1993,
pages 64-75は、ＲＭＷ更新プロトコールの修正を論
じ、読み取った古いデータとパリティのプロシージャを
実行するが、古いデータとパリティのＸＯＲをログに送
り出すことによってパリティ更新を遅延させ、後に、当
該アレに関するログ・ファイルが読み取られ、パリティ
がその場で更新される方法を開示している。Stodosky氏
らの提案の問題は、それがあまりに複雑であるという点
である。

【０００８】Jai MenonおよびJim Kassonの両氏は、"Me
thods for improved update performance of disk arra
ys", IBM report RJ6928(66034), July 13,1989に、浮
動パリティ方式を記載している。この浮動パリティ方式
は、標準的ＲＭＷシーケンスを実行する。しかし、ディ
スクの完全な１回転を待つこととは対照的に、更新され
たデータとパリティは、アレイの最近接の使用可能空間
に直ちに書き込まれる。MenonおよびKasson両氏の提案
は、ディスク上のデータの回転位置について余分なマッ
ピング・ポインタと知識を必要とすることによって過度
の複雑さを持ち込む。

【０００９】Thomas H. CormenおよびDavid Kotz両氏
は、"Integrating Theory and Practice in Parallel F
ile Systems" Proceedings of the 193 DAGS/PC Sympos
ium, pages 64-74, June 1993において、パリティ保護
なしにアレイへファイルを選択的に書き込む方法を開示
している。パリティ保護なしに書き込まれるファイル
は、アレイ上において他のファイルに比較して相対的に
一時的状態を持つものである。ディスク故障からの回復
を可能にするため、上記著書において、パリティ・ポイ
ント・プロシージャが論じられているが、これはチェッ
クポイントと同等のものとみなされる。パリティ・ポイ
ントは、プログラムがディスク故障から動作を再開する
ポイント、すなわち、最後に記録された冗長情報がアレ
イに記憶されているポイントである。このアーキテクチ
ャの問題点は、データが保護されていない間の長期間に
わたってアプリケーションおよびファイル・システムが
明示的にこの仕組みに関与する必要があるという点であ
る。

【００１０】Brant氏その他に付与の米国特許第5,274,7
99号は、バスを経由してアレイ・コントローラ、典型的
にはフォルト・トレラント・コントローラに接続された
ＣＰＵを含むコピーバック・キャッシュを備えた記憶装
置を記載している。アレイ・コントローラは、複数の記
憶装置すなわちディスク・ドライブの各々にＩ／Ｏバス
経由で接続される。不揮発性記憶装置すなわちコピーバ
ック・キャッシュもまたＩ／Ｏバスに接続される。ま
た、コピーバック・キャッシュに書き込まれた情報を同
時に記憶するため、鏡写しに構成される別のコピーバッ
ク・キャッシュが備えられる。ＲＡＩＤへの書込みが発
生すると、データはコピーバック・キャッシュの最初の
有効位置に直ちに書き込まれる。コピーバック・キャッ
シュへの書込みが完了すると直ちに、書き込み動作が成
功したことがＣＰＵへ通知される。その後、書き込まれ
たデータに対するエラー訂正ブロック更新を待つことな
く、ＣＰＵによる後続の記憶装置アクセスが続行され
る。１つの実施形態では、アイドル時間を利用して従来
技術のＲＭＷ更新プロトコルを実行することによって、
コピーバック・キャッシュにあるデータ・ブロックの各
々に関するエラー訂正ブロックが計算される。別の実施
形態では、書き込みデータがコピーバック・キャッシュ
に記録された後、コントローラのバッファ・メモリにお
ける書込みデータを使用して、他のＣＰＵＩ／Ｏアクセ
スとオーバーラップする形態で、アレイに対する書込み
動作が継続する。このようにして、コピーバック・キャ
ッシュは、書込みデータの走行「ログ」としての機能が
加わる。この装置の欠点は、「ログ」のサイズが相対的
に小さい点で、このため、データ量が制限され、更新を
遅延させることとなる。

【００１１】Noya氏その他に付与の米国特許第5,315,60
2号は、ディスク・システムのような一時データ記憶と
永久記憶装置を持つホスト中央処理装置を含み、ディス
ク・ドライブの冗長アレイに対する最適化されたストラ
イプ検出機能を持つコンピュータ・システムを開示して
いる。通信バスが、中央処理装置と永久記憶装置を接続
する。キャッシュ・メモリがまた通信バスに接続され
る。ホスト処理装置とディスク・ドライブの間でデータ
を伝送するＩ／Ｏ要求の数を減少させるため、プロセッ
サによって頻繁に使用されるデータはキャッシュに維持
される。すべての新しいデータは、アレイに書き込まれ
る前にキャッシュに書き込まれる。典型的にはキャッシ
ュは不揮発性であって、そこに記憶されるデータを電源
故障による損失から保護する。コンピュータによって必
要とされるＩ／Ｏ要求の数を更に減少させるため、パリ
ティ・データを生成するために必要とされるＩ／Ｏ要求
数を減少させる技術が用いられる。第１のプロシージャ
は、アレイに書き込まれるべき新しいデータを含めて、
ストライプ全体からパリティ・データを生成するために
必要なＩ／Ｏ要求の数を決定する。第２のプロシージャ
は、ストライプの新しいデータおよび古いパリティ・デ
ータからパリティ・データを生成するために必要なＩ／
Ｏ要求の数を決定する。次に、システムは、第１または
第２のプロシージャによって決定される最小Ｉ／Ｏ要求
数を必要とする技術を使用して、ストライプ全体あるい
は個々のブロックとしてパリティ・データを生成するた
めに必要なブロックをキャッシュにおいて統合する。

【００１２】DeMoss氏その他に付与の米国特許第5,418,
925号は、バッファ用にディスク・アレイ・コントロー
ラを含む予備ドライを使用するディスク・アレイにおけ
る迅速な書込み処理手段を開示している。コントローラ
は、ホスト・インターフェースを経由して電子的にホス
ト・コンピュータ・システムに接続される。コントロー
ラは、予備ドライブを含むディスク・ドライブのアレイ
の動作を調整する。予備ドライブは、いわゆる迅速書込
みドライブ(fast-write-driveの頭文字をとってＦＷＤ
と略称される)である。コントローラの制御の下、ディ
スク・アレイに書き込まれるべきデータ・ブロックの各
々はＦＷＤに即刻送られる。コントローラは、各ＦＷＤ
データ・トラックの現在時状態を示す状態テーブルを維
持する。ＦＷＤデータ・トラックへのブロック書き込み
の各々が完了すると、コントローラは、状態テーブルを
更新して、揮発性メモリに更新されたテーブルを保存す
る。次に、書込みステップが完了したことがホスト・シ
ステムに通知される。このように、コントローラが書込
み動作を独自に実行している間ホストは他の動作を処理
することができる。アレイのドライブの１つに記憶され
ているデータを更新するには、先ず古いデータおよびパ
リティ情報がアレイから読み取られる。古いデータおよ
びパリティ情報はＸＯＲされる。既にＦＷＤに保存され
ている新しいデータが読み取られ、ＸＯＲされた古いデ
ータおよびパリティ情報とＸＯＲされる。このアーキテ
クチャの欠点は、古いパリティ情報およびデータを読み
取るため付加的読み取り動作が必要とされることであ
る。また、ＦＷＤ上のデータを読み取ることがこのアー
キテクチャの処理性能を減少させる。

【００１３】DeMoss氏その他に付与の米国特許第5,388,
108号は、ＲＭＷ更新プロトコールを使ってディスク・
アレイにおけるデータおよびパリティ情報を更新する方
法を開示している。この方法は、ＲＡＩＤ５ディスク・
アレイに対するコントローラを使用し、ホスト・システ
ムからの新しいデータの受領の完了とともにＩ／Ｏ待ち
行列に適切な読み書き要求を入れることを含む。コント
ローラが先ずデータ・ドライブから古いデータを読み、
新しいデータおよび古いデータを記憶バッファ内の第１
および第２の領域にそれぞれ書き込むように、Ｉ／Ｏ動
作はスケジュールされる。コントローラは次にデータ・
ドライブに新しいデータを書き込み、パリティ動作を実
行する、すなわちパリティ・ドライブから古いパリティ
情報を読み取り、記憶バッファ内の第３の領域に古いパ
リティ情報を保存する。新しいパリティ情報を生成し
て、それをパリティ・ドライブに書き込む動作は、該当
するドライブが情報を受け取る用意ができるまで遅延さ
れる。このようにして、パリティ読取り、生成および書
込み動作がディスク・サービス時間の犠牲を伴わずに効
率的に進むことができるようになるまでパリティ・ドラ
ブを他の入出力動作に使用することが可能とされる。こ
の方法の欠点は、バッファ・サイズが限られていること
であって、そのため更新できるデータ量が減少する。

【００１４】Neufeld氏へ付与の米国特許第5,333,305号
は、ディスク・アレイ・サブシステムにおける部分的ス
トライプ書込み性能を改善する方法を開示している。こ
の方法は、部分的なストライプ書込み動作が開始したか
否か、および部分的ストライプ書き込みの間新しいデー
タを受け取らないストライプ部分がファイル・システム
の未使用空間を含むか否か両方を判断するステップを含
む。未使用空間がストライプの中に確保されていない場
合、部分的ストライプ書込み動作は、従来のＲＭＷ更新
プロトコルを使用して実行される。部分的ストライプ書
き込みの間、新しいデータを受け取らないストライプ部
分がファイル・システムの未使用空間を含む場合、デー
タ・ストライプの現在の内容は維持される必要がない。
この方法は、ファイル・システムが大量の未使用ファイ
ル空間を持っているシステムに関して使用される場合に
のみ利点がある。

【００１５】Schneider氏その他へ付与の米国特許第5,4
08,644号は、ディスク・アレイ・サブシステムにおける
部分的ストライプ動作の性能を改善する方法および装置
を開示している。このサブシステムは、電子的にディス
ク・アレイおよびディスク・アレイ・コントローラに接
続された転記メモリを含む。ディスク・アレイへの書込
み動作が例えばホスト・プロセッサによって実行される
時、書込みデータは、使用可能空間があるとすれば転記
メモリへ書き込まれる。転記メモリは、ホストへレディ
信号を直ちに返す。後刻、転記メモリのデータ・ブロッ
クの各々に対して従来技術のＲＭＷ更新プロトコルが実
行される。ディスク・アレイ・システムのシーク遅延お
よび回転待ち時間のため、転記メモリにおけるデータ記
憶時間は、ディスク・アレイ・システムの場合よりも非
常に迅速であり、そのため、ホストは他の動作を続行で
きる。この装置の欠点は、転記メモリのサイズに関する
ものであり、更新されるデータ量が制限される可能性が
ある。

【００１６】

【発明が解決しようとする課題】小規模更新問題を克服
する上述の試みの大部分が持つ欠点は、データとパリテ
ィの間の堅固な密着性であって、これは、現在時パリテ
ィ情報を維持することから派生し、小規模更新がＲＭＷ
シーケンスの間ディスクの長い回転待ちを経験する原因
となる。かくして、データとパリティの間の上述のよう
な堅固な密着性を緩和して、ディスク・アレイ上に記憶
されたデータの更新のために必要とされるアクセス時間
を短縮するアーキテクチャが求められている。

【００１７】

【課題を解決するための手段】本発明は、ディスク・ア
レイを形成する複数のディスク・ドライブ装置を持つフ
ォルト・トレラント記憶装置上で、処理性能を向上させ
るためパリティ・ブロックの更新を一時的に中断する形
態でデータ更新プロトコールを実行する方法および装置
を提供する。典型的には、ディスクがアイドルであるこ
とをディスク・アレイの入出力速度が示すまでパリティ
・ブロック更新が延期され、それによって、データとパ
リティの密着性が短時間の間緩和される。これは、アレ
イ上に記憶された古いデータおよび古いパリティ情報を
読み取らずに小規模更新を実行することを可能にし、ド
ライブ装置の回転待ちを減少させる。パリティの更新を
延期させることによって、アレイが冗長情報を常に含む
ことはなくなる。むしろ、アレイは冗長情報を常にでな
く頻繁に含むことになる。このように、本発明の更新プ
ロトコールは、頻繁に保存される冗長情報を持つ独立デ
ィスク・アレイを提供する。このようなアレイ・プロト
コールを、本発明は、a Frequently Redundant Array o
f Independent Disksの頭文字をとってＡＦＲＡＩＤプ
ロトコールと呼称する。

【００１８】本発明のＡＦＲＡＩＤプロトコールは、小
規模更新を実行するため、データが書き込まれるべきア
レイ内のブロックすなわちストライプの目標領域を先ず
識別する。その後、新しいデータは、目標領域にある古
いデータを読み取ることなく直接目標領域に書き込まれ
る。新しいデータの書き込みに加えて、「パリティ再構
築必要ビット」(Needs Parity Rebuild Bitを略してＮ
ＰＲＢと呼称される)が不揮発性メモリに書き込まれ
る。このビットは、更新されたストライプが新しいデー
タに対応するパリティ情報を持っていないすなわちスト
ライプは保護されていないことを標示する。本発明の第
１の局面において、現在存在するＮＰＲＢの数を監視し
て、平均データ損失時間(Mean-Time-To-Data-Lossを略
してＭＴＴＤＬと呼称される)の連続的計算を可能にす
る。ＭＴＴＤＬが所定の範囲内にある限り、アレイがア
イドルになるまでパリティ更新は延期される。アイドル
か否かを判断するため、アレイに対するＩ／Ｏ要求が監
視される。ディスク・アレイがアイドルとなると、パリ
ティ情報を再構築する必要がある１つまたは複数の非保
護ストライプが選択される。そのようなストライプの各
々毎に、そのストライプのすべてのデータが読み取ら
れ、排他論理和演算(すなわちＸＯＲ)が行われ、新しい
パリティ・データが生成される。次に、新しいパリティ
・データがストライプの該当する目標領域に書き込まれ
る。ＭＴＴＤＬ条件が充足されない場合、更新は、従来
技術のＲＭＷ更新プロトコールに従って進む。

【００１９】本発明の第２の局面において、ＡＦＲＡＩ
Ｄプロトコールは、多数の基準を基に選択的に用いられ
る。例えば、ＡＦＲＡＩＤ更新プロトコールをデフォル
トの更新プロトコールとして、特定の更新要求にフラグ
を立て、それらの更新には従来技術の更新プロトコール
を用いるようにする。更に、アレイの記憶空間の一部す
なわち特定のブロック・アドレスにフラグを立て、その
空間に対する更新は従来技術の更新プロトコールを使用
することとする。逆に、デフォルトの更新プロトコール
を従来技術の更新プロトコルとして、特定の更新動作あ
るいはブロック・アドレスにフラグを立てそれらの更新
にはＡＦＲＡＩＤプロトコールを使用する。

【００２０】

【発明の実施の形態】図１は、バッファ・メモリ１１と
連係動作するＣＰＵ１０を含むコンピュータ・システム
を示す。ＣＰＵ１０は、線１２を介してアレイ・コント
ローラ１４と電気的または光学的に通信する。コントロ
ーラ１４は、バッファ・メモリ１３と連係動作する。不
揮発性記憶アレイ１６は、ディスク・ドライブ１８、２
０、２２、２４および２６のような複数の記憶装置から
構成される。５つのディスク・ドライブが図示されてい
るけれども、アレイ１６は、実際には、アプリケーショ
ンに従って、所望の数のディスク・ドライブを含むこと
ができる。アレイ・コントローラ１４は、アレイ１６の
各ディスク・ドライブと電気的あるいは光学的に通信す
る。アレイ・コントローラ１４は、典型的には、ディス
ク・ドライブ１８−２６を制御するため、ＣＰＵ１０と
は別に、プログラム可能プロセッサを含む。ＣＰＵ１０
は、広範囲のコンピュータ・アプリケーションを実行す
る複数のユーザをサポートする。動作の間、コントロー
ラ１４を経由してメモリ１１とアレイ１６の間でデータ
を転送するため、ＣＰＵ１０は読み取り(ＲＥＡＤ)およ
び書き込み(ＷＲＩＴＥ)コマンドのようなＩ／Ｏ要求を
出す。

【００２１】ＲＡＩＤ５アーキテクチャでは、ディスク
・ドライブ１８、２０、２２、２４および２６の記憶空
間は、各ディスク・ドライブ上に順次に番号付けされた
１組のブロックに構成される。典型的には、１データ・
ブロックは、ディスクの伝統的セクタ上に記憶される情
報量に等しい。しかし、ブロックの数は多いことがあ
る。例えば、ブロックはセクタの整数に匹敵するかもし
れない。ブロックは、更に、(ストライプとして知られ
ている)データ・セクタに構成される。上述のように、
ストライプは、各ディスク上で同一のアドレス範囲を持
つブロックから構成される。各ストライプは、Ｎ個のデ
ータ・ブロックに加えて１つのパリティ・ブロックを持
つ。パリティ・ブロックは、ストライプの残りのブロッ
クに記録されたデータに関するパリティ情報を含む。パ
リティ・ブロックは、ディスク・ドライブの各々にわた
って分散されることもある。ストライプを使用する技術
は、いくつかの異なるディスク・ドライブ上のいくつか
のディスクにデータを同時並行的に読み書きすることを
可能にする。

【００２２】ＲＡＩＤ５アーキテクチャおよび一般的に
従来技術が持つ問題は、データのパリティ保護が、小規
模更新の各々毎に多数のＩ／Ｏ要求を必要とする点であ
る。例えば、データが、ブロック３６を目標領域として
メモリ１１に現在記憶されていると仮定する。ブロック
３６は、ブロック３０、３２、３４、３６および３８か
らなるストライプ２８に含まれている。新しいデータを
ブロック３６に書き込むために、パリティ保護を維持し
ている限り、そのブロックのデータの古い値を読み取る
ことが必要とされる。加えて、古いパリティも読み取ら
れなければならない。例えば、ブロック３８に記憶され
ている(目標領域３６に対応する)パリティが読み取られ
なければならない。この情報がメモリ１３へ転送され、
そこに記憶されている新しいデータとのＸＯＲ(排他的
論理和)動作を受ける。その後、新しいデータがブロッ
ク３６に書き込まれ、新しいパリティ・データがブロッ
ク３８に書き込まれる。このように、４つのＩ／Ｏ要求
が小規模更新を達成するため必要とされる。これら４つ
のＩ／Ｏ要求のうち、２つがＲＥＡＤ命令を含み、２つ
がＷＲＩＴＥ命令を含む。

【００２３】小規模更新に必要とされるＩ／Ｏ要求数を
減少させるため、本発明は、アレイが使用可能なパリテ
ィ情報をほとんど使用しないという事実と共に、最近の
ディスク・ドライブが持つ信頼性を有効に活かす。具体
的には、本発明は、アレイ上の古いデータおよび古いパ
リティ情報を読み取ることなく小規模更新を実行するこ
とを可能にする。データは、短時間の間、新しいデータ
に対応するパリティ・エラー訂正情報なしにアレイ上へ
書き込まれる。

【００２４】最近のディスク・ドライブが持つ信頼性
は、ディスク・ドライブに関するデータの可用性によっ
て示すことができる。可用性は、ディスクまたはアレイ
上のデータがアクセス可能であるかまたは消失しない時
間量として定義される。ほとんどのＲＡＩＤアーキテク
チャの可用性は、ディスク故障から生じる最初の破局的
データ損失に対する時間を検査することによって決定す
ることができる。ＲＡＩＤ５はパリティ／冗長度情報を
常に提供するので、破局的データ損失は、２つのディス
ク故障が時間的に接近している時すなわち最初のディス
ク故障の後冗長度情報が再構築される前に第２のディス
クが故障する場合に発生する。このタイプのデータ損失
の尺度は、第１のデータ損失までの平均時間(mean-time
-to-first-data-lossを略してＭＴＴＤＬと呼ぶ)であっ
て、(Ｎ＋１)個のディスクを持つＲＡＩＤ５ディスク・
アレイに関しては次の式(1)のように表すことができ
る。

【００２５】

【数１】(1) ＭＴＴＤＬ_{RAID-catastrophic}＝(ＭＴＴ
Ｆ_disk)²／(Ｎ(Ｎ＋１)×ＭＴＴＲ_disk)

【００２６】上式において、ＭＴＴＦ_diskはディスク故
障までの平均時間であり、ＭＴＴＲは平均修復時間であ
る。ＭＴＴＦ_disk＝１,０００,０００時間、ＭＴＴＲ
_disk＝４８時間の５ディスク・アレイは、約４７５,０
００年のＭＴＴＤＬ_{RAID-catastro} _phicを提供する。こ
のタイプの信頼性の場合、データ損失のリスクをほとん
ど伴うことなくすなわち可用性を大幅に減ずることな
く、短時間の間パリティ更新を遅延させることができる
と本発明は判断した。典型的には、ＣＰＵ１０によるア
クセス要求の観点からアレイ１６がアイドルとなるまで
パリティ更新が延期される。このようにパリティ更新を
延期することは、ＣＰＵ１０の要求によって起きる回転
待ち時間を減少させ、非冗長ディスク・アレイに匹敵す
る書込み「応答」時間を提供することによって処理性能
を向上させる。

【００２７】ＡＦＲＡＩＤプロトコルを使うことによっ
て、アレイ１６の可用性が変わることが観察される。特
に、時間的に接近した２つのディスク故障についてのみ
データ損失を示すＲＡＩＤ５とは異なり、１つのディス
クが不意に故障する時にデータ損失が発生する。アレイ
１６上に保護データおよび非保護データの両者が存在す
る場合、非保護データ期間に関するＭＴＴＤＬへの貢献
は次の式(2)のように示すことができる。

【００２８】

【数２】(2) ＭＴＴＤＬ_{AFRAID-UNPROTECTED}＝(Ｔ
_total／Ｔ_unprot.) × (ＭＴＴＦ_disk／(Ｎ＋１))

【００２９】Ｔ_unprot.／Ｔ_totalはアレイ１６において
非保護データが存在する時間の割合であり、ＭＴＴＦ
_diskはディスク故障までの平均時間であり、Ｎ＋１はア
レイ１６におけるディスク総数である。

【００３０】非保護データがアレイ上に存在しない場合
は、アレイのＭＴＴＤＬは上式(1)によって定まるもの
に等しく、次の式(3)のように示される。

【００３１】

【数３】(3) ＭＴＴＤＬ_{AFRAID-RAID-catastrophic}＝
Ｔ_total／(Ｔ_total−Ｔ_unprot.) × ＭＴＴＤＬ
_{RAID-catastrophic}

【００３２】Ｔ_unprot.／Ｔ_totalは上式(2)の場合と同
様である。式(2)および式(3)を加えることによって、Ａ
ＦＲＡＩＤプロトコールを用いるアレイのＭＴＴＤＬは
次の式(4)のようになる。

【００３３】

【数４】 (4) ＭＴＴＤＬ_AFRAID＝１／(ＭＴＴＤＬ
_{AFRAID-UNPROTECTED}＋１／(ＭＴＴＤＬ
_{AFRAID-RAID-catastrophic}))

【００３４】上記の点より、アレイ中の非保護データ
は、使用可能アレイを少なくするＭＴＴＤＬを減らすこ
とができることがわかる。Ｉ／Ｏアクセスがアイドルと
なるまでパリティ更新を延期することによる所与の時間
における非保護データの量は、ＣＰＵ１０上で動作する
プログラム／アプリケーションのＩ／Ｏ集中度によって
決定されることが観察される。例えば、冗長情報を持た
ないアレイに匹敵する書込みスループット時間を維持し
ながら、ＡＦＲＡＩＤアレイの可用性がＲＡＩＤ５のよ
うな完全な冗長度を提供するアレイの可用性にほぼ等し
くなる程十分なアイドルＩ／Ｏ時間を提供する特定のア
プリケーションが存在する。逆に、一部のプログラム／
アプリケーションは十分なアイドルＩ／Ｏ時間を提供し
ないため、保護データを持たないディスク・アレイと同
じ可用性を持つアレイになる。

【００３５】前述の概念の特長を活かして、ＡＦＲＡＩ
Ｄプロトコールは、所望の可用性レベルを維持しつつ最
適な処理性能を提供する。これは、プログラム／アプリ
ケーションが連続的に実行されている間にアレイのＭＴ
ＴＤＬを決定することによって達成される。このため、
所与の時間にアレイにおける非保護データ量を確認する
ことが必要とされる。

【００３６】図２、図３および図４において、ＡＦＲＡ
ＩＤプロトコールは、アレイ１６とのＷＲＩＴＥおよび
ＲＥＡＤ動作を完遂するためコントローラ１４によって
実行されるコンピュータ・プログラムとして好ましくは
実施される３つの非同期サブルーチンとして記述されて
いる。ＡＦＲＡＩＤプロトコールは記述を簡単にするた
めＷＲＩＴＥ動作に関して記述されているが、以下の記
述はＲＥＡＤ動作についても同様に適応できる。図２に
示されるサブルーチンのステップは、ＣＰＵ１０からの
Ｉ／Ｏ要求をコントローラ１４が実質的に連続して監視
することを含む。活動プロセスまたはアプリケーション
によってＣＰＵ１０がＷＲＩＴＥコマンドを生成する
と、コマンドはコントローラ１４上へ渡される。コント
ローラ１４は、データを書き込むディスク・ドライブ上
の目標領域を識別する。目標領域は、アレイ１６のデー
タ・ストライプを形成する各ディスク・ドライブのディ
スク上のブロックに位置する。

【００３７】図２のステップ４４において、ＷＲＩＴＥ
コマンドがコントローラ１４によって受け取られる。ス
テップ４６において、データを受け取るディスク・ドラ
イブ上のストライプを識別する１つまたは複数の目印が
メモリ１３に記録される。ステップ４８において、デー
タがアレイ１６に書き込まれ、更新されたストライプが
作成される。このようにして、目標領域中に存在するい
かなるデータも読み取りを行うことなく上書きされる。
メモリ１３に記憶される目印は、更新されたストライプ
中のデータが非保護であること、すなわち、更新された
ストライプについてアレイ１６上にパリティ(エラー訂
正)情報が存在しないことを示す。この目印は、典型的
には「パリティ再構築必要ビット(すなわちNeeds Parit
y RebuildBitを略してＮＰＲＢと呼ばれる)」として知
られているもので、好ましくは不揮発性メモリ１３に書
き込まれる情報ビットである。具体的には、メモリ１３
は典型的には電源故障の際でも情報損失のないようにバ
ッテリ・バックアップを有するＲＡＭであり、そのた
め、アレイのディスク・ドライブ上の非保護データの量
を連続的に監視することができる。ステップ４８がステ
ップ４６と別のものとして示されているが、ステップ４
６および４８は、目標領域への新しいデータの書込みの
間同時に処理されることもできる。

【００３８】図３は、ＡＦＲＡＩＤプロトコールの第２
のサブルーチンを示し、ステップ４９において、コント
ローラ１４がメモリ１３のＮＰＲＢを検査して非保護デ
ータがアレイ１６上に存在するか否かを判断する。ステ
ップ５０において、コントローラ１４は、アレイ１６に
関してパリティ情報を生成してそれを書き込むことがで
きるようにアレイが十分アイドルであるか否かを判断す
る。アイドルの判断は当業者に既知の方法の１つを基に
して行われる。それら方法のいくつかが、Richard Gold
ing氏その他著の"Idleness is not sloth,"Proceedings
of Winter USENIX 1995 Technical Conference, Janua
ry 16-20, 1995, pages 201-212に記載されている。例
えば、コントローラ１４がディスク・ドライブとのＩ／
Ｏをあらかじめ定められた一定時間(例えば１００ミリ
秒)検出しなければディスク・ドライブはアイドルであ
るとみなされる。また、ディスク・ドライブとのＩ／Ｏ
速度があらかじめ決められた速度またはしきい値以下
に、例えばゼロ以上でユーザによって設定された上限以
下に落下した場合ディスク・ドライブはアイドルである
とみなすこともできる。アレイがアイドルでないとコン
トローラが判断すると、サブルーチンは、ステップ４２
に戻る。書き込み要求などのＩ／Ｏ要求が更にあれば、
図２に関する上述のように、書込みコマンドが処理され
る。新しいＩ／Ｏ要求がなければ、コントローラ１４
は、アレイがアイドルであるとみなすことができるか再
度判断する。ステップ５４において、アレイ１６がアイ
ドルとみなされると、コントローラ１４は、１つまたは
複数の非保護ストライプのデータを読み取る。次に、ス
テップ５６において、パリティ情報が生成される。次
に、ステップ５８において、生成されたパリティ情報が
非保護ストライプの該当するブロックに書き込まれる。
その後、ステップ６０において、パリティが更新された
ストライプに対応するＮＰＲＢがメモリ１３から消去さ
れ、コントローラ１４は、別のＩ／Ｏ要求に関してＣＰ
Ｕ１０を引き続き監視する。

【００３９】図４はＡＦＲＡＩＤプロトコールの第３の
サブルーチンを示す。ステップ６１において、コントロ
ーラ１４は、メモリ１３に記録されているＮＰＲＢの数
およびその数が変化しなかった持続時間を調べる。ステ
ップ６２において、ＣＰＵ１０は、メモリ１３に記録さ
れているＮＰＲＢの数およびその数が変化しなかった持
続時間に基づいて、ＭＴＴＤＬを計算する。ステップ６
３において、サブルーチンは、ステップ６２で計算され
たＭＴＴＤＬがユーザによって要求された可用性を満た
すか否かを判断する。このようにして、アレイ１６の可
用性が連続的に計算され、アレイ１６が保護データなし
でアレイの可用性を提供するか、データの連続的保護を
提供するかあるいはそのどこかの間にするかが判断され
る。例えば、あるユーザは、基本線としてＲＡＩＤ５の
アーキテクチャを使用するとして、提供される可用性が
ＲＡＩＤ５アーキテクチャの可用性の９０％であるよう
にＡＦＲＡＩＤプロトコールを設定するかもしれない。
典型的には、可用性の要求されたレベルの各々がメモリ
１３におけるＮＰＲＢの持続時間に対応するようにプロ
トコールによって提供される可用性をメモリ１３に存在
するＮＰＲＢ数の関数として決定されることもできる。
メモリ１３におけるＮＰＲＢの持続時間があらかじめ定
められた時間の長さを越える場合、ＭＴＴＤＬは受容さ
れず、プロトコールは図３のステップ５４ないしステッ
プ６０と同様のステップ６４ないしステップ６７を処理
する。メモリ１３におけるＮＰＲＢの持続時間があらか
じめ定められた時間の長さ以下である場合、プロトコー
ルはステップ６１に戻って、アレイ１６の可用性の監視
を継続する。更に、可用性をメモリ１３におけるＮＰＲ
Ｂの数に基づくようにさせることもできる。メモリ１３
にビットを記録することの代わりに、他のいかなるデー
タ構造も非保護データを示すため用いることができる。
例えば、メモリ１３のデータは非保護データを持つスト
ライプ数のリストを含むこともできる。

【００４０】隣接する非保護ストライプ・データに関す
るパリティ更新は並列的に実行することができ、それに
よって必要ディスク時間を減少させることができる点は
理解されるべきである。これは、パリティ再構築の間の
時間効率を大幅に向上させる。非保護ストライプの数が
アイドルの長さおよび周期数の関数であることは明白で
ある。従って、非保護になるかもしれないストライプの
数は、アイドルの基準を変えることによって調節するこ
とができる。

【００４１】代替的形態として、アレイに関する別の可
用性基準を、メモリ１３に記憶されたＮＰＲＢ数が変化
することのなかった平均時間から決定することもでき
る。これは、所与の時間間隔の間のアレイ上の非保護デ
ータの平均量すなわち平均パリティ遅れ時間の決定を可
能にするもので、設定されたＮＰＲＢの数およびそれら
が設定された時間の長さから決定することができる。平
均パリティ遅れ時間の測定から、平均データ損失率(Mea
n-Data-Loss-Rateの頭文字をとってＭＤＬＲと呼ばれ
る)を決定することが可能である。これは、所与の時間
において損失するデータ量に比例し、データが非保護で
ある時間の分数である。上述の通り、ＲＡＩＤ５アーキ
テクチャに関する破局的データ損失は、時間的に接近し
た２つのディスク故障に対して発生する。従って、ＲＡ
ＩＤ５アーキテクチャに関するＭＤＬＲは次の式(5)の
ように示すことができる。

【００４２】

【数５】 (5) ＭＤＬＲ_{RAID-catastrophic} ＝２Ｖ_disk × Ｎ／
（Ｎ＋１）× １／ＭＴＴＤＬ_{RAID-catastrophic}

【００４３】Ｖ_diskは、単一ディスクの容量であり、Ｎ
＋１はアレイにおけるディスクの数である。上述の通
り、ＡＦＲＡＩＤプロトコールは、１つのディスクの故
障に対して破局的故障を経験するので、このプロトコー
ルに関するＭＤＬＲは次の式(6)のようになる。

【００４４】

【数６】(6) ＭＤＬＲ_unprotected＝ (平均パリティ遅
れ／Ｎ) × (Ｎ＋１)／ＭＴＴＦ_disk

【００４５】平均パリティ遅れ／Ｎは１つのディスク故
障に対して弱い非保護データの平均量を定義し、((Ｎ＋
１)／ＭＴＴＦ)は、アレイ中のすべてのディスクの総故
障率を定義する。(5)および(6)を加算することによっ
て、ＡＦＲＡＩＤプロトコールに関するＭＤＬＲが次の
式(7)のように得られる。

【００４６】

【数７】(7) ＭＤＬＲ_AFRAID＝ＭＤＬＲ
_{RAID-catastrophic}＋ＭＤＬＲ_unprotected

【００４７】ＭＤＬＲ計算を用いることによって、ＡＦ
ＲＡＩＤプロトコールにおいて、ユーザは信頼性を平均
データ損失時間（ＭＴＴＤＬ)だけでなく損失データ量
(ＭＤＬＲ)にも基づかせることができる。ＭＴＴＤＬと
同様に、ＡＦＲＡＩＤプロトコールがＭＴＴＤＬと連係
して動作するようにあるいはその代わりに動作するする
ように使われている間に、ＭＤＬＲは連続的に計算され
ることができる。ＭＤＬＲがＭＴＴＤＬと連係して動作
するように使われるならば、ステップ６１で測定された
ビットの数は、プロトコールがステップ６４を続ける前
にステップ６３で充足されなければならない２つの基準
を示すであろう。しかし、ＭＴＴＤＬを減少させる程に
はＡＦＲＡＩＤプロトコールがＭＤＬＲを増加させない
ので、ＭＴＴＤＬがアレイの信頼性劣化に関する制御変
数であると本発明は判断した。従って、計算を単純化す
るため、ＭＤＬＲの計算を先行させることが望ましい。

【００４８】図５には、ＲＡＩＤ５アーキテクチャを用
いるＲＡＩＤシステムとＡＦＲＡＩＤプロトコールの間
の比較が示されている。図示されているデータは、複数
のトレース(traces)でアレイの動作をシミュレートした
イベント主導型シミュレータを使用して得られたもので
ある。トレースは、種々の処理システムとディスク・ド
ライブ・アレイの間のＩ／Ｏアクセスに対応している。
シミュレータは、ＨＰＣ３３２５、２ＧＢ、３.５"、５
４００ＲＰＭディスクを含むアレイをモデル化した。グ
ラフ８２は、分析されたトレースのすべてから得られた
結果の平均を表す。縦軸は、ＲＡＩＤ５アーキテクチャ
と比較されたＡＦＲＡＩＤプロトコールの相対的信頼性
を示す。横軸は、ＲＡＩＤ５と比較されたＡＦＲＡＩＤ
の相対的書込み応答時間を示す。点８０において、ＡＦ
ＲＡＩＤプロトコールは、ＲＡＩＤ５アーキテクチャの
信頼性の約９０％で約１.５倍の応答時間向上を与え
る。点８４において、ＡＦＲＡＩＤプロトコールは、Ｒ
ＡＩＤ５アーキテクチャの信頼性の約６０％で約３.５
倍の応答時間向上を与える。図５は、処理性能と可用性
の間のトレードオフを示す。本発明の好ましい実施形態
において、ユーザは、例えばＲＡＩＤ５の５０％、７０
％または９０％のように所望の信頼性を設定し、ＡＦＲ
ＡＩＤプロトコールがＭＴＴＤＬを連続的に計算する。
ＭＴＴＤＬが設定された基準の範囲内にある限り、ＡＦ
ＲＡＩＤプロトコールは、アレイ１６がアイドルとなる
まで、パリティ更新を延期する。基準内でなければ、Ａ
ＦＲＡＩＤプロトコールは直ちに１つまたは複数の非保
護ストライプに保持されているデータを読み取り、パリ
ティ情報を書き込む。非保護ストライプのパリティ再構
築を達成するため、パリティ更新のピギーバッキングや
ディスク全体の単一掃引を含むいかなる従来技術をも使
用することができる。

【００４９】図６には、コントローラ１４がＣＰＵ１０
からのＩ／Ｏ要求を実質的に連続的に監視するＡＦＲＡ
ＩＤプロトコールの実施プロセスが示されている。ステ
ップ７２でアレイ１６がＷＲＩＴＥコマンドを受け取る
と、ステップ７４において、コントローラ１４はステッ
プ７６、７７および７８で従来技術のＲＭＷ更新プロト
コールが起動されるべきか、ＡＦＲＡＩＤプロトコール
が起動されるべきかを判断する。ＡＦＲＡＩＤプロトコ
ールが使われるならば、プログラムはステップ７５へ進
み、図２および図４に示されたサブルーチンを実行す
る。このようにして、ユーザは、ＡＦＲＡＩＤプロトコ
ールが小規模更新のため用いられることを選択すること
ができる。

【００５０】従来技術の更新プロトコールにおいては、
新しいデータが書き込まれる領域としてコントローラ１
４によって識別されるディスク上の目標領域からデータ
の古い値を、その目標領域に対応する古いパリティ情報
と共に、読み取る(ステップ７６)。この古いデータおよ
びパリティ情報はメモリ１３に送られ、新しいパリティ
情報を生成するためそこに記憶されている新しいデータ
とのＸＯＲ動作を受ける(ステップ７７)。その後、ステ
ップ７８において、新しいデータおよびパリティ情報が
アレイ１６上の該当する目標領域に書き込まれる。

【００５１】ステップ７４における２つの更新プロトコ
ールのどちらを使用するかの判断は、複数の条件のいず
れかの発生に基づいて行われる。例えば、デフォルト更
新プロセスはＡＦＲＡＩＤプロトコールを使うものとし
て、特定の書き込み「フラグ」があれば、従来技術の更
新プロトコールを使用することとすることができるであ
ろう。更に、特定のブロックまたはストライプ・アドレ
スなどのアレイ記憶空間のサブセットにフラグを立て、
それによって従来技術の更新プロトコールを使用するよ
うにできる。逆に、デフォルト更新プロセスは従来技術
の更新プロトコールを使うものとして、特定の書き込み
「フラグ」があれば、ＡＦＲＡＩＤプロトコールを使用
することとすることもできる。更に、Ｉ／Ｏパターンが
目標ＭＴＴＤＬを維持しながらスループット時間の増加
を許容するものとＣＰＵ１０が予測するならば、ＡＦＲ
ＡＩＤプロトコールを自動的に起動させることもでき
る。そのような予測を行うため、過去のＩ／Ｏ機能を監
視する既知の予測技術のいずれをも使うことができる。

【００５２】本発明が小規模ファイル更新すなわち部分
的ストライプ更新に関して記述されたが、本発明は、新
しいデータが（ストライプ全体でなければ)ストライプ
を含む相当数のブロックに書き込まれる形態の大規模ス
トライプ更新にも同様に適用することができる。ストラ
イプ全体が書き込まれる場合は、ＡＦＲＡＩＤプロトコ
ールを使用する利益はほとんどない。そのようなストラ
イプの場合は、消去される関連ＮＰＲＢに関する新しい
パリティを含めてその全体が単純に書き込まれるべきで
ある。

【００５３】ＡＦＲＡＩＤプロトコールは、また、デー
タの１つのストライプのサブストライプを更新するよう
に実施することもできる。このように、新しいデータ
は、ストライプを構成するいくつかのブロックの部分に
書き込まれる。例えば、各ブロックが６４ＫＢの情報を
含むとすれば、所与のストライプにおいて、更新される
サブストライプは各ブロックに書き込まれる２ＫＢのデ
ータすなわちブロックのサブセットを含むことができ
る。この例では、２ＫＢの新しいパリティ情報だけを生
成してストライプのパリティ・ブロックに書き込むだけ
でよい。

【００５４】本発明には、例として次のような実施様態
が含まれる。（１）データおよびパリティ情報を記憶するため複数の
ストライプを有するディスク・アレイを形成する複数の
ディスク装置を備えたフォールト・トレラント記憶装置
にデータを記憶する方法であって、上記複数のストライ
プの１つに位置し、古いデータに重ねて新しいデータを
書き込むべき少なくとも１つの目標領域を識別するステ
ップと、古いデータおよびそれに関連するパリティ情報
を読み取ることなく、新しいデータを上記少なくとも１
つの識別された目標領域に非保護データとして書き込む
ステップと、上記アレイ上に存在する上記非保護データ
の数量を監視するステップと、上記アレイ上に存在する
上記非保護データの数量を動的に調節するステップと、
を含むデータ記憶方法。（２）上記調節するステップが、上記数量があらかじめ
定められたしきい値を越えないことを保証するように非
保護データの上記数量を調節することを含む、上記
（１）に記載のデータ記憶方法。（３）上記監視するステップが、平均データ損失時間を
連続的に決定することを含む、上記（１）または（２）
に記載のデータ記憶方法。

【００５５】（４）上記監視するステップが、あらかじ
め定められた時間量にわたって上記数量を監視して、上
記時間間隔の間の非保護データの平均量を決定し、平均
データ損失率を決定することを含む、上記（１）、
（２）または（３）に記載のデータ記憶方法。（５）上記調節するステップが、上記新しいデータに関
するエラー訂正情報を生成して、上記更新されるストラ
イプに上記エラー訂正情報を書き込むことを含む、上記
（１）、（２）、（３）または（４）に記載のデータ記
憶方法。（６）上記調節するステップが、アレイに対するＩ／Ｏ
要求率を監視し、上記Ｉ／Ｏ要求率があらかじめ定めら
れた範囲内にある場合上記新しいデータに関するエラー
訂正ブロックを生成することを含む、上記（１）、
（２）、（３）、（４）または（５）に記載のデータ記
憶方法。（７）上記識別するステップおよび上記新しいデータを
書き込むステップが複数回起き、新しいデータで複数の
ストライプを更新するステップが上記調節ステップの前
に行われる、上記（１）、（２）、（３）、（４）、
（５）または（６）に記載のデータ記憶方法。（８）上記新しいデータに対応するエラー訂正情報が上
記ディスク・アレイ上に存在しないことを示すためパリ
ティ再構築必要ビットすなわちＮＰＲＢを定義する情報
をメモリに書き込むステップを含み、上記監視ステップ
が上記ＮＰＲＢを検出することを含み、上記生成ステッ
プが上記ＮＰＲＢの存在に応答してエラー訂正情報を生
成することを含む、上記（１）、（２）、（３）、
（４）、（５）、（６）または（７）に記載のデータ記
憶方法。（９）上記生成ステップが、新しいデータを保持する上
記複数のストライプに関してエラー訂正情報を並列的に
生成することを含む、上記（７）に記載のデータ記憶方
法。

【００５６】（１０）複数のディスク・ドライブに関す
るパリティ情報を生成する装置であって、古いデータに
重ねて新しいデータを書き込むべき少なくとも１つの目
標領域を各々が持つ複数のストライプを有するディスク
・アレイを構成する複数の個別ディスク・ドライブと、
上記アレイとのデータ通信を通して上記アレイの動作を
調整するコントローラと、上記コントローラおよび上記
アレイとのデータ通信を通して、上記古いデータ目標領
域を含む複数の目標領域のうちの第１の複数の新しいデ
ータ目標領域へ新しいデータをエラー訂正情報を持たな
い非保護データとして書き込むサブルーチンを記憶し、
上記新しいデータ目標領域に存在する上記新しいデータ
からエラー訂正情報を生成し、上記アレイ上に存在する
非保護データの数量を監視し、上記アレイ上に存在する
非保護データの数量を動的に調節するメモリ手段と、を
備えるパリティ情報生成装置。

【００５７】

【発明の効果】本発明は、パリティ情報の生成、書き込
みをディスクがアイドルとなるまで延期することによっ
て、小規模更新を行う場合に従来技術のＲＭＷシーケン
スが派生する長いディスク回転待ちを回避して、ディス
ク・アレイ上のデータ更新に必要とされるアクセス時間
を短縮するという効果を奏する。

【図面の簡単な説明】

【図１】本発明に従った小規模データ更新プロトコール
を組み入れたコンピュータ・システムのブロック図であ
る。

【図２】図３および図４と共に、本発明に従った小規模
更新プロトコールを実行する第１の方法の非同期サブル
ーチンの動作を示す流れ図である。

【図３】図２および図４と共に、本発明に従った小規模
更新プロトコールを実行する第１の方法の非同期サブル
ーチンの動作を示す流れ図である。

【図４】図２および図３と共に、本発明に従った小規模
更新プロトコールを実行する第１の方法の非同期サブル
ーチンの動作を示す流れ図である。

【図５】処理性能および信頼性に関する本発明とＲＡＩ
Ｄ５アーキテクチャの比較を示すグラフ図である。

【図６】本発明に従った小規模更新プロトコールを実行
する第２の方法の動作を示す流れ図である。

【符号の説明】

１０ＣＰＵ１１、１３バッファ・メモリ１２線１４アレイ・コントロー
ラ１８、２０、２２、２４、２６ディスク・ドライブ２８ストライプ(帯) ３０、３２、３４、３６、３８ブロック

Claims

【特許請求の範囲】

【請求項１】データおよびパリティ情報を記憶するため
複数のストライプを有するディスク・アレイを形成する
複数のディスク装置を備えたフォールト・トレラント記
憶装置にデータを記憶する方法であって、上記複数のストライプの１つに位置し、古いデータに重
ねて新しいデータを書き込むべき少なくとも１つの目標
領域を識別するステップと、古いデータおよびそれに関連するパリティ情報を読み取
ることなく、新しいデータを上記少なくとも１つの識別
された目標領域に非保護データとして書き込むステップ
と、上記アレイ上に存在する上記非保護データの数量を監視
するステップと、上記アレイ上に存在する上記非保護データの数量を動的
に調節するステップと、を含むデータ記憶方法。