JP5020491B2

JP5020491B2 - Ｎｍｒデータの処理装置及び方法

Info

Publication number: JP5020491B2
Application number: JP2005274503A
Authority: JP
Inventors: 慶子平川; 和紀有福; 正子藤原
Original assignee: Jeol Resonance Inc
Current assignee: Jeol Resonance Inc
Priority date: 2005-05-02
Filing date: 2005-09-21
Publication date: 2012-09-05
Anticipated expiration: 2025-09-21
Also published as: JP2006337354A

Description

本発明は、NMR(核磁気共鳴）データを処理するための装置及び方法に関わり、特に、例えばメタボローム解析（メタボノミクスまたはメタボロミクス）のように多数のNMRスペクトルの多変量解析を行なう用途に好適なものである。

近年、ゲノムやプロテオーム科学の進展に伴って、代謝物全体（メタボローム又はメタボノーム）を網羅的に解析するメタボノミクス（メタボロミクスともいう）が注目を集めている。特に、NMR装置により測定される多数の生体サンプルのプロトンスペクトル（NMRスペクトル）を用い、多変量解析によってサンプル間のパターン分類を行うことで、例えば病態や未病に対する知見を得ようとする解析方法が、メタボノミクスにおいて採用される。

すなわち、生体サンプルのプロトンスペクトルは、多種の低分子代謝物や生体高分子化合物を含むので多くのピークが重なり複雑なパターンを示す。また、微弱なピークも多くて、それをノイズと区別することが難しい。そのため、プロトンスペクトルに含まれる個々のピークを同定し構造解析することが困難である。そこで、メタボノミクスにおいては、多数の生体サンプルのプロトンスペクトルを測定し、測定された多数のプロトンスペクトルのデータを用いて多変量解析のような統計的解析を行ない、生体サンプル間の構成成分種や比率の相違をパターン（特徴量）として抽出するという解析方法が採用される。この方法により、代謝物の質的相違を捉えたり、経時変化を検出したりすることが可能になる。

ところで、メタボノミクスを使用した薬物発見、疾患の処置及び診断のための方法が特許文献１に開示されている。ただし、特許文献１には、NMRスペクトルに関する開示はない。また、特許文献２及び３には、メタボノミクスのためのNMRスペクトルの処理に関する技術が開示されている。また、化学データの多変量解析の種々の手法が、非特許文献１に開示されている。

特表２００３−５３０１３０号公報特表２００４−５２６１３０号公報特表２００４−５３８５５９号公報「コンピュータ・ケミストリーシリーズ３ケモメトリックス化学パターン認識と多変量解析」宮下芳・佐々木慎一著、共立出版

一般的なメタボノミクスのプロセスは、NMR装置から出力される多数のサンプルのFID(Free Induction Decay：自由誘導減衰）データを得ること、多数のサンプルのFID信号をそれぞれNMRスペクトルに変換すること、及び、多数のサンプルのNMRスペクトルに関して多変量解析に代表される統計処理を行なうことが含まれる。メタボノミクスのプロセスに含まれる複雑なNMRスペクトルデータの処理は、通常、コンピュータにより実行されるが、信頼できる処理結果を得るためには、FID信号から得られるNMRスペクトルの精度を向上し、かつ、多数のNMRスペクトルを統計処理プログラムで効率よく分析できるようにするためのデータ加工技術が必要である。

NMRスペクトルの精度を向上させるための従来の処理技術として、位相補正とベースライン補正がある。位相補正とベースライン補正は、いずれも、コンピュータにより自動的に行い得るが、しかし最終的には、人が手動で、コンピュータの表示スクリーンに表示されたNMRスペクトルのグラフを見ながら、補正パラメータを最も適当と思われる値に調整するための操作をコンピュータに加えるという方法で行われる。しかし、この従来の補正方法は、長い作業時間を要して非効率的であるとともに、補正結果の適正レベルが人に依存するので常に最適なNMRスペクトルを得ることが難しい。

また、NMRスペクトルを統計処理プログラムで効率よく分析できるようにするために、従来、NMRスペクトルを統計処理プログラムにインプットする前に、NMRスペクトルにバケット積分を適用して、これをデータ量のより小さいヒストグラムに縮約するという処理が行われている。すなわち、NMRスペクトルのケミカルシフト軸（周波数軸）に沿った観測範囲が、一定幅(典型的には０．０４ppm）の刻みで多数のバケット（ケミカルシフトの小区間）に分割され、バケット毎にNMRスペクトルの強度の積分（バケット積分）が行われ、その結果として、多数のバケットの積分値のセットからなるヒストグラムが、NMRスペクトルの縮約として得られる。各サンプルのNMRスペクトルがヒストグラムに変換されるので、全体でサンプル数×バケット数に相当する数の積分値が得られ、それらの積分値が統計処理プログラムにインプットされる。

しかしながら、従来のバケット積分の処理方法で得られるヒストグラムは、必ずしも、NMRスペクトルの特徴を十分に良く反映したものではない。すなわち、NMRスペクトル上の重要な幾つかの強度ピークが、ヒストグラム上では矮小化又は稀釈化されてしまう場合がある。この現象は、バケット積分のプロセスにおいて、一つの強度ピークが分布するケミカルシフト領域が複数のバケットに分割され、その結果、その強度ピークが複数の小さい積分値に分散されるときに生じる。

上述した位相補正とベースライン補正に関わる問題、及びバケット積分に関わる問題に対しては、特許文献１−３はいずれも、格別有用な技術を提供していない。これらの問題は、メタボノミクスのためのNMRスペクトル処理だけに限らず、他の用途のためのNMRスペクトル処理においても同様に存在する。

また、統計処理プログラムにより行なわれる多変量解析の処理については、上述した特許文献には格別の提案はない。

ここで、非特許文献１に開示されているように、多変量解析と呼ばれる分析手法には多くの種類がある。代表的な分析手法の一つはPCA（Principal component Analysis：主成分分析）である。PCAでは、サンプルの成分である多数の変数の座標軸からなる多次元空間中で、サンプル間の相違（分散）が最も顕著に現れる少数本（例えば３本程度）の新しい座標軸が定義され、そして、新しい座標軸上での各サンプルの座標値が計算される。ここで、その新しい座標軸は「主成分軸」と呼ばれ、各主成分軸に沿った変数は「主成分」と呼ばれ、そして、各サンプルの各主成分軸上の座標値は「スコア」と呼ばれる。各主成分は、多数の変数の線形一次式で定義され、その線形一次式内の各変数項の係数は「ローディング」と呼ばれる。ある主成分についての各変数のローディングは、その主成分に対する各変量の寄与度合いつまり重みを表す。

このようなPCAの結果に基づいて、主成分空間上に多数のサンプルをプロットすることにより、それらサンプルの性格を視覚的に把握することが容易になる。また、主成分空間上でのサンプルの配置や相互間の距離などを利用して、多数のサンプルのクラス分けを行なうことができる。

また、PCAを応用したSIMCA（Soft Independent Modeling of Class Analogy：部分空間法）も、メタボノミクスにおいて有用であると考えられる。SIMCAでは、異なるクラスのサンプルに対してクラス毎にPCAを行ない、クラス毎に主成分を決定し、そして、或る主成分がそれらのクラスを分類するためにどの程度有効であるかを評価することができる。

このようなPCA及びSIMCAの解析結果を巧く利用することにより、サンプルから得られる知見を有効に生かして、例えばマーカ変数の検出やその他の目的をより容易且つ精度良く達成できるようになることが期待される。

しかしながら、上記の期待を満足させるために、特に、メタボノミクスのような応用分野で高い有用性を発揮するために、PCA及びSIMCAを具体的にどのように実行し、どのように関連させ、そして、その解析結果をどのようなにユーザに対して表示するかというような活用技術については、まだ満足できるものが従来提供されていない。そのため、多変量解析は、統計数学の専門家以外の人々にとってはまだ敷居が高く、メタボノミクスなどの応用分野で、期待されながらも、その真価を発揮するほどには十分に活用されていないというのが現状である。

従って、本発明の目的は、NMRスペクトルの解析処理の精度を高めることにある。

別の目的は、NMRスペクトルの解析処理の効率を高めることにある。

別の目的は、NMRスペクトルをバケット積分によりヒストグラムに縮約するとき、NMRスペクトルのピークの特徴がヒストグラムに良く反映されるようにすることにある。

さらに別の目的は、多数サンプルのNMRスペクトルの解析において、多変量解析を有効に活かすための処理技術を提供することにある。

さらにまた別の目的は、メタボノミクスなどの応用分野において、多変量解析処理を活用して、より精度の高い結果又は結論を導くことを容易にすることにある。

本発明の一つの側面に従えば、NMRデータの処理装置は、サンプルのNMR特性を示す対象スペクトルデータを生成するスペクトル生成手段と、前記対象スペクトルデータに対し、不均等な幅をもつ多数のバケットからなるバケットセットを用いたバケット積分を実行することにより、前記対象スペクトルデータをヒストグラムデータに縮約するデータ縮約手段と、前記ヒストグラムデータを記憶又は出力する手段とを備える。

対象スペクトルデータのバケット積分を実行する際、適切に設定された不均等な幅をもつバケットセットを用いることにより、対象スペクトルデータがもつ重要なピークの情報を良好に維持したまま、対象スペクトルデータをバケット積分データのセットであるヒストグラムに縮約できる。そのため、そのヒストグラムを用いて行われるスペクトル解析の精度が向上する。

好適な実施形態では、対象スペクトルデータがもつ重要なピークの情報を良好に維持するために、指定された１以上のピーク領域のいずれもが複数バケットに分割されないように、不均等幅のバケットセットが設定されている。さらに、対象スペクトルデータから検出された１以上のピーク領域のいずれもが複数バケットに分割されないように、不均等幅のバケットセットが設定されている。

好適な実施形態では、上記のような不均等幅のバケットセットを自ら設定するバケット設定手段が、NMRデータの処理装置に備えられる。このバケット設定手段は、複数の対象スペクトルデータを入力し、それらの複数の対象スペクトルデータが投影された投影スペクトルデータを生成し、投影スペクトルデータからピーク領域を検出し、そして、検出された１以上のピーク領域のいずれもが複数バケットに分割されないようにして各バケットを設定する。さらに、このバケット設定手段は、１以上のピーク領域を指定し、指定された１以上のピーク領域のいずれもが複数バケットに分割されないようにして各バケットを設定する。さらに、このバケット設定手段は、オペレータから入力された要求に応答して、各バケットを修正することもできる。

好適な実施形態では、上記対象スペクトルとして、サンプルのFIDデータから得られたNMRスペクトルデータに絶対値微分を施した結果である絶対値微分スペクトルデータが用いられる。ここで、NMRスペクトルデータの絶対値微分とは、NMRスペクトルの実部の周波数（ケミカルシフト）微分の二乗と、虚部の周波数（ケミカルシフト）微分の二乗との和の平方根である。このような絶対値微分スペクトルデータを用いてスペクトル解析を行うことで、面倒な位相補正やベースライン補正を行うことなしに、効率的に精度の良い解析結果を得ることが可能になる。

本発明の別の側面に従うNMRデータの処理装置は、サンプルのFIDデータを取得する手段と、前記FIDデータからNMRスペクトルデータを生成する手段と、前記NMRスペクトルデータに絶対値微分を施して絶対値微分スペクトルデータを生成する手段と、前記絶対値微分スペクトルデータを記憶又は出力する手段とを備える。

本発明のまた別の側面に従うNMRスペクトルの統計処理装置は、複数のサンプルのNMRヒストグラムデータからなる多変量データ行列を入力する多変量データ行列入力手段と、入力された前記多変量データ行列についてPCA解析計算を行なうPCA解析手段と、前記PCA解析計算の結果を受けて、複数種のPCA解析結果チャートをユーザインタフェース画面に表示するPCA解析結果表示手段と、前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段と、入力された前記ユーザ要求が1以上のサンプルを選択するものである場合、前記選択されたサンプルのNMRスペクトルのデータを入力して、入力された前記NMRスペクトルをケミカルシフト軸上に表したNMRスペクトルチャートを前記ユーザインタフェース画面に表示するNMRスペクトル連携手段とを備える。

前記PCA解析結果チャートには少なくとも、複数の主成分に対する前記サンプルのスコアを表したスコアプロットと、変数たる所定の複数のケミカルシフト値の前記複数の主成分に対するローディングを表したローディングプロットと、前記所定の複数のケミカルシフト値の寄与率又はローディングをケミカルシフト軸上に表した寄与率／ローディングチャートとが含まれる。前記寄与率／ローディングチャートと前記NMRスペクトルチャートとは、それぞれの前記ケミカルシフト軸のスケールが一致するようにして、前記ケミカルシフト軸に直交する方向に並べられて表示されるようになっている。

好適な実施形態では、入力された前記ユーザ要求が前記寄与率／ローディングチャートを拡大するものである場合、前記PCA解析結果表示手段と前記NMRスペクトル連携手段が、前記寄与率／ローディングチャートと前記NMRスペクトルチャートとの間の前記ケミカルシフト軸のスケールの一致が保持されるようにして、前記寄与率／ローディングチャートと前記NMRスペクトルチャートとを拡大して表示する。

また、好適な実施形態では、入力された前記ユーザ要求が選択された1以上のサンプルを削除するものである場合、前記PCA解析手段が、前記削除されたサンプル以外のサンプルのNMRヒストグラムデータからなる多変量データ行列についてPCA解析計算を再度実行し、前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する。

また、好適な実施形態では、入力された前記ユーザ要求が選択された1以上の変数たるケミカルシフト値を削除するものである場合、前記PCA解析手段が、前記削除されたケミカルシフト値以外のケミカルシフト値を用いてPCA解析計算を再度実行し、前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する。

本発明のさらにまた別の側面に従うNMRスペクトルの統計処理装置は、数のクラスに割り当てられた複数のサンプルのNMRヒストグラムデータからなる複数クラスの多変量データ行列を入力する多変量データ行列入力手段と、入力された前記複数クラスの多変量データ行列についてSIMCA解析計算を行なうSIMCA解析手段と、前記SIMCA解析計算の結果を受けて、複数種のSIMCA解析結果チャートをユーザインタフェース画面に表示するSIMCA解析結果表示手段と、前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段と、入力された前記ユーザ要求が1以上のサンプルを選択するものである場合、前記選択されたサンプルのNMRスペクトルのデータを入力して、入力された前記NMRスペクトルをケミカルシフト軸上に表したNMRスペクトルチャートを前記ユーザインタフェース画面に表示するNMRスペクトル連携手段とを備える。

前記SIMCA解析結果チャートには少なくとも、前記複数のクラスに対する前記サンプルの距離を表したクーマンプロットと、変数たる所定の複数のケミカルシフト値のモデリング力又は識別力をケミカルシフト軸上に表したモデリング力／識別力チャートとが含まれる。前記モデリング力／識別力チャートと前記NMRスペクトルチャートとは、それぞれの前記ケミカルシフト軸のスケールが一致するようにして、前記ケミカルシフト軸に直交する方向に並べられて表示されるようになっている。

好適な実施形態では、入力された前記ユーザ要求が前記モデリング力／識別力チャートを拡大するものである場合、前記SIMCA解析結果表示手段と前記NMRスペクトル連携手段が、前記モデリング力／識別力チャートと前記NMRスペクトルチャートとの間の前記ケミカルシフト軸のスケールの一致が保持されるようにして、前記モデリング力／識別力チャートと前記NMRスペクトルチャートとを拡大して表示する。

また、好適な実施形態では、入力された前記ユーザ要求が選択された1以上のサンプルを削除するものである場合、前記SIMCA解析手段が、前記削除されたサンプル以外のサンプルのNMRヒストグラムデータからなる複数クラスの多変量データ行列についてSIMCA解析計算を再度実行し、前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する。

また、好適な実施形態では、入力された前記ユーザ要求が、所定の閾値より前記識別力又はモデリング力が高い変数たるケミカルシフト値を選択するとともに再計算を要求するものである場合、前記SIMCA解析手段が、前記選択されたケミカルシフト値だけを用いてSIMCA解析計算を再度実行し、前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する。

本発明のまた更に別の側面に従うNMRスペクトルの統計処理装置は、複数のサンプルのNMRヒストグラムデータからなる多変量データ行列についてPCA解析計算を行なうPCA解析手段と、前記PCA解析計算の結果を受けて、複数種のPCA解析結果チャートをユーザインタフェース画面に表示するPCA解析結果表示手段と、複数のクラスに割り当てられた複数のサンプルのNMRヒストグラムデータからなる複数クラスの多変量データ行列を入力する多変量データ行列入力手段と、入力された前記複数クラスの多変量データ行列についてSIMCA解析計算を行なうSIMCA解析手段と、前記SIMCA解析計算の結果を受けて、複数種のSIMCA解析結果チャートをユーザインタフェース画面に表示するSIMCA解析結果表示手段と、前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段とを備える。

前記PCA解析結果チャートには少なくとも、複数の主成分に対する前記サンプルのスコアを表したスコアプロットと、変数たる所定の複数のケミカルシフト値の前記複数の主成分に対するローディングを表したローディングプロットと、前記所定の複数のケミカルシフト値の寄与率又はローディングをケミカルシフト軸上に表した寄与率／ローディングチャートとが含まれる。前記SIMCA解析結果チャートには少なくとも、前記複数のクラスに対する前記サンプルの距離を表したクーマンプロットと、変数たる所定の複数のケミカルシフト値のモデリング力又は識別力をケミカルシフト軸上に表したモデリング力／識別力チャートとが含まれる。

前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力／識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともにPCA解析計算の再実行を要求するものである場合、前記PCA解析手段が、前記選択されたケミカルシフト値だけを用いてPCA解析計算を再度実行し、前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する。

好適な実施形態では、前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力／識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともに変数を追加したPCA解析計算の再実行を要求するものである場合、前記PCA解析手段が、前記選択されたケミカルシフト値を現在の変数たるケミカルシフト値に追加してなる変数を用いてPCA解析計算を再度実行し、前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する。

また、好適な実施形態では、前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力／識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともにSIMCA解析計算の再実行を要求するものである場合、前記SIMCA解析手段が、前記選択されたケミカルシフト値だけを用いてPCA解析計算を再度実行し、前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する。

本発明は更に、上述した原理に基づくNMRデータの処理方法、NMRデータ処理のためのコンピュータプログラム、及びNMRスペクトルの統計処理のためのコンピュータプログラムも提供する。

本発明のNMRデータの処理装置及び方法によれば、多数サンプルのNMRスペクトルの解析において、多変量解析を有効に活かすことができ、そのため、メタボノミクスなどの応用分野において、より精度の高い結果又は結論を導くことが容易になる。

本発明のNMRデータの処理装置及び方法によれば、NMRスペクトルに絶対値微分を適用することで、NMRスペクトルの解析処理の効率が向上する。

本発明のNMRスペクトルの統計処理装置によれば、多数サンプルのNMRスペクトルの解析において、多変量解析を有効に活かすことができる。

本発明のNMRスペクトルの統計処理装置によれば、これをメタボノミクスなどの応用分野で利用することにより、多変量解析処理を活用して、より精度の高い結果又は結論を導くことが容易になる。

以下、図面を参照して本発明の実施形態を説明する。

図１は、本発明に従うNMRデータ処理装置の一実施形態の全体的な構成と機能を示す。

図１に示すように、本発明に従うNMRデータ処理装置としてのコンピュータシステム１００が、NMR装置１０２と関連して用いられる。コンピュータシステム１００は、プログラムされた１台コンピュータマシン(例えば、汎用のパーソナルコンピュータ、ワークステーション或いはメインフレームコンピュータマシンなど）であってもよいし、或は複数台のコンピュータマシンから構成されてもよい。なお、コンピュータシステムに代えて、１以上の専用ハードウェア回路、又は専用ハードウェア回路とコンピュータシステムとの組み合わせなどが、NMRデータ処理装置として用いられてもよい。

コンピュータシステム１００は、プロセッサ１０４と、プロセッサ１０４のためのコンピュータプログラム及びプロセッサ１０４により処理されるデータを格納するための記憶装置１０６とを有する。プロセッサ１０４は、記憶装置３０６に記憶されている所定のコンピュータプログラムを実行することによりNMRデータの処理を行う。NMRデータを処理する目的が異なれば、その処理の方法も当然に異なるが、ここでは、NMRデータの処理の一例として、メタボノミクスによりマーカ成分を確定することを目的として、多数のサンプルのNMRスペクトルを収集し、それらのスペクトルを統計的に解析する場合を取り上げて説明する。

プロセッサ１０４が行うNMRデータの処理は、大きくFIDデータ入力処理１０８、NMRスペクトル処理１１０、データ縮約処理１１２、積分結果データ保存／出力処理１１４、及び統計処理１１６に分けられる。FIDデータ入力処理１０８では、NMR装置１０２から出力される各サンプルのFID(Free Induction Decay：自由誘導減衰）データが入力され、それにより、多数のサンプルのFIDデータが収集されて記憶装置１０６に記憶される。NMRスペクトル処理１１０では、各サンプルのFIDデータがフーリエ変換によりNMRスペクトルデータに変換され、更にそのNMRスペクトルデータが本発明の原理に従った「絶対値微分法（Absolute Differential Calculation Method)」により「絶対値微分NMRスペクトル（Absolute Differential NMR Spectrum」データに変換され、それにより、多数のサンプルの「絶対値微分NMRスペクトル」データが記憶装置１０６に記憶される。ここで、「絶対値微分法」及び「絶対値微分NMRスペクトル」という用語は、この明細書で説明の便宜上用いられる特殊な用語であり、その詳細は後に説明する。「絶対値微分NMRスペクトル」は、以下、「ADスペクトル」と略称する。

次のデータ縮約処理１１２では、本発明の原理に従った方法で「最適化バケットセット」が算出され、そして、その「最適化バケットセット」を用いて多数のサンプルのADスペクトルに「最適化バケット積分」が実行され、それにより、多数のサンプルのADスペクトルの縮約データであるヒストグラム（バケット積分データのセット）が生成される。ここで、「最適化バケットセット」及び「最適化バケット積分」という用語も、この明細書で説明の便宜上用いられる特殊な用語であり、その詳細は後に説明する。積分結果データ保存／出力処理１１４では、上記のデータ縮約処理１１２により生成された多数のサンプルのヒストグラムデータ（バケット積分データのセット）が、記憶装置１０６に記憶され、また必要に応じて外部へ出力される。統計処理１１６では、多数のサンプルのヒストグラムデータを用いて、処理目的に応じた統計処理、例えばマーカ成分を確定するための検出多変量解析、が行われる。そして、その統計処理の結果を表すデータが記憶装置１０６に記憶され、また必要に応じて外部へ出力される。

ここで、FIDデータ入力処理１０８、積分結果データ保存／出力処理１１４及び統計処理１１６には、それぞれ、公知の各種の処理方法が採用可能であるため、これらについての詳細な説明は省略する。以下では、絶対値微分法を用いたNMRスペクトル処理１１０と、最適化バケット積分によるデータ縮約１１４について、詳細且つ具体的に説明する。

図２は、NMRスペクトル処理１１０の流れを示す。

図２に示すように、ステップ１２０で、NMR装置１０２から取得されて記憶装置１０６に保存されている各サンプルのFIDデータが、記憶装置１０６から読み込まれる。ステップ１２２で、そのFIDデータに対してウィンドウ処理が行われ、そのFIDデータのSN比が改善され、またリップルが除去される。ステップ１２４で、ウィンドウ処理１２２を経たFIDデータに対してフーリエ変換処理が行われて、そのFIDデータがNMRスペクトルデータに変換される。ステップ１２６で、そのNMRスペクトルデータに対して絶対値微分演算が行われて、そのNMRスペクトルデータがADスペクトルデータ（絶対値微分NMRスペクトルデータ）に変換される。ステップ１２８で、そのNMRスペクトルデータとADスペクトルデータとが記憶装置１０６に保存され、また、必要に応じて外部へ出力される。多数のサンプルの各々について、上記のステップ１２０〜１２８の処理が行われ、それにより、多数のサンプルのNMRスペクトルデータとADスペクトルデータが記憶装置１０６に蓄積される。

ステップ１２６の絶対値微分演算について、以下、具体的に説明する。

絶対値微分の対象であるNMRスペクトルは、δをケミカルシフト、ｊを虚数記号としたとき、次式
NMRスペクトル＝R(δ)＋ｊ・I(δ) …(1)
で表現することができる。ここで、R(δ)はNMRスペクトルの実部であり、I(δ)は虚部である。そして、NMRスペクトルを絶対値微分した結果であるADスペクトルは、次式

で表現することができ（又は、ケミカルシフトδに代えて周波数ωで微分してもよい）。すなわち、これは、NMRスペクトルの実部R(δ)と虚部I(δ)それぞれの微分値の２乗和の平方根である。

図３Aは、NMRスペクトルの一例の実部の波形を示し、図３BはこのNMRスペクトルの絶対値微分であるADスペクトルの波形を示す。

図３Aに示されたNMRスペクトルの実部１４０から分かるように、このNMRスペクトルには位相ずれ（例えば、溶媒信号の部分１４２に位相ずれが顕著に表れている）が含まれ、かつ、そのベースライン成分は平坦ではなく歪んでいる。FIDデータから得られたNMRスペクトルは、殆ど例外なく、位相ずれと歪んだベースライン成分を含んでいる。従来技術によれば、NMRスペクトルに位相補正とベースライン補正が施される必要がある。

位相補正は位相ずれを除去するための操作である。位相ずれが含まれたNMRスペクトルでは、実部R(δ)と虚部I(δ)におけるピーク波形はそれぞれ図４Aに例示するような波形になる。位相補正では、位相ずれを低減して、図４Bに例示するような波形に整形する。また、ベースライン補正は、NMRスペクトルからベースライン成分を差し引くための補正である。図５Bに例示するように歪んだベースラインBLを、図５Bに例示するようなゼロで一定のベースラインBLに修正するのである。しかし、位相補正とベースライン補正は、オペレータにより手動で調整される必要があり、時間がかかり、かつ、オペレータの主観や技量のバイアスが入ってしまう。さらに、苦労して調整しても、十分満足できる結果に到達することが難しい。

これに対し、図３Bに例示されるように、NMRスペクトルの絶対値微分結果であるADスペクトル１４４においては、位相ずれが解消され、さらに、ベースラインもゼロ近傍でほぼ一定である。このことは、ADスペクトル１４４を用いれば、位相補正とベースライン補正が実質的に不要になることを意味する。その理由について具体的に説明する。

NMRスペクトルの実部R(δ)と虚部I(δ)は、次式
R(δ)＝A(δ)・cos(θ(δ)) …(3)
I(δ)＝A(δ)・sin(θ(δ)) …(4)
で表現することができる。ここで、A(δ)は振幅であり、θ(δ)は位相である。位相θ(δ)は、大雑把にはケミカルシフトδの一次関数、
θ(δ)＝K・δ＋L …(5)
で表すことができ、ここで、KとLは一定の係数である。これらの式を用いて絶対値微分を計算すると、ADスペクトルは次式、

に変換される。

上記(6)式から分かるように、ADスペクトルには位相θ(δ)の成分が含まれていない。また、(6)式において支配的な部分は第1項であるが、そこでは振幅A(δ)がケミカルシフトδで微分されており、この微分によりベースライン成分（これは、図５Aの例から分かるようにケミカルシフトδに対して緩やかな傾きで歪んでいる）は実質的にゼロになる。そのため、ADスペクトルでは、ベースライン成分はかなり小さく低減される。このように、絶対値微分という簡易な演算により、位相補正およびベースライン補正をすることなく高品位なスペクトルを得ることができる。

また、NMRスペクトルには、図３Aに参照番号１４２で示すような溶媒（例えば軽水）信号の巨大なピークが存在する。その巨大な溶媒ピークの裾野部分は幅広く広がっており、これも、スペクトルの精度低下の主原因の一つである。しかし、ADスペクトルにおいては、ベースラインと同様に上記理由によって溶媒ピークの裾野部分も良好に低減されるので、溶媒ピークの影響を極めて小さくすることができる。

なお、ADスペクトルの一つの欠点は、NMRスペクトルの絶対的な定量性が失われること、特に、ブロードなピークの信号強度が微分により減衰してしまうことである。しかしながら、複数のNMRスペクトル相互間の相対的な関係（例えば、どのケミカルシフトδの位置にピークが現れるかという点での相対的関係）は、ADスペクトルにおいても保たれるため、メタボノミクスのように多数のNMRスペクトルを解析する目的においては、ADスペクトルは非常に有用な情報である。

再び図２を参照して、ステップ１２６で上述したADスペクトルが生成された後、ステップ１２８でそのADスペクトルが記憶装置１０６に保存される。統計処理に必要な多数のサンプルのNMRスペクトルのそれぞれについて、図２に示す処理が繰り返され、その結果、多数のサンプルのADスペクトルが記憶装置１０６に蓄積される。その後、図１に示すように、最適化バケット積分を用いたデータ縮約処理１１２が実行される。

図６は、最適化バケット積分を用いたデータ縮約処理１１２の流れを示す。

図６に示すように、ステップ１７０で、記憶装置１０６に蓄積された多数のADスペクトルのそれぞれについて、そのケミカルシフト（δ）軸スケールの基準点（δ基準点）（原点）が自動的に設定される。δ基準点の設定は公知の方法で行うことができ、それにより、いずれのADスペクトルについても、同じ特定物質のピークが現れるケミカルシフト軸上のポイントが基準点として設定される。

その後、ステップ１７１で、多数のADスペクトルを共通のスペクトル上に投影する処理が行われる。このスペクトル投影処理１７１は、それらのADスペクトルのケミカルシフト軸のスケールを合わせた上で、ケミカルシフトδのポイント毎に全てのADスペクトルの最大値又は総和を計算するという処理である。その結果、多数のADスペクトルの最大値又は総和として１つの投影ADスペクトルが生成され、その投影ADスペクトルには、全てのADスペクトルに含まれる全てのピークが現れることになる。

図７A,Bは、このスペクトル投影処理１７１の原理を説明する図であり、図８は、このスペクトル投影処理１７１の流れを示す。

スペクトル投影処理１７１では、図８に示すように、ステップ１９０で、多数のADスペクトルの中から一つのADスペクトルSaが選択される。例えば図７Aに示すようなスペクトルSaが選択される。このADスペクトルSaが、投影ADスペクトルSpに初期設定される。ステップ１９２で、別の一つのADスペクトルSbが選択される。例えば、図７Bに示すようなADスペクトルSbが選択される。

ステップ１９４で、両スペクトルSbとSpのケミカルシフト軸スケールを一致させた上で（例えば、両スペクトルの基準点rbとraの差分(rb-ra)だけ、スペクトルSbのδスケール（ケミカルシフト軸スケール）をシフトさせて、基準点rbとraを一致させた上で）、両スペクトルSbとSpの強度の最大値又は和がδポイント毎に計算される。具体的には、
最大値： if(Sp > Sb(rb-ra)) Sp=Sa else Sp =Sb(rb-ra)
和： Sp = Sp+Sb (rb-ra)
という計算がδポイント毎に行われる。それにより、図７Cに示すように、投影ADスペクトルSpには、処理された複数のスペクトルSaとSbに含まれている全てのピークが投影されることになる。なお、最大値と和のうち、いずれか一方のみが計算されてもよいし、或いは、最大値と和の両方が別個の投影ADスペクトルとして計算されてもよい。

ステップ１９６により、処理対象である全てのADスペクトルについて、上述したステップ１９２と１９４が繰り返される。全てのADスペクトルについての繰り返し処理が終わると、その全てのADスペクトルに含まれる全てのピークが投影された投影ADスペクトルSｐが完成する。ステップ１９８で、その投影ADスペクトルSｐが記憶装置１０６に保存され、また、必要に応じて外部へ出力される。

再び図６を参照する。上述したスペクトル投影処理１７１が終わると、ステップ１７２で、投影ADスペクトルのバケット積分が計算される。

図９は、この投影ADスペクトルのバケット積分処理１７２の原理を説明する図であり、図１０は、このバケット積分処理１７２の流れを示す。

図９において、参照番号２００は、バケット積分が実行される１単位の積分範囲を示し、「バケット」と呼ばれる。バケット２００は、このバケット積分処理１７２においては、規定された一定の幅W（例えば０．０４ppm）をもつが、後の処理において、この幅Wが修正され最適化されることになる。参照番号２０２は、バケット積分を実行すべきケミカルシフトδの全範囲を示し、例えば０ppm〜約１６ppmの範囲である。全範囲２０２は、例えば約２００個のバケット２００に分割される。このように全範囲２０２内に設定された多数のバケット２００の集合を、以下、「バケットセット」という。また、参照番号２０４は、バケット積分を実行しない範囲を示し、「ダークリジョン」と呼ばれる。

図１０に示すように、バケット積分処理１７２では、ステップ２１０で、図９に示された全範囲２０２が多数の一定幅Wのバケット２００に均等に分割され、そして、バケット２００毎に投影ADスペクトルSpの積分値（すなわち、各バケットにおける投影ADスペクトルSpとケミカルシフト軸とにより挟まれた領域の面積）が計算される。それにより、バケット２００の個数に相当する個数のバケット積分データの集合が得られる。この多数のバケット積分データの集合を、以下「積分データセット」という。この積分データセットは、投影ADスペクトルSpのバケット毎のピーク面積を示す一種のヒストグラムである。

その後、ステップ２１２で、ダークリジョン２０４に該当するバケットと、そのバケットセットのバケット積分データが、ステップ２１０で得られたバケットセットと積分データセットの中から削除される。ステップ２１４では、その積分データセットの総和が所定値になるように、その積分データセットがノーマライズされる。そして、ノーマライズされた積分データセット（ヒストグラムデータ）と、バケットセットに含まれる全てのバケットの位置（始点と終点）を表したバケットセット情報とが、記憶装置１０６に保存され、また、必要に応じて外部出力される。

再び図６を参照する。上述したバケット積分処理１７２が終わると、ステップ１７４で、自動積分ブロック設定に基づくバケットの自動修正処理が行われる。ここでは、公知技術である自動積分ブロック設定処理により、投影ADスペクトルSp上の種々のピークが自動的に検出され、検出された各ピークが複数のバケットにより分割されないようにバケットの位置と幅Wが修正される。以下では、「ピーク」という用語は、単一の孤立したピークだけでなく、一つのピークと看做せるような一塊の複数のピークを指す意味でも用いる。

図１１は、この自動積分ブロック設定に基づくバケットの自動修正処理１７４の原理を説明する図であり、図１２は、このバケット自動修正処理１７４の流れを示す。

このバケット自動修正処理１７４では、図１２に示すように、ステップ２３０で、公知技術である自動積分ブロック設定処理が投影ADスペクトルSpに対して施される。それにより、投影ADスペクトルSp上の種々のピークが自動的に検出され、そして、検出されたピークが存在するケミカルシフトδ領域（以下、「ピーク領域」という）にそれぞれ１対1の関係で積分ブロック（積分区間）が自動的に設定される。例えば、図１１Aに示されるように、ADスペクトルSp上に２つのピーク（例えば、左側のものは３つのピークの塊であり、右側は単一のピークである）が存在する場合、その２つのピークが自動的に検出され、そして、図１１Bに例示するように、左側のピーク領域には一つの積分ブロック２２０xが設定され、また、右側のピーク領域には別の一つの積分ブロック２２０yが設定される。いずれの積分ブロック２２０x、２２０yも、対応するピーク領域をカバーしており、一つのピーク領域が複数の積分ブロックにより分割されることはない。

これに対し、図１１Cに例示するように、現在のバケット２００a、２００b、２００ｃ、…は、図９を参照して既に説明したように、全範囲２０２を単純に一定幅W（例えばｍ０．０４ppm）で均等分割したものであるから、一つのピーク領域を複数のバケットが分割しているおそれがある。図１１A,Cに示す例では、左側のピーク領域が２つのバケット２００bと２００cにより分割されている。記憶装置１０６に現在保存されている積分データセット（ヒストグラム）は、このようなバケットセットを用いて計算されたものであるため、分割されたピークの情報が異なる積分データに分散され稀釈化されてしまっていおり、精度が良くない。そこで、この問題を解消するために、以下に述べる後続のステップが行われて、ピークを分割しないようにバケットセットが修正される。

すなわち、図１２に示すように、ステップ２３２で、それぞれの積分ブロックの始点に最も近いバケットの終点が記憶装置１０６内のバケットセット情報からサーチされ、見つかったバケットの終点が、それぞれ対応する積分ブロックの始点と同一値に修正される。さらに、ステップ２３４で、それぞれの積分ブロックの終点に最も近いバケットの始点が記憶装置１０６内のバケットセット情報からサーチされ、見つかったバケットの始点が、それぞれ対応する積分ブロックの終点と同一値に修正される。例えば、図１１B,C,Dに示された例では、左側の積分ブロック２００xの始点s(x)に最も近いバケット２００ａの終点e(a)がその始点s(x)と同一値に修正され、また、右側の積分ブロック２００yの始点s(y)に最も近いバケット２００dの終点e(d)がその始点s(y)と同一値に修正される。また、左側の積分ブロック２００xの終点e(x)に最も近いバケット２００dの始点s(d)がその終点e(x)と同一値に修正され、右側の積分ブロック２００yの終点e(y)に最も近いバケット２００fの始点s(f)がその終点e(y)と同一値に修正される。

上記始点／終点の修正の後、ステップ２３６で、一つの積分ブロックを分割する複数のバケットがサーチされ、その複数のバケットが一つのバケットに統合される。例えば、図１１B,C,Dに示された例では、上記始点／終点の修正の後は、左側の積分ブロック２００xだけが２つのバケット２００bと２００ｃにより分割されるので、その２つのバケット２００bと２００ｃが一つのバケット２００bcに統合される。

そして、ステップ２３８で、上述したステップ２３２〜２３６で修正された全てのバケットについてバケット積分が再計算される。そして、記憶装置１０６に現在記憶されている積分データセットのうち、該当するバケットの積分データが、再計算された積分データに置き換えられる。例えば図１１Dに示された例の場合、バケット２００a、２００bc、２００d、２００e及び２００fの全てに修正がなされたので、それらバケット２００a、２００bc、２００d、２００e及び２００fのそれぞれについてバケット積分が再計算されて、再計算された積分データが、前の積分データに置き換えられる。

ステップ２３９では、以上のようにして修正された積分データセットと修正されたバケットセット情報とが記憶装置１０６に保存され、また、必要に応じて外部へ出力される。上記修正されたバケットセット情報によれば、自動積分ブロック設定処理によって投影ADスペクトルSpから自動的に検出された全てのピーク領域のいずれもが複数バケットにより分割されないように（つまり、一つのピーク領域は必ず一つのバケットによりカバーされる）ように、バケットセットが定義される。上記修正された積分データセットは、上記修正されたバケットセットに基づいているので、検出された全てのピークの情報は稀釈されておらず、よって、以前の積分データセットより精度が良い。

しかしながら、公知の自動積分ブロック設定処理により自動検出されたピークに基づいて設定されたケミカルシフトδ区間（積分区間）が必ずしも適切であるとはいえない。そこで、更にバケットデータセットと成分データセットを最適化するための処理が後続して行われる。すなわち、図６に示すように、上述した自動積分ブロック設定に基づくバケット自動修正処理１７４の後、更にバケットデータセットと成分データセットを最適化するために、指定ピーク情報に基づくバケット自動修正処理１７６と、バケットの手動修正処理１７８とが実行される。

まず、指定ピーク情報に基づくバケット自動修正処理１７６について説明する。

この処理１７６では、既に同定されているNMRスペクトル（ADスペクトルではない）上の特定のピークが指定され、その指定されたピークのピーク領域をカバーするように積分ブロックが決定され、その積分ブロックに基づいて、指定ピークのピーク領域が複数バケットにより分割されないように、現在記憶されているバケットセットが修正される。指定されるピークは、典型的には、このスペクトル解析の用途においてマーカになり得るようなピークである。スペクトル解析の用途が異なればマーカも異なることになるから、用途に応じて、指定されるピークが異なってくる。

ピークを指定するためのソースデータとしては、学会誌などで規定するNMRデータの一般的な発表フォーマット（Bull. Chem. Soc. Japan等）に従ったピーク定義データ用いることができる。そのようなフォーマットによるピーク定義データの一例を挙げると、
1H-NMR (CDCl3) δ: 8.06 (2H, t, J = 8.1 Hz, CH2), 7.24 (1H, s, CH3),…
というようなものである。このデータ例において、最初の「1H-NMR」は測定核名を示し、次の「(CDCl3)」は溶媒名を示し、次の「δ: 8.06」は１つ目のピークの中心のケミカルシフトを示し、次の「2H」は１つ目のピークのプロトン数を示し、次の「t」は１つ目のピークの分裂パターンを示し、次の「J = 8.1 Hz」は１つ目のピークのスピン結合定数を示し、次の「CH2」は１つ目のピークに関するコメントである。１つ目のピークの定義の後に、２つ目のピークの定義、３つ目のピークの定義、…が順次続く。ここで、ピークの分裂パターンには種々のものがあるが、代表的な分裂パターンは例えば以下の５種のパターン、
「s」：単一（singlet）
「d」：２分裂（doublet）
「t」：３分裂（triplet）
「q」：４分裂（qualtet）
「m」：多分裂（multiplet）
の組合せとなる。

図１３Aは３分裂ピークの例を示しており、図１３Bは４分裂ピークの例を示している。

図１３Aに示すように、３分裂ピークの場合、上述したようなフォーマットのピーク定義データにより、その中心のケミカルシフトδ（単位：ppm）と１つのスピン結合定数J（単位：Hz）が定義される。図示は省略するが、２分裂ピークの場合も、同様に、中心のケミカルシフトδと１つのスピン結合定数Jが定義される。単一ピークの場合は、中心のケミカルシフトδが定義されるが、スピン結合定数Jは当然に定義されない。また、図１３Bに例示するように、４分裂ピークの場合、中心のケミカルシフトδと、広狭２つのスピン結合定数Ja、Jb（単位：Hz）が定義される。図示は省略するが、多分裂（５以上の分裂）ピークの場合、中心のケミカルシフトδと、分列数に応じた数の異なるスピン結合定数が定義される。なお、中心のケミカルシフトδが決め難い複数分裂ピークの場合、「δa−δb」というようにケミカルシフトδの範囲でピークが定義される場合もあり得る。

図１３A、Bに例示するように、各ピークのピーク領域（そのピークが位置するケミカルシフトδ区間）は、上述したピーク定義データに含まれる数値、特に中心のケミカルシフトδとスピン結合定数Jとに基づいて決定することができる。例えば図１３Aに示す３分裂ピークの場合には、そのピーク領域２４０xの始点s(x)と終点e(x)は、
s(x)＝δ−（J＋PW/2)
e(x)＝δ＋（J＋PW/2)
により、また、図１３Bに示す４分裂ピークの場合には、そのピーク領域２４０yの始点s(y)と終点e(y)は、
s(y)＝δ−（Jb＋PW/2)
e(y)＝δ＋（Jb＋PW/2)
により計算することができる。ここで、「PW」はピーク幅（単位：Hz)を指し、これはNMR装置の分解能やサンプルの状態などの幾つかの条件によって異なってくるので、その条件セットに応じた適当な値を予め設定しておけばよい。図示以外の分裂パターンの場合についても、中心ケミカルシフトδとスピン結合定数J（ここで、単一ピークの場合はJ=0とすればよい）を用いてピークが定義されていれば、上記と同様のやり方でピーク領域が決定できる。また、「δa−δb」というようにケミカルシフトδの範囲でピークが定義されている場合には、そのピーク領域の始点sと終点eは、
s＝δa−PW/2
e＝δb＋PW/2
により計算することができる。

さて、本実施形態にかかるNMRデータ処理装置１００は、指定ピークについて上述したようなフォーマットのピーク定義データを入力し、そのピーク定義データに基づいて、指定ピークのピーク領域を決定するために必要な情報（以下、「指定ピーク情報」という）を自動的に生成する。生成された指定ピーク情報は、後に何時でも利用できるように、記憶装置１０６に登録されることができる。

図１４A,Bは、記憶装置１０６に登録される指定ピーク情報のデータ構造例を示す。

図１４Aに示すように、NMRスペクトル解析の異なる用途にそれぞれ対応した異なる指定ピーク情報セット２５０A、２５０B、２５０Cが、記憶装置１０６に登録されている。例えば、特定の疾病に罹患した者の血液に共通するマーカを確定しようとする用途と、特定種類の食品に共通するマーカを確定しようとする用途とでは、マーカとなり得るピークは異なるから、用途毎に異なるピークが指定されることになる。そのため、用途毎に別の指定ピーク情報セット２５０A、２５０B、２５０Cが登録される。指定ピーク情報セット２５０A、２５０B、２５０Cの各々には、指定された１以上のピークの各々のピーク指定情報が記録されている。各ピークのピーク指定情報には、そのピークを識別するためのピークIDと、そのピークのピーク領域を計算するためのケミカルシフト、分裂パターン及びスピン結合定数などの数値データが含まれている。これらの数値データは、NMRデータ処理装置１００に入力された上述したようなフォーマットのピーク定義データの中から、NMRデータ処理装置１００により自動抽出されたものである。

また、図１４Bに例示するように、予め設定されたピーク幅PWを示すピーク幅セット２５２も、記憶装置１０６に登録されている。前述したように分解能やその他の条件が異なるとピーク幅PWが異なってくるため、ピーク幅セット２５２には、異なる条件セットに対応して異なるピーク幅PWが設定されている。

ところで、変形例として、図１４Aに例示された指定ピーク情報セット２５０A、２５０B、２５０Cには、ケミカルシフト、分裂パターン及びスピン結合定数などの数値データと共に、又はそれに代えて、それらの数値データに基づき上記計算方法により計算されたピーク領域を示すデータ（例えば、始点と終点の数値データ）が登録されてもよい。

さて、以上のような指定ピーク情報を用いて、図６に示されたステップ１７６の、指定ピーク情報に基づくバケットの自動修正処理が、次の手順で行われる。

図１５は、このバケット自動修正処理１７６の流れを示す。

図１５に示すように、ステップ２６０で、任意に指定された１以上のピークのそれぞれについてピーク定義情報が入力され、そのピーク定義情報に基づいて各指定ピークのピーク定義情報が生成される。或いは、予め記憶装置１０６に登録されている図１４Aに例示されたような指定ピーク情報セット２５０A、２５０B、２５０Cの中から、今回の用途に対応した指定ピーク情報セットが選択され、その選択された指定ピーク情報セットからピーク毎の指定ピーク情報が読み込まれる。さらに、予め設定されている図１４Bに例示されたような条件毎のピーク幅データの中から、今回の解析に最適なピーク幅データが読込まれる。

そして、ステップ２６２で、各指定ピークの指定ピーク情報とピーク幅データに基づいて、上述したような計算方法により、各指定ピークのピーク領域が決定され、そのピーク領域がそのまま積分ブロックとして設定される。例えば、図１３A,Bに例示された２種類のピークの場合、それらのピークのピーク領域２４０x及び２４０yがそれぞれ積分ブロックとして設定される。

その後、ステップ２６４で、図１２に示した自動積分ブロック設定に基づくバケット修正処理１７４のステップ２３２〜２３８と同様の手順で、記憶装置１０６に記憶されている1度修正されたバケットセットが、指定ピークに対応する積分ブロックに応じて更に修正される。この２回目のバケット修正により、いずれの指定ピークのピーク領域も複数のバケットにより分割されないようになる（つまり、いずれの指定ピークのピーク領域の必ずいずれか一つのバケット内に入るようになる）。また、ここで修正がなされたバケットについては、投影ADスペクトルSpのバケット積分が再計算され、再計算されたバケットの積分データにより、記憶装置１０６に記憶されている対応するバケットの積分データが置き換えられる。

そして、ステップ２３９で、このように２度修正されたバケットセットと積分データセットが、記憶装置１０６に保存され、また、必要に応じて外部に出力される。

次に、図６に示されたステップ１７８の、バケットの手動修正処理について説明する。この処理１７８は、上述した２回の自動的なバケット修正だけでは満足できない場合、オペレータが手動でバケットを更に修正できるようにするためのものである。

図１６A,Bはバケットの手動修正処理１７８の原理を示し、図１７はバケットの手動修正処理１７８の流れを示す。

この処理１７８において、記憶装置１０６に保存されている投影ADスペクトルSpと前述した２度の自動修正を終えたバケットセットが、NMRスペクトル処理装置１００のディスプレイスクリーンに表示される。オペレータはその表示を見ながら、任意のバケットの始点又は終点に対する修正要求をNMRスペクトル処理装置１００に入力する。例えば、図１６Aに例示するように、或るバケット２００jを修正したい場合、オペレータは、そのバケット２００jを指定した上で、その始点を終点の修正要求として、新たな始点s(j)と新たな終点e(j)を入力する。すると、図１７に示すように、ステップ２７０で、指定されたバケット２００jの始点と終点が、オペレータから入力された始点s(j)と終点e(j)と同一値に修正される。また、ステップ２７２で、指定されたバケットの始点s(j)側の隣バケットの終点e(i)が指定バケットの始点s(ｊ)と同一値に修正され、ステップ２７４で、指定バケットの終点e(j)側の隣バケットの始点s(k)が指定バケットの終点e(ｊ)と同一値に修正される。その後、ステップ２７６で、修正されたバケット毎にバケット積分が再計算され、再計算された積分データにより、記憶装置１０６に記憶されている対応するバケットの積分データが置き換えられる。そして、ステップ２７８で、手動修正の終わったバケットセットと、そのバケットセットに基づいて上記のように修正された積分データセットとが、記憶装置１０６に保存され、また必要に応じて外部へ出力される。

以上のように、図６のステップ１７２で、全バケットが一定幅（例えば０．０４ppm）をもつ均等幅のバケットセットが初期的に設定され、その後、ステップ１７４と１７６と１７８の３段階のバケット修正が行われて、バケットにより幅の異なる不均等幅のバケットセットが完成する。なお、ステップ１７４と１７６と１７８の３つの修正段階は、必ずしもその全てが実行されなければならないわけではなく、いずれかの修正段階（例えば手動修正）が省略されても良い。いずれにしても、最終的に完成された不均等幅のバケットセットは「最適化バケットセット」と呼ばれる。

図１８は、記憶装置１０６に保存された最適化バケットセットのデータ構造例を示す。

図１８に示すように、スペクトル解析の異なる用途にそれぞれ対応して異なる最適化バケットセット２８０A、２８０B、２８０Cが、記憶装置１０６に記憶されている。用途が異なれば、既に説明したように指定ピークが異なり、また、処理対象のNMRスペクトル自体も異なるので、当然、出来上がる最適化バケットセットが異なるからである。最適化バケットセット２８０A、２８０B、２８０Cの各々には、用途を示す用途ID、ピーク幅PWを示す数値データ、ケミカルシフト軸スケールの基準点（原点）を示す数値データ、並びに、このバケットセットを構成する多数のバケットのバケット番号、始点及び終点のデータなどが登録されている。さらに、いずれかの指定ピークに対応するバケットには、その対応する指定ピークを指すピークIDも登録されている。

上述した３段階のバケット修正処理の説明から分かるように、最適化バケットセットにおいては、全てのバケットが均等な幅（例えば０．０４ppm）をもってはおらず、それぞれに特有の不均等な幅をもっている。そして、投影ADスペクトルSpから自動的に検出された全てのピークについても、加えて、指定ピーク情報により指定された全てのピークについても、各ピークのピーク領域は必ずいずれか一つのバケットの中に入っており、いずれのピーク領域も複数バケットにより分割されてはいない。さらに、この最適化バケットセットの作成の基礎となった投影ADスペクトルSpには、解析対象である多数のADスペクトル上のほぼ全てのピークが投影されており、それらのピークのピーク領域が最適化バケットセット反映されている。さらに、解析用途のために重要であると考えられる既知の指定ピークのピーク領域も、最適化バケットセットに反映されている。従って、この最適化バケットセットを用いて、解析対象である多数のADスペクトルのそれぞれのバケット積分を行なうことにより、いずれのADスペクトルも、そこに含まれるほぼ全てのピークの情報が良好に維持された状態で、積分データセット（ヒストグラム）に変換されることになる。

再び図６を参照する。最適化バケットセットが完成すると、ステップ１８０の、多数ADスペクトルの最適化バケット積分処理が行われる。

図１９は、多数ADスペクトルの最適化バケット積分処理１８０の流れを示す。

図１９に示すように、ステップ２９０で、最適化バケットセットが記憶装置１０６から読込まれる。ステップ２９２で、解析対象である多数のADスペクトルの各々が記憶装置１０６から読込まれる。ステップ２９２で、読込まれたADスペクトルのケミカルシフト軸スケール（δスケール）が、最適化バケットセットのケミカルシフト軸スケール（δスケール）に合わされる（例えば、ADスペクトルの基準点が最適化バケットセットの基準点に一致するように、ADスペクトルのケミカルシフト軸スケールがシフトされる。）。そして、ステップ２９６で、そのADスペクトルのバケット積分が、最適化バケットセットを用いて実行され、ステップ２９８で、そのバケット積分で求まった積分データセット（ヒストグラムデータ）が記憶装置１０６に保存され、必要に応じて外部へ出力される。

ステップ２９９により、解析対象の全てのADスペクトルについて、上述したステップ２９２〜２９８の処理が繰り返される。その結果、解析対象の全てのADスペクトルが、それぞれ積分データセット（ヒストグラムデータ）に縮約されて、記憶装置１０６に保存される。

再び図６を参照する。その後、ステップ１８２で、解析対象の全てのADスペクトルの最適化バケット積分データセット（ヒストグラムデータ）が、次の統計処理に渡すのに適したデータ形式に整えられた上で、記憶装置１０６に保存され、必要に応じて外部へ出力される。

以上図６に示された流れに沿って説明した処理が実行されることにより、図１に示された最適化バケット積分を用いたデータの縮約処理１１２と、積分結果データの保存／出力処理１１４が完了する。その後に、図１に示される統計処理１１６が実行される。この統計処理１１６では、解析対象の全てのADスペクトルの積分データセット（ヒストグラムデータ）が記憶装置１０６から読込まれ、それらの積分データセット（ヒストグラムデータ）を用いて、所定の統計処理（例えば多変量解析法の一つである主成分分析）が実行され、そして、マーカとなるピークの確定などの解析結果が生成され出力される。統計処理の具体的な手法としては、公知の種々の方法を用いることができる。例えば、後に詳述するように、本発明の原理に従う統計処理では、いずれも多変量解析法の一つである主成分分析（Principal component Analysis：PCA）と部分空間法（Soft Independent Modeling of Class Analogy：SIMCA）とが組み合わせて用いられる。既に説明するようなしたように、統計処理の材料であるADスペクトルの積分データセット（ヒストグラムデータ）には、ADスペクトル上の重要なピークの情報が良好に含まれているので、統計処理の結果は精度の高いものとなる。

図２０は、本発明に従うNMRデータ処理装置の別の実施形態の全体的な構成と機能を示す。

このNMRデータ処理装置３００は、前述のNMRデータ処理装置１００とは別の用途に使用される。すなわち、前述のNMRデータ処理装置１００の用途は、多数のサンプルのNMRスペクトルを解析し統計的なデータを得ることであるのに対し、このNMRデータ処理装置３００の用途は、基本的に一つのサンプルのNMRスペクトルを分析してそのサンプルの性質又は成分などを検査すること（例えば、或る人の血液のNMRスペクトルを分析して、その人が特定の疾病に罹患してないかどうか検査すること、あるいは、或る食品のNMRスペクトルを分析して、そこに如何なる物質が含有されているか検査すること、など）にある。このNMRデータ処理装置３００も、前述のNMRデータ処理装置１００と同様に、プログラムされたコンピュータシステムを用いて実現することができる。

図２０に示すように、NMRデータ処理装置３００のプロセッサ３０４は、記憶装置３０６に記憶されている所定のコンピュータプログラムを実行することにより、FIDデータ入力処理３０８、NMRスペクトル処理３１０、最適化バケット積分を用いたデータ縮約処理３１２、ヒストグラム分析処理３１４、分析結果データ保存／出力処理３１６を行う。記憶装置３０６には、上記コンピュータプログラムの他に、予め、図１８に例示したような用途別の最適化バケットセット２８０A、２８０B、２８０Cが記憶されている。さらに記憶装置３０６には、検査目的に対応した参照モデルデータが記憶されている。検査目的に対応した参照モデルデータとは、検査の判断を行う際に検査対象のNMRデータと対比される基準のデータである。例えば、人の血液からその人が特定の疾病に罹患してないかどうか検査するという用途の場合であれば、その特定の疾病に罹患している多数の人々の血液サンプルのNMRデータを前述のNMRデータ処理装置２００で解析することによって確定されたマーカの情報が、参照モデルデータの一つとして採用することができる。

FIDデータ入力処理３１２では、NMR装置１０２から出力される検査対象の一サンプルのFIDデータが入力され、記憶装置３０６に記憶される。NMRスペクトル処理３１０では、入力されたFIDデータに対して、図２に示されたと同様の流れの処理が行われて、そのFIDデータの絶対値微分であるADスペクトルが生成され、記憶装置３０６に記憶される。

データ縮約処理３１２では、記憶装置３０６に予め記憶されている用途に応じた最適化バケットセットを用いた最適化バケット積分が、検査対象のADスペクトルに対して実行され、それにより、検査対象のADスペクトルが最適化された積分データセット（ヒストグラム）に縮約される。ヒストグラム分析処理３１４では、検査対象の積分データセット（ヒストグラム）が、記憶装置３０６に予め記憶されている用途に応じた参照モデルデータと対比され、対比結果に基づく判断がなされて検査結果が生成される。分析結果の保存／出力処理３１６では、生成された検査結果が記憶装置３０６に保存され、また外部へ出力される。

図２１は、図２０に示された最適化バケット積分を用いたデータ縮約処理３１２の流れを示す。

ステップ３２０で、検査対象のADスペクトルが記憶装置３０６から読込まれ、ステップ３２２で、用途に対応した最適化バケットセットが記憶装置３０６から読込まれる。ステップ３２４で、検査対象のADスペクトルのケミカルシフト軸スケール（δスケール）が最適化バケットセットのそれに一致させられる。その後、ステップ３２６で、最適化バケットセットを用いた最適化バケット積分が、検査対象のADスペクトルに対して実行され、検査対象の積分データセット（ヒストグラム）が求まる。ステップ３２８で、検査対象の積分データセット（ヒストグラム）が記憶装置３０６に保存され、必要に応じて外部へ出力される。

図２２は、図２０に示されたヒストグラムの分析処理３１４の流れを示す。

ステップ３３０で、検査対象の積分データセット（ヒストグラム）が記憶装置３０６から読込まれる。ステップ３３２で、検査目的に対応した参照モデルデータが記憶装置３０６から読込まれる。ステップ３３４で、検査対象の積分データセット（ヒストグラム）と、検査目的に対応した参照モデルデータとが対比され、検査結果が判断される。ステップ３３６で、検査結果が記憶装置３０６に保存され、また外部へ出力される。

以上のようなサンプルの検査を用途とするNMRデータ処理においても、用途に応じて予め用意された最適化バケットセットを用いた最適化バケット積分がスペクトルに対して行われるので、スペクトルがもつピーク情報が良好に維持され、精度の高い検査結果を得ることができる。また、分析には、NMRスペクトルの絶対値微分であるADスペクトルが用いられるため、面倒な位相補正やベースライン補正が不要になり、処理効率が向上する。

次に、本発明の一実施形態にかかるNMRスペクトルの統計処理装置について説明する。

本発明の一実施形態にかかる統計処理装置は、図１に示したNMRデータ処理装置１００内に統計処理部１１６として組み込まれており、そして、典型的には、既に説明した前処理部分（図１内の処理部１０８，１１０，１１２，１１４）と一緒にコンピュータプログラムとして具現化されている。しかし、これは説明のための一つの例示にすぎず、本発明に従うNMRスペクトルの統計処理装置は、既に説明した前処理部分からは分離された単独装置として構成されることもできる。

図２２は、本発明の一実施形態にかかるNMRスペクトルの統計処理装置、すなわち、図１に示した統計処理部１１６、の機能的な構成を示す。

図２２に示すように、統計処理部１１６は、多変量解析部３４０と、ユーザ要求入力部３４２と、表示制御部３４４とを有する。

多変量解析部３４０は、PCA解析部３４６とSIMCA解析部３４８とを有する。PCA解析部３４６は、記憶装置１０６に保存されている多数のサンプルのNMRスペクトルの積分データセット（以下、「NMRヒストグラム」という）を入力して、主成分分析（Principal component Analysis： PCA）による多変量解析を行なう。また、SIMCA解析部３４８は、記憶装置１０６に保存されている多数のサンプルのNMRヒストグラムを入力して、部分空間法（Soft Independent Modeling of Class Analogy：SIMCA）（以下、SIMCAという）による多変量解析を行なう。PCA解析部３４６とSIMCA解析部３４８の入力となる解析対象としての多数のサンプルのヒストグラムのデータは、記憶装置１０６内のPCAテーブル３５０に記録されている。PCAテーブル３５０の構成については、後に説明する。

記憶装置１０６内には、図１に示した積分結果データの保存／出力処理１１４により書き込まれた大量のサンプルのNMRヒストグラムデータ３５６がある。PCA解析部３４６とSIMCA解析部３４８は、それぞれ、その大量のサンプルのNMRヒストグラムデータ３５６の中から、任意の多数のサンプルのNMRヒストグラムのデータを解析対象として抽出してPCAテーブル３５０に登録することができる。多変量解析部３４０は、ユーザからの要求に応じてPCAテーブル３５０の更新も行なう。また、PCA解析部３４６とSIMCA解析部３４８は、それぞれ、PCA解析結果（例えば、サンプルのスコア及び変数のローディングなど）とSIMCA解析結果（サンプルの各クラスまでの距離、変数のモデリング力及び識別力など）を、解析結果データ３５２として、記憶装置１０６内に保存することができる。

SIMCA解析部３４８とPCA解析部３４６は、後に詳述するように、前者による解析結果が後者の解析にフィードバックされるように連携して動作することができる。それにより、このような多変量解析を行なう目的、例えばメタボノミクスにおいてバイオマーカを探し当てる目的が、より容易に達成されるようになる。

表示制御部３４４は、PCA解析部３４６からPCA解析結果（スコア及びローディングなど）を受け、また、SIMCA解析部３４８からとSIMCA解析結果（各クラスまでの距離、モデリング力及び識別力など）を受けて、そして、そのPCA解析結果とSIMCA解析結果を表示したグラフィカルユーザインタフェース（以下、「UI」という）３４６を作成し、そのUI３４６をコンピュータシステム１００（図１）のディスプレイ装置（図示省略）に表示する。表示制御部３４４は、記憶装置１０６に記憶されている多数のサンプルのNMRスペクトルデータ３５０の中から、ユーザにより選択された１以上のサンプルのNMRスペクトルデータを読み込み、そのUI３４６上に、PCA解析結果とSIMCA解析結果と一緒に、ユーザにより選択されたサンプルのNMRスペクトルを表示する。なお、この実施形態では、表示されるNMRスペクトルデータは、元のNMRスペクトルデータではなく、それを絶対値微分して得られたADスペクトルデータであるが、これを以下では単に「NMRスペクトルデータ」と呼ぶ。

表示制御部３４４は、UI３４６上のPCA解析結果とSIMCA解析結果の表示とNMRスペクトルの表示とが連携するように、UI３４６上での両者の表示を制御する。それにより、オペレータは多変量解析結果とNMRスペクトルとの関連性が視覚的に容易に理解できるようになり、このような多変量解析を行なう目的、例えばメタボノミクスにおいてバイオマーカを探し当てる目的が、より容易に達成されるようになる。さらに、そのUI３４６上には、ユーザが各種の要求を入力するための各種の入力ボタンも表示される。そのUI３４６の詳細については、後に説明する。

ユーザ要求入力部３４２は、ユーザによりマウスまたはキーボードなどから上記UIに入力された各種の要求を受け、その入力要求を上述した多変量解析部３４０および表示制御部３４４に渡す。多変量解析部３４０および表示制御部３４４は、ユーザから入力された要求に応答して、後述するような各種の動作を行う。

図２４は、図２３に示したPCAテーブル３５０の構成例を示す。

既に述べたように、PCAテーブル３５０には、解析の対象となる多数のサンプルのNMRヒストグラムのデータが記録されている。すなわち、図２４に示すように、PCAテーブル３５０には、ヒストグラムを作成するときに行なわれたバケット積分に関するバケット積分条件４００が記録されており、これには、バケット積分が行なわれたケミカルシフトδの全範囲（図９に示した全範囲２０２に相当）、バケットの基本的な幅（図９に示した幅Ｗに相当）、自動積分ブロック設定でバケット幅の調整を行ったか否か、全範囲の合計積分値、及びダークリジョン（（図９に示したダークリジョン２０４に相当）（図示の例では、５．３ｐｐｍから４．３ｐｐｍという１つのダークリジョンだけが登録されているが、複数のダークリジョンが登録され得る）が含まれる。

また、PCAテーブル３５０には、解析対象のサンプルの数４０２、各サンプルを構成する多数の変数の数（つまり、バケットの数）４０４、及び、各サンプルのNMRスペクトルデータが格納されているフォルダ名４０６とファイル名４０８のセット（つまり、各サンプルのNMRスペクトルデータファイルのパス名）が記録されている。ここで、前述した図２３では、図示の都合から、多数のサンプルのNMRスペクトルデータは纏めて1つのブロック３５４で示されているが、このブロック３５４は実際には、サンプル毎のNMRスペクトルデータを格納した多数のスペクトルデータファイルの集まりであり、それら多数のスペクトルデータファイルのパス名（フォルダ名４０６とファイル名４０８）がPCAテーブル３５０に記録されている。図２４では、図示の都合から、３つのサンプルのスペクトルデータファイルのパス名しか示されていないが、実際には、サンプル数４０２に示された数のサンプルの全てのスペクトルデータファイルのパス名がPCAテーブル３５０に記録されている。

さらに、PCAテーブル３５０には、UI３４６の画面上にプロットされるサンプル毎のマークの形状とカラーをそれぞれ指定したプロットタイプ４１０とプロットカラー４１２が定義されている。プロットタイプ４１０は、例えば、値「０」が×形マーク、値「１」が塗りつぶしの無い円形マーク、値「−１」が黒く塗りつぶされた円形マーク、…などを指定する。また、プロットカラー４１２は、３原色である赤（R)、緑（G）及び青（B)の明度（濃度）値のセットで定義される。後述するように、UI３４６上にはPCA解析結果の一つであるスコアプロットや、SIMCA解析結果の一つであるクーマンプロットが表示されるが、そのスコアプロットやクーマンプロット上では、各サンプルは、PCAテーブル３５０で指定された形状とカラーを持ったマークで表示されることになる。

さらに、PCAテーブル３５０には、サンプル毎のサンプルステータス４１４が登録されている。各サンプルのサンプルステータス４１４は、該当のサンプルが解析対象に含まれるか否かを示すものであり、例えば、値「０」が該当のサンプルが解析対象に含まれることを意味し、値「１」が該当のサンプルがユーザからの要求により解析対象から除外されたことを意味する。後に説明するように、PCAテーブル３５０に登録されているサンプルの全ては初期的には解析対象に含まれるのである（つまり、サンプルステータスが「０」である）が、ユーザは、UI３４６のスコアプロット上でクーマンプロット上で任意のサンプルを選択して、選択したサンプルを解析対象から除外することができ、そのようにして除外されたサンプルのサンプルステータスは「１」に変わる。サンプルステータスが「１」であるサンプルは、PCA解析やSIMCA解析において計算に入れられない。

さらに、PCAテーブル３５０には、実質的な解析対象である多変量データ行列４１８が登録されている。この多変量データ行列４１８には、上記積分全範囲に含まれる全バケットのそれぞれの中点のケミカルシフト値（これは、多変量解析における変数つまり記述子に相当する）４１８と、サンプル毎のNMRヒストグラムのデータ（すなわち、サンプル毎の最適化バケット積分で得られた積分データのセットであり、解析対象である多変量データ行列の正味の部分である）４２０、それぞれのバケットの始点のケミカルシフト値４２２と終点のケミカルシフト値４２４、及び、それぞれのバケットのステータス４２６が登録されている。各バケットのステータス４２６は、そのバケット（つまり、その変数）を解析に使用するか否かを示すものであり、例えば、値「０」はそのバケットを解析に使用することを意味し、値「１」は解析に使用しないことを意味する。後述するように、UI３４６上に表示されるSIMCA解析結果の一つである識別力に基づいて、ユーザは任意のレベル以上に高い識別力をもつ変数（バケット）だけを選択し、選択されたバケットだけを用いて再度PCA解析やSIMCA解析を行なうことを要求することができる。全てのバケットは、初期的にはステータスが「０」であって、解析に使用されるようになっているが、上記のようにして特定のバケットだけが後の解析のために選択された場合、選択されなかったバケットのステータスは「１」に変わり、ステータスが「１」であるバケットは後の解析では使用されないことになる。

以上のような構成を持つPCAテーブル３５０を使用して、PCA解析とSIMCA解析が実行されることになる。

図２５は、図２３に示した多変量解析部３４０のPCA解析部３４６とSIMCA解析部３４８並びに表示制御部３４４の機能をより詳細に示している。

図２５に示すように、PCA解析部３４６は、PCAモデル読込・追加・保存部３６０と、PCA計算部３６２とを有する。PCAモデル読込・追加・保存部３６０は、記憶装置１０６上の大量サンプルのNMRヒストグラムデータ３５６の中から、解析対象となる多数のサンプルのNMRヒストグラムデータを選んで、その選ばれた多数のサンプルのNMRヒストグラムデータに基づいてPCAテーブルの情報を新規に作成する機能や、記憶装置１０６上の大量サンプルのNMRヒストグラムデータ３５６の中から追加のサンプルのNMRヒストグラムデータを選んで、それをPCAテーブルの多変量データ行列に追加する機能をもつ。さらに、PCAモデル読込・追加・保存部３６０は、作成されたり追加されたり或は変更されたりしたPCAテーブルの情報を、記憶装置１０６にPCAテーブル３５０として保存する機能をもつ。PCA計算部３６２は、PCAモデル読込・追加・保存部３６０により用意されたPCAテーブルの情報を用いてPCA解析の計算を行ってPCAモデルを作成し、そのPCAモデルに基づいたPCA解析結果（例えば、各サンプルのスコアや、各変数(各バケット）のローディングなど）を出力する。なお、PCA解析の計算方法それ自体は周知であるから（例えば、非特許文献１を参照）、これについての詳細な説明はこの明細書では省略する。

SIMCA解析部３７０は、PCAモデル読込・追加・保存部３７０と、SIMCA計算部３７０を有する。PCAモデル読込・追加・保存部３７０は、記憶装置１０６上の大量サンプルのNMRヒストグラムデータ３５６の中からユーザが第1と第２のクラスにそれぞれ割り当てたサンプルのNMRヒストグラムデータを読込んで、第１と第２の２つのクラスのPCAテーブルの情報を用意する機能や、記憶装置１０６上の大量サンプルのNMRヒストグラムデータ３５６の中からユーザがテストクラスに割り当てたサンプルのNMRヒストグラムデータを読込んで、テストクラスのPCAテーブルの情報を用意する機能をもつ。さらに、PCAモデル読込・追加・保存部３７０は、各クラスのPCAテーブルの情報を、記憶装置１０６に各クラスのPCAテーブル３５０として保存する機能をもつ。SIMCA計算部３７２は、PCAモデル読込・追加・保存部３７０により用意された複数のクラスのPCAテーブルの情報を用いてSIMCA解析の計算を行って各クラスのPCAモデルを作成し、それらのPCAモデルに基づいたSIMCA解析結果（例えば、各サンプルの各クラスからの距離や、各変数(各バケット）のモデリング力や識別力など）を出力する。SIMCA解析の計算には、クラス毎のPCA計算が含まれており、このクラス毎のPCA計算を行うために、SIMCA計算部３７２は、PCA解析部３４６のPCA計算部３６２を使用する。なお、SIMCA解析の計算方法それ自体は周知であるから（例えば、非特許文献１を参照）、これについての詳細な説明はこの明細書では省略する。

PCA解析部３４６とSIMCA解析部３４８は、解析データ記憶部３６４と解析データ保存部３６６とを有する。解析データ記憶部３６４は、PCA解析部３４６から出力されたPCA解析結果と、SIMCA解析部３４８から出力されたSIMCA解析結果を記憶する。解析データ保存部３６６は、解析データ記憶部３６４に記憶されたPCA解析結果とSIMCA解析結果を、記憶装置１０６上に解析結果データ３５２として保存する。

後に詳述するように、解析データ記憶部３６４に記憶されるSIMCA解析結果の中には、或るレベル以上に高い識別力をもつ変数（バケット又はそれに対応するケミカルシフト値）を選択する情報が含まれている。この変数選択情報は、解析データ記憶部３６４を通じて、PCA計算部３６２及びSIMCA計算部３７２にフィードバックされることができる。そして、PCA計算部３６２とSIMCA計算部３７２はそれぞれ、フィードバックされた変数選択情報に従って、選択された変数（つまり、或るレベル以上に高い識別力をもつバケット又はそれに対応するケミカルシフト値）だけを用いて、再度、PCA解析とSIMCA解析を行なって、修正されたPCA解析結果とSIMCA解析結果を再度出力することができるようになっている。これにより、より望ましいPCA解析結果とSIMCA解析結果を得ることができるようになる。

表示制御部３４４は、PCA解析画面制御部３７４と、SIMCA解析画面制御部３７６と、NMRスペクトル連携部３７８とを有する。PCA解析画面制御部３７４は、PCA計算部３６２から解析データ記憶部３６４に出力されたPCA解析結果を受けて、後に具体的に説明するように、UI３４６上にPCA解析結果を示した複数種のチャート（例えば、スコアプロット、ローディングプロット、寄与率チャート及びローディングチャート）(以下、「PCA解析結果チャート」と総称する）を表示し、また、UI３４６に入力されたユーザからの選択、拡大、削除及び初期化などの要求に応答して、UI３４６上のそれらのチャートを変化させる。SIMCA解析画面制御部３７６は、SIMCA計算部３７２から解析データ記憶部３６４に出力されたSIMCA解析結果を受けて、後に具体的に説明するように、SIMCA解析結果を示す複数種のチャート（例えば、クーマンプロット、モデリング力チャート及び識別力チャート）(以下、「SIMCA解析結果チャート」と総称する）をUI３４６上に表示し、また、UI３４６に入力されたユーザからの選択、拡大、削除及び初期化などの要求に応答して、UI３４６上のそれらのチャートを変化させる。

NMRスペクトル連携部３７８は、記憶装置１０６上の大量のサンプルのNMRスペクトルデータ３５４の中から、UI３４６上でユーザにより選択された１又は複数のサンプルのNMRスペクトルデータを読込んで、その選択されたサンプルのNMRスペクトルを示すチャートを、UI３４６上に上述したPCA解析結果チャートまたはSIMCA解析結果チャートと並べて表示する。

以下では、図２５に示した各部の機能を、UI３４６の画面例を参照しつつ説明する。

図２６は、PCA解析結果を表示した場合におけるUI３４６の画面例を示す。図２７は、SIMCA解析結果を表示した場合におけるUI３４６の画面例を示す。

図２６と図２７に示すように、この実施形態におけるUI３４６の画面４３０（以下、「UI画面」という）は、PCA解析結果とSIMCA解析結果とが交互に切り替え可能な別の画面に表示されるようになっているが、これは表示方法の一例にすぎない。十分に大型のディスプレイ装置を使用する場合のために、同一画面にPCA解析結果とSIMCA解析結果とを表示できるようになっていてもよい。

図２６と図２７に示すように、PCA解析結果とSIMCA解析結果のいずれを表示する場合にも、UI画面４３０には、コントロールパネル４３２があり、そこには、図１に示したステップ１０８〜１１４の前処理を制御するための各種要求をユーザが入力するための前処理コントロールパネル４３４と、PCA解析を制御するための各種要求をユーザが入力するためのPCAコントロールパネル４３６と、SIMCA解析を制御するための各種要求をユーザが入力するためのSIMCAコントロールパネル４３８とが図示のように配置される。

このUI画面４３０上のPCAコントロールパネル４３６の一番上の「PCA」選択ラジオボタンがユーザにより操作された（例えばクリックされた）場合には、それに応答して、図２５に示したPCA解析画面制御部３７４が動作する。PCA解析画面制御部３７４は、解析データ記憶部３６４からPCA解析結果を受けて、UI画面４３０上に図２６に示すように、複数のPCA解析結果チャート、すなわち、スコアプロット４４０、ローディングプロット４４２、寄与率プロット４４４及びローディングプロットを表示する。他方、SIMCAコントロールパネル４３８の一番上の「SIMCA」選択ラジオボタンが操作された場合には、それに応答して図２５に示したSIMCA解析画面制御部３７６が動作する。SIMCA解析画面制御部３７６は、解析データ記憶部３６４からSIMCA解析結果を受けて、UI画面４３０上に図２７に示すように、複数のSIMCA解析チャート、すなわち、クーマンプロット４６２、第１のクラスに対するモデリング力チャート４６４、第２のクラスに対するモデリング力チャート４６６及び識別力チャート４６８を表示する。

さらに、図２６と図２７に示すように、PCA解析結果とSIMCA解析結果のいずれを表示する場合にも、図２５に示したNMRスペクトル連携部３７８が動作して、UI画面４３０上に、NMRスペクトルチャート４５０を表示する。NMRスペクトルチャート４５０には、ユーザに選択された１以上のサンプルのNMRスペクトルのグラフが表示される。ここで、注目すべき点は、PCA解析結果を表示した場合、図２６に示すように、NMRスペクトルチャート４５０と寄与率チャート４４４とローディングチャート４４６とが、それぞれの横軸であるケミカルシフト軸のスケールが互に一致するようにして、ケミカルシフト軸に直交する縦軸方向に配列される点である。また、同様に、SIMCA解析結果を表示した場合、図２７に示すように、NMRスペクトルチャート４５０と識別力チャート４６８とが、それぞれの横軸であるケミカルシフト軸のスケールが互に一致するようにして、ケミカルシフト軸に直交する縦軸方向に配列される。これにより、ユーザは、寄与率、ローディング又は識別力の大きい変数（バケット又はそれに対応するケミカルシフト値）とNMRスペクトルのピークとの相関関係が視覚的に容易に把握でき、例えばメタボノミクスにおいてバイオマーカを決定することがより容易になる。

以下では、PCA解析を行なう場合と、SMCA解析を行なう場合とに分けて、それぞれの場合における動作をより具体的に説明する。まず、PCA解析を行なう場合について説明する。

まず、図２６に示したUI画面４３０上のPCAコントロールパネル４３６内の「PCA」選択ラジオボタンが操作された上で「Open_Model」ボタンが操作されると、図２５に示したPCAモデル読込・追加・保存部３６０が動作して、記憶装置１０６内の大量のサンプルのNMRヒストグラムデータ３５６の中から、ユーザに指定された複数のサンプルのNMRヒストグラムデータを選択して読み込み、図２４に示したような、多変量データ行列やその他の情報をからなるPCAテーブルの情報を作成する。ユーザ指定されたサンプルの数がN個で、各サンプルのNMRスペクトルを構成する変数（バケット）の数がM個であるならば、PCAテーブルの情報に含まれる多変量データ行列はN×Mのデータ行列となる。

PCAモデル読込・追加・保存部３６０は、作成したPCAテーブルの情報をPCA計算部３６２に引渡す。PCA計算部３６２は、そのPCAテーブルの情報を用いてPCA解析の計算を行なって、そのPCAテーブルの情報に含まれている多変量データ行列についてのPCAモデルを算出する。ここで、PCA解析計算において計算される主成分の数は、UI画面４３０上のPCAコントロールパネル４３６の一番上の「PCA」選択ラジオボタンの右脇に置かれた入力ボックスにユーザが入力した数で決まる（図示の例では主成分数として「６」が設定されている）。PCA計算部３６２は、算出されたPCAモデルに基づくPCA解析結果として、各主成分に対する各サンプルのスコア、そのスコアの分散、各主成分に対する各変数のローディング及び各変数の寄与率（全主成分に対するローディングの絶対値の和）などを算出する。算出されたPCA解析結果は、解析データ記憶部３６４に記憶される。

PCA解析画面制御部３７４が、解析データ記憶部３６４から上記PCA解析結果を受け取る。PCA解析画面制御部３７４は、図２６に示すように、各主成分に対する各サンプルのスコアに基づいて、スコアプロット４４０を作成してUI画面４３０上に表示し、各主成分に対する各変数のローディングに基づいて、ローディングプロット４４２とローディングチャート４４６を作成してUI画面４３０上に表示し、さらに、各変数の寄与率に基づいて、寄与率チャート４４４を作成してUI画面４３０上に表示する。

図２６に示すように、スコアプロット４４０では、ユーザにより選択された２つの主成分に対するそれぞれのスコアをそれぞれX軸とY軸にとり、各サンプルのその２つの主成分に対するスコアがプロットされる。X軸とY軸に相当する主成分は、PCAコントロールパネル４３６内の「X」軸プルダウンメニュー及び「Y」軸プリダウンメニューからユーザにより選ばれた番号の主成分である（図示の例では、X軸が第「１」主成分（PCA1)、Y軸が第「２」主成分（PCA2)。）。プロットされるサンプルのマークの形状と色は、上記PCAテーブル情報の中のサンプル毎のプロットタイプとプロットカラー（図２４の参照番号４１０、４１２に対応する情報）に従う。さらに、X軸とY軸には、対応する主成分番号とその分散も表示される（例：PC1(39.8%)）。さらに、計算に使用されたサンプル数も表示される。

スコアプロット４４０上で、複数のサンプルマーク間の位置が近いほど、それらのサンプルは特徴的に互いにより似ており、他方、位置が遠いほどより違っていることを意味する。従って、スコアプロット４４０上に、例えば互いに分離された幾つかのサンプルマークの塊が存在するならば、分析対象のサンプルが、それぞれの塊に対応する特徴的に異なる幾つかのクラスに分けられたと判断することができる。

また、各主成分におけるスコアの分散は、その値が大きいほど、その主成分がサンプルのクラス分けに寄与する度合いが高いことを意味する。例えば、X軸とY軸の主成分の分散の和が、或る値（例えば、６０％程度）より大きければ、それらの主成分を用いたPCAモデルにおいてサンプルがかなり明確にクラス分けされ得ると判断することができる。

PCAコントロールパネル４３６内の「Name」チェックボックスにユーザがチェックを入れると、PCA解析画面制御部３７４は、図２８（スコアプロット４４０内の部分領域の拡大図）に示すように、スコアプロット４４０上の全てのサンプルマークの近傍に、対応するサンプルのNMRスペクトルのファイル名を表示する。マウスポインターが各サンプルの上に置かれた場合にも、スコアプロット４４０の右上に自動的に対応するファイル名が表示される。これにより、ユーザは、スコアプロット４４０上の各サンプルマークが、具体的にどのサンプルに該当するのかを容易に把握できる。

図２６に示すように、ローディングプロット４４２では、PCAコントロールパネル４３６内の「X」軸プルダウンメニュー及び「Y」軸プリダウンメニューで選択された２つの主成分におけるローディングをそれぞれX軸とY軸にとり、その２つの主成分に対する各変数（バケット又はそれに対応するケミカルシフト値）のローディングが、所定の形状とカラーをもつ変数マークでプロットされる。また、X軸とY軸には、対応する主成分願号とその分散が表示される（例：PC1(39.8%)）。また、計算に使用された変数（バケット）の数も表示される。

ローディングプロット４４２上で、X軸とY軸の原点から遠くに存在する変数ほど、X軸とY軸にそれぞれ対応する主成分に対する寄与度が高い、つまり、サンプルのクラス分けに寄与する度合いが高いことを意味する。

PCAコントロールパネル４３６内の「Name」チェックボックスにユーザがチェックを入れると、PCA解析画面制御部３７４は、図２９（ローディングプロット４４２内の部分領域の拡大図）に示すように、ローディングプロット４４２上の全ての変数マークの近傍に、対応する変数（バケット）のケミカルシフト値(ppm）を表示する。また、マウスポインターが各変数マークの上に置かれた場合にも、ローディングプロット４４２の右上に自動的に対応するケミカルシフト値が表示される。これにより、ユーザは、ローディングプロット４４２上の各変数マークが、具体的にどの変数（ケミカルシフト値）に該当するのかを容易に把握できる。

図２６に示すように、寄与率チャート４４４では、ケミカルシフトを横軸にとり、各変数（ケミカルシフト値）の第１、２、３主成分に対するローディングの絶対値と残差（residual）成分の和が、棒グラフの形で表示される。第１、２、３主成分のスコアの分散と残差成分の分散も表示される。寄与率チャート４４４において、寄与率（棒グラフの高さ）が高い変数ほど、サンプルのクラス分けに寄与する度合いが高いと判断することができる。

図２６に示すように、ローディングチャート４４６では、ケミカルシフトを横軸にとり、PCAコントロールパネル４３６内の「X」軸プルダウンメニューで選択された１つの主成分に対する各変数のローディングが、棒グラフの形で表示される。また、そのX軸に選択された主成分のスコアの分散も表示される。ローディングチャート４４６において、ローディングの絶対値（棒グラフの高さ）が高い変数ほど、その主成分に寄与する度合いが高いと判断することができる。

図２６に示されたスコアプロット４４０、ローディングプロット４４２、寄与率プロット４４４及びローディングチャート４４６のそれぞれにおいて、選択、拡大／縮小、削除、初期化等の各種操作を行うことが可能である。

まず、スコアプロット４４０の各種操作について説明する。

図３０に示すように、スコアプロット４４０上の任意の１以上のサンプルマークをマウスのドラッグにより選択すると、PCA解析画面制御部３７４（図２５）が、その選択範囲４７０をスコアプロット４４０上に表示する。これと連携して、NMRスペクトル連携部３７８（図２５）が動作して、選択されたサンプルマークに対応するサンプルのNMRスペクトルデータを、PCMテーブルに登録されているそのサンプルのパス名とファイル名とを用いて、記憶装置１０６内のNMRスペクトルデータ３５４から読み込み、そして、選択されたサンプルのNMRスペクトルをNMRスペクトルチャート４５０上に表示する。NMRスペクトルチャート４５０には、表示されたNMRスペクトルのファイル名も表示される。

NMRスペクトルチャート４５０上で、複数のNMRスペクトルは、ケミカルシフト軸スケールを互いに一致させるようにして、ケミカルシフト軸に直交する縦軸方向に並んで表示され、且つ、規定の異なる色で区別して表示されるので、相互間の識別および相関が一目で分かる。加えて、図２６に示されているように、NMRスペクトルチャート４５０上の各NMRスペクトルと、寄与率チャート４４４とローディングチャート４４６とが、ケミカルシフト軸スケールを互いに一致させて、縦軸方向に並んで表示されるので、それらの間の相関も一目で分かる。

ユーザがキーボードの「CTRL」キーを押しながら、スコアプロット４４０上の任意のサンプルマークをマウスにてドラッグして選択すると、PCA解析画面制御部３７４は、そのサンプルマークを選択範囲に追加し、又は、そのサンプルマークが既に選択されている場合には、そのサンプルマークを選択範囲から外す。これと連携して、NMRスペクトル連携部３７８が、選択範囲に追加されたサンプルマークに対応するサンプルのNMRスペクトルをNMRスペクトルチャート４５０上に追加表示したり、又は、選択範囲から外されたサンプルのNMRスペクトルをNMRスペクトルチャート４５０から消去する。

図３１Aに示すように、スコアプロット４４０上で選択されたサンプルマークに関し、ユーザが「Del」キーを押すなどの削除要求を行うと、PCA解析画面制御部３７４は、図３１Bに示すように、そのサンプルマークをスコアプロット４４０上から消去し、これと連携して、NMRスペクトル連携部３７８が、その選択されたサンプルのNMRスペクトルをNMRスペクトルチャート４５０から消去する。同時に、PCA計算部３６２が、その削除要求のあったサンプルのPCAテーブル上でのサンプルステータス（図２４の参照番号４１４に相当）を「０」（解析対象に含まれる）から「１」（解析対象に含まれない）に切り替え、そして、サンプルステータスが「０」（解析対象に含まれる）であるサンプルのNMRヒストグラムデータだけを用いて、PCA解析計算を再度行い、その再計算の結果を解析データ記憶部３６４に出力する。PCA解析画面制御部３７４は、解析データ記憶部３６４から再計算の結果を受けて、UI画面４３０上に、再計算の結果に基づくスコアプロット４４０、ローディングプロット４４２、寄与率チャート４４４及びローディングロット４４６を表示する（図３１Bは、再計算後に表示されたスコアプロット４４０の例を示す）。

例えば、スコアプロット４４０上に、解析目的からみて支障になる或いは寄与しないと考えられるサンプルが表示されていた場合、そのサンプルを上記のようにして解析対象から除外した上で再度PCA計算を行うことにより、より望ましい解析結果が得られることになる。

また、ユーザがキーボードの「Shift」キーを押しながら、スコアプロット４４０上の任意の部分領域をマウスにてドラッグし選択すると、PCA解析画面制御部３７４は、選択した部分領域を拡大してスコアプロット４４０上に表示する。その後、ユーザが拡大表示されたスコアプロット４４０の画面を選択して、キーボードの「Home」キーを押すと、PCA解析画面制御部３７４は、スコアプロット４４０上の拡大率を「１」に初期化し、全てのスコア範囲を表示する。

また、ユーザがPCMコントロールパネル４３６上の「Reset_score」ボタンを操作すると、PCA計算部３６２が、PCAテーブル内の上記サンプル削除機能により「１」となっていたサンプルステータスを初期値「０」し、このように初期化されたPCAテーブルの内容に基づいて再度PCA解析計算を行い、そして、PCA解析画面制御部３７４が、そのPCA解析計算の結果に基づいたスコアプロット４４０、ローディングプロット４４２、寄与率チャート４４４及びローディングロット４４６を改めて表示する。

次に、ローディングプロット４４２の各種操作について説明する。

図３２に示すように、ユーザがローディングプロット４４２内の任意の１以上の変数マークをマウスでドラッグして選択すると、PCA解析画面制御部３７４が、その選択範囲４７２をローディングプロット４４２上に表示する。これと連携して、PCA解析画面制御部３７４は、寄与率チャート４４４及びローディングチャート４４６内の選択された変数マークに対応する変数（ケミカルシフト値）の棒グラフを、他の変数の棒グラフとは異なる所定の選択色で表示する（図中では、選択された変数の棒グラフを黒塗りで表示している。）。これにより、ローディングプロット４４２、寄与率チャート４４４及びローディングチャート４４６上での各変数（ケミカルシフト値）の識別と相関が一目で分かる。

ユーザがキーボードの「CTRL」キーを押しながら、ローディングプロット４４２上の任意の変数マークをマウスにてドラッグして選択すると、PCA解析画面制御部３７４は、その変数マークを選択範囲に追加し、又は、その変数マークが既に選択されている場合には、その変数マークを選択範囲から外す。これと連携して、PCA解析画面制御部３７４は、寄与率チャート４４４及びローディングチャート４４６上、選択範囲に追加された変数マークに対応する変数の棒グラフを追加的に選択色で表示したり、又は、選択範囲から外された変数の棒グラフの選択色表示を解除したりする。

また、図３３Bに示すように、上記のようにして或る選択範囲４７６で選択された変数マークについて、ユーザが「Del」キーを押すなどの削除要求を行うと、PCA解析画面制御部３７４は、その変数マークをローディングプロット４４０上から消去する。同時に、PCA計算部３６２が、その削除要求のあった変数マークに対応する変数（バケット）のPCAテーブル上でのステータス（図２４の参照番号４２６に相当）を「０」（解析に使用する）から「１」（解析に使用しない）に切り替え、そして、解析対象のサンプルのNMRヒストグラムデータ中の、ステータスが「０」（解析に使用する）である変数（バケット）に対応する積分値だけを使用して、PCA解析計算を再度行い、その再計算の結果を解析データ記憶部３６４に出力する。PCA解析画面制御部３７４は、解析データ記憶部３６４から再計算の結果を受けて、UI画面４３０上に、再計算の結果に基づくスコアプロット４４０、ローディングプロット４４２、寄与率チャート４４４及びローディングロット４４６を表示する（図３３Bは、再計算後に表示されたローディングプロット４４２の例を示す。）。

例えば、ローディングプロット４４０上に、解析目的からみて支障になる或いは寄与しないと考えられる変数が表示されていた場合、その変数を上記のようにして解析に使用する変数から除外した上で再度PCA計算を行うことにより、より望ましい解析結果が得られることになる。

また、ユーザが「Shift」キーを押しながら、ローディングプロット４４２上の任意の変数マークをマウスにてドラッグして選択すると、PCA解析画面制御部３７４は、ローディングプロット４４２上の選択範囲に相当する部分を拡大して表示する。この後、ユーザが拡大表示されたローディングプロット４４２を選択して、キーボードの「Home」キーを押すと、PCA解析画面制御部３７４は、ローディングプロット４４２の拡大率を「１」に初期化し、全てのケミカルシフト範囲を表示する。

また、ユーザがPCMコントロールパネル４３６上の「Reset loading」ボタンを操作すると、PCA計算部３６２が、PCAテーブル内容の上記サンプル削除機能により「１」となっていたバケットのステータスを初期値「０」に戻し、このように初期化されたPCAテーブルの内容に基づいて再度PCA解析計算を行い、そして、PCA解析画面制御部３７４が、そのPCA解析計算の結果に基づいたスコアプロット４４０、ローディングプロット４４２、寄与率チャート４４４及びローディングロット４４６を改めて表示する。

次に、寄与率チャート４４４とローディングチャート４４６の各種操作について説明する。

ユーザが、寄与率チャート４４４又はローディングチャート４４６のケミカルシフト軸上の任意の変数（ケミカルシフト値）範囲をマウスにてドラッグして選択すると、PCA解析画面制御部３７４が、その選択範囲に属する変数のローディングチャート４４２上の変数マークと、寄与率チャート４４４及びローディングチャート４４６上の棒グラフを、選択範囲外の変数のそれと区別した所定の選択色で表示する。それにより、ローディングプロット４４２、寄与率チャート４４４及びローディングチャート４４６上での各変数（ケミカルシフト値）の識別と相関が一目で分かる。

また、上記のようにして寄与率チャート４４４又はローディングチャート４４６上で選択された変数（ケミカルシフト値）範囲について、ユーザが「Del」キーを押すなどの削除要求を行うと、PCA解析画面制御部３７４は、その選択範囲に属する変数の変数マークをローディングプロット４４０上から消去する。同時に、PCA計算部３６２が、その選択範囲に属する変数（バケット）のPCAテーブル上でのステータス（図２４の参照番号４２６に相当）を「０」（解析に使用する）から「１」（解析に使用しない）に切り替え、そして、解析対象のサンプルのNMRヒストグラムデータ中の、ステータスが「０」（解析に使用する）である変数（バケット）に対応する積分値だけを使用して、PCA解析計算を再度行い、その再計算の結果を解析データ記憶部３６４に出力する。PCA解析画面制御部３７４は、解析データ記憶部３６４から再計算の結果を受けて、UI画面４３０上に、再計算の結果に基づくスコアプロット４４０、ローディングプロット４４２、寄与率チャート４４４及びローディングロット４４６を表示する。

例えば、寄与率チャート４４４又はローディングチャート４４６上に、解析目的からみて支障になる或いは寄与しないと考えられる変数（ケミカルシフト値）範囲が在る場合、その範囲の変数を上記のようにして解析に使用する変数から除外した上で再度PCA計算を行うことにより、より望ましい解析結果が得られることになる。

また、図３４Aに示すように、ユーザが「Shift」キーを押しながら、ローディングチャート４４６又は寄与率チャート４４４のケミカルシフト軸上の任意の変数（ケミカルシフト値）範囲をマウスにてドラッグして選択すると、PCA解析画面制御部３７４は、図３４Bに示すように、ローディングチャート４４６及び寄与率チャート４４４の中の選択された変数（ケミカルシフト値）範囲に相当する部分を拡大して表示する。これに連携して、NMRスペクトル連携部３７８が、NMRスペクトルチャート４５０の中の選択された変数（ケミカルシフト値）範囲に相当する部分を拡大して表示する。従って、どのような拡大率で表示した場合でも常に、ローディングチャート４４６と寄与率チャート４４４とNMRスペクトルチャート４５０はケミカルシフト軸スケールが一致した状態に維持され、それらの間の相関関係が一目で分かるようになっている。

このようにローディングチャート４４６及び寄与率チャート４４４並びにNMRスペクトルチャート４５０の拡大表示を行なった後、ユーザが拡大表示されたローディングチャート４４６又は寄与率チャート４４４を選択して、キーボードの「Home」キーを押すと、PCA解析画面制御部３７４とNMRスペクトル連携部３７８は、それらのチャート４４６、４４４、４５０の拡大率を「１」に初期化し、全てのケミカルシフト範囲を表示する。

PCA解析を行なう場合、以上のような各種の操作がUI画面４３０上で行なうことができる。このような操作を逐次に行いながらPCA解析を進めていく過程の任意の段階で、ユーザがPCAコントロールパネル４３６内の「Add_Model」ボタンを操作すると、PCAモデル読込・追加・保存部３６０が、記憶装置１０６内の大量のサンプルのNMRヒストグラムデータ３５６の中から、ユーザに指定された追加のサンプルのNMRヒストグラムデータを選択して読み込み、これを現在処理中のPCAテーブル内の多変量データ行列に追加し、その多変量データ行列が追加されたPCAテーブルの情報をPCA計算部３６２に渡す。PCA計算部３６２は、その多変量データ行列が追加されたPCAテーブルの情報を用いてPCA解析計算を再実行する。PCA解析画面制御部３７４は、その再実行されたPCA解析計算の結果を、UI画面４３０に改めて表示する。

また、上記のようにPCA解析を進めていく過程の任意の段階で、ユーザがPCAコントロールパネル４３６内の「Save_model」ボタンを操作すると、PCAモデル読込・追加・保存部３６０が、その時点で処理中の多変量データ行列を始めとするPCAテーブルの情報を、記憶装置１０６内にPCAテーブル３５０として保存する。

以上が、PCA解析を行なう場合の各部の動作である。上述した説明から分かるように、PCA解析を行なう場合、UI画面４３０上では、スコアプロット４４０、ローディングプロット４４２、寄与率チャート４４４、ローディングチャート４４６及びNMRスペクトルチャート４５０の全ての情報が有機的に結合されて表示され、そして、いずれかの操作が行われると、その操作結果が、それに関連する全てのチャートにリアルタイムに反映される。特に、解析対象からのサンプルの削除や変数の削除などを行なった後にPCA解析をすばやく再実行し、より精度の高い解析結果を導き出すことが容易である。また、UI画面４３０上では、PCA解析結果に連携してNMRスペクトルも表示される。そのため、PCA解析結果とNMRスペクトルの形状とを合わせて評価することができ、解析結果の意味づけを考察することがより容易になる。PCA解析過程で必要な操作を行った後の最終的に評価結果からPCAの再解析およびスペクトルの再処理をすばやく実行しより精度の高い解析結果を導き出すことが容易になる。

次に、SIMCA解析を行なう場合における動作について説明する。

すなわち、まず、図２６又は図２７に示したUI画面４３０上のSIMCAコントロールパネル４３８内の「SIMCA」選択ラジオボタンが操作された上で「Model1」ボタンが操作されると、図２５に示したSIMCA解析部３４８内のPCAモデル読込・追加・保存部３７０が動作して、記憶装置１０６内の大量のサンプルのNMRヒストグラムデータ３５６の中から、ユーザに指定された複数のサンプルのNMRヒストグラムデータを選択して読み込み、図２４に示したような、多変量データ行列やその他の情報からなるPCAテーブルの情報を作成する。作成されたPCAテーブルの情報は、第1のクラスのPCAテーブル情報として扱われる。同様に、「Model２」ボタンが操作されると、PCAモデル読込・追加・保存部３７０が、記憶装置１０６内のNMRヒストグラムデータ３５６の中から、ユーザに指定された複数のサンプルのNMRヒストグラムデータを選択して読み込み、第２のクラスのPCAテーブルの情報を作成する。

SIMCA解析を開始する場合には、少なくとも第１と第２クラスのPCAテーブルが定義される必要がある。更に、ユーザは、所望すればSIMCAコントロールパネル４３８内の「Model1」ボタンが操作されると、「Test_model」ボタンを操作することができる。「Test_model」ボタンが操作されると、PCAモデル読込・追加・保存部３７０が、記憶装置１０６内のNMRヒストグラムデータ３５６の中から、ユーザに指定された複数のサンプルのNMRヒストグラムデータを選択して読み込み、テストクラスのPCAテーブルの情報を作成する。

PCAモデル読込・追加・保存部３７０は、作成した第１クラスと第２クラスのPCAテーブルの情報をSIMCA計算部３７２に引渡す。テストクラスのPCAテーブルが更に作成された場合には、そのテストクラスのPCAテーブルの情報もSIMCA計算部３７２に引渡される。SIMCA計算部３７２は、それらのクラスのPCAテーブルの情報を用いて、PCA計算部３６２を呼び出してクラス毎のPCAモデルを算出させ、それらのクラスのPCAモデルを用いてSIMCA解析の計算を行なう。各種クラスのPCAモデルの主成分数は、SIMCAコントロールパネル４３８内の「SIMCA」選択ラジオボタンの右脇の入力ボックスにユーザが入力した数に従う。SIMCA計算部３７２は、SIMCA解析結果として、第1と第２の各クラスに対する各サンプルの距離、第1と第２の各クラスの残差標準偏差（RSD）、第1と第２の各クラスに対する各変数（ケミカルシシフト値）のモデリング力（modeling power）、及び各変数（ケミカルシシフト値）の識別力（discrimination power）などを算出する。算出されたSIMCA解析結果は、解析データ記憶部３６４に記憶される。

SIMCA解析画面制御部３７４が、解析データ記憶部３６４から上記SIMCA解析結果を受け取る。SIMCA解析画面制御部３７６は、図２７に示すように、第1と第２の各クラスに対する各サンプルの距離に基づいてクーマンプロット４６０を作成してUI画面４３０上に表示し、第1と第２の各クラスに対する各変数（ケミカルシシフト値）のモデリング力に基づいて、第１クラスのモデリング力チャート４６２と第２クラスのモデリング力チャート４６４を作成してUI画面４３０上に表示し、さらに、各変数（ケミカルシシフト値）の識別力に基づいて、識別力チャート４６６を作成してUI画面４３０上に表示する。

図２７に示すように、クーマンプロット４６０では、第1クラスと第２クラスからの距離をそれぞれX軸とY軸にとり、各サンプルのその２つのクラスまでの距離がプロットされる。プロットされるサンプルのマークの形状と色は、上記PCAテーブル情報の中のサンプル毎のプロットタイプとプロットカラー（図２４の参照番号４１０、４１２に対応する情報）に従う。さらに、クーマンプロット４６０上には、第1クラスと第２クラスのそれぞれの残差標準偏差（RSD）の名称と値（例：RSD(1)0.5449）がX軸とY軸の近傍に表示され、かつ、それぞれのクラスの残差標準偏差（RSD）を示す直線（以下、「RSD」線という）４８０、４８２が表示される。

クーマンプロット４６０上でのサンプルマークの配置状態が、次のような明快分類状態に近い状態であるほど、サンプルがより明確に第１クラスと第２クラスに分類されたと判断することができる。すなわち、その明快分類状態とは、サンプルマークが２つの塊に分かれ、一方の塊が第１クラスのRSD線４８０とY軸との間に領域に存在し、他方の塊が第２クラスのRSD線４８２とX軸との間の領域に存在するという状態である。

SIMCAコントロールパネル４３８内の「Name」チェックボックスにユーザがチェックを入れると、SIMCA解析画面制御部３７４は、図２８を参照して説明したスコアプロット４４０の場合と同様に、クーマンプロット４６０上の全てのサンプルマークの近傍に、対応するサンプルのNMRスペクトルのファイル名を表示する。マウスポインターが各サンプルの上に置かれた場合にも、クーマンプロット４６０の右上に自動的に対応するファイル名が表示される。これにより、ユーザは、クーマンプロット４６０の各サンプルマークが、具体的にどのサンプルに該当するのかを容易に把握できる。

図２７に示すように、第１クラスと第２クラスのモデリングチャート４６２、４６４では、ケミカルシフトを横軸にとり、各変数（ケミカルシフト値）の第１クラスと第２クラスについてのモデリング力（これは、それぞれのクラスのデータ構造を記述するための各変数の有効性を評価するための一つの指標である）が、棒グラフの形で表示される。各クラスのモデリングチャート４６２、４６４において、モデリング力（棒グラフの高さ）が高い変数ほど、各クラスのデータ構造を記述する有効性がより高いと判断することができる。

図２７に示すように、識別力チャート４６６では、ケミカルシフトを横軸にとり、各変数（ケミカルシフト値）の識別力（これは、第1と第２のクラスへの分類のための各変数の有効性を評価するための一つの指標である）が、棒グラフの形で表示される。識別力チャート４６６において、識別力（棒グラフの高さ）が高い変数ほど、第1と第２のクラスへの分類のための有効性がより高いと判断することができる。

図２７に示されたクーマンプロット４６０、モデリングチャート４６２、４６４、識別力チャート４６６のそれぞれにおいて、選択、拡大／縮小、削除、初期化等の各種操作を行うことが可能である。

まず、クーマンプロット４６０の各種操作について説明する。

図３５に示すように、クーマンプロット４６０上の任意の１以上のサンプルマークをマウスのドラッグにより選択すると、SIMCA解析画面制御部３７６が、その選択範囲４８４をクーマンプロット４６０上に表示する。これと連携して、NMRスペクトル連携部３７８が動作して、選択されたサンプルマークに対応するサンプルのNMRスペクトルデータを、PCMテーブルに登録されているそのサンプルのパス名とファイル名とを用いて、記憶装置１０６内のNMRスペクトルデータ３５４から読み込み、そして、選択されたサンプルのNMRスペクトルをNMRスペクトルチャート４５０上に表示する。NMRスペクトルチャート４５０には、表示されたNMRスペクトルのファイル名も表示される。

NMRスペクトルチャート４５０上で、複数のNMRスペクトルは、ケミカルシフト軸スケールを互いに一致させるようにして、ケミカルシフト軸に直交する縦軸方向に並んで表示され、且つ、規定の異なる色で区別して表示されるので、相互間の識別および相関が一目で分かる。加えて、図２７に示されているように、NMRスペクトルチャート４５０上の各NMRスペクトルと識別力チャート４６６とが、ケミカルシフト軸スケールを互いに一致させて、縦軸方向に並んで表示されるので、それらの間の相関も一目で分かる。

ユーザがキーボードの「CTRL」キーを押しながら、クーマンプロット４６０上の任意のサンプルマークをマウスにてドラッグして選択すると、SIMCA解析画面制御部３７６は、そのサンプルマークを選択範囲に追加し、又は、そのサンプルマークが既に選択されている場合には、そのサンプルマークを選択範囲から外す。これと連携して、NMRスペクトル連携部３７８が、選択範囲に追加されたサンプルマークに対応するサンプルのNMRスペクトルをNMRスペクトルチャート４５０上に追加表示したり、又は、選択範囲から外されたサンプルのNMRスペクトルをNMRスペクトルチャート４５０から消去する。

図３６Aに示すように、クーマンプロット４６０上で選択されたサンプルマークに関し、ユーザが「Del」キーを押すなどの削除要求を行うと、SIMCA解析画面制御部３７６は、図３６Bに示すように、そのサンプルマークをクーマンプロット４６０上から消去し、これと連携して、NMRスペクトル連携部３７８が、その選択されたサンプルのNMRスペクトルをNMRスペクトルチャート４５０から消去する。同時に、SIMCA計算部３７２が、その削除要求のあったサンプルの該当クラスのPCAテーブル上でのサンプルステータス（図２４の参照番号４１４に相当）を「０」（解析対象に含まれる）から「１」（解析対象に含まれない）に切り替え、そして、サンプルステータスが「０」（解析対象に含まれる）であるサンプルのNMRヒストグラムデータだけを用いて、SIMCA解析計算を再度行い、その再計算の結果を解析データ記憶部３６４に出力する。SIMCA解析画面制御部３７６は、解析データ記憶部３６４から再計算の結果を受けて、UI画面４３０上に、再計算の結果に基づくクーマンプロット４６０、モデリングプロット４６２、４６４及び識別力チャート４６６を表示する（図３６Bは、再計算後に表示されたクーマンプロット４６０の例を示す）。

例えば、クーマンプロット４６０上に、解析目的からみて支障になる或いは寄与しないと考えられるサンプルが表示されていた場合、そのサンプルを上記のようにして解析対象から除外した上で再度SIMCA計算を行うことにより、より望ましい解析結果が得られることになる。

また、ユーザがキーボードの「Shift」キーを押しながら、クーマンプロット４６０上の任意の部分領域をマウスにてドラッグし選択すると、SIMCA解析画面制御部３７６は、選択した部分領域を拡大してクーマンプロット４６０上に表示する。その後、ユーザが拡大表示されたクーマンプロット４６０の画面を選択して、キーボードの「Home」キーを押すと、SIMCA解析画面制御部３７６は、クーマンプロット４６０上の拡大率を「１」に初期化し、元の表示範囲の全部を表示する。

また、ユーザがSIMCAコントロールパネル４３８上の「Reset_score」ボタンを操作すると、SIMCA計算部３７２が、各クラスのPCAテーブル内の上記サンプル削除機能により「１」となっていたサンプルステータスを初期値「０」し、このように初期化されたPCAテーブルの内容に基づいて再度SIMCA解析計算を行い、そして、SIMCA解析画面制御部３７６が、そのSIMCA解析計算の結果に基づいたクーマンプロット４６０、モデリングプロット４６２、４６４及び識別力チャート４６６を改めて表示する。

次に、モデリング力チャート４６２、４６４と識別力チャート４６６の各種操作について説明する。

図３７に示すように、識別力チャート４６６上で、ユーザが縦軸方向の任意の高さ位置（つまり、任意の識別力の値）をマウスでドラッグして閾値として指定すると、SMCA解析画面制御部３７６が、識別力チャート４６６上のその指定された閾値を示す閾値ライン４８６を表示するとともに、その指定された閾値より高い識別力を持つ変数のみを選択して、その選択された変数の棒グラフを、モデリング力チャート４６２、４６４及び識別力チャート４６６の全てにおいて、他の変数とは異なる所定の選択色で表示する。同時に、解析結果記憶部３６４が、選択された変数（すなわち、指定された閾値より識別力の高い変数）を特定する情報を記憶する。同様に、ユーザが第1クラス又は第２クラスモデリング力チャート４６２又は４６４上で、或るモデリング力の値を閾値として指定した場合にも、その閾値より高いモデリング力をもつ変数が他の変数とは異なる選択色で表示され、かつ、その選択された変数を特定する情報が解析結果記憶部３６４に記憶される。これにより、モデリング力チャート４６２、４６４、識別力チャート４６６及NMRスペクトルチャート４５０における選択された変数の識別や相関関係が一目で分かる。

上記のようにして識別力又はモデリング力の高い変数が選択された後、ユーザがSIMCAコントロールパネル４３８内の「Set_D.P.」ボタンを操作すると、SIMCA計算部３７２が、解析データ記憶部３６４から選択された変数の特定情報を受け取り、各クラスのPCAテーブル情報中の選択されていない変数のステータスを「０」（解析に使用する）から「１」（解析に使用しない）に変更し、そして、選択された変数だけを用いて再度SIMCA計算を行なう。続いて、SIMCA解析画面制御部３７６が、図３８に示すように、SIMCA再計算の結果を受けて、それに基づきクーマンプロット４６０、モデリングプロット４６２、４６４及び識別力チャート４６６を改めて表示する。このようにして識別力又はモデリング力の高い変数だけを用いてSIMCA解析を再度行うことで、より望ましい解析結果を得ることが可能になる。

また、上記のようにして識別力又はモデリング力の高い変数が選択された後、ユーザがPCAコントロールパネル４３６内の「Set_D.P.」ボタンを操作すると、PCA計算部３６２が、解析データ記憶部３６４から選択された変数の特定情報を受け取り、SIMCA解析で使用されていた全クラスのPCAテーブル情報を統合して、全クラスのサンプルの多変量データ行列をもつPCA解析用のPCAテーブル情報を作成し、そのPCA解析用のPCAテーブル情報中の選択された変数のステータスを「０」（解析に使用する）とし、選択されてない変数のステータスを「１」（解析に使用しない）とする。そして、PCA計算部３６２は、その選択された変数だけを用いて、PCA解析用のPCAテーブル情報中の全クラスのサンプルの多変量データ行列についてPCA計算を再度行なう。続いて、PCA解析画面制御部３７４が、UI画面４３０を図２７に示すようなSIMCA解析用のものから、図２６に示すようなPCA解析用のもの切り替え、上述したPCA解析の再計算の結果に基づいたスコアプロット４４０、ローディングプロット４４２、寄与率チャート４４４及びローディングチャート４４６を改めて表示する。このようにして識別力又はモデリング力の高い変数だけを用いてPCA解析を再度行うことで、より望ましい解析結果を得ることが可能になる。

また、図２７に示すようなSIMCA解析用のUI画面４３０において、ユーザが「Shift」キーを押しながら、モデリング力チャート４６２、４６４又は識別力チャート４６６中のケミカルシフト軸上の任意の変数（ケミカルシフト値）範囲をマウスにてドラッグして選択すると、SIMCA解析画面制御部３７６は、モデリング力チャート４６２、４６４及び識別力チャート４６６中の選択された変数（ケミカルシフト値）範囲に相当する部分を拡大して表示する。これに連携して、NMRスペクトル連携部３７８が、NMRスペクトルチャート４５０の中の選択された変数（ケミカルシフト値）範囲に相当する部分を拡大して表示する。従って、どのような拡大率で表示した場合でも常に、識別力チャート４６６とNMRスペクトルチャート４５０はケミカルシフト軸スケールが一致した状態に維持され、それらの間の相関関係が一目で分かるようになっている。

このようにモデリング力チャート４６２、４６４、識別力チャート４６６及びNMRスペクトルチャート４５０の拡大表示を行なった後、ユーザが拡大表示されたモデリング力チャート４６２、４６４又は識別力チャート４６６を選択して、キーボードの「Home」キーを押すと、SIMCA解析画面制御部３７６とNMRスペクトル連携部３７８は、それらのチャート４６２、４６４、４６６の拡大率を「１」に初期化し、全てのケミカルシフト範囲を表示する。

以上が、SIMCA解析を行なう場合の各部の動作である。上述した説明から分かるように、SIMCA解析を行なう場合、UI画面４３０上では、クーマンプロット４６０、モデリングプロット４６２、４６４、識別力チャート４６６及びNMRスペクトルチャート４５０の全ての情報が有機的に結合されて表示され、そして、いずれかの操作が行われると、その操作結果が、それに関連する全てのチャートにリアルタイムに反映される。特に、解析対象からのサンプルの削除や変数の選択などを行なった後にSIMCA解析をすばやく再実行し、より精度の高い解析結果を導き出すことが容易である。また、UI画面４３０上では、SIMCA解析結果に連携してNMRスペクトルも表示される。そのため、SIMCA解析結果とNMRスペクトルの形状とを合わせて評価することができ、解析結果の意味づけを考察することがより容易になる。

また、SIMCA解析では、各変数についてモデリング力と識別力という二つの尺度が算出される。識別力は２つのクラスについてどの変数が分類に有効であるかを表している。下がって、識別力に基づいて分類に寄与する変数を抽出することができ、他の変数は分類にあまり寄与しないノイズと考えることができる。この実施形態では、上述したように分類に有効な変数のみを用いて再度PCA解析もしくはSIMCA解析を実行することができる。それにより、サンプルをより一層明確にクラス分けすることが可能となる。

図３９は、SIMCA解析で選択された識別力の高い変数を使ってSIMCA解析計算又はPCA解析計算を再実行するための処理手順を示す。

図３９に示すように、ステップ５００でSIMCA解析が実施され、ステップ５０２で、識別力チャート４６６上で識別力の閾値が指定されると、ステップ５０４で、その閾値以上の識別力をもつ変数が抽出される。その後、ステップ５０６で、SIMCAコントロールパネル４３８上の「Set_D.P.」ボタンが操作されると、ステップ５０８で、抽出された変数だけを用いてSIMCA解析計算が再度実行され、SIMCA解析結果が表示される。

また、ステップ５０４の後、ステップ５１０で、PCAコントロールパネル４３６上の「Set_D.P.」ボタンが操作されると、ステップ５１２で、抽出された変数だけを用いて、SIMCA解析の対象となったサンプルについてPCA解析計算が再度実行され、PCA解析結果が表示される。また、ステップ５０４の後、ステップ５１４で、PCAコントロールパネル４３６上の「Add_D.P.」ボタンが操作されると、ステップ５１６で、現在の解析に使用することになっている変数に、抽出された変数を追加した上で、それらの変数を用いてSIMCA解析の対象となったサンプルについてPCA解析計算が再度実行され、PCA解析結果が表示される。

ところで、上述した「Add_D.P.」ボタンを用いた変数の追加機能は、例えば次のような用途に利用可能である。すなわち、クラスが３つ以上存在する場合、それぞれ２つのクラスの組合せを第１と第２のクラスとしてSIMCA解析を行って、分類に有効な変数を求め、その有効な変数を、上述した「Add_D.P.」ボタン操作で逐次に加算して行くことができる。すなわち、まず、最初に選んだ２つのクラスの組合せでSIMCA解析を実施して有効な変数を選択した後、PCAコントロールパネル４３６上の「Set_D.P.」ボタン操作で、その選択された変数を使用対象に設定する。次に、別の２つのクラスの組合せでSIMCA解析を実施して有効な変数を選択した後、PCAコントロールパネル４３６上の「ADD_D.P.」ボタン操作で、その選択された変数を、最初に選択された変数に追加する。以後、その他の２つのクラスの組み合わせのそれぞれについて、SIMCA解析を実施して有効な変数を選択した後上記「ADD_D.P.」ボタン操作を繰り返す。これにより、ぞれぞれのクラスの組み合わせで有効な変数が使用対象にセットされることになり、いずれのクラスの組み合わせにおいても有効ではないとされた変数だけが、使用対象から外される。

以上、図２３〜図３９を参照して、本発明の一実施形態にかかるNMRスペクトルの統計処理装置（図１に示した統計処理部１１６）の構成、機能、動作について説明した。以下では、このNMRスペクトルの統計処理装置を特定の用途に用いる場合の使用例を紹介する。

図４０は、メタボノミクスにおいてバイオマーカを決定する用途にこの統計処理装置を使用する場合の使用手順を示す。

図４０に示すように、ステップ５２０で分析が開始される。この分析では、例えば、人からの採取物に基づいてその人が特定の疾病に罹っているか否かを判断するためのバイオマーカを決定したいという場合、既にその疾病に罹っている人々からの採取物と健康な人々からの採取物とが分析対象のサンプルとして選ばれる。クラス毎に、異なるカラーがプロットカラーとして指定される。まず、ステップ５２２で、分析対象の多数のサンプルについてPCA解析が行われる。ステップ５２４で、スコアプロット４４０などに示された第１主成分（PC1）と第２主成分（PC2）のスコアの分散の和が、ユーザが決めた或る閾値、例えば６０％、を超えているかどうかが、ユーザにより判断される。もし、上記スコアの分散の和が閾値６０％を超えているならば、ステップ５２６で、ユーザは、ステップ５２２で行ったPCA解析で得られたPCAモデルにおいて、サンプルは明快にクラス分けされていると判断する。その場合、ステップ５２８で、ユーザは、ローディングプロット４４２、寄与率チャート４４４、ローディングチャート４４６及びNMRスペクトルチャート４５０などを参照しながら、寄与率の高いケミカルシフト値又はそれに対応するNMRスペクトルのピークを選定し、それに基づきバイオマーカを決定する。

他方、ステップ５２４で、上記スコアの分散の和が閾値６０％以下であるならば、ユーザは、ステップ５２２で行ったPCA解析で得られたPCAモデルでは、サンプルは明快にはクラス分けされていないと判断し、次に、ステップ５３２のSIMCA解析を実行する。SIMCA解析においては、ステップ５３４で、検査対象のサンプルが第1と第２の２つのクラスに分けられる。例えば、その疾病に罹っている人々から採取されたサンプルが第1のクラスに、健康な人々から採取されたサンプルが第２のクラスに割り当てられる。この２つのクラスについてSIMCA解析が実行され、そのSIMCA解析結果が表示されると、ユーザは、ステップ５３６で、識別力チャート４６６上で識別力の閾値を設定して、その閾値以上の識別力を持った変数を選択する。その後、ユーザは、PCAコントロールパネル４３６の「Set_D.P.」ボタンを操作する。それにより、ステップ５２２で、選択された変数だけを用いて、同じサンプルに対してPCA解析計算が再度実行される。その結果、前回のPCA解析計算の結果よりも、より明確にサンプルが分散したPCAモデルが得られ、バイオマーカの決定がより容易になる。

図４１は、テストサンプルの性向を診断する用途に、本発明の一実施形態にかかるNMRスペクトルの統計処理装置（図１に示した統計処理部１１６）を使用する場合における使用手順の一例を示す。

図４１に示すように、ステップ５４０で診断が開始される。この診断は、例えば、或る人々について特定の疾病に罹っているか否かを診断するものである。ステップ５４２で、２つの基本クラスつまり第1と第２のクラスが設定される。例えば、既に疾病に罹っている人々から採取されたサンプルが第1のクラスに、健康な人々から採取されたサンプルが第２のクラスに割り当てられる。また、ステップ５４４で、診断対象の人々から採取されたサンプルがテストクラスとして設定される。クラス毎に、異なるカラーがプロットカラーとして指定される。

その後、ステップ５４６で、それら３つのクラスのサンプルを統合した多変量データ行列についてPCA解析が実行される。また、ステップ５４８で、それら３つのクラスのサンプルについてSIMCA解析が行なわれる。SIMCA解析では、テストクラスのサンプルの第1のクラスと第２のクラスにそれぞれに対する距離が求まり、それがクーマンプロット４４０上に表現される。スコアププロット４４０でも、クーマンプロットでも、３つのクラスのサンプルはクラス別の異なるプロットカラーで表示されるので、それらの相関が一目で分かる。

ステップ５５０で、ユーザは、PCA解析結果とSIMCA解析結果を参照することで、テストサンプルである診断対象の人々と、第1クラスである当該疾病に罹っている人々と、第２クラスである健康な人々との間の相関を把握し、そこから、診断対象の人々が当該疾病に罹っているのか、健康であるのか、或は未定なのかなどの判断を下す。

以上、本発明の実施形態を説明したが、この実施形態は本発明の説明のための例示にすぎず、本発明の範囲をこの実施形態にのみ限定する趣旨ではない。本発明は、その要旨を逸脱することなく、その他の様々な態様でも実施することができる。例えば、上記の実施形態では、多変量解析結果であるスコアプロット、ローディング及びクーマンプロットを、UI画面上で２本の座標軸からなる二次元図形の形で表示したが、それに代えて又はそれと併用して、３本の座標軸からなる三次元図形として形成し、その三次元図形を任意の視線方向から表示できるようにすることもできる。また、本発明は、メタボノミクスだけでなく、それ以外の用途にも適用することができる。

本発明に従うNMRデータ処理装置の一実施形態の全体的な構成と機能を示すブロック図。 NMRスペクトル処理１１０の流れを示すフローチャート。 NMRスペクトル（実部）と、これに絶対値微分を施した結果であるADスペクトルの一例を示す図。位相補正を説明する図。ベースライン補正を説明する図。最適化バケット積分を用いたデータ縮約処理１１２の流れを示すフローチャート。スペクトル投影処理１７２の原理を説明する図。スペクトル投影処理１７２の流れを示すフローチャート。投影ADスペクトルのバケット積分処理１７２の原理を説明する図。バケット積分処理１７２の流れを示すフローチャート。自動積分ブロック設定に基づくバケットの自動修正処理１７４の原理を説明する図。自動積分ブロック設定に基づくバケットの自動修正処理１７４の流れを示すフローチャート。 NMRスペクトル上の３分裂と４分裂のピークの例を示す図。指定ピーク情報のデータ構造例を示す図。指定ピーク情報に基づくバケット自動修正処理１７６の流れを示すフローチャート。バケットの手動修正処理１７８の原理を示す図。バケットの手動修正処理１７８の流れを示すフローチャート。最適化バケットセットのデータ構造例を示す図。多数ADスペクトルの最適化バケット積分処理１８０の流れを示す。本発明に従うNMRデータ処理装置の別の実施形態の全体的な構成と機能を示すブロック図最適化バケット積分を用いたデータ縮約処理３１２の流れを示すフローチャート。ヒストグラムの分析処理３１４の流れを示すフローチャート。本発明の一実施形態にかかるNMRスペクトルの統計処理装置、すなわち、図１に示した統計処理部１１６、の機能的な構成を示すブロック図。 PCAテーブル３５０の構成例を示す図。図２３に示した多変量解析部３４０のPCA解析部３４６とSIMCA解析部３４８並びに表示制御部３４４の機能をより詳細に示したブロック図。 PCA解析結果を表示した場合におけるUI３４６の画面例を示す図。 SIMCA解析結果を表示した場合におけるUI３４６の画面例を示す図。ファイル名の表示機能を説明するためのスコアプロット４４０内の部分領域の拡大図。ケミカルシフト値の表示機能を説明するためのローディングプロット４４２内の部分領域の拡大図。スコアプロット４４０上でのプロット選択機能とNMRスペクトル連携機能とを説明するためのスコアプロット４４０とNMRスペクトルをャート４５０の例を示す図。スコアプロット４４０上でのプロットの削除機能を説明するためのスコアプロット４４０の例を示す図。ローディングプロット４４２上でのプロット選択機能とそれに連携する寄与率チャート４４４とローディングチャート４４６の表示変更機能とを説明するためのローディングプロット４４２と寄与率チャート４４４とローディングチャート４４６の例を示す図。ローディングプロット４４２上でのプロットの削除機能を説明するためのローディングプロット４４２の例を示す図。寄与率チャート４４４又はローディングチャート４４６の拡大機能とNMRスペクトル連携機能とを説明するための寄与率チャート４４４とローディングチャート４４６とNMRスペクトルをャート４５０の例を示す図。クーマンプロット４６０上でのプロット選択機能とNMRスペクトル連携機能とを説明するためのクーマンプロット４６０とNMRスペクトルをャート４５０の例を示す図。クーマンプロット４６０上でのプロットの削除機能を説明するためのクーマンプロット４６０の例を示す図。モデリングチャート４６２、４６４及び識別力チャート４６６での変数の選択機能を説明するためのモデリングチャート４６２、４６４及び識別力チャート４６６の例を示す図。変数選択後のSIMCA解析計算の再実行を説明するためのUI画面４３０の例を示す図。変数選択後のSIMCA解析計算とPCA解析計算の再実行の手順を示すフローチャート。メタボノミクスにおいてバイオマーカを決定する用途に、本発明の一実施形態にかかるNMRスペクトルの統計処理装置（図１に示した統計処理部１１６）を使用する場合における使用手順の一例を示すフローチャート。テストサンプルの性向を診断する用途に、本発明の一実施形態にかかるNMRスペクトルの統計処理装置（図１に示した統計処理部１１６）を使用する場合における使用手順の一例を示すフローチャート。

符号の説明

１００、３００コンピュータシステム（NMRデータ処理装置）
１０２ NMR装置
１０４、３０４プロセッサ
１０６、３０６記憶装置
１０８、３０８ FIDデータ入力処理
１１０、３１０ NMRスペクトル処理
１１２、３１２データ縮約処理
１２６絶対値微分処理（ADスペクトル生成処理）
１４０ NMRスペクトル（実部）
１４４、Sa、Sb ADスペクトル
１７１多数のADスペクトルの投影処理
１７２投影ADスペクトルのバケット積分処理
１７４自動積分ブロック設定に基づくバケットの自動修正処理
１７６指定ピーク情報に基づくバケットの自動修正処理
１７８バケットの手動修正処理
１８０多数ADスペクトルの最適化バケット積分処理
Sp 投影ADスペクトル
２００a−２００f、２００i−２００k バケット
２２０x、２２０y 自動設定された積分ブロック
２４０x、２４０y 指定ピーク情報に基づくピーク領域
２５０A−２５０C 指定ピーク情報セット
２８０A−２８０C 最適化バケットセット
３４０多変量解析部
３４２ユーザ要求入力部
３４４表示制御部
３４６ PCA解析部
３４８ SIMCA解析部
３５０ PCAテーブル
３５４ NMRスペクトルデータ
３５６ NMRヒストグラムデータ
３６０ PCAモデル読込・追加・保存部
３６２ PCA計算部
３６４解析データ記憶部
３６６解析結果保存部
３７０ PCAモデル読込・追加・保存部
３７２ SIMCA計算部
３７４ PCA解析画面制御部
３７６ SIMCA解析画面制御部
３７８ NMRスペクトル連携部
４３０ UI画面
４４０スコアプロット
４４２ローディングプロット
４４４寄与率チャート
４４６ローディングチャート
４５０ NMRスペクトルチャート
４６０クーマンプロット
４６２、４６４モデリング力プロット
４６６識別力プロット

Claims

サンプルのＮＭＲ特性を示す数式（１）で定義されるＮＭＲスペクトルデータと、前記ＮＭＲスペクトルデータに絶対値微分を施して数式（２）で定義される絶対値微分スペクトルデータを得る手段と、
前記絶対値微分スペクトルデータに対し、不均等な幅をもつ多数のバケットからなるバケットセットを用いたバケット積分を実行することにより、前記絶対値微分スペクトルデータをヒストグラムデータに縮約するデータ縮約手段と、
前記ヒストグラムデータを記憶又は出力する手段と
を備え、
δをケミカルシフト、ｊを虚数記号、Ｒ（δ）をＮＭＲスペクトルの実部、Ｉ（δ）をＮＭＲスペクトルの虚部とするとき、数式（１）及び数式（２）はそれぞれ、
ＮＭＲスペクトル＝Ｒ（δ）＋ｊ・Ｉ（δ） …（１）

であって、
前記バケットの幅は、前記絶対値微分スペクトル中に含まれる個々のピーク領域が複数のバケットに分割されることのないよう、予めピークを検出して、検出されたピークの幅に応じて決定されることを特徴とするＮＭＲデータの処理装置。
請求項１記載の装置において、
指定された１以上のピーク領域のいずれもが複数バケットに分割されないように、前記不均等な幅のバケットセットが設定されているＮＭＲデータの処理装置。
請求項１記載の装置において、
前記絶対値微分スペクトルデータから検出された１以上のピーク領域のいずれもが複数バケットに分割されないように、前記不均等な幅のバケットセットが設定されているＮＭＲデータの処理装置。
請求項１記載の装置において、
前記不均等な幅のバケットセットを設定するバケット設定手段を更に備えるＮＭＲデータの処理装置。
請求項４記載の装置において、
前記バケット設定手段が、
１以上のピーク領域を指定するピーク指定手段と、
前記指定された１以上のピーク領域のいずれもが複数バケットに分割されないようにして各バケットを設定する手段と
を有するＮＭＲデータの処理装置。
請求項４記載の装置において、
前記バケット設定手段が、
前記絶対値微分スペクトルデータからピーク領域を検出する検出手段と、
前記検出された１以上のピーク領域のいずれもが複数バケットに分割されないようにして各バケットを設定する手段と
を有するＮＭＲデータの処理装置。
請求項６記載の装置において、
前記検出手段が、複数の絶対値微分スペクトルデータを入力し、前記複数の絶対値微分スペクトルデータが投影された投影スペクトルデータを生成し、前記投影スペクトルデータからピーク領域を検出するようになっているＮＭＲデータの処理装置。
請求項４記載の装置において、
前記バケット設定手段が、オペレータから入力された要求に応答して、各バケットを修正する手段を有するＮＭＲデータの処理装置
サンプルのＮＭＲ特性を示す数式（１）で定義されるＮＭＲスペクトルデータと、前記ＮＭＲスペクトルデータに絶対値微分を施して数式（２）で定義される絶対値微分スペクトルデータを得るステップと、
前記絶対値微分スペクトルデータに対し、不均等な幅をもつ多数のバケットからなるバケットセットを用いたバケット積分を実行することにより、前記絶対値微分スペクトルデータをヒストグラムデータに縮約するステップと、
前記ヒストグラムデータを記憶又は出力するステップと
を備え、
δをケミカルシフト、ｊを虚数記号、Ｒ（δ）をＮＭＲスペクトルの実部、Ｉ（δ）をＮＭＲスペクトルの虚部とするとき、数式（１）及び数式（２）はそれぞれ、
ＮＭＲスペクトル＝Ｒ（δ）＋ｊ・Ｉ（δ） …（１）

であって、
前記バケットの幅は、前記絶対値微分スペクトル中に含まれる個々のピーク領域が複数のバケットに分割されることのないよう、予めピークを検出して、検出されたピークの幅に応じて決定されることを特徴とするＮＭＲデータの処理方法。
サンプルのＮＭＲ特性を示す数式（１）で定義されるＮＭＲスペクトルデータと、前記ＮＭＲスペクトルデータに絶対値微分を施して数式（２）で定義される絶対値微分スペクトルデータを得るステップを、コンピュータに実行させるためのプログラム部分と、
前記絶対値微分スペクトルデータに対し、不均等な幅をもつ多数のバケットからなるバケットセットを用いたバケット積分を実行することにより、前記絶対値微分スペクトルデータをヒストグラムデータに縮約するステップを、コンピュータに実行させるためのプログラム部分と、
前記ヒストグラムデータを記憶又は出力するステップを、コンピュータに実行させるためのプログラム部分と、
を備え、
δをケミカルシフト、ｊを虚数記号、Ｒ（δ）をＮＭＲスペクトルの実部、Ｉ（δ）をＮＭＲスペクトルの虚部とするとき、数式（１）及び数式（２）はそれぞれ、
ＮＭＲスペクトル＝Ｒ（δ）＋ｊ・Ｉ（δ） …（１）

であって、
前記バケットの幅は、前記絶対値微分スペクトル中に含まれる個々のピーク領域が複数のバケットに分割されることのないよう、予めピークを検出して、検出されたピークの幅に応じて決定されることを特徴とするＮＭＲデータの処理のための機械読み取り可能なコンピュータプログラム。