[go: up one dir, main page]

JP7667155B2 - 既存薬物を再開発するためのデータ処理システムおよび方法 - Google Patents

既存薬物を再開発するためのデータ処理システムおよび方法 Download PDF

Info

Publication number
JP7667155B2
JP7667155B2 JP2022534660A JP2022534660A JP7667155B2 JP 7667155 B2 JP7667155 B2 JP 7667155B2 JP 2022534660 A JP2022534660 A JP 2022534660A JP 2022534660 A JP2022534660 A JP 2022534660A JP 7667155 B2 JP7667155 B2 JP 7667155B2
Authority
JP
Japan
Prior art keywords
patients
distinct
patient
group
patient characteristics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022534660A
Other languages
English (en)
Other versions
JP2023504203A (ja
Inventor
アンヌ-ギャエル・ラデュニャック
ポール・ブライス
エマニュエーレ・デ・リナルディス
ラモン・アントニオ・エルナンデス・ヴェシーノ
フランシスコ・ハビエル・ヒメネス・ヒメネス
クリオナ・マリー・モロニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanofi SA
Original Assignee
Sanofi SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanofi SA filed Critical Sanofi SA
Publication of JP2023504203A publication Critical patent/JP2023504203A/ja
Priority to JP2025064018A priority Critical patent/JP2025108516A/ja
Application granted granted Critical
Publication of JP7667155B2 publication Critical patent/JP7667155B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

優先権の主張
本出願は、2020年6月9日に出願された欧州特許出願第20315299.6号、および2019年12月9日に出願された米国仮特許出願第62/945,814号の利益を主張する。上記の内容全体は、参照により本明細書に援用される。
本開示は、概して、既存薬物を再開発するためのデータ処理システムおよび方法に関する。
臨床的な既存薬物の再開発(ドラッグリパーパシング)(drug repurposing)(リポジショニング(repositioning)と称される場合もある)は、比較的低コストであり得るとともに高い効率を提供することができる、創薬のための戦略を指す場合がある。既存薬物の再開発は、通常、1つのタイプの病状(例えば、疾患)を治療するために承認された薬物を、他のタイプの病状(例えば、一般的な(common)疾患および/または希少(rare)疾患)を治療するために使用することができるか否かを分析することを含む。腫瘍学、免疫学、感染症および希少(orphan)疾患を含む、既存薬物の再開発のための高い可能性を示す、いくつかの治療分野がある。
本開示の少なくとも1つの態様において、データ処理システムが提供される。データ処理システムは、コンピュータ実行可能命令を含むコンピュータ可読メモリと、コンピュータ実行可能命令と少なくとも1つの機械学習モデルとを含む実行可能ロジックを実行するように構成された少なくとも1つのプロセッサとを含む。少なくとも1つのプロセッサがコンピュータ実行可能命令を実行しているとき、少なくとも1つのプロセッサは、1つまたはそれ以上の作動方法を実施するように構成される。1つまたはそれ以上の作動方法は、複数の患者のカルテ(medical record)を表すデータを受け取ることを含む。1つまたはそれ以上の作動方法は、カルテに基づき:薬物に関連する少なくとも1つの標的シグナル伝達経路を決定することと;標的シグナル伝達経路に関連付けられた診断に対応する1つまたはそれ以上の因子に基づき、1つまたはそれ以上のインジケータを決定することとにより、一組の患者を選択することを含む。1つまたはそれ以上の作動方法は、一組の患者の複数の患者特性を決定することを含み、一組の患者の各患者は、複数の患者特性のうちの少なくとも1つを示す。1つまたはそれ以上の作動方法は、機械学習モデルを使用するとともに複数の患者特性に従って、複数の別個のグループを生成するために一組の患者をグループ化することを含み、別個のグループの各々は、一組の患者のうちの少なくとも1人の患者を含む。1つまたはそれ以上の作動方法は、1つまたはそれ以上のグループ選択基準に基づき、複数の別個のグループのうちの一組の別個のグループを選択することを含む。1つまたはそれ以上の作動方法は、一組の別個のグループの各別個のグループを分析することにより、1つまたはそれ以上の関連する患者特性を特定することを含む。
機械学習モデルは、1つまたはそれ以上の教師なしクラスタリング技法を使用して一組の患者をグループ化するように訓練することができる。1つまたはそれ以上の教師なしクラスタリング技法は、二分(bisecting)k平均クラスタリング技法を含むことができる。一組の患者をグループ化することは、多重対応分析を実行して複数の患者特性の次元を低減させることを含むことができる。
一組の別個のグループを選択することは、複数の別個のグループの各別個のグループについて、その別個のグループによって示される各患者特性に対する特徴スコアを決定することを含むことができる。一組の別個のグループを選択することは、複数の別個のグループの各別個のグループの特徴スコアを特徴スコア閾値と比較することを含むことができる。一組の別個のグループを選択することは:複数の別個のグループの各別個のグループについて安定性尺度を決定することと、複数の別個のグループの各別個のグループについて純度尺度を決定することと、複数の別個のグループの各別個のグループに含まれる一組の患者の患者数を決定することとのうちの少なくとも1つを含むことができる。
1つまたはそれ以上の関連する患者特性を特定することは、一組の別個のグループの各別個のグループについて、複数の患者特性のうちの、その別個のグループによって示されるとともにそのグループのテーマに対応する患者特性を選択することにより、複数の関連する可能性のある患者特性を生成することを含むことができる。1つまたはそれ以上の関連する患者特性を特定することは、複数の関連する可能性のある患者特性の関連する可能性がある患者特性の各々をランク付けすることを含むことができる。関連する可能性がある患者特性の各々をランク付けすることは、各関連する可能性がある患者特性について、その関連する可能性がある患者特性と薬物に関連する少なくとも1つの参照インジケーションとの共起の頻度に基づいて、ランク値を割り当てることを含むことができる。共起は、関連する可能性がある患者特性の各々について、その関連する可能性がある患者特性と少なくとも1つの参照インジケーションとの両方を含む一組の別個のグループの比率を決定することにより測定することができる。1つまたはそれ以上の関連する患者特性を特定することは、関連する可能性がある患者特性の各々について:臨床的実現可能性および商業的実現可能性のうちの少なくとも一方を決定することを含むことができる。
1つまたはそれ以上の作動方法は、既存薬物を再開発するための標的インジケーションとして1つまたはそれ以上の関連する患者特性のうちの少なくとも1つを特定することを含むことができる。
これらおよび他の態様、構成および実施態様は、方法、装置、システム、構成要素、プログラム製品、機能を実施する手段または工程として、且つ他の方法で表現することができる。
本開示の実施態様は、以下の利点のうちの1つまたはそれ以上を提供することができる。従来の技術と比較すると、本明細書に記載するシステムおよび方法は、既存薬物の再開発に使用するために、関連する可能性があるインジケーション(本明細書では、患者特性と称する場合がある)を特定するための異なるレベルの複雑性を有する大量のデータを処理する計算時間を短縮することにより、計算効率を向上させることができる。特定の機械学習技法を使用して、従来の技術によって特定することができない新たなインジケーションを発見することができる。従来の技術と比較すると、本明細書に記載するシステムおよび方法は、人間の入力および技能への依存を低減させることができる。
これらおよび他の態様、構成および実施態様は、特許請求の範囲を含む以下の説明から明らかとなろう。
既存薬物の再開発のためのデータ処理システムの一例を示す図である。 既存薬物を再開発するための方法例を示すフローチャートである。 本明細書に記載するシステムおよび方法を使用する実験を示す図である。 本明細書に記載するシステムおよび方法の使用からもたらされる実験結果を示す図である。 本開示に記載するアルゴリズム、方法、機能、プロセス、フローおよび手順に関連する計算機能を提供するために使用されるコンピュータシステム例のブロック図である。
既存薬物の再開発を使用して、臨床的に承認された薬物に対して新たな臨床インジケーション(例えば、ある薬物を使用する理由)を見つけることができる。何百もの新たなインジケーションが探索される際、キーオピニオンリーダー(KOL)は、これらの新たなインジケーションに対応する高レベルの複雑性に対処することができない可能性がある。大量のデータを処理するとともに高度な分析を使用することは、KOLを中心とする手法をサポートすることができる。関連する臨床的クエスチョンによって誘導されて、強力な高度な分析技法は、後に臨床的意思決定に役立つことができる、大量のデータに隠された臨床的に関連する情報を引き出すことができる。
計算による既存薬物の再開発方法は、類似度尺度(化学的類似度、分子活性類似度、遺伝子発現類似度または副作用類似度)、分子ドッキングまたは共有分子病理学を使用して、新たな薬物-疾患関係を検出することができる。既存薬物の再開発手法は、ネットワークベース、テキストマイニング(文献検索)および意味論手法として分類することができる。
ネットワークベースの手法は、薬物、タンパク質、遺伝子および疾患等の複数のデータソースを組み合わせることにより、統合ネットワークを作成することを含むことができる。例えば、コネクティビティマップ(C-Map:Connectivity Map)手法は、遺伝子発現プロファイリングを利用して生物学、化学および臨床症状を関係付けて、新たな疾患-遺伝子-薬物の接続の発見を促進することにより、トランスクリプトームを利用することができる。ネットワークベースクラスタ手法(クラスタリング)を使用して、生物学的モジュールを見つけることができる。この手法は、生物学的ネットワークの同じモジュールにおける生物学的実体(疾患、薬物、タンパク質等)が、通常、類似の特性を共有しているという事実に着想を得ている。クラスタリングは、ネットワークのトポロジ構造を使用して、薬物-疾患、薬物-薬物、疾患-疾患または薬物-標的の関連を見つけることを含むことができる。クラスタリング手法の実施には、いくつかの困難が伴う可能性がある。例えば、薬物と疾患とを関連付けるエッジは、不完全である収集された薬物-疾患の関連性によって決まる可能性があり、それは、予測の精度を向上させるために、複数のデータベースの統合を必要とする可能性がある。加えて、薬物の副作用に関する情報を提供する異なるデータソースを組み込むことにより、潜在的な安全性シグナルを収集することができる。さらに、否定的な関連性と肯定的な関連性とを区別することは困難である場合があり、生物学的モジュール間の関連性を検証する「絶対的」基準方法は存在しない。
テキストマニングベースの手法は、新たな薬物-疾患の関連性のためにキーワードの共起と意味論的推論とを使用することができる。いくつかの手法は、Swansonの類推による推論手法(ABCモデル)に基づくことができ、これは、「B」が疾患「C」の特徴の1つであり、物質「A」が「B」に影響を与える場合、Bコネクションを通して暗黙のリンク「A:C」を推論することができる、と仮定することができる。しかしながら、文献マイニングベースの方法のみでは、言語の曖昧な性質、生物医学的関係の限られた範囲、およびテキストマイニング技法の限られた精度により、限界がある可能性がある。
本明細書に記載するデータ処理システムおよび方法の実施態様により、インジケーションを特定するために既存薬物の再開発のための現実世界データ駆動プロトコルを使用することにより、上述した不都合を軽減することができる。いくつかの実施態様では、本明細書に記載するデータ処理システムおよび方法は、分析論および現実世界データをKOL臨床出力と組み合わせる。いくつかの実施態様では、本明細書に記載するデータ処理システムおよび方法は、教師なし方式で現実世界データおよび分析論を使用する。いくつかの実施態様では、患者は、機械学習手法を使用してクラスタリングされ、複数のクラスタにわたって出現する病状のグループが特定される。いくつかの実施態様では、特定された病状のグループは、共通の生物学的経路に対応する可能性がある。本明細書に記載するデータ処理システムおよび方法を使用して、従来の技法を使用して以前は特定されなかった潜在的なインジケーションを特定することができる。
以下の記載では、説明の目的で、本開示が完全に理解されるように、多数の具体的な詳細を示す。しかしながら、本開示は、これらの具体的な詳細なしに実施することができることは明らかとなろう。他の場合では、本開示を不必要に不明瞭にしないために、周知の構造およびデバイスを、ブロック図形態で示す。
図面において、説明を容易にするために、デバイス、モジュール、命令ブロックおよびデータ要素を表すもの等、概略要素の具体的な配置または順序付けを示す。しかしながら、当業者であれば、図面における概略要素の具体的な順序付けまたは配置は、処理の特定の順序もしくはシーケンス、またはプロセスの分離が必要であることを意味するように意図されていないことが理解されるはずである。さらに、図面に概略要素を含めることは、こうした要素がすべての実施態様において必須であること、またはこうした要素によって表される構成が、いくつかの実施態様において他の要素に含まれ得ないかまたは他の要素と組み合わせられ得ないことを意味するようには意図されていない。
さらに、図面において、実線または破線の線または矢印等の接続要素を使用して、2つ以上の他の概略要素の間の接続、関係または関連性を示す場合、こうした接続要素のいずれがないことも、接続、関係または関連性が存在する可能性がないことを意味するようには意図されていない。言い換えれば、図面では、本開示を不明瞭にしないように、要素間のいくつかの接続、関係または関連性を示していない。加えて、例示を容易にするために、単一の接続要素を用いて、要素間の複数の接続、関係または関連性を表す。例えば、接続要素が信号、データまたは命令の通信を表す場合、当業者であれば、通信に影響を与えるために、必要に応じて、こうした要素が1つまたは複数の信号経路(例えば、バス)を表すことが理解されるはずである。
ここで、添付の図面に例が示されている、実施態様について詳細に言及する。以下の詳細な説明では、さまざまな記載する実施態様が完全に理解されるように、多数の具体的な詳細を示す。しかしながら、当業者であれば、これらの具体的な詳細なしにさまざまな記載する実施態様を実施することができることが明らかとなろう。他の場合では、実施態様の態様を不必要に不明瞭にしないように、周知の方法、手順、構成要素、回路およびネットワークについては詳細に記載していない。
以下、各々を互いに独立してまたは他の構成との任意の組合せで使用することができる、いくつかの構成について記載する。しかしながら、いかなる個々の構成も、上述した問題のいずれも対処しない場合があり、または、上述した問題の1つのみに対処する可能性がある。上述した問題のうちのいくつかは、本明細書に記載する構成のうちのいずれによっても完全には対処されない可能性がある。見出しを設けているが、特定の見出しに関連するがその見出しを有するセクションに見出されないデータも、本明細書の他の場所に見出される可能性がある。
データ処理システムおよび方法例
図1は、データ処理システム100の一例を示す。いくつかの実施態様では、データ処理システム100は、薬物(再開発する既存薬物)の新たなインジケーションを特定するために複数の患者のカルテを表すことができるデータを処理するように構成されている。システム100は、コンピュータプロセッサ110を含む。コンピュータプロセッサ110は、コンピュータ可読メモリ111とコンピュータ可読命令112とを含む。システム100は、機械学習システム150も含む。機械学習システム150は、機械学習モデル120を含む。機械学習モデル120は、コンピュータプロセッサ110から分離することも、コンピュータプロセッサ110と一体化することもできる。
コンピュータ可読媒体111(またはコンピュータ可読メモリ)は、限定されないが、半導体ベースのメモリデバイス、磁気メモリデバイスおよびシステム、光メモリデバイスおよびシステム、固定メモリ、リムーバブルメモリ、ディスクメモリ、フラッシュメモリ、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、電子的消去可能プログラマブルリードオンリメモリ(EEPROM)等を含む、ローカル技術環境に適している任意のデータ記憶技術タイプを含むことができる。いくつかの実施態様では、コンピュータ可読媒体111は、実行可能命令を有するコードセグメントを含む。
いくつかの実施態様では、コンピュータプロセッサ110は、汎用プロセッサを含む。いくつかの実施態様では、コンピュータプロセッサ110は、中央処理装置(CPU)を含む。いくつかの実施態様では、コンピュータプロセッサ110は、少なくとも1つの特定用途向け集積回路(ASIC)を含む。コンピュータプロセッサ110は、汎用プログラマブルマイクロプロセッサ、グラフィック処理ユニット、専用プログラマブルマイクロプロセッサ、デジタル信号プロセッサ(DSP)、プログラマブルロジックアレイ(PLA)、フィールドプログラマブルゲートアレイ(FPGA)、専用電子回路等またはそれらの組合せも含むことができる。コンピュータプロセッサ110は、コンピュータ実行可能命令112等のプログラムコードを実行するように構成されるとともに、機械学習モデル120を含む実行可能ロジックを実行するように構成されている。
コンピュータプロセッサ110は、複数の患者のカルテを表すデータを受け取るように構成されている。例えば、コンピュータプロセッサ110は、異なるデータテーブル間で患者のマッチングを可能にするキー識別子(ID)によって識別可能な、およそ9400万人(またはそれより多く)の患者に対する電子カルテ(EMR)を含むデータベースから、データを受け取ることができる。いくつかの実施態様では、データは、診断、臨床検査、処置、医薬品、患者イベント、保険、バイオマーカ、測定値、臨床状態、ライフスタイルパラメータ、微生物学、処方等を示す。いくつかの実施態様では、データは、自然言語処理駆動データを含む。データは、無線通信、光ファイバ通信、USB、CD-ROM等、さまざまな技法のうちの任意のものを通して受け取ることができる。
機械学習システム150は、機械学習モデル120を訓練するために機械学習技法を適用することができる。機械学習モデル120の訓練の一部として、機械学習システム150は、対象の特性を有すると判断された入力データ項目の正の訓練セットを特定することにより、入力データの訓練セットを形成することができ、いくつかの実施態様では、対象の特性のない入力データ項目の負の訓練セットを形成することができる。
機械学習システム150は、訓練セットの入力データから特徴値を抽出し、この特徴は、入力データ項目が関連する1つの特性または複数の特性を有するか否かに関連する可能性があるとみなされる変数である。本明細書では、入力データに対する特徴の順序付きリストを、入力データの特徴ベクトルと称する。いくつかの実施態様では、機械学習システム150は、次元削減を適用して、入力データの特徴ベクトルのデータの量を、より小さい、より代表的なデータのセットに削減する。例えば、機械学習システム150は、多重対応分析(MCA)、線形判別分析(LDA)、主成分分析(PCA)等を適用することができる。
いくつかの実施態様では、機械学習システム150は、教師なし機械学習を使用して、機械学習モデル120を訓練する。典型的には、教師なし機械学習技法は、既知の、すなわちラベル付きの結果を参照することなく、入力ベクトルを用いてデータセットから推論を行う。いくつかの実施態様では、機械学習システム150は、クラスタリングを実施して、データ点を複数のグループに、同じグループ内のデータ点が同じグループ内の他のデータ点とより類似するとともに他のグループ内のデータ点とは類似しないように分割することができる。いくつかの実施態様では、クラスタリングは、K平均クラスタリングを実施することを含み、そこでは、データセットを反復的に分割することにより、データ点の1レベル非ネスト化分割が作成される。すなわち、Kがクラスタの所望の数である場合、各反復において、データセットは、K個の独立したクラスタに分割される。このプロセスは、指定されたクラスタリング基準関数値が最適化されるまで続けることができる。いくつかの実施態様では、機械学習システム150は、二分K平均クラスタリングを実施するように構成されている。二分k平均クラスタリングは、通常、k個のクラスタが得られるまで、各二分ステップで(例えば、k平均を使用することにより)1つのクラスタを2つのサブクラスタに分割することを含む。二分K平均クラスタリングは、K平均クラスタリングと比較してより有益である可能性があり、それは、二分K平均クラスタリングが、Kが比較的大きい値であるときに計算時間を短縮することができ、同様のサイズのクラスタを生成することができ、エントロピのより小さいクラスタを生成することができるためである。
コンピュータプロセッサ110は、コンピュータ実行可能命令112を実行して1つまたはそれ以上の作動方法を実施するように構成されている。いくつかの実施態様では、1つまたはそれ以上の作動方法は、複数の患者のカルテを表すデータを受け取ることを含む。例えば、コンピュータプロセッサ110は、異なるデータテーブルにわたる患者のマッチングを可能にするキー識別子(ID)によって識別可能なおよそ9400万人(またはそれより多くの)患者の電子カルテ(EMR)を含むデータベースから、データを受け取ることができる。いくつかの実施態様では、データは、診断、臨床検査、処置、医薬品、患者イベント、保険、バイオマーカ、測定値、臨床状態、ライフスタイルパラメータ、微生物学、処方等を示す。いくつかの実施態様では、データは、自然言語処理駆動データを含む。データは、無線通信、光ファイバ通信、USB、CD-ROM等、さまざまな技法のうちの任意のものを通して受け取ることができる。
いくつかの実施態様では、1つまたはそれ以上の作動方法は、カルテに基づき、一組の患者を選択することを含む。一組の患者の選択は、再開発する既存薬物に関連する少なくとも1つの標的シグナル伝達経路を決定することを含む。例えば、再開発する既存薬物がデュピルマブ(Dupilumab)である場合、コンピュータプロセッサ110は、薬物の既知の機能に基づき、薬物がインターロイキン4(IL-4)およびインターロイキン13(IL-13)シグナル伝達経路を調節すると決定することができる。一組の患者を選択することは、標的シグナル伝達経路に関連付けられた診断に対応する1つまたはそれ以上の因子に基づき、1つまたはそれ以上のインジケータを決定することも含む。例えば、経路機構、関連する臨床症状、治療的類似体、データおよび疫学、ならびに医薬品ライフサイクルマネジメントの整合性等の因子を用いて、医学データベースおよび医学的エビデンスソフトウェアを含むソースを検索し、決定されたシグナル伝達経路に関連付けられた疾患を特定することができる。これらの疾患は、決定されたシグナル伝達経路へのリンクの強度に基づいてカテゴライズすることができる。カテゴリは、集中的(focused)グループ、中位(medium)グループおよび広範(broad)グループを含むことができる。例えば、IL-4/IL-13例に戻ると、疾患の集中的グループは、Th2経路上のIL-4/IL-13作用機序と直接関係がある疾患を含むことができ、疾患の中位グループは、Th2経路上のIL-4/IL-13作用機序と間接的な関係がある疾患を含むことができ、疾患の広範グループは、より広範の炎症反応と関連する疾患を含むことができる。集中的グループから広範グループに移行することにより、一組の患者を選択するときに考慮すべきインジケータの数を増加させることができ、分子の影響の可能性を低減させることができる。したがって、いくつかの実施態様では、一組の患者を選択するために、集中的グループのみ、または集中的グループおよび中位グループを使用する。いくつかの実施態様では、決定されたシグナル伝達経路に関連する少なくとも1つの診断、医薬品、臨床検査および/または処置を有する患者のみが、一組の患者に含まれるように選択される。因子およびインジケータの詳細な例は、表1を参照して後に提供する。
いくつかの実施態様では、1つまたはそれ以上の作動方法は、一組の患者の複数の患者特性(本明細書では特徴と称する場合がある)を決定することを含み、そこでは、一組の患者の各患者は、複数の患者特性のうちの少なくとも1つを示す。複数の患者特性を決定することは、最初に受け取ったデータを分析して、受け取ったデータのすべてまたは実質的な部分を取り込むための広範な患者特性を特定することを含むことができる。例えば、広範な患者特性は、診断(例えば、免疫疾患、糖尿病)、処方(例えば、免疫薬、他の薬物クラス)、処置(例えば、ヒト白血球抗原タイピング)および検査結果(例えば、IgE異常高/低)に対応することができる。いくつかの実施態様では、複数の患者特性を決定することは、(例えば、コンピュータプロセッサ110と通信するユーザインタフェースを介して)ユーザ入力を受け取ることを含む。例えば、ユーザは、臨床入力、人口統計、医薬品、併存疾患、処置、および免疫学に特有の臨床検査データに基づいて、患者特性を入力することができる。データの完全性、代表性を向上させるとともに、疾患および薬物反応に関するより多くの情報を収集するために、カスタマイズされた特性クラスも追加してもよい。いくつかの実施態様では、複数の患者特性を決定することは、複数の患者特性を検証することを含む。検証は、各特性ファミリの少なくとも1つを有する選択された患者の割合(例えば、処方記録を有する患者の割合)を計算し、この割合を各特性ファミリの少なくとも1つを有する最初に受け取ったデータの患者の割合と比較することにより、最初に受け取ったデータの患者特性が、選択された一組の患者に正確にマッピングされているか否かを判断することを含むことができる。2つの数の値が近いほど、マッピングが正確に行われたことを示す。検証は、最初に受け取ったデータと選択された一組の患者との両方に含まれる複数の患者を特定して、最初に受け取ったデータの患者と選択された一組の患者との間の患者特性の同一のマッピングを検証することにより、患者特性が正確な患者にマッピングされたか否かを判断することを含むことができる。
いくつかの実施態様では、1つまたはそれ以上の作動方法は、(例えば、決定されたシグナル伝達経路に関連する特徴によって定義されるように)複数の患者特性に従って、各々が一組の患者のうちの少なくとも1人の患者を含む複数の別個のグループを生成するために一組の患者をグループ化することを含む。例えば、1つまたはそれ以上のコンピュータプロセッサ110は、機械学習モデル120を実行して、上述した二分k平均クラスタリング技法等のクラスタリング技法を実施することができる。クラスタリングにより、患者の複数のクラスタ(例えば、別個のグループ)をもたらすことができ、そこでは、1つのクラスタにおける患者が、それらの対応する患者特性に関して、他のクラスタにおける患者よりも互いに類似している。いくつかの実施態様では、生成されたクラスタは、同じ患者に存在しない場合であっても、患者特性間の相関を示す可能性がある。臨床入力を受け取り、結果として得られるクラスタの臨床的関連性を確保するようにクラスタリングプロセスのさまざまな段階で使用することができる。例えば、疾患専門家による臨床入力により、臨床的に関連する特徴の包含およびグループ化において、かつクラスタの検証および評価において、臨床的に関連するコホートの作成を容易にすることができる。患者特性は、一般集団(例えば、選択された一組の患者において全体的)におけるよりも頻繁に発生した場合、クラスタにおいて特徴的であると特定することができる。
いくつかの実施態様では、多重対応分析(MCA)を使用して、患者特性の次元を低減させる。二分K平均により、十分に「タイト」であるが安定したクラスタでの患者の適切かつ効果的な分離が容易になり、免疫関連性を示した多数のクラスタを、患者特性をスコアリングする(後のより詳細に説明する)ために使用することが可能になる。結果として得られるクラスタは、検証および評価のためにユーザ(例えば、臨床専門家)に(例えば、ユーザインタフェースを介して)提示することができる。これにより、クラスタの非解釈性のリスクが低減するとともに、異なるクラスタ間で重複する特徴が存在しないことを確実にすることができる。
いくつかの実施態様では、1つまたはそれ以上の作動方法は、1つまたはそれ以上のグループ選択基準に基づき、複数の別個のグループのうちの一組の別個のグループを選択することを含む。いくつかの実施態様では、一組の別個のグループを選択することは、グループをランク付けすることと、多数の最も高くランク付けされたグループ(例えば、上位60個のランク付けされたグループ)を選択することとを含む。グループは、免疫学的充実度、安定性、純度およびサイズに基づいてランク付けすることができる。いくつかの実施態様では、クラスタをランク付けするために、各患者特性について1つまたはそれ以上の尺度(本明細書では特徴スコアと称する場合がある)が計算される。この1つまたはそれ以上の尺度としては、例えば、特殊性(本明細書では「リフトスコア」と称する場合がある)と、患者特性を提示するクラスタ内の患者の数と、免疫学的スコアとを挙げることができる。特殊性スコアは、患者特性がクラスタ内でその集団の残りのものに対してどれほど特徴的であるかを測定する(例えば、男性が集団の50%およびクラスタの75%を占める場合、「リフトスコア」は1.5に等しくなる可能性がある)。いくつかの実施態様では、閾値リフトスコア(例えば、1)を超えるリフトスコアを有するとともに、患者の閾値割合(例えば、10%)を超える患者の割合で出現する患者特性のみが、クラスタを定義しかつクラスタのテーマに対応するとみなされる。クラスタを定義するとみなされる患者特性は、本明細書では、関連する可能性がある患者特性と称する場合がある。次に、患者特性(例えば、クラスタを定義するとみなされた患者特性、または患者特性のすべてのいずれか)に、免疫学的スコアを与えることができ、この免疫学的スコアは、患者特性を、そのタイプ(例えば、疾患、薬物、臨床検査、処置等)および免疫学的関連性に従ってスコアリングする。次いで、各クラスタ内の患者特性スコアは、集計(例えば、合計)して正規化することができる。次いで、閾値クラスタスコア(例えば、50%)を満たすクラスタは、免疫学的に特有であるとみなすことができる。
一組の別個のグループを選択することは、安定性、純度、および各クラスタ内の患者の数のうちの1つまたはそれ以上を評価することを含むことができる。安定性は、以下の方法:(1)異なるサイズのデータでクラスタを再現すること;(2)クラスタの初期化シードを変更すること;(3)生成されたクラスタの数を変更すること;および(4)訓練-テスト方法を適用することのうちの1つまたはそれ以上を使用して評価することができる。訓練セットにおける各クラスタについて、安定性は、テストセットにおいてもともにグループ化されている患者の最大比率として定義することができる。純度は、クラスタ内の患者のMCA成分のクラスタ内分散によって測定することができ、これにより、均質かつ高密度のクラスタをもたらすことができる。いくつかの実施態様では、クラスタは、閾値安定性の割合(例えば、50%)を超えるとともに、閾値純度の割合(例えば、クラスタは、すべてのクラスタ中、最高20%の純度にある)を超える場合に、選択される。
いくつかの実施態様では、1つまたはそれ以上の作動方法は、一組の別個のグループの各別個のグループを分析することにより、1つまたはそれ以上の関連する患者特性(例えば、インジケーション)を特定することを含む。1つまたはそれ以上の関連する患者特性を特定することは、各選択されたクラスタによって提示される患者特性(例えば、患者特性のすべて、またはクラスタを定義するとみなされる患者特性)をランク付けすることを含むことができる。ランク付けは、再開発する既存薬物の多数の(参照の)確立された(参照)特性各々との共起の頻度に基づくことができる(例えば、薬物がデュピルマブである場合、参照特性は、喘息、アトピー性皮膚炎、IgEアレルギーおよび複合免疫学的スコアを含む可能性がある)。共起は、患者特性および参照の両方を含む患者重み付けクラスタの比率を計算することによって測定することができる。いくつかの実施態様では、内容領域専門家が(例えば、ユーザインタフェースを介して受け取られたユーザ入力によって示されるような)コアクラスタテーマに関連すると判断した1つまたはそれ以上の患者特性もまた、これらの特徴が出現した患者の数(10%未満である可能性がある)に関わらず、評価のために考慮することができる。
1つまたはそれ以上の患者特性を特定することは、患者特性の臨床的かつ商業的実現可能性を評価することを含むことができる。例えば、別個の臨床診断を示す患者特性を特定することができる。商業的評価は、入手可能であった販売予測および競合他社の資産を示すデータ、(刊行物に記載されているか否かに関わらず)標的シグナル伝達経路への決定されたリンク、患者特性の世界的な罹患率、および(例えば、100,000生存年数についての)患者特性の障害調整生存年数(DALY)に基づくことができる。いくつかの実施態様では、1つまたはそれ以上の患者特性のうちの少なくとも1つは、既存薬物を再開発するための標的インジケーションとして特定することができる。その結果、いくつかの実施態様では、1つまたはそれ以上の作動方法は、概して、再開発する既存薬物に対する1つまたはそれ以上の新たなインジケーションを出力する。
本明細書は、概して、患者をヒト患者として記載するが、実施態様はそれに限定されない。例えば、患者は、非ヒト動物、植物またはヒトレプリカシステムを指すことができる。
例示の目的で、本明細書は、およそ9400万人の患者に対応するデータを受け取ることを記載するが、データは、より少ないかまたはより多い患者に対応することができることが理解される。
例示の目的で、本明細書は、再開発する既存薬物としてデュピルマブについて記載するが、再開発する既存薬物は、任意の薬物であり得ることが理解される。
図2は、既存薬物を再開発するための方法例200を示すフローチャートである。方法200は、図1を参照して上述したデータ処理システム100によって実施することができる。方法200は、カルテを表すデータを受け取ること(ブロック210)と、一組の患者を選択すること(ブロック220)と、複数の患者特性を決定すること(ブロック230)と、複数の別個のグループを生成するために一組の患者をグループ化すること(ブロック240)と、一組の別個のグループを選択すること(ブロック250)と、1つまたはそれ以上の関連する患者特性を特定すること(ブロック260)とを含む。
ブロック210において、複数の患者のカルテを表すデータが受け取られる。データは、例えば、異なるデータテーブルにわたる患者のマッチングを可能にするキーIDによって識別可能なおよそ9400万人(またはそれより多く)の患者のEMRを含むデータベースから受け取ることができる。いくつかの実施態様では、データは、診断、臨床検査、処置、医薬品、患者イベント、保険、バイオマーカ、測定値、臨床状態、ライフスタイルパラメータ、微生物学、処方、医用画像等を示す。いくつかの実施態様では、データは、自然言語処理駆動データを含む。データは、無線通信、光ファイバ通信、USB、CD-ROM等、さまざまな技法のうちの任意のものを介して受け取ることができる。
ブロック220において、再開発する既存薬物に関連する少なくとも1つの標的シグナル伝達経路が決定される。例えば、薬物がデュピルマブである場合、薬物の既知の機能に基づき、薬物がインターロイキン4(IL-4)およびインターロイキン13(IL-13)シグナル伝達経路を調節すると決定することができる。いくつかの実施態様では、標的シグナル伝達経路に関連付けられた診断に対応する1つまたはそれ以上の因子に基づき、1つまたはそれ以上のインジケータを決定することができる。例えば、経路機序、関連する臨床症状、治療的類似体、データおよび疫学、ならびに医薬品ライフサイクルマネジメントの整合性等の因子を用いて、医学データベースおよび医学的エビデンスソフトウェアを含むソースを検索し、決定されたシグナル伝達経路に関連付けられた疾患を特定することができる。これらの疾患は、決定されたシグナル伝達経路へのリンクの強度に基づいてカテゴライズすることができる。カテゴリは、集中的グループ、中位グループおよび広範グループを含むことができる。例えば、IL-4/IL-13例に戻ると、疾患の集中的グループは、Th2経路上のIL-4/IL-13作用機序と直接関係がある疾患を含むことができ、疾患の中位レンズグループは、Th2経路上のIL-4/IL-13作用機序と間接的な関係がある疾患を含むことができ、疾患の広範グループは、より広範の炎症反応と関連する疾患を含むことができる。集中的グループから広範グループに移行することにより、一組の患者を選択するときに考慮すべきインジケータの数を増加させることができ、分子の影響の可能性を低減させることができる。したがって、いくつかの実施態様では、一組の患者を選択するために、集中的グループのみ、または集中的グループおよび中位グループを使用する。いくつかの実施態様では、決定されたシグナル伝達経路に関連する少なくとも1つの診断、医薬品、臨床検査および/または処置を有する患者のみが、一組の患者に含まれるように選択される。
ブロック230において、一組の患者の複数の患者特性が決定され、そこでは、一組の患者の各患者は、複数の患者特性のうちの少なくとも1つを示す。複数の患者特性を決定することは、最初に受け取ったデータを分析して、受け取ったデータのすべてまたは実質的な部分を取り込むための広範な患者特性を特定することを含むことができる。例えば、広範な患者特性は、診断(例えば、免疫疾患、糖尿病)、処方(例えば、免疫薬、他の薬物クラス)、処置(例えば、ヒト白血球抗原タイピング)および検査結果(例えば、IgE異常高/低)に対応することができる。いくつかの実施態様では、複数の患者特性を決定することは、(例えば、ユーザインタフェースを介して)ユーザ入力を受け取ることを含む。例えば、ユーザは、臨床入力および人口統計、医薬品、併存疾患、処置、ならびに免疫学に特有の臨床検査データに基づいて、患者特性を入力することができる。データの完全性、代表性を向上させるとともに、疾患および薬物反応に関するより多くの情報を収集するために、カスタマイズされた特性クラスも追加してもよい。いくつかの実施態様では、複数の患者特性を決定することは、複数の患者特性を検証することを含む。検証は、各特性ファミリの少なくとも1つを有する選択された患者の割合(例えば、処方記録を有する患者の割合)を計算し、この割合を各特性ファミリの少なくとも1つを有する最初に受け取ったデータの患者の割合と比較することにより、最初に受け取ったデータの患者特性が、選択された一組の患者に正確にマッピングされているか否かを判断することを含むことができる。2つの数の値が近いほど、マッピングが正確に行われたことを示す。検証は、最初に受け取ったデータと選択された一組の患者との両方に含まれる複数の患者を特定して、最初に受け取ったデータの患者と選択された一組の患者との間の患者特性の同一のマッピングを検証することにより、患者特性が正確な患者にマッピングされたか否かを判断することを含むことができる。
ブロック240において、(例えば、決定されたシグナル伝達経路に関連する特徴によって定義されるように)複数の患者特性に従って、一組の患者がグループ化されて、各々が一組の患者のうちの少なくとも1人の患者を含む複数の別個のグループが生成される。例えば、一組の患者について複数の患者特性を使用して、上述した二分k平均クラスタリング技法等のクラスタリング技法を実施することができる。クラスタリングにより、患者の複数のクラスタ(例えば、別個のグループ)をもたらすことができ、そこでは、1つのクラスタにおける患者が、それらの対応する患者特性に関して、他のクラスタにおける患者よりも互いに類似している。いくつかの実施態様では、生成されたクラスタは、同じ患者に存在しない場合であっても、患者特性間の相関を示す可能性がある。臨床入力を受け取り、結果として得られるクラスタの臨床的関連性を確保するようにクラスタリングプロセスのさまざまな段階で使用することができる。例えば、疾患専門家による臨床入力により、臨床的に関連する特徴の包含およびグループ化において、かつクラスタの検証および評価において、臨床的に関連するコホートの作成を容易にすることができる。患者特性は、一般集団(例えば、選択された一組の患者において全体的)におけるよりも頻繁に発生した場合、クラスタにおいて特徴的であると特定することができる。
いくつかの実施態様では、多重対応分析(MCA)を使用して、患者特性の次元を低減させる。二分K平均により、十分に「タイト」であるが安定したクラスタでの患者の適切かつ効果的な分離が容易になり、免疫関連性を示した多数のクラスタを、患者特性をスコアリングする(後のより詳細に説明する)ために使用することが可能になる。結果として得られるクラスタは、検証および評価のためにユーザ(例えば、臨床専門家)に(例えば、ユーザインタフェースを介して)提示することができる。これにより、クラスタの非解釈性のリスクが低減するとともに、異なるクラスタ間で重複する特徴が存在しないことを確実にすることができる。
ブロック250において、1つまたはそれ以上のグループ選択基準に基づき、複数の別個のグループのうちの一組の別個のグループが選択される。いくつかの実施態様では、一組の別個のグループを選択することは、グループをランク付けすることと、多数の最も高くランク付けされたグループ(例えば、上位60個のランク付けされたグループ)を選択することとを含む。グループは、免疫学的充実度、安定性、純度およびサイズに基づいてランク付けすることができる。いくつかの実施態様では、クラスタをランク付けするために、各患者特性について1つまたはそれ以上の尺度が計算される。この1つまたはそれ以上の尺度としては、例えば、特殊性(本明細書では「リフトスコア」と称する場合がある)と、患者特性を提示するクラスタ内の患者の数と、免疫学的スコアとを挙げることができる。特殊性スコアは、患者特性がクラスタ内でその集団の残りのものに対してどれほど特徴的であるかを測定する(例えば、男性が集団の50%およびクラスタの75%を占める場合、「リフトスコア」は1.5に等しくなる可能性がある)。いくつかの実施態様では、閾値リフトスコア(例えば、1)を超えるリフトスコアを有するとともに、患者の閾値割合(例えば、10%)を超える患者の割合で出現する患者特性のみが、クラスタを定義しかつクラスタのテーマに対応するとみなされる。クラスタを定義するとみなされる患者特性は、本明細書では、関連する可能性がある患者特性と称する場合がある。次に、患者特性(例えば、クラスタを定義するための考慮された患者特性、または患者特性のすべてのいずれか)に、免疫学的スコアを与えることができ、この免疫学的スコアは、患者特性を、そのタイプ(例えば、疾患、薬物、臨床検査、処置等)および免疫学的関連性に従ってスコアリングする。次いで、各クラスタ内の患者特性スコアは、集計(例えば、合計)して正規化することができる。次いで、閾値クラスタスコア(例えば、50%)を満たすクラスタは、免疫学的に特有であるとみなすことができる。
一組の別個のグループを選択することは、安定性、純度、および各クラスタ内の患者の数のうちの1つまたはそれ以上を評価することを含むことができる。安定性は、以下の方法:(1)異なるサイズのデータでクラスタを再現すること;(2)クラスタの初期化シードを変更すること;(3)生成されたクラスタの数を変更すること;および(4)訓練-テスト方法を適用することのうちの1つまたはそれ以上を使用して評価することができる。訓練セットにおける各クラスタについて、安定性は、テストセットにおいてもともにグループ化されている患者の最大比率として定義することができる。純度は、クラスタ内の患者のMCA成分のクラスタ内分散によって測定することができ、これにより、均質かつ高密度のクラスタをもたらすことができる。いくつかの実施態様では、クラスタは、閾値安定性の割合(例えば、50%)を超えるとともに、閾値純度の割合(例えば、クラスタは、すべてのクラスタ中、最高20%の純度にある)を超える場合に、選択される。
ブロック260において、一組の別個のグループの各別個のグループを分析することにより、1つまたはそれ以上の関連する患者特性が特定される。1つまたはそれ以上の関連する患者特性を特定することは、各選択されたクラスタによって提示される患者特性(例えば、患者特性のすべて、またはクラスタを定義するとみなされる患者特性)をランク付けすることを含むことができる。ランク付けは、再開発する既存薬物の多数の(参照の)確立された(参照)特性各々との共起の頻度に基づくことができる(例えば、薬物がデュピルマブである場合、参照特性は、喘息、アトピー性皮膚炎、IgEアレルギーおよび複合免疫学的スコアを含む可能性がある)。共起性は、患者特性および参照の両方を含む患者重み付けクラスタの比率を計算することによって測定することができる。いくつかの実施態様では、内容領域専門家が(例えば、ユーザインタフェースを介して受け取られたユーザ入力によって示されるような)コアクラスタテーマに関連すると判断した1つまたはそれ以上の患者特性もまた、これらの特徴が出現した患者の数(10%未満である可能性がある)に関わらず、評価のために考慮することができる。
1つまたはそれ以上の患者特性を特定することは、患者特性の臨床的かつ商業的実現可能性を評価することを含むことができる。例えば、別個の臨床診断を示す患者特性を特定することができる。商業的評価は、入手可能であった販売予測および競合他社の資産を示すデータ、(刊行物に記載されているか否かに関わらず)標的シグナル伝達経路への決定されたリンク、患者特性の世界的な罹患率、および(例えば、100,000生存年数についての)患者特性の障害調整生存年数(DALY)に基づくことができる。いくつかの実施態様では、1つまたはそれ以上の患者特性のうちの少なくとも1つは、既存薬物を再開発するための標的インジケーションとして特定することができる。
実験結果
図3は、本明細書に記載するシステムおよび方法を使用する実験を示す図である。この実験は、抗IL4/IL13薬物であるデュピルマブの新規インジケーションを特定するために、その薬物の既存薬物の再開発のためのRWD駆動プロトコルを検証するために行った。この実験の1つの目的は、薬物の開発コストを削減するとともに上市までの時間を短縮する一方で、脱落およびリスクを最小化することであった。KOLの専門知識、商業的評価、および現実世界データと組み合わされた分析を通して、科学的かつ臨床的能力を使用するハイブリッド手法を適用した。
データソース:2014年から2018年までのOptum Humedicaデータセットを使用した。このデータベースは、異なるデータテーブルにわたる患者のマッチングを可能にする、キー識別子によって識別可能な9400万人の患者に対する電子カルテを含んでいた。このデータベースは、診断、臨床検査、処置、医薬品、患者イベント、保険、バイオマーカ、測定値、臨床状態およびライフスタイルパラメータ、微生物学ならびに処方等、EMRデータに関する情報を収集した。データの範囲および臨床的関連性が限られているため、自然言語処理(NLP)駆動テーブルは含めなかった。さらに、不完全であるかまたは無関係な情報を含むデータテーブルは除外した。合計5つのデータテーブルを含み、データソースを4000万人の患者まで低減させた。
患者の選択:患者選択のインジケータは、表1に示すように、基礎となる免疫学経路に関連する臨床的フレームワークに基づいた。
Figure 0007667155000001
IL4/13経路(すなわち、シグナル伝達経路)に関連する診断を受けたことがある、少なくとも1つの診断、医薬品、臨床検査および処置を受けた成人患者(18歳以上)のみを選択した。これらの免疫学的条件の基準とデータ完全性とを使用して、結果として、1700万人の一意の患者からなるコホートが得られた。
インジケータを特定するために、(表1に示すような)5つの因子を考慮した。これらの因子は、いくつかのプラットフォーム(DOC Library、DOC Data、Doctor Evidence、DOC Label、DOC Search)からなり、PubMed、ClinicalTrials.gov、WHO等を含む、医療エビデンスソフトウェアおよびサービス会社であるDoctor Evidenceエンジンデータベースのソースを通して検索した。そして、これらの因子内の情報を、Th2反応に基づく3つのレンズ:集中的、中位および広範に従って分類した。例えば、疾患は、Th2経路におけるIL4/IL13の作用機序にそれぞれ直接および間接的に関係することに基づいて集中的または中位レンズに割り当て、より広範の炎症反応に関連している場合は広範レンズに割り当てた。集中的レンズから広範レンズに移行することにより、検討すべきインジケータの範囲が広がり、分子の影響の可能性が低下した。広範レンズのインジケータは、類似する特性を有する患者集団を特定する基準を満たすほどそれらの機序的なリンクが特有でなかったため、最終的に分析から除外した。そのため、集中的レンズおよび中位レンズのインジケータのみを実験に含めた。17の広範システムにわたる分析のために、208のインジケータの最終リストを含めた。
特徴の選択:Optumデータセットにおいて利用可能な情報を取り込むために、広範な特徴(患者特性)を選択し;その後、臨床専門家によって選択された特徴に対して優先順位を付けて検証して、すべての必須変数が含まれ、変数値が臨床的に意味をなすことを確実にした。適切な場合は、いくつかの特徴は保持し、他の特徴(ある人口統計)は(図4を参照して後述するようなV1によって示すように)新たに作成した。臨床入力および人口統計、医薬品、併存疾患、処置、ならびに免疫学に特有の臨床検査データに基づいて、新たな特徴を追加した。データの完全性、代表性を向上させるとともに、疾患および薬物反応の重症度に関するより多くの情報を収集するために、(図4を参照して後述するようなV2およびV3によって示すように)カスタマイズされた特徴クラスを生成して分析に反復的に追加した。
最終データベースにおける特徴の完全性を保証するために、ロバストな手法を使用した。Optumデータベースおよび生成されたテーブルにわたる患者および特徴のマッピングに基づく2つの確認ステップを行って、特徴が正確に生成されたことを検証した。第1に、Optumの患者特徴が本発明のデータテーブルに正確にマッピングされたか否かを確認するために、少なくとも1つの特徴ファミリを有する患者の割合を計算し、この数がOptum Humedicaおよび本発明のデータテーブルにおいて同じであるか否かを判断した。第2に、特徴が正確な患者にマッピングされているか否かを確認するために、Optum Humedicaの生データから生成されたデータセットまで、10人の無作為の患者を追跡して、2つのデータセットにおける特徴の同一のマッピングを保証した。特徴確認により正確なマッピングが実証された後、2700の特徴が含まれる1700万人の患者に対してアルゴリズムを実行した。
クラスタリング:クラスタリング技法を使用して、IL4/13経路に関連する特徴によって定義されるような類似する特性を共有する患者をあわせてグループ化した。クラスタリングは、患者の特徴に基づいて患者間の類似度を探した。生成されたクラスタにより、同じ患者に存在しない場合であっても、症状間の相関が見つかった。結果の臨床的な関連性を確保するために、プロセスのさまざまな段階において臨床入力を組み込んだ。したがって、疾患専門家による臨床入力は、臨床的に関連するコホートの作成と、臨床的に関連する特徴の包含およびグループ化と、最終的にクラスタの検証および評価とに役立った。特徴は、一般集団よりも頻繁に発生した場合、クラスタ内で特徴的であるものとして特定した。
多重対応分析(MCA)を使用して、特徴の次元を低減させた。そして、二分K平均を利用して、データを500のクラスタに分割し、十分に「タイト」であるが安定したクラスタでの患者の適切かつ効果的な分離を提供し、免疫関連性を示した多数のクラスタをインジケーションスコアリングに使用することができるようにした。臨床専門家が、このプロセスを通して特定されたクラスタを検証および評価した。このステップにより、クラスタの非解釈性のリスクの低減が容易になり、異なるクラスタ間で重複する特徴が存在しないことが確実になった。このクラスタリング手法は、2700の特徴(例えば、MCA成分)と1700万人の患者とを表すデータを実行した。このアルゴリズムの最後に生成されたクラスタの数は500であった。
新たなインジケーション(すなわち、関連する患者特性)の特定:さらなる評価のために、臨床的かつ商業的判断を実施して、優先シグナルの短いリストを得るとともに、クラスタ出力に基づいてクラスタにわたる最も臨床的に関連するインジケーションを特定した。4つの方法論的ステップを使用した。第1のステップでは、免疫学的充実度、安定性、純度およびサイズに基づき、ランク付けされた500のクラスタから上位60のクラスタを選択した。各クラスタに含まれる特徴に対して3つの尺度:特殊性、各クラスタ内でその特徴を提示する患者の数、および免疫学的スコアを計算して、選択を決定した。「リフトスコア」とも称する特殊性は、ある特徴がクラスタ内で集団の残りのものに対してどれほど特徴的であるかを測定した(例えば、男性が集団の50%およびクラスタの75%を占める場合、「リフトスコア」は1.5に等しい)。1を超えるリフトスコアを有する(より広範の集団と比較して予想を超えて高い割合で、クラスタ内で発生することを意味する)とともに、患者の10%以上に出現する特徴のみを、クラスタを定義(および命名)しかつクラスタのテーマを展開するものとしてみなした。加えて、各選択された特徴に、そのタイプ(疾患、薬物、臨床検査または処置)および免疫学的関連性に従ってスコアを与えた。各クラスタ内の特徴スコアを合計し、正規化した。次いで、クラスタが50%のスコアという事前定義された閾値を満たした場合、そのクラスタを免疫学的に特有であるとみなした。第2のステップとして、安定性、純度および患者の数に従ってクラスタを選択した。安定性は、4つの方法:1.異なるサイズのデータでクラスタを再現すること、2.クラスタの初期化シードを変更すること、3.生成されたクラスタの数を変更すること、および4.訓練-テスト方法を適用することを使用して評価した。訓練セットにおける各クラスタについて、安定性は、テストセットにおいてもともにグループ化されている患者の最大比率として定義する。純度は、そのクラスタ内の患者のMCA成分のクラスタ内分散によって測定することができ、これにより、均質かつ高密度のクラスタをもたらすことができる。クラスタは、50%を超える安定性を有するとともに、最高20%の純度にある場合に、分析に含まれる。加えて、内容領域専門家がコアクラスタテーマに関連すると判断したインジケーションのすべてを、これらの特徴が出現した患者の数(10%未満である可能性がある)に関わらず、評価のために考慮した。そして、第3のステップにおいて、これらの新たなインジケーションを、デュピルマブの4つの確立された(参照の)インジケーション(喘息、アトピー性皮膚炎、IgEアレルギーおよび複合免疫学的スコア)の各々との共起の頻度に基づいて、ランク付けした。共起性は、インジケーションおよび参照の両方を含む患者重み付けクラスタの比率を計算することによって測定した。最後のステップにおいて、臨床的かつ商業的実現可能性により、インジケーションの最終リストをさらに特徴付けた。臨床的評価は、別個の臨床診断を示すインジケーションを保持した。IL4/IL13参照でのランク付けに基づき、上位30に出現しなかった病状は、IL4/IL13調節との関連性が低いと思われるため削除した。商業的評価は、臨床的に妥当と思われるインジケーションのサブセットに対して、販売予測および競合他社の資産に関するデータが入手可能であった場合においてのみ可能であった。加えて、商業的評価に対して、複数の因子:文献に記載されているか否かに関わらずIL4/13経路へのリンク、インジケーションの世界的な罹患率、および(100,000生存年数についての)インジケーションの障害調整生存年数(DALY)もまた考慮した。
結果:図4は、本明細書に記載するシステムおよび方法の使用からもたらされる実験結果を示す図である。Optum Humedicaから抽出された1700万人の患者の最終的なコホートを分析して、選択された特徴にわたるデータの完全性および代表性を評価した。中位レンズ集団では、患者のコホートは、59%が女性で、大部分が白人(77%)からなり、最後の活動時の平均年齢は53歳(SD=7年間)であり、平均フォローアップ期間は7.1年であった。患者は、免疫学的病状として、急性副鼻腔炎(25.2%)、詳細不明のアレルギー性鼻炎(20.6%)およびその他の詳細不明の喘息(19.4%)のICD10コードを最も頻繁に示した。最も頻繁に用いられる免疫学関連医薬品は、プレドニゾン(28.0%)、フルチカゾンフロエート(22.2%)およびメチルプレドニゾロン(13.3%)であり、患者の0.4%は、アレルゲン免疫療法注射およびβ2糖タンパク質抗体測定を受けた。患者の大部分が、白血球数(70.8%)、絶対好中球数(ANC)(64.3%)および絶対リンパ球数(ALC)(63.8%)の検査を受けた。クラスタリング手順により、500のクラスタが生成され、そのうちの125を、免疫疾患に対して充実しているとともに安定しているものとして分類した。これらの125のうち、110はまた高純度であるものとしても分類した。これらのうち、クラスタごとの最大数の患者を含む60のクラスタを保持し、臨床的に関連するシグナルについて分析した。確認プロセスに続き、訓練-テスト方法を用いて、クラスタの84%を、高度に安定しているとみなし、データテーブルにおけるシード位置および患者の数に関わらず、上位20のクラスタの90%および99%をそれぞれ再現した。クラスタに含まれる特徴に基づいて、6つのクラスタテーマ:多臓器の免疫学的影響、新生物、喘息および他の過敏症、筋骨格機能障害、心代謝スペクトル、ならびに婦人科および産科状態を特定し、V2およびV3の反復においてもまた一部再現した。それらのうち、クラスタ評価のために、250のインジケーションを選択し、各参照との共起性によってランク付けした。臨床的かつ商業的実現可能性により、約85のインジケーションのリストをさらに特徴付け:それらのうちの約20は、別個の臨床診断を表さなかったか、またはIL4/13調節に対して臨床的根拠が不十分であり、他は、商業的評価情報を容易に得られなかった。ハイブリッド手法からのインジケーションの最終的なリストは、すでにライフサイクルマネジメントにあるインジケーションのおよそ90%とともに、追加のあり得る新たなインジケーションのおよそ60%とを特定した。
図5は、本開示のいくつかの実施態様による、(図2を参照して上述した方法200等)本開示に記載したアルゴリズム、方法、機能、プロセス、フローおよび手順に関連する計算機能を提供するために使用されるコンピュータシステム例600のブロック図である。図示するコンピュータ602は、物理的インスタンス、仮想インスタンスまたは両方を含む、サーバ、デスクトップコンピュータ、ラップトップ/ノートブックコンピュータ、無線データポート、スマートフォン、携帯情報端末(PDA)、タブレットコンピューティングデバイス、またはこれらのデバイス内の1つもしくはそれ以上のプロセッサ等、任意のコンピューティングデバイスを包含するように意図されている。コンピュータ602は、ユーザ情報を受け入れることができるキーパッド、キーボードおよびタッチスクリーン等の入力デバイスを含むことができる。また、コンピュータ602は、コンピュータ602の作動方法に関連する情報を伝達することができる出力デバイスを含むことができる。情報は、デジタルデータ、視覚データ、音声情報または情報の組合せを含むことができる。情報は、グラフィカルユーザインタフェース(UI)(またはGUI)で提示することができる。
コンピュータ602は、クライアント、ネットワークコンポーネント、サーバ、データベース、永続性、または本開示に記載する主題を実施するコンピュータシステムのコンポーネントとしての役割を果たすことができる。図示するコンピュータ602は、ネットワーク630と通信可能に連結される。いくつかの実施態様では、コンピュータ602の1つまたはそれ以上のコンポーネントは、クラウドコンピューティングベースの環境、ローカル環境、グローバル環境および環境の組合せを含む、異なる環境内で動作するように構成することができる。
大まかには、コンピュータ602は、記載した主題に関連するデータおよび情報を受信し、送信し、処理し、記憶し、管理するように動作可能な電子コンピューティングデバイスである。いくつかの実施態様によれば、コンピュータ602はまた、アプリケーションサーバ、電子メールサーバ、ウェブサーバ、キャッシュサーバ、ストリーミングデータサーバまたはサーバの組合せを含むか、またはそれらと通信可能に連結することもできる。
コンピュータ602は、(例えば、別のコンピュータ602で実行している)クライアントアプリケーションから、ネットワーク630を介して要求を受信することができる。コンピュータ602は、受信した要求を、ソフトウェアアプリケーションを使用して処理することにより、受信した要求に応答することができる。要求はまた、内部ユーザ(例えば、コマンドコンソールから)、外部(または第三者)、自動化アプリケーション、エンティティ、個人、システムおよびコンピュータから、コンピュータ602に送信することもできる。
コンピュータ602のコンポーネントの各々は、システムバス603を使用して通信することができる。いくつかの実施態様では、ハードウェアまたはソフトウェアコンポーネントを含む、コンピュータ602のコンポーネントのうちの任意のものまたはすべてが、システムバス603を介して、互いにまたはインタフェース604(または両方の組合せ)とインタフェースすることができる。インタフェースは、アプリケーションプログラミングインタフェース(API)612、サービス層613、またはAPI612およびサービス層613の組合せを使用することができる。API612は、ルーチン、データ構造およびオブジェクトクラスに対する仕様を含むことができる。API612は、コンピュータ言語に依存する場合もあればしない場合もある。API612は、完全なインタフェース、単一の機能、または一組のAPIを参照することができる。
サービス層613は、コンピュータ602、および(図示されているか否かに関わらず)コンピュータ602に通信可能に連結されている他のコンポーネントに対してソフトウェアサービスを提供することができる。コンピュータ602の機能は、このサービス層を使用してすべてのサービス消費者がアクセス可能であり得る。サービス層613によって提供されるもの等のソフトウェアサービスは、規定されたインタフェースを介して、再使用可能な規定された機能を提供することができる。例えば、インタフェースは、JAVA、C++、または拡張可能マークアップ言語(XML)形式でデータを提供する言語で書かれたソフトウェアであり得る。コンピュータ602の統合コンポーネントとして図示しているが、代替実施態様では、API612またはサービス層613は、コンピュータ602の他のコンポーネント、およびコンピュータ602に通信可能に連結された他のコンポーネントに関連して、スタンドアロンコンポーネントであり得る。さらに、API612またはサービス層613の任意のまたはすべての部分は、本開示の範囲から逸脱することなく、別のソフトウェアモジュール、エンタープライスアプリケーションまたはハードウェアモジュールの子またはサブモジュールとして実装することができる。
コンピュータ602は、インタフェース604を含む。図5では単一のインタフェース604として図示しているが、コンピュータ602の特定の必要性、要求または特定の実施態様、ならびに記載した機能に従って、2つ以上のインタフェース604を使用することができる。インタフェース604は、(図示されているか否かに関わらず)分散環境においてネットワーク603に接続されている他のシステムと通信するようにコンピュータ602によって使用することができる。概して、インタフェース604は、ネットワーク630と通信するように動作可能なソフトウェアまたはハードウェア(またはソフトウェアおよびハードウェアの組合せ)で符号化されたロジックを含むか、またはそうしたロジックを使用して実装することができる。より具体的には、インタフェース604は、通信に関連する1つまたはそれ以上の通信プロトコルをサポートするソフトウェアを含むことができる。したがって、ネットワーク630またはインタフェースのハードウェアは、図示するコンピュータ602の内部または外部で物理信号を通信するように動作可能であり得る。
コンピュータ602は、プロセッサ605を含む。図5では単一のプロセッサ605として図示しているが、コンピュータ602の特定の必要性、要求または特定の実施態様、ならびに記載した機能に従って、2つ以上のプロセッサ605を使用することができる。概して、プロセッサ605は、命令を実行することができ、データを操作して、本開示に記載するようなアルゴリズム、方法、機能、プロセス、フローおよび手順を用いる作動方法を含む、コンピュータ602の作動方法を実施することができる。
コンピュータ602はまた、コンピュータ602、および(図示されているか否かに関わらず)ネットワーク630に接続された他のコンポーネントに対するデータを保持することができる、データベース606を含む。例えば、データベース606は、インメモリ、従来型、または本開示と一貫するデータを記憶するデータベースであり得る。いくつかの実施態様では、データベース606は、コンピュータ602の特定の必要性、要求または特定の実施態様、ならびに記載した機能に従って、2つ以上の異なるデータベースタイプ(例えば、ハイブリッドインメモリデータデータベースおよび従来のデータベース)の組合せであり得る。図5では単一のデータベースとして図示しているが、コンピュータ602の特定の必要性、要求または特定の実施態様、ならびに記載した機能に従って、2つ以上のデータベース(同じタイプ、異なるタイプ、またはタイプの組合せ)を使用することができる。データベース606は、コンピュータ602の内部コンポーネントとして図示しているが、代替実施態様では、データベース606はコンピュータ602の外部であり得る。
コンピュータ602はまた、コンピュータ602、または(図示されているか否かに関わらず)ネットワーク630に接続されたコンポーネントの組合せに対するデータを保持することができる、メモリ607も含む。メモリ607は、本開示と一貫する任意のデータを記憶することができる。いくつかの実施態様では、メモリ607は、コンピュータ602の特定の必要性、要求または特定の実施態様、ならびに記載した機能に従って、2つ以上の異なるタイプのメモリの組合せ(例えば、半導体および磁気記憶の組合せ)であり得る。図5では単一のメモリ607を図示しているが、コンピュータ602の特定の必要性、要求または特定の実施態様、ならびに記載した機能に従って、2つ以上のメモリ607(同じタイプ、異なるタイプ、またはタイプの組合せ)を使用することができる。メモリ607は、コンピュータ602の内部コンポーネントとして図示しているが、代替実施態様では、メモリ607はコンピュータ602の外部であり得る。
アプリケーション608は、コンピュータ602の特定の必要性、要求または特定の実施態様、ならびに記載した機能に従って機能を提供する、アルゴリズムソフトウェアエンジンであり得る。例えば、アプリケーション608は、1つまたはそれ以上のコンポーネント、モジュールまたはアプリケーションとしての役割を果たすことができる。さらに、単一のアプリケーション608として図示しているが、アプリケーション608は、コンピュータ602上の複数のアプリケーション608として実装することができる。加えて、コンピュータ602の内部として図示しているが、代替実施態様では、アプリケーション608はコンピュータ602の外部であり得る。
コンピュータ602はまた、電源614も含むことができる。電源614は、ユーザ交換可能または非ユーザ交換可能のいずれかであるように構成することができる充電式または非充電式バッテリを含むことができる。いくつかの実施態様では、電源614は、再充電、スタンバイおよび電力管理機能を含む、電力変換および管理回路を含むことができる。いくつかの実施態様では、電源614は、例えば、コンピュータ602に電力を供給するかまたは充電式バッテリを再充電するために、コンピュータ602がコンセントまたは電源に差し込まれるのを可能にする電源プラグを含むことができる。
コンピュータ602を含むコンピュータシステムに関連するかまたはその外部の任意の数のコンピュータ602が存在することができ、各コンピュータ602はネットワーク603を介して通信する。さらに、「クライアント」、「ユーザ」という用語および他の適切な用語法は、本開示の範囲から逸脱することなく、適宜、交換可能に使用することができる。さらに、本開示は、多くのユーザが1つのコンピュータ602を使用することができ、1人のユーザが複数のコンピュータ602を使用することができることを企図している。
本明細書に記載した主題および機能的作動方法の実施態様は、デジタル電子回路において、有形的に具現化されたコンピュータソフトウェアもしくはファームウェアにおいて、本明細書に開示した構造およびそれらの構造的均等物を含むコンピュータハードウェアにおいて、それらのうちの1つまたはそれ以上の組合せで実装することができる。記載した主題のソフトウェア実施態様は、1つまたはそれ以上のコンピュータプログラムとして実装することができる。各コンピュータプログラムは、データ処理装置によって実行されるように、またはデータ処理装置の作動方法を制御するように、有形的な、非一時的コンピュータ可読記憶媒体において符号化された、コンピュータプログラム命令の1つまたはそれ以上のモジュールを含むことができる。代替的にまたはさらに、プログラム命令は、人工的に生成された伝播信号内/上に符号化することができる。例えば、この信号は、データ処理装置によって実行されるように好適な受信装置に送信されるように情報を符号化するために生成される、機械が生成した電気、光または電磁信号であり得る。コンピュータ記憶媒体は、機械可読記憶デバイス、機械可読記憶基板、ランダムもしくはシリアルアクセスメモリデバイス、またはコンピュータ記憶媒体の組合せであり得る。
「データ処理装置」、「コンピュータ」および「電子コンピュータデバイス」(または、当業者によって理解されるような均等物)という用語は、データ処理ハードウェアを指す。例えば、データ処理装置は、例として、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサもしくはコンピュータを含む、データを処理するすべての種類の装置、デバイスおよび機械を包含することができる。本装置はまた、例えば、中央処理装置(CPU)、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向け集積回路(ASIC)を含む、専用論理回路も含むことができる。いくつかの実施態様では、データ処理装置または専用論理回路(または、データ処理装置もしくは専用論理回路の組合せ)は、ハードウェアベースまたはソフトウェアベース(またはハードウェアベースおよびソフトウェアベース両方の組合せ)であり得る。本装置は、場合により、コンピュータプログラムの実行環境を作成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステムまたは実行環境の組合せを構成するコードを含むことができる。本開示は、従来のオペレーティングシステム、例えば、LINUX、UNIX、WINDOWS、MAC OS、ANDROIDまたはIOSを含むかまたは含まないデータ処理装置の使用を企図している。
プログラム、ソフトウェア、ソフトウェアアプリケーション、モジュール、ソフトウェアモジュール、スクリプトまたはコードと称するかまたはそうしたものとしても述べることもできるコンピュータプログラムは、任意の形式のプログラミング言語で書くことができる。プログラミング言語としては、例えば、コンパイル型言語、インタプリタ型言語、宣言型言語または手続き型言語を挙げることができる。プログラムは、スタンドアロンプログラム、モジュール、コンポーネント、サブルーチン、またはコンピューティング環境で使用されるユニットを含む、任意の形式で展開することができる。コンピュータプログラムは、ファイルシステムのファイルに対応することができるが、それは必須ではない。プログラムは、他のプログラムまたはデータ、例えば、マークアップ言語文書に記憶された1つまたはそれ以上のスクリプトを保持するファイルの一部に、当該プログラムに専用の単一ファイルに、または1つもしくはそれ以上のモジュール、サブプログラムもしくはコードの一部を記憶する複数の調整されたファイルに、記憶することができる。コンピュータプログラムは、例えば、1つのサイトに位置するか、または通信ネットワークによって相互接続されている複数のサイトにわたって分散されている、1つのコンピュータでまたは複数のコンピュータで実行されるように展開することができる。さまざまな図に示したプログラムの部分は、さまざまなオブジェクト、方法またはプロセスを通してさまざまな構成および機能を実装する個々のモジュールとして示している場合があるが、プログラムは、代わりに、多数のサブモジュール、サードパーティサービス、コンポーネントおよびライブラリを含むことができる。逆に、さまざまなコンポーネントの構成および機能を、適宜、単一のコンポーネントに組み合わせることができる。計算上の決定を行うために使用される閾値は、静的に、動的に、または静的かつ動的に、決定することができる。
本明細書に記載した方法、プロセスまたは論理フローは、1つまたはそれ以上のコンピュータプログラムを実行する1つまたはそれ以上のプログラマブルコンピュータにより、入力データを操作して出力を生成することにより機能を実施するように、実施することができる。方法、プロセスまたは論理フローは、専用論理回路、例えば、CPU、FPGAまたはASICによっても実施することができ、本装置はそうしたものとして実装することもできる。
コンピュータプログラムの実行に好適なコンピュータは、汎用および専用マイクロプロセッサならびに他の種類のCPUのうちの1つまたはそれ以上に基づくことができる。コンピュータの要素は、命令を実施または実行するCPUと、命令およびデータを記憶する1つまたはそれ以上のメモリデバイスである。一般に、CPUは、メモリから命令およびデータを受け取る(かつメモリにデータを書き込む)ことができる。コンピュータはまた、データを記憶する1つまたはそれ以上の大容量記憶デバイスも含み、またはそれに動作可能に連結され得る。いくつかの実施態様では、コンピュータは、例えば、磁気ディスク、光磁気ディスクまたは光ディスクを含む大容量記憶デバイスからデータを受け取り、かつそこにデータを転送することができる。さらに、コンピュータは、別のデバイス、例えば、携帯電話、携帯情報端末(PDA)、携帯オーディオまたはビデオプレイヤー、ゲーム機、全地球測位システム(GPS)受信器、またはユニバーサルシリアルバス(USB)フラッシュドライブ等のポータブルストレージデバイスに組み込むことができる。
コンピュータプログラム命令およびデータを記憶するのに好適なコンピュータ可読媒体(適宜、一時的または非一時的)は、すべての形式の永久/非永久かつ揮発性/非揮発性メモリ、媒体およびメモリデバイスを含むことができる。コンピュータ可読媒体は、例えば、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、消去可能プログラマブルリードオンリメモリ(EPROM)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)およびフラッシュメモリデバイス等、半導体メモリデバイスを含むことができる。コンピュータ可読媒体は、例えば、テープ、カートリッジ、カセットおよび内蔵/リムーバブルディスク等、磁気デバイスも含むことができる。コンピュータ可読媒体は、例えば、デジタルビデオディスク(DVD)、CD ROM、DVD+/-R、DVD-RAM、DVD-ROM、HD-DVDおよびBLURAYを含む、光磁気ディスクおよび光メモリデバイスおよび技術も含むことができる。メモリは、キャッシュ、クラス、フレームワーク、アプリケーション、モジュール、バックアップデータ、ジョブ、ウェブページ、ウェブページテンプレート、データ構造、データベーステーブル、リポジトリおよび動的情報を含む、さまざまなオブジェクトまたはデータを記憶することができる。メモリに記憶されるオブジェクトおよびデータのタイプとしては、パラメータ、変数、アルゴリズム、命令、ルール、制約および参照を挙げることができる。さらに、メモリは、ログ、ポリシー、セキュリティまたはアクセスデータ、および報告ファイルを含むことができる。プロセッサおよびメモリは、専用論理回路によって補完するかまたは専用論理回路に組み込むことができる。
本開示に記載した主題の実施態様は、情報をユーザに表示すること(およびユーザから入力を受け取ること)を含む、ユーザとのインタラクションを提供するディスプレイデバイスを有するコンピュータ上で実装することができる。ディスプレイデバイスのタイプとしては、例えば、陰極線管(CRT)、液晶ディスプレイ(LCD)、発光ダイオード(LED)およびプラズマモニタを挙げることができる。ディスプレイデバイスは、キーボードと、例えば、マウス、トラックボールまたはトラックパッドを含むポインティングデバイスとを含むことができる。ユーザ入力は、圧力感度を有するタブレットコンピュータの表面、または容量もしくは電気検知を用いるマルチタッチスクリーン等、タッチスクリーンを使用することにより、コンピュータに提供することもできる。他の種類のデバイスを使用して、例えば、視覚フィードバック、聴覚フィードバックまたは触覚フィードバックを含む知覚フィードバックを含むユーザフィードバックを受け取ることを含む、ユーザとのインタラクションを提供することができる。ユーザからの入力は、音響、音声または触覚入力の形式で受け取ることができる。加えて、コンピュータは、ユーザが使用するデバイスに文書を送信するとともにそうしたデバイスから文書を受信することにより、ユーザとインタラクトすることができる。例えば、コンピュータは、ユーザのクライアントデバイスのウェブブラウザから要求を受信することに応答して、ウェブページをウェブブラウザに送信することができる。
「グラフィカルユーザインタフェース」すなわち「GUI」という用語は、単数形または複数形で使用して、1つまたはそれ以上のグラフィカルユーザインタフェース、および特定のグラフィカルユーザインタフェースのディスプレイの各々を述べることができる。したがって、GUIは、情報を処理するとともに、情報結果をユーザに効率的に提示する、限定されないがウェブブラウザ、タッチスクリーンまたはコマンドラインインタフェース(CLI)を含む、任意のグラフィカルユーザインタフェースを表すことができる。概して、GUIは、インタラクティブフィールド、プルダウンリストおよびボタン等、一部またはすべてがウェブブラウザに関連する、複数のユーザインタフェース(UI)要素を含むことができる。これらのおよび他のUI要素は、ウェブブラウザの機能に関連するかまたはそうした機能を表すことができる。
本明細書に記載する主題の実施態様は、(例えば、データサーバとして)バックエンドコンポーネントを含むコンピューティングシステム、またはミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)において実装することができる。さらに、コンピューティングシステムは、フロントエンドコンポーネント、例えば、ユーザがコンピュータとインタラクトすることができるグラフィカルユーザインタフェースまたはウェブブラウザの一方または両方を有するクライアントコンピュータを含むことができる。システムのコンポーネントは、通信ネットワークにおける有線または無線デジタルデータ通信(またはデータ通信の組合せ)の任意の形態または媒体によって相互接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、無線アクセスネットワーク(RAN)、メトロポリタンエリアネットワーク(MAN)、広域ネットワーク(WAN)、マイクロ波アクセスの世界的相互運用(WIMAX:Worldwide Interoperability for Microwave Access)、(例えば、802.11a/b/g/nもしくは802.20またはプロトコルの組合せを使用する)無線ローカルエリアネットワーク(WLAN)、インターネットのすべてもしくは一部、または1つもしくはそれ以上の場所における他の任意の1つの通信システムもしくは複数の通信システム(または通信ネットワークの組合せ)が挙げられる。ネットワークは、例えば、インターネットプロトコル(IP)パケット、フレームリレーフレーム、非同期転送モード(AMT)セル、音声、ビデオ、データ、またはネットワークアドレス間の通信タイプの組合せで通信することができる。
コンピューティングシステムは、クライアントおよびサーバ含むことができる。クライアントおよびサーバは、概して互いにリモートとすることができ、典型的には、通信ネットワークを通してインタラクションすることができる。クライアントとサーバとの関係は、それぞれのコンピュータ上で実行しておりかつクライアント-サーバ関係を有するコンピュータプログラムによって生じることができる。
クラスタファイルシステムは、読取および更新のために複数のサーバからアクセス可能な任意のファイルシステムタイプであり得る。ファイル交換システムのロックはアプリケーション層で行うことができるため、ロックまたは一貫性の追跡は必要でない可能性がある。さらに、ユニコードデータファイルは、非ユニコードデータファイルとは異なる可能性がある。
本明細書は、多くの具体的な実施態様の詳細を含むが、これらは、請求項され得るものの範囲の限定として解釈されるべきではなく、むしろ、特定の実施態様に固有であり得る構成の記述として解釈されるべきである。本明細書において別個の実施態様の文脈で記載するいくつかの構成は、単一の実施態様において組み合わせて実装することもできる。逆に、単一の実施態様の文脈で記載するさまざまな構成は、複数の実施態様において別個に、または任意の好適なサブコンビネーションで実装することもできる。さらに、上述した構成は、いくつかの組合せで作用するように記載し、さらにはそういうものとして最初に請求する場合もあるが、請求する組合せからの1つまたはそれ以上の構成は、場合により、その組合せから削除することができ、請求される組合せは、サブコンビネーションまたはサブコンビネーションの変形に向けられる場合もある。
上述した記載では、本発明の実施形態について、実施態様ごとに異なる可能性のある多数の具体的な詳細を参照して説明した。したがって、説明および図面は、限定的な意味ではなく例示的な意味でみなされるべきである。本発明の範囲、および本発明の範囲であると出願人が意図するものの唯一かつ排他的なインジケータは、任意の後続する補正を含む、本出願から特許となる文字通りのかつ等価な範囲の請求項の組(こうした請求項が特許となる特定の形態で)である。こうした請求項に含まれる用語について本明細書に明示的に示したいかなる定義も、請求項で使用するこうした用語の意味に適用されるものとする。加えて、上述した説明または以下の請求項において「さらに含む(comprising)」または「さらに含む(including)」という用語を使用する場合、この言い回しの前にあるものは、追加のステップもしくは実体、または先行して列挙したステップもしくは実体のサブステップ/サブエンティティであり得る。
主題の特定の実施態様について記載した。記載した実施態様の他の実施態様、改変および置換形態は、当業者であれば明らかであるように以下の請求項の範囲内にある。図面または請求項において作動方法を特定の順序で示すが、これは、望ましい結果を達成するために、こうした作動方法が、図示する特定の順序でまたは逐次実施されること、または例示したすべての作動方法が実施されること(いくつかの作動方法は任意であるとみなされ得る)を必要とするものとして理解されるべきではない。状況によっては、適切であるとみなされる際、マルチタスクまたは並列処理(またはマルチタスクおよび並列処理の組合せ)が有利であり、実施され得る。
さらに、上述した実施態様におけるさまざまなシステムモジュールおよびコンポーネントの分離または統合は、すべての実施態様においてこうした分離または統合を必要とするものとして解釈されるべきではなく、記載したプログラムコンポーネントおよびシステムは、概して、単一のソフトウェア製品にともに統合するか、または、複数のソフトウェア製品にパッケージングすることができることが理解されるべきである。
したがって、上述した実施態様例は、本開示を規定も制約もしない。本開示の趣旨および範囲から逸脱することなく、他の変更、置換および改変も可能である。
さらに、任意の請求する実施態様は、少なくともコンピュータ実装方法;コンピュータ実装方法を実施するコンピュータ可読命令を記憶する非一時的コンピュータ可読媒体;およびコンピュータ実装方法または非一時的コンピュータ可読媒体に記憶された命令を実施するように構成されたハードウェアプロセッサと相互動作可能に連結されたコンピュータメモリを含むコンピュータシステムに適用可能であるとみなされる。
これらのシステムおよび方法の多数の実施形態について記載した。それにも関わらず、本開示の趣旨および範囲から逸脱することなく、さまざまな変更を行ってもよいことが理解されよう。

Claims (20)

  1. 既存薬物を再開発するためのコンピュータ実装方法であって:
    コンピュータシステムにより、複数の患者のカルテを表すデータを受け取ることと;
    カルテに基づき、一組の患者を選択することであって、
    患者のカルテのデ-タが、薬物に関連する標的シグナル伝達経路に関連する少なくとも1つの診断、投薬、臨床検査、または処置を有する場合にのみ、前記一組の患者に含めるために前記複数の患者のうちの1人の患者を選択することを含み;
    一組の患者の複数の患者特性を決定することであって、一組の患者の各患者は複数の患者特性のうちの少なくとも1つを示すことと;
    コンピュータシステムにより、複数の患者特性に従って複数の別個のグループを生成するために一組の患者をグループ化することであって、別個のグループの各々は一組の患者のうちの少なくとも1人の患者を含むことと;
    1つまたはそれ以上のグループ選択基準に基づき、複数の別個のグループのうちの一組の別個のグループを選択することと;
    一組の別個のグループの各別個のグループを分析することにより、1つまたはそれ以上の関連する患者特性を特定することと、
    を含む前記方法。
  2. 一組の患者をグループ化することは:
    1つまたはそれ以上の教師なしクラスタリング技法を実行するように構成された機械学習システムを実行すること
    を含む、請求項1に記載の方法。
  3. 1つまたはそれ以上の教師なしクラスタリング技法は、二分k平均クラスタリング技法を含む、請求項2に記載の方法。
  4. 一組の患者をグループ化することは、多重対応分析を実行して、複数の患者特性の次元を低減させることを含む、請求項1~3のいずれか一項に記載の方法。
  5. 一組の別個のグループを選択することは:
    複数の別個のグループの各別個のグループについて、その別個のグループによって示される各患者特性に対する特徴スコアを決定することと;
    複数の別個のグループの各別個のグループの特徴スコアを特徴スコア閾値と比較することと、
    を含む、請求項1~4のいずれか一項に記載の方法。
  6. 一組の別個のグループを選択することは:
    各々の別個のグル-プのための安定性尺度は、複数の別個のグル-プを生成するために実行されるグループ化操作のパラメータの摂動の下での別個のグル-プの再現性を特徴付ける、複数の別個のグループの各別個のグループについて安定性尺度を決定することと、
    各々の別個のグル-プのための純度尺度は、別個のグル-プに含まれる患者の特徴ベクトル間の分散の尺度に基づき、複数の別個のグループの各別個のグループについて純度尺度を決定することと、
    複数の別個のグループの各別個のグループに含まれる一組の患者の患者数を決定することとのうちの少なくとも1つを含む、請求項1に記載の方法。
  7. 1つまたはそれ以上の関連する患者特性を特定することは:
    一組の別個のグループの各別個のグループについて、複数の患者特性のうちの、その別個のグループによって示されるとともにそのグループのテーマに対応する患者特性を選択することにより、複数の関連する可能性のある患者特性を生成することと;
    複数の関連する可能性のある患者特性の関連する可能性がある患者特性の各々をランク付けすることと、
    を含む、請求項1に記載の方法。
  8. 関連する可能性がある患者特性の各々をランク付けすることは、各関連する可能性がある患者特性について、その関連する可能性がある患者特性と薬物に関連する少なくとも1つの参照インジケーションとの共起の頻度に基づいて、ランク値を割り当てることを含む、請求項7に記載の方法。
  9. 共起は、関連する可能性がある患者特性の各々について、その関連する可能性がある患者特性と少なくとも1つの参照インジケーションとの両方を含む一組の別個のグループの比率を決定することにより測定される、請求項8に記載の方法。
  10. 1つまたはそれ以上の関連する患者特性を特定することは、関連する可能性がある患者特性の各々について:臨床的実現可能性および商業的実現可能性のうちの少なくとも一方を決定することを含む、請求項7に記載の方法。
  11. 既存薬物を再開発するためのデータ処理システムであって、
    コンピュータ実行可能命令を含むコンピュータ可読メモリと;
    該コンピュータ実行可能命令と少なくとも1つの機械学習モデルとを含む実行可能ロジックを実行して1つまたはそれ以上の作動方法を実行するように構成された少なくとも1つのプロセッサと、
    を含み、1つまたはそれ以上の作動方法は:
    複数の患者のカルテを表すデータを受け取ることと;
    カルテに基づき、一組の患者を選択することであって、
    患者のカルテのデ-タが、薬物に関連する標的シグナル伝達経路に関連する少なくとも1つの診断、投薬、臨床検査、または処置を有する場合にのみ、前記一組の患者に含めるために前記複数の患者のうちの1人の患者を選択することを含み;
    一組の患者の複数の患者特性を決定することであって、一組の患者の各患者は複数の患者特性のうちの少なくとも1つを示すことと;
    機械学習モデルを使用するとともに複数の患者特性に従って、複数の別個のグループを生成するために一組の患者をグループ化することであって、別個のグループの各々は一組の患者のうちの少なくとも1人の患者を含むことと;
    1つまたはそれ以上のグループ選択基準に基づき、複数の別個のグループのうちの一組の別個のグループを選択することと;
    一組の別個のグループの各別個のグループを分析することにより、1つまたはそれ以上の関連する患者特性を特定することと、
    を含む、前記データ処理システム。
  12. 機械学習モデルは、1つまたはそれ以上の教師なしクラスタリング技法を使用して一組の患者をグループ化するように訓練されている、請求項11に記載のデータ処理システム。
  13. 1つまたはそれ以上の教師なしクラスタリング技法は、二分k平均クラスタリング技法を含む、請求項12に記載のデータ処理システム。
  14. 一組の患者をグループ化することは、多重対応分析を実行して複数の患者特性の次元を低減させることを含む、請求項11~13のいずれか一項に記載のデータ処理システム。
  15. 一組の別個のグループを選択することは;
    複数の別個のグループの各別個のグループについて、その別個のグループによって示される各患者特性に対する特徴スコアを決定することと;
    複数の別個のグループの各別個のグループの特徴スコアを特徴スコア閾値と比較することと、
    を含む、請求項11~14のいずれか一項に記載のデータ処理システム。
  16. 一組の別個のグループを選択することは:
    各々の別個のグル-プのための安定性尺度は、複数の別個のグル-プを生成するために実行されるグループ化操作のパラメータの摂動の下での別個のグル-プの再現性を特徴付けて、複数の別個のグループの各別個のグループについて安定性尺度を決定することと、
    各々の別個のグル-プのための純度尺度は、別個のグル-プに含まれる患者の特徴ベクトル間の分散の尺度に基づき、複数の別個のグループの各別個のグループについて純度尺度を決定することと、
    複数の別個のグループの各別個のグループに含まれる一組の患者の患者数を決定することとのうちの少なくとも1つを含む、請求項11~15のいずれか一項に記載のデータ処理システム。
  17. 1つまたはそれ以上の関連する患者特性を特定することは:
    一組の別個のグループの各別個のグループについて、複数の患者特性のうちの、その別個のグループによって示されるとともにそのグループのテーマに対応する患者特性を選択することにより、複数の関連する可能性のある患者特性を生成することと;
    複数の関連する可能性のある患者特性の関連する可能性がある患者特性の各々をランク付けすることと、
    を含む、請求項11に記載のデータ処理システム。
  18. 関連する可能性がある患者特性の各々をランク付けすることは、各関連する可能性がある患者特性について、その関連する可能性がある患者特性と薬物に関連する少なくとも1つの参照インジケーションとの共起の頻度に基づいて、ランク値を割り当てることを含む、請求項17に記載のデータ処理システム。
  19. 共起は、関連する可能性がある患者特性の各々について、その関連する可能性がある患者特性と少なくとも1つの参照インジケーションとの両方を含む一組の別個のグループの比率を決定することにより測定される、請求項18に記載のデータ処理システム。
  20. 既存薬物を再開発するためのコンピュータ実装方法であって、
    コンピュータシステムにより、複数の患者のカルテを表すデータを受け取ることと;
    カルテに基づき、一組の患者を選択することであって、
    患者が、薬物に関連する標的シグナル伝達経路に関連する少なくとも1つの診断、投薬、臨床検査、または処置を有する場合にのみ、前記一組の患者に含めるために前記複数の患者のうちの1人の患者を選択することを含み;
    一組の患者の複数の患者特性を決定することであって、一組の患者の各患者は複数の患者特性のうちの少なくとも1つを示すことと;
    コンピュータシステムにより、複数の患者特性に従って複数の別個のグループを生成するために一組の患者をグループ化することであって、別個のグループの各々は一組の患者のうちの少なくとも1人の患者を含むことと;
    1つまたはそれ以上のグループ選択基準に基づき、複数の別個のグループのうちの一組の別個のグループを選択することと;
    一組の別個のグループの各別個のグループを分析することにより、1つまたはそれ以上の関連する患者特性を特定することと;
    薬物を再開発するための標的インジケーションとして1つまたはそれ以上の関連する患者特性のうちの少なくとも1つを特定することと、
    を含む前記方法。
JP2022534660A 2019-12-09 2020-12-09 既存薬物を再開発するためのデータ処理システムおよび方法 Active JP7667155B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2025064018A JP2025108516A (ja) 2019-12-09 2025-04-09 既存薬物を再開発するためのデータ処理システムおよび方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962945814P 2019-12-09 2019-12-09
US62/945,814 2019-12-09
EP20315299 2020-06-09
EP20315299.6 2020-06-09
PCT/US2020/064100 WO2021119188A1 (en) 2019-12-09 2020-12-09 Data processing systems and methods for repurposing drugs

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2025064018A Division JP2025108516A (ja) 2019-12-09 2025-04-09 既存薬物を再開発するためのデータ処理システムおよび方法

Publications (2)

Publication Number Publication Date
JP2023504203A JP2023504203A (ja) 2023-02-01
JP7667155B2 true JP7667155B2 (ja) 2025-04-22

Family

ID=74104226

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022534660A Active JP7667155B2 (ja) 2019-12-09 2020-12-09 既存薬物を再開発するためのデータ処理システムおよび方法
JP2025064018A Pending JP2025108516A (ja) 2019-12-09 2025-04-09 既存薬物を再開発するためのデータ処理システムおよび方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2025064018A Pending JP2025108516A (ja) 2019-12-09 2025-04-09 既存薬物を再開発するためのデータ処理システムおよび方法

Country Status (5)

Country Link
US (3) US12243628B2 (ja)
EP (1) EP4073818A1 (ja)
JP (2) JP7667155B2 (ja)
CN (1) CN114868204A (ja)
WO (1) WO2021119188A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112022011098A2 (pt) 2019-12-09 2022-09-20 Sanofi Biotechnology Métodos para tratamento de distúrbios relacionados a il-4/il-13 digitalmente identificados
US20230317281A1 (en) * 2022-04-04 2023-10-05 Express Scripts Strategic Development, Inc. Targeted medical intervention system
US20240029850A1 (en) * 2022-07-22 2024-01-25 Opeeka, Inc. Method and system utilizing machine learning to develop and improve care models for patients in an electronic patient system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012025763A (ja) 2000-02-29 2012-02-09 Alcon Inc 緑内障の診断及び治療方法
US20120296090A1 (en) 2011-04-04 2012-11-22 The Methodist Hospital Research Institute Drug Repositioning Methods For Targeting Breast Tumor Initiating Cells
JP2016099674A (ja) 2014-11-18 2016-05-30 国立研究開発法人産業技術総合研究所 薬剤探索装置、薬剤探索方法およびプログラム
US20190350912A1 (en) 2016-10-03 2019-11-21 Indiana University Research And Technology Corporation Combination drug therapy reduces parp-1 related dna repair and increases the efficacy of genotoxic agents

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL134994A0 (en) * 2000-03-09 2001-05-20 Yeda Res & Dev Coupled two way clustering analysis of data
US9492114B2 (en) * 2004-06-18 2016-11-15 Banner Health Systems, Inc. Accelerated evaluation of treatments to prevent clinical onset of alzheimer's disease
EP2105843B1 (fr) * 2008-03-28 2011-03-16 Ela Medical Dispositif médical actif comprenant des moyens perfectionnés de discrimination entre tachycardies d'orgine ventriculaire et tachycardies d'orgine supraventriculaire
US11562323B2 (en) * 2009-10-01 2023-01-24 DecisionQ Corporation Application of bayesian networks to patient screening and treatment
US8543520B2 (en) * 2011-03-09 2013-09-24 Telenav, Inc. Navigation system with single pass clustering based template generation mechanism and method of operation thereof
WO2012174338A2 (en) * 2011-06-15 2012-12-20 Glaxosmithkline Llc Method of selecting therapeutic indications
US20160196394A1 (en) * 2015-01-07 2016-07-07 Amino, Inc. Entity cohort discovery and entity profiling
WO2016191340A1 (en) * 2015-05-22 2016-12-01 Georgetown University Discovery and analysis of drug-related side effects
US10926034B2 (en) * 2015-07-29 2021-02-23 Sanofi-Aventis Deutschland Gmbh Sensor device for a drug delivery device
US11031135B2 (en) * 2017-09-26 2021-06-08 Edge2020 LLC Determination of cybersecurity recommendations
US11107589B2 (en) * 2017-12-27 2021-08-31 International Business Machines Corporation Estimating personalized drug responses from real world evidence
WO2020047453A1 (en) * 2018-08-31 2020-03-05 Ampel Biosolutions, Llc Systems and methods for single-cell rna-seq data analysis
WO2021014405A1 (en) * 2019-07-24 2021-01-28 Janssen Pharmaceuticals, Inc. Learning platform for patient journey mapping
BR112022011098A2 (pt) 2019-12-09 2022-09-20 Sanofi Biotechnology Métodos para tratamento de distúrbios relacionados a il-4/il-13 digitalmente identificados

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012025763A (ja) 2000-02-29 2012-02-09 Alcon Inc 緑内障の診断及び治療方法
US20120296090A1 (en) 2011-04-04 2012-11-22 The Methodist Hospital Research Institute Drug Repositioning Methods For Targeting Breast Tumor Initiating Cells
JP2016099674A (ja) 2014-11-18 2016-05-30 国立研究開発法人産業技術総合研究所 薬剤探索装置、薬剤探索方法およびプログラム
US20190350912A1 (en) 2016-10-03 2019-11-21 Indiana University Research And Technology Corporation Combination drug therapy reduces parp-1 related dna repair and increases the efficacy of genotoxic agents

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Hua Xu,Validating drug repurposing signals using electronic health records: a case study of metformin associated with reduced cancer mortality,2014年07月22日

Also Published As

Publication number Publication date
EP4073818A1 (en) 2022-10-19
JP2023504203A (ja) 2023-02-01
JP2025108516A (ja) 2025-07-23
US20240242791A1 (en) 2024-07-18
CN114868204A (zh) 2022-08-05
US20250182862A1 (en) 2025-06-05
US20210174912A1 (en) 2021-06-10
WO2021119188A1 (en) 2021-06-17
US12243628B2 (en) 2025-03-04

Similar Documents

Publication Publication Date Title
Kline et al. Multimodal machine learning in precision health: A scoping review
Yu et al. Evaluating progress in automatic chest x-ray radiology report generation
Kehl et al. Natural language processing to ascertain cancer outcomes from medical oncologist notes
Krittanawong et al. Machine learning prediction in cardiovascular diseases: a meta-analysis
Weng et al. Can machine-learning improve cardiovascular risk prediction using routine clinical data?
US11232365B2 (en) Digital assistant platform
Hammond et al. Predicting childhood obesity using electronic health records and publicly available data
Blecker et al. Comparison of approaches for heart failure case identification from electronic health record data
Morris et al. Reinventing radiology: big data and the future of medical imaging
Chicco et al. Survival prediction of patients with sepsis from age, sex, and septic episode number alone
Poucke et al. Scalable predictive analysis in critically ill patients using a visual open data analysis platform
Hung et al. Development of an intelligent decision support system for ischemic stroke risk assessment in a population-based electronic health record database
JP2025108516A (ja) 既存薬物を再開発するためのデータ処理システムおよび方法
US20230253122A1 (en) Systems and methods for generating a genotypic causal model of a disease state
CN107980162A (zh) 基于组合的研究建议系统和方法
Lwowski et al. The risk of racial bias while tracking influenza-related content on social media using machine learning
WO2023147472A1 (en) Methods and systems for risk stratification of colorectal cancer
Pandey et al. Extraction of radiographic findings from unstructured thoracoabdominal computed tomography reports using convolutional neural network based natural language processing
US20240233952A1 (en) Systems and Methods for Continuous Cancer Treatment and Prognostics
Li et al. Using association rule mining for phenotype extraction from electronic health records
Chen et al. Knowledge graphs for the life sciences: Recent developments, challenges and opportunities
Oreskovic et al. Optimizing the use of electronic health records to identify high-risk psychosocial determinants of health
CN114078597A (zh) 从文本获得支持的决策树用于医疗健康应用
Chin et al. Mining disease risk patterns from nationwide clinical databases for the assessment of early rheumatoid arthritis risk
Chen et al. Improved interpretability of machine learning model using unsupervised clustering: predicting time to first treatment in chronic lymphocytic leukemia

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20241018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250410

R150 Certificate of patent or registration of utility model

Ref document number: 7667155

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150