WO2025169993A1 - 大腸がん患者の予後予測方法 - Google Patents
大腸がん患者の予後予測方法Info
- Publication number
- WO2025169993A1 WO2025169993A1 PCT/JP2025/003938 JP2025003938W WO2025169993A1 WO 2025169993 A1 WO2025169993 A1 WO 2025169993A1 JP 2025003938 W JP2025003938 W JP 2025003938W WO 2025169993 A1 WO2025169993 A1 WO 2025169993A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- gene
- genes
- score
- prognosis
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Definitions
- CRC Colorectal cancer
- CMS Consensus Molecular Subtyping
- the present disclosure aims to provide a method and kit for predicting the prognosis of colorectal cancer patients.
- the present disclosure provides a kit for predicting the prognosis of a colorectal cancer patient, the kit comprising: a group of genes (a) to (e): (a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16, (b) DEFA6, DEFA5, and SPINK1, (c) BST2, BATF, RAMP1, and TPM2, (d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
- the present invention provides a kit comprising a reagent for measuring the expression level of one or more genes selected from the group consisting of:
- CRC-SC colorectal cancer stem cell
- the nine panels on the right show the expression of marker genes in that cell population (dark grey): MKI67 and PCNA; cell proliferation markers; CD24, CD44, and BMI1; intestinal epithelial stem cell markers; EPCAM; epithelial cell marker; MUC12, PIGR, and PLA2G2A; lucky 5 gene.
- Gene expression in CRC-SC lines compared to NCE-SC lines. (Top left) Flowchart of this study. Transcriptional activity of NCE-SC and CRC-SC spheroids was measured as mRNA expression levels using microarrays.
- the graph on the right shows the HR and its 95% CI.
- the graph on the right shows HR and its 95% CI.
- Heatmap showing mRNA expression levels in 57 CRC-SC spheroid lines (55T to 83T) and 5 NCE-SC lines (3N to 73N; 3N-d in the leftmost column is a cell line differentiated in vitro from 3N by removing the medium containing Wnt ligands).
- the graph on the right shows the HR and 95% CI for the five-signature, including the lead gene candidate CXCL14.
- Flowchart for calculating the colorectal cancer comprehensive signature (GCS).
- the five signatures were classified into two categories: long-term survival signatures and short-term survival signatures.
- b and c) The mean Z-scores of the long-term and short-term survival signatures were treated as positive (+) and negative (-) scores, respectively.
- the GCS score was calculated by summing the signature scores.
- a retrospective observational study of the GCS score was performed using the TCGA-CRC-DSS, TCGA-CRC-PFS, or GSE39582-RFS datasets as validation cohorts.
- the primers or probes may comprise or consist of a sequence complementary to a portion of the mRNA sequence encoded by each gene.
- the primers or probes may be, for example, 10 to 50 nucleotides, 15 to 35 nucleotides, or 20 to 30 nucleotides.
- the primers or probes comprise or consist of a sequence of 10 to 50 nucleotides, 15 to 35 nucleotides, or 20 to 30 nucleotides complementary to a portion of the mRNA sequence encoded by each gene.
- the method of the present disclosure calculates a Z-score (Z) for each gene from the expression level of each gene in a patient using formula (I): (where x is the expression level of the gene in the patient, and ⁇ and ⁇ are the mean and standard deviation of the expression levels of the gene in multiple colorectal cancer patients, respectively) To seek by determining a gene expression signature score for each group of genes; and comparing the gene expression signature score to a cutoff value.
- the gene expression signature score may be compared with multiple cutoff values. For example, for multiple colorectal cancer patients whose prognosis is known, the prognosis of each patient may be ranked into three or more levels, and two or more gene expression signature scores that can separate each rank group with a statistically significant difference may be used as cutoff values. Statistical significance can be determined, for example, by the logrank test.
- the cutoff values may be multiple values that can separate multiple colorectal cancer patients at a certain ratio in order of their gene expression signature scores, and may be, for example, the quartiles of the gene expression signature scores of multiple colorectal cancer patients. By comparing with multiple cutoff values, colorectal cancer patients can be stratified according to prognosis.
- the gene expression signature score of gene group (c) is compared with the cutoff value for that gene group. If the gene expression signature score of gene group (c) is higher than the cutoff value, the patient is predicted to have a poor prognosis.
- the gene expression signature score for gene group (e) is compared with the cutoff value for that gene group. If the gene expression signature score for gene group (e) is higher than the cutoff value, the patient is predicted to have a poor prognosis.
- the method of the present disclosure includes measuring the expression levels of genes in two gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in three gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in four gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in five gene groups selected from gene groups (a) to (e).
- the GCS score is compared with a cutoff value.
- the cutoff value is a GCS score value that can statistically significantly divide multiple colorectal cancer patients with known prognosis into good prognosis and poor prognosis groups.
- the cutoff value can be, for example, the value that minimizes the P value when multiple colorectal cancer patients are divided into good prognosis and poor prognosis groups using the Kaplan-Meier survival curve.
- the statistical significance between the good prognosis and poor prognosis groups can be determined, for example, using the logrank test. If the colorectal cancer composite score is higher than the cutoff value, the patient is predicted to have a good prognosis.
- the present disclosure provides a method for treating colorectal cancer patients, which comprises predicting the prognosis of a colorectal cancer patient using the prognosis prediction method of the present disclosure, and administering to the patient a therapeutic agent or therapy selected based on the prediction results.
- the therapeutic agent may be an anticancer drug such as 5-fluorouracil (5-FU), tegafur, tegafur-uracil (UFT), doxifluridine (5'-DFUR), carmofur, tegafur-gimeracil-oteracil potassium (S-1), capecitabine (Cape), regorafenib, trifluridine-tipiracil hydrochloride (FTD/TPI), mitomycin C, irinotecan (IRI), oxaliplatin (OX), or vascular endothelial growth factor (VGF).
- an anticancer drug such as 5-fluorouracil (5-FU), tegafur, tegafur-uracil (UFT), doxifluridine (5'-DFUR), carmofur, tegafur-gimeracil-oteracil potassium (S-1), capecitabine (Cape), regorafenib, trifluridine-tipiracil hydrochloride (FTD
- a method for predicting the prognosis of a colorectal cancer patient comprising: (a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16, (b) DEFA6, DEFA5, and SPINK1, (c) BST2, BATF, RAMP1, and TPM2, (d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and SPINK1.
- a kit for predicting the prognosis of a colorectal cancer patient comprising: (a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16, (b) DEFA6, DEFA5, and SPINK1, (c) BST2, BATF, RAMP1, and TPM2, (d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
- a kit comprising a reagent for measuring the expression level of one or more genes in a group selected from the group consisting of: [14] 14.
- the kit according to 13 above, wherein the one or more gene groups are gene groups (a) to (e).
- the reagent is a primer or a probe.
- a method for treating a patient with colorectal cancer comprising: 13.
- a method comprising: predicting the prognosis of a colorectal cancer patient by the method according to any one of 1 to 12; and administering to the patient a therapeutic agent or treatment selected based on the result of the prediction.
- RNA from each specimen was linearly amplified and labeled with Cy3-dCTP.
- Labeled cRNA was purified using the RNAeasy Mini Kit (Qiagen). The concentration and specific activity of the labeled cRNA preparation (pmol Cy3/ ⁇ g cRNA) were measured using a NanoDrop ND-1000 (NanoDrop, Wilmington, DE, USA).
- Each labeled cRNA sample 600 ng was fragmented with 5 ⁇ l 10x blocking agent and 1 ⁇ l 25x fragmentation buffer, then heated at 60°C for 30 min. Finally, 25 ⁇ l of 2x GE hybridization buffer was added to dilute the labeled cRNA.
- Lead genes and their associated genes We identified genes with extremely variable mRNA expression (SD > 6.5) in CRC-SC lines. Among these genes, we selected five lead genes encoded on different chromosomes and independently regulated; their expression levels were not correlated with each other (Spearman correlation coefficient
- Gene expression signature scores were calculated as previously reported ⁇ Jackstadt et al., 2019 ⁇ .
- Z-score Zij for the jth specific gene in the ith patient in the dataset was calculated using the following formula:
- Xij (uppercase letters) indicates the logarithmic value of the mRNA expression level after log2 transformation for each patient's tumor.
- the GSE39582 data was measured using microarrays and was originally displayed as log2 values, whereas the TCGA-CRC data used in this study was RNA-seq data, so values were displayed without logarithmic transformation.
- the gene expression signature score was the average Z score calculated using the following formula: That is, the lucky 5 gene expression signature score was calculated by adding the Z scores of the five jth genes, and that of the lead gene was calculated by adding the Z scores of the lead gene and the jth gene whose expression is correlated within that subgroup, and then dividing by the number of genes (m) (i.e., 5 for the lucky 5, 3-4 for the lead gene signature).
- OS overall survival
- DSS disease-specific survival
- PFS progression-free survival
- RFS recurrence-free survival
- CRC specimens were divided into four equal subgroups according to GCS score, and analyzed using the Kaplan-Meier method followed by the log-rank test.
- the 95% CI and HR for the poorest quartile group were calculated using the Mantel-Haenszel method in the GraphPad Prism software package.
- Matrigel-enclosed spheroids were suspended in cell recovery solution (Corning) and collected in a 1.5 mL tube. Matrigel was dissolved at 4°C for 30 minutes with rotation and mixing. Spheroids were centrifuged at 4°C for 5 minutes and washed twice with PBS. Genomic DNA from the spheroids was purified using the DNeasy Blood & Tissue Kit (Qiagen, Hilden, Germany) according to the manufacturer's protocol. Hotspot mutations in 50 or 409 cancer-related genes in CRC-SC lines were detected by Macrogen Inc. (Seoul, Republic of Korea).
- k-means analysis Among the genes highly expressed in CRC-SC lines compared to NCE-SC lines, the 100 most differentially expressed genes were subjected to gene cluster analysis using Integrated Differential Expression and Pathway analysis v0.951 (iDEP.951) ⁇ Ge, Son et al. 2018 ⁇ .
- scRNA-seq Single-cell RNA-seq library preparation, data processing, and quality check.
- scRNA-seq library preparation was performed by Rhelixa Inc. (Tokyo, Japan) as previously described ⁇ Joanito, Wirapati et al. 2022 ⁇ . Briefly, fresh 70N-NCE-SC were cultured in single suspension and loaded into a Chromium system (10X Genomics) at 5,000 cells per well. Barcoded sequencing libraries were generated using the Chromium Single Cell 3' v3.1 reagent Kit Dual (10X Genomics). The libraries were sequenced on an Illumina NovaSeq 6000 until full saturation was achieved.
- MUC12 and PIGR are expressed in colonocytes
- PLA2G2A and ZG16 are expressed in goblet cells
- SLC4A4 is expressed in CA1-positive colonocytes.
- NCE-SCs cultured as spheroids in our medium appear to be partially differentiated toward fetal colon and small intestine, as suggested by the Metascape analysis data above (Fig. 2C).
- EMT epi-mesenchymal transition
- a novel prognostic signature candidate represented by high, non-intersecting mRNA expression of DEFA6, CXCL14, BST2, MAGEA6, and IGF2 in human colorectal cancer stem cell spheroid cell lines.
- We found five lead gene candidates representing novel molecular subgroups (Table 2 and Figure 5A). These gene candidates are DEFA6, CXCL14, BST2, MAGEA6, and IGF2.
- These lead gene candidates are only moderately expressed in NCE-SC, and largely do not intersect with each other or with the lucky 5-gene signature expression group (Figure 2A, Figure 5A).
- k-means method a representative non-hierarchical statistical method, to classify the data into five subgroups.
- This signature is the sum of the individual standardized signatures, with + indicating a good prognosis and - indicating a poor prognosis, and is called the General Colorectal Cancer Signature (GCS).
- GCS General Colorectal Cancer Signature
- the colorectal cancer stem cell spheroid lines whose total mRNA we analyzed as our discovery cohort were a set that included additional stage III and IV lines in consideration of clinical importance. However, since the number of lines was limited to 57, we first analyzed the correlation with overall survival (OS) using the TCGA-CRC cancer tissue mRNA database of nearly 600 cases as a validation cohort.
- OS overall survival
- GCS can be a very useful prognostic signature.
- a unified prognosis prediction may be possible, and relatively mild chemotherapy may be sufficient for patients with high GCS values, while more intensive chemotherapy may be recommended for patients with low GCS values, if possible.
- PDSOX patient-derived spheroid orthotopic xenografts
- mice transplanted with the favorable-prognosis Q4 quartile CRC-SC line survived throughout the observation period ( Figure 6F, upper left), and consistent with this, no metastatic lesions were detected in the liver or lungs at autopsy.
- Two CRC-SC lines from each of the Q2 and Q3 quartiles died within 26 weeks after transplantation ( Figure 6F, lower left).
- many of the Q4 CRC-SC lines had high levels of the Lucky 5 signature, a signature associated with a favorable prognosis (Figure 6G).
- the GCS score may play an important role in the outcome of colorectal cancer patients, reflecting the unique growth and metastatic characteristics of individual CRC-SCs.
- each gene signature and the GCS can be very useful signatures for predicting the prognosis of colorectal cancer patients.
- the GCS is a value that reflects the integrated analysis of each gene signature, and can be an extremely practical prognostic prediction tool.
- the GCS score is expected to facilitate understanding of the condition of colorectal cancer patients and the physicians involved in their treatment, and to be useful in determining the most appropriate treatment plan.
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本開示は、大腸がん患者の予後を予測するための方法であって、患者のがん試料における遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む方法;および大腸がん患者の予後を予測するためのキットであって、前記遺伝子群(a)~(e)から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含むキットなどを含む。
Description
本出願は、日本国特許出願第2024-017258号について優先権を主張するものであり、ここに参照することによって、その全体が本明細書中へ組み込まれるものとする。
本開示は、大腸がん患者の予後を予測するための方法およびキットなどを含む。
本開示は、大腸がん患者の予後を予測するための方法およびキットなどを含む。
大腸がん(colorectal cancer; CRC)は、ヒトのがんとして発症頻度で3番目、死亡率で2番目に高い。大腸がんによる死因の多くは肝臓や肺など主要臓器への転移である。CMS(Consensus Molecular Subtyping)分類に代表されるように、多数の大腸がん組織試料のmRNA発現が解析され、分類されてきた。それらの解析のほとんどは新鮮な大腸がんの凍結組織や、パラフィン包埋ブロックの試料を用いているが、それらは「がん上皮」と「間質」から構成されており、後者には血球や脈管内皮細胞、炎症細胞や免疫細胞、線維芽細胞などが含まれ、そのことがデータを複雑なものにしているし、がん上皮そのものの表現型の変化も遺伝子発現に影響する。大腸がん「上皮に特異的なサブグループ」(CRC epithelial cell-intrinsic subtypes; CRIS)の検索に患者由来異種移植腫瘍(PDXs; patient-derived xenografts)も試みられてきた。なぜならヒト腫瘍に由来する間質細胞がマウスの間質細胞に置換されて、上皮のみがヒト由来になるからである。また、個々の腫瘍内の不均一性を避けるために、同じ腫瘍の複数の領域を解析することもなされてきた。しかしながら、これまでのところ遺伝子発現解析による大腸がん患者の予後予測は十分に確立されていない。
本開示は、大腸がん患者の予後を予測するための方法およびキットを提供することを目的とする。
一態様において、本開示は、大腸がん患者の予後を予測するための方法であって、患者のがん試料における遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む方法を提供する。
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む方法を提供する。
一態様において、本開示は、大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含むキットを提供する。
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含むキットを提供する。
本開示により、大腸がん患者の予後を予測するための方法およびキットが提供される。
特に具体的な定めのない限り、本明細書で使用される用語は、有機化学、医学、薬学、分子生物学、微生物学等の分野における当業者に一般に理解されるとおりの意味を有する。以下にいくつかの本明細書で使用される用語についての定義を記載するが、これらの定義は、本明細書において、一般的な理解に優先する。
一態様において、本開示は、大腸がん患者の予後を予測するための方法に関する。本開示の予後予測方法は、表1に示す遺伝子群(a)~(e)から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む。遺伝子群(a)~(e)の各遺伝子群内の遺伝子の大腸がん細胞での発現は相互に相関しており、各遺伝子群はシグネチュアとなる。これら遺伝子シグネチュアは、その遺伝子群に含まれる単独の遺伝子よりも大腸がん患者の予後予測因子として強い統計的有意差を示しうる。各遺伝子にコードされる代表的なmRNA配列およびアミノ酸配列のGenbankアクセッション番号を表1に示す。個々の大腸がん患者における各遺伝子の配列はこれら配列に限定されず、天然の変異を含みうる。
遺伝子の発現レベルの測定は、その遺伝子によりコードされるmRNAまたはタンパク質の発現を測定することにより、行うことができる。mRNAまたはタンパク質の発現はいずれの方法により測定してもよい。測定方法としては、PCR(polymerase chain reaction)、RNAシーケンシング(RNA-Seq)、マイクロアレイ、および免疫染色、ELISA、ウェスタンブロット、ドットブロットなどの免疫学的方法などが挙げられる。本明細書において、PCRなる用語は、RT-PCR(reverse transcription PCR)、qPCR(quantitative PCR)、リアルタイムPCRなど、PCRを利用したいずれの方法をも含む意味で用いられる。当業者は、がん試料を測定方法に応じて適切に処理することができ、各遺伝子によりコードされるmRNA配列またはアミノ酸配列に基づき、測定に適するプライマー、プローブまたは抗体などの試薬を適宜作製または選択することができる。一実施形態において、遺伝子の発現レベルの測定は、mRNA発現レベルの測定により行われる。
プライマーまたはプローブは、各遺伝子によりコードされるmRNA配列の一部に相補的な配列を含むか、前記配列からなりうる。プライマーまたはプローブは、例えば、10~50ヌクレオチド、15~35ヌクレオチド、または20~30ヌクレオチドでありうる。一実施形態において、プライマーまたはプローブは、各遺伝子によりコードされるmRNA配列の一部に相補的な10~50ヌクレオチド、15~35ヌクレオチド、または20~30ヌクレオチドの配列を含むか、前記配列からなる。一実施形態において、プライマーまたはプローブは、配列番号1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、および37から選択されるいずれかの配列の一部に相補的な10~50ヌクレオチド、15~35ヌクレオチド、または20~30ヌクレオチドの配列を含むか、前記配列からなる。
一実施形態において、遺伝子の発現レベルは、各遺伝子に特異的なプライマーを用いたPCRにより測定される。PCRは、各遺伝子に対する反応を別々の容器で行ってもよく、複数の遺伝子に対する反応を1つの容器で行ってもよい。当業者は好適なPCR条件を適宜設定することができる。
大腸は結腸および直腸に分けられ、大腸がんには結腸がんおよび直腸がんが含まれる。大腸がんは、進行の程度により、0、I、II、III、およびIVのステージに分けられる。本開示における大腸がんにはいずれのステージの大腸がんも含まれる。一実施形態において、大腸がん患者は、ステージI、II、III、またはIVの患者である。一実施形態において、大腸がん患者は、ステージII、III、またはIVの患者である。一実施形態において、大腸がん患者は、ステージIIIまたはIVの患者である。
がん試料は、患者の大腸がん組織における遺伝子発現レベルを調べることができるものであればよい。がん試料は、例えば、手術試料、バイオプシー試料、またはがんスフェロイドでありうる。一実施形態において、手術試料は、原発巣切除時の手術試料である。本明細書において、がんスフェロイドとは、腫瘍始原細胞(tumor initiating cell)を含む細胞塊を意味し、腫瘍始原細胞とは免疫不全動物に移植すると腫瘍を形成する細胞を意味する。がんスフェロイドは、患者のがん細胞または組織から作成される。がんスフェロイドはいずれの方法により作成してもよく、例えば国際公開第2019/111998号公報に記載の方法により作成することができる。
一実施形態において、本開示の方法は、患者における各遺伝子の発現レベルから、各遺伝子のZスコア(Z)を、式(I):
(式中、xは前記患者の当該遺伝子の発現レベルであり、μおよびσはそれぞれ、複数の大腸がん患者の当該遺伝子の発現レベルの平均および標準偏差である)
により求めること、
各遺伝子群の遺伝子発現シグネチュアスコアを決定すること、および
前記遺伝子発現シグネチュアスコアをカットオフ値と比較すること
を含む。
により求めること、
各遺伝子群の遺伝子発現シグネチュアスコアを決定すること、および
前記遺伝子発現シグネチュアスコアをカットオフ値と比較すること
を含む。
μおよびσは、複数の大腸がん患者の当該遺伝子の発現レベルの平均および標準偏差であり、遺伝子ごとに事前に決定された値である。μおよびσの値は、例えば、患者の遺伝子発現レベルの測定に用いる方法と同じ方法で測定された複数の大腸がん患者の遺伝子発現レベルから決定することができる。あるいは、μおよびσの値は、データベースに登録された複数の大腸がん患者の遺伝子発現データに基づき決定することができる。利用可能なデータベースとしては、TCGA-CRC(The Cancer Genome Atlas)(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)、National Center for Biotechnology Information(NCBI)(https://www.ncbi.nlm.nih.gov/geo/)のGene Expression Omnibus(GEO)のGSE39582などが挙げられる。μおよびσの値は、複数の大腸がん患者のがんスフェロイドの遺伝子発現データに基づき決定することもできる。複数の大腸がん患者は、例えば50~1000、50~500、50~200、または50~100例でありうるが、これらに限定されない。当業者は必要な症例数を適宜決定することができ、症例数が増加した際に(例えば、症例数が倍加するごとに)μおよびσの値を補正することもできる。Zスコアの算出に用いる遺伝子発現レベルは、各遺伝子の発現レベルが反映される値であればよく、測定値であっても相対値であっても、これらの対数であってもよく、また適宜補正または標準化された値であってもよい。
遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子の発現レベルを示す値であり、当該遺伝子群の遺伝子のZスコアの合計、または当該遺伝子群の遺伝子のZスコアの平均値である。例えば、遺伝子群(a)(ラッキー5シグネチュア)の遺伝子発現シグネチュアスコアは、MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16の5種類の遺伝子のZスコアを足し合わせることにより、またはこれら遺伝子のZスコアを足し合わせた値をその遺伝子数である5で割ることにより、決定することができる。一実施形態において、遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子のZスコアの平均値である。
遺伝子発現シグネチュアスコアは、カットオフ値と比較される。カットオフ値は、予後が判明している複数の大腸がん患者を予後良好群と予後不良群とに統計的有意差をもって分けることができる遺伝子発現シグネチュアスコアの値である。カットオフ値は、例えば、カプラン-マイヤー法による生存曲線において複数の大腸がん患者を予後良好群と予後不良群とにわけたときにP値が最小となる値とすることができる。予後良好群と予後不良群との間の統計的有意差は、例えばlogrank検定により決定することができる。
遺伝子発現シグネチュアスコアは、複数のカットオフ値と比較してもよい。例えば、予後が判明している複数の大腸がん患者において、各患者の予後を3段階以上にランク付けし、各ランクの群を統計学的有意差をもって分けることができる2またはそれ以上の遺伝子発現シグネチュアスコアをカットオフ値としてもよい。統計的有意差は、例えばlogrank検定により決定することができる。あるいは、カットオフ値は、複数の大腸がん患者を遺伝子発現シグネチュアスコアの順に一定の割合で区切ることができる複数の値であってもよく、例えば、複数の大腸がん患者の遺伝子発現シグネチュアスコアの四分位数であってもよい。複数のカットオフ値との比較により、大腸がん患者を予後に応じて層別化することができる。
遺伝子発現シグネチュアスコアとカットオフ値との比較は、統計学解析を含んでも、含まなくてもよい。統計学的解析方法としては、一元配置分散分析(one-way ANOVA)、二元配置分散分析(two-way ANOVA)、ダネットの検定(Dunnett's test)、テューキーの検定(Tukey's test)などが挙げられる。
遺伝子群(a)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(a)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後良好であると予測される。
遺伝子群(b)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(b)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後良好であると予測される。
遺伝子群(c)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(c)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後不良であると予測される。
遺伝子群(d)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(d)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後不良であると予測される。
遺伝子群(e)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(e)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後不良であると予測される。
一実施形態において、本開示の方法は、遺伝子群(a)~(e)から選択される2つの遺伝子群の遺伝子の発現レベルを測定することを含む。一実施形態において、本開示の方法は、遺伝子群(a)~(e)から選択される3つの遺伝子群の遺伝子の発現レベルを測定することを含む。一実施形態において、本開示の方法は、遺伝子群(a)~(e)から選択される4つの遺伝子群の遺伝子の発現レベルを測定することを含む。一実施形態において、本開示の方法は、遺伝子群(a)~(e)から選択される5つの遺伝子群の遺伝子の発現レベルを測定することを含む。
一実施形態において、本開示の方法は、
遺伝子群(a)~(e)の遺伝子群の遺伝子の発現レベルを測定すること、
大腸がん総合シグネチュア(GCS)スコアを、式(II):
(式中、
は予後の極性を示す係数であり、ここで遺伝子群(a)~(b)の係数は1であり、遺伝子群(c)~(e)の係数は-1であり、
は、各遺伝子群の遺伝子のZスコアの平均値である)
により求めること、および
前記GCSスコアをカットオフ値と比較すること
を含む。
遺伝子群(a)~(e)の遺伝子群の遺伝子の発現レベルを測定すること、
大腸がん総合シグネチュア(GCS)スコアを、式(II):
により求めること、および
前記GCSスコアをカットオフ値と比較すること
を含む。
GCSスコアは、遺伝子群(a)~(e)の5種類のシグネチュアを統合した総合的なシグネチュアである。
は、各遺伝子群(すなわち各遺伝子シグネチュア)の予後の極性を示す係数である。予後良好と相関する遺伝子群(a)~(b)の係数は1であり、予後不良と相関する遺伝子群(c)~(e)の係数は-1である。
は、各遺伝子群の遺伝子のZスコアの平均値であり、各遺伝子群の遺伝子のZスコアの足し合わせ、遺伝子の数で割ることで求められる。すなわち、GCSスコアは、遺伝子群(a)~(e)について、各遺伝子群の遺伝子のZスコアの平均値に予後の極性を示す係数を乗じた値を求め、これらを足し合わせることで求められる。
GCSスコアは、カットオフ値と比較される。カットオフ値は、予後が判明している複数の大腸がん患者を予後良好群と予後不良群とに統計的有意差をもって分けることができるGCSスコアの値である。カットオフ値は、例えば、カプラン-マイヤー法による生存曲線において複数の大腸がん患者を予後良好群と予後不良群とにわけたときにP値が最小となる値とすることができる。予後良好群と予後不良群との間の統計的有意差は、例えばlogrank検定により決定することができる。大腸がん総合スコアがカットオフ値より高い場合、患者は予後良好であると予測される。
GCSスコアは、複数のカットオフ値と比較してもよい。例えば、予後が判明している複数の大腸がん患者において、各患者の予後を3段階以上にランク付けし、各ランクの群を統計学的有意差をもって分けることができる2またはそれ以上の大腸がん総合スコアをカットオフ値としてもよい。統計的有意差は、例えばlogrank検定により決定することができる。あるいは、カットオフ値は、複数の大腸がん患者をGCSスコアの順に一定の割合で区切ることができる複数の値であってもよく、例えば、複数の大腸がん患者の大腸がん総合スコアの四分位数であってもよい。複数のカットオフ値との比較により、大腸がん患者を予後に応じて層別化することができる。
GCSスコアとカットオフ値との比較は、統計学解析を含んでも、含まなくてもよい。統計学的解析方法としては、一元配置分散分析(one-way ANOVA)、2元配置分散分析(two-way ANOVA)、ダネットの検定(Dunnett's test)、テューキーの検定(Tukey's test)などが挙げられる。
大腸がんは治療ガイドラインにステージごとの治療方針が定められており、例えば、ステージIIは原則化学療法の対象外だが、本開示の方法により予後不良と予測されれば化学療法を行う、といった治療選択が可能である。また、ステージIIIは原則化学療法を行うよう定められているが、本開示の方法により予後良好と予測されれば化学療法を行わないか、副作用の少ない薬剤を使用する、予後不良と予測されれば作用の強い薬剤を使用する、などの治療選択が可能である。すなわち、本開示の予後予測方法は治療方法の最適化に貢献する。
このように、本開示の方法により予後を予測された大腸がん患者は、予測結果に基づき選択した治療薬または治療法で処置されうる。それゆえ、本開示は、一態様において、大腸がん患者の治療方法であって、本開示の予後予測方法により大腸がん患者の予後を予測すること、および予測結果に基づき選択した治療薬または治療法を前記患者に施すことを含む方法を提供する。治療薬としては、5-フルオロウラシル(5-FU)、テガフール、テガフール-ウラシル(UFT)、ドキシフルリジン(5’-DFUR)、カルモフール、テガフール-ギメラシル-オテラシルカリウム(S-1)、カペシタビン(Cape)、レゴラフェニブ、トリフルリジン-チピラシル塩酸塩(FTD/TPI)、マイトマイシンC、イリノテカン(IRI)、オキサリプラチン(OX)などの抗がん剤、および血管内皮細胞増殖因子(VEGF)阻害薬(例えば、ベバシズマブ、アフリベルセプト)、血管内皮細胞増殖因子受容体(VEGFR)阻害薬(例えば、ラムシルマブ)、FGFR阻害薬(例えば、エルダフィチニブ、ロガラチニブ、AZD4547、インフィグラチニブ、フィソガチニブ、LY2874455、フチバチニブ、ASP5878、デラザンチニブ)、EGFR阻害薬(例えば、セツキシマブ、パニツムマブ、エルロチニブ)などの分子標的薬が挙げられる。治療法としては、FOLFOX療法(点滴5-FU+レボホリナート+OX)、FOLFIRI療法(5-FU+レボホリナート+IRI)、FOLFOXIRI療法(5-FU+レボホリナート+OX+IRI)、CapeOX療法(Cape+OX)、SOX療法(S-1+OX)、IRIS療法(S-1+IRI)などの化学療法、内視鏡的切除、外科的切除、放射線療法が挙げられる。
一態様において、本開示は、大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含むキットに関する。
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含むキットに関する。
試薬は、本開示の予後予測方法に関して記載されるように、各遺伝子によりコードされるmRNA配列またはアミノ酸配列に基づき作製または選択することができる。一実施形態において、試薬は、プライマーまたはプローブである。一実施形態において、試薬は、PCR用プライマーである。キットは、試薬に加え、測定用容器、緩衝液、使用説明書などを含んでもよい。
本開示の例示的実施形態を以下に記載する。
[1]
大腸がん患者の予後を予測するための方法であって、患者のがん試料における遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびSPINK1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む、方法。
[2]
各遺伝子のZスコア(Z)を、式(I):
(式中、xは前記患者の当該遺伝子の発現レベルであり、μおよびσはそれぞれ、複数の大腸がん患者の当該遺伝子の発現レベルの平均および標準偏差である)
により求めること、
各遺伝子群の遺伝子発現シグネチュアスコアを決定すること、ここで、各遺伝子群の遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子のZスコアの合計、または各遺伝子群の遺伝子のZスコアの平均値である、および
前記遺伝子発現シグネチュアスコアをカットオフ値と比較すること
をさらに含む、前記1に記載の方法。
[3]
各遺伝子群の遺伝子発現シグネチュアスコアが、各遺伝子群の遺伝子のZスコアの平均値である、前記2に記載の方法。
[4]
遺伝子群(a)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、前記2または3のいずれかに記載の方法。
[5]
遺伝子群(b)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、前記2~4のいずれかに記載の方法。
[6]
遺伝子群(c)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~5のいずれかに記載の方法。
[7]
遺伝子群(d)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~6のいずれかに記載の方法。
[8]
遺伝子群(e)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~7のいずれかに記載の方法。
[9]
1以上の遺伝子群が、遺伝子群(a)~(e)である、前記1~8のいずれかに記載の方法。
[10]
1以上の遺伝子群が、遺伝子群(a)~(e)である、および、
大腸がん総合シグネチュア(GCS)スコアを、式(II):
(式中、
は予後の極性を示す係数であり、ここで遺伝子群(a)~(b)の係数は1であり、遺伝子群(c)~(e)の係数は-1であり、
は、各遺伝子群の遺伝子のZスコアの平均値である)
により決定すること、および
前記GCSスコアををカットオフ値と比較すること
をさらに含む、前記1に記載の方法。
[11]
がん試料が、手術試料またはバイオプシー試料である、前記1~10のいずれかに記載の方法。
[12]
がん試料が、がんスフェロイドである、前記1~10のいずれかに記載の方法。
[1]
大腸がん患者の予後を予測するための方法であって、患者のがん試料における遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびSPINK1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む、方法。
[2]
各遺伝子のZスコア(Z)を、式(I):
により求めること、
各遺伝子群の遺伝子発現シグネチュアスコアを決定すること、ここで、各遺伝子群の遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子のZスコアの合計、または各遺伝子群の遺伝子のZスコアの平均値である、および
前記遺伝子発現シグネチュアスコアをカットオフ値と比較すること
をさらに含む、前記1に記載の方法。
[3]
各遺伝子群の遺伝子発現シグネチュアスコアが、各遺伝子群の遺伝子のZスコアの平均値である、前記2に記載の方法。
[4]
遺伝子群(a)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、前記2または3のいずれかに記載の方法。
[5]
遺伝子群(b)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、前記2~4のいずれかに記載の方法。
[6]
遺伝子群(c)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~5のいずれかに記載の方法。
[7]
遺伝子群(d)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~6のいずれかに記載の方法。
[8]
遺伝子群(e)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~7のいずれかに記載の方法。
[9]
1以上の遺伝子群が、遺伝子群(a)~(e)である、前記1~8のいずれかに記載の方法。
[10]
1以上の遺伝子群が、遺伝子群(a)~(e)である、および、
大腸がん総合シグネチュア(GCS)スコアを、式(II):
により決定すること、および
前記GCSスコアををカットオフ値と比較すること
をさらに含む、前記1に記載の方法。
[11]
がん試料が、手術試料またはバイオプシー試料である、前記1~10のいずれかに記載の方法。
[12]
がん試料が、がんスフェロイドである、前記1~10のいずれかに記載の方法。
[13]
大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含む、キット。
[14]
1以上の遺伝子群が、遺伝子群(a)~(e)である、前記13に記載のキット。
[15]
試薬が、プライマーまたはプローブである、前記13または14に記載のキット。
大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含む、キット。
[14]
1以上の遺伝子群が、遺伝子群(a)~(e)である、前記13に記載のキット。
[15]
試薬が、プライマーまたはプローブである、前記13または14に記載のキット。
大腸がん患者の治療方法であって、
前記1~12のいずれかに記載の方法により大腸がん患者の予後を予測すること、および
予測結果に基づき選択した治療薬または治療法を前記患者に施すこと
を含む、方法。
前記1~12のいずれかに記載の方法により大腸がん患者の予後を予測すること、および
予測結果に基づき選択した治療薬または治療法を前記患者に施すこと
を含む、方法。
以下、本発明を実施例によりさらに説明するが、本発明は如何なる意味においても以下の実施例に限定されない。
1.材料と方法
ヒト標本
合計216個の腫瘍標本は2014年10月から2018年8月の間に京都大学附属病院(KUHP)で原発巣切除術を受けた合計208人の大腸癌患者から採取された。KUHPにおいて病理専門医による組織病理学的検査を通して、彼らの診断は高・中・低分化大腸がん、粘液大腸がん、乳頭状大腸がんのいずれかとして確認された。ヒト標本の研究プロトコルは日本国京都市の京都大学における医の倫理委員会に承認され(承認番号R0915およびR0857, 2015年から2024年まで)、標本の使用とそのデータ解析に関して患者は同意書を提出した。
ヒト標本
合計216個の腫瘍標本は2014年10月から2018年8月の間に京都大学附属病院(KUHP)で原発巣切除術を受けた合計208人の大腸癌患者から採取された。KUHPにおいて病理専門医による組織病理学的検査を通して、彼らの診断は高・中・低分化大腸がん、粘液大腸がん、乳頭状大腸がんのいずれかとして確認された。ヒト標本の研究プロトコルは日本国京都市の京都大学における医の倫理委員会に承認され(承認番号R0915およびR0857, 2015年から2024年まで)、標本の使用とそのデータ解析に関して患者は同意書を提出した。
患者由来CRC-SCのスフェロイドとしての分離と培養
方法は以前に記述した {Miyoshi et al., 2018}。手短に言えば、2片の腫瘍組織片(それぞれ 約1 cm3)を大腸がん病変の隆起部位から、1片の正常粘膜組織片(約1 cm2)をその周辺の正常大腸組織から、それぞれ採取した。それら組織片は氷冷の洗浄用培地 [HEPESとL-グルタミン入りDMEM/F12(Nacalai tesque, Kyoto, Japan)に100 units/ml ペニシリン(Nacalai tesque)、0.1 mg/ml ストレプトマイシン(Nacalai tesque)、および10% 仔牛血清(Sigma)が含まれている] に入れて研究室に移送された。組織は術後24時間以内に処理された。大腸がん摘出標本の組織片と正常大腸粘膜の試料は60 mm ペトリ皿上でハサミを用いてそれぞれ別個に細かく刻まれた。それぞれの標本は2 mlのコラーゲナーゼ溶液 [0.2% collagenase type I(Thermo Fisher Scientific, Waltham, MA, USA)と50 μg/ml ゲンタマイシン(Thermo Fisher)を添加した洗浄用培地] 中で37℃で40-60分間消化され、細胞はピペッティングにより分離された。その後、CRC細胞とNCE細胞は直径100 μmのセルストレイナー(Corning Inc., Corning, NY)で一度濾過され、遠心法で回収された。それから単離された細胞はマトリゲル(Corning)内に懸濁され、12ウェル細胞培養プレート(TPP, Trasadingen, Switzerland)のそれぞれのウェルの中心に載せられた(1ウェルあたり30 μlずつ)。37℃でのマトリゲルのゲル化の後、ペニシリン(100 units/ml, Nacalai tesque)、ストレプトマイシン(0.1 mg/ml, Nacalai tesque)、L-グルタミン(2 mM)、Y27632(10 μM)、SB431542(1 μM)、EGF(50 ng/ml, Peprotech)、塩基性FGF(100 ng/ml Peprotech)を添加したAdvanced DMEM/F12(Thermo Fisher)中で、5% CO2の中で37℃で細胞を培養した。NCE-SC細胞は過去に記載したようにeL-WRN培地で培養した {Miyoshi et al., 2018}。
方法は以前に記述した {Miyoshi et al., 2018}。手短に言えば、2片の腫瘍組織片(それぞれ 約1 cm3)を大腸がん病変の隆起部位から、1片の正常粘膜組織片(約1 cm2)をその周辺の正常大腸組織から、それぞれ採取した。それら組織片は氷冷の洗浄用培地 [HEPESとL-グルタミン入りDMEM/F12(Nacalai tesque, Kyoto, Japan)に100 units/ml ペニシリン(Nacalai tesque)、0.1 mg/ml ストレプトマイシン(Nacalai tesque)、および10% 仔牛血清(Sigma)が含まれている] に入れて研究室に移送された。組織は術後24時間以内に処理された。大腸がん摘出標本の組織片と正常大腸粘膜の試料は60 mm ペトリ皿上でハサミを用いてそれぞれ別個に細かく刻まれた。それぞれの標本は2 mlのコラーゲナーゼ溶液 [0.2% collagenase type I(Thermo Fisher Scientific, Waltham, MA, USA)と50 μg/ml ゲンタマイシン(Thermo Fisher)を添加した洗浄用培地] 中で37℃で40-60分間消化され、細胞はピペッティングにより分離された。その後、CRC細胞とNCE細胞は直径100 μmのセルストレイナー(Corning Inc., Corning, NY)で一度濾過され、遠心法で回収された。それから単離された細胞はマトリゲル(Corning)内に懸濁され、12ウェル細胞培養プレート(TPP, Trasadingen, Switzerland)のそれぞれのウェルの中心に載せられた(1ウェルあたり30 μlずつ)。37℃でのマトリゲルのゲル化の後、ペニシリン(100 units/ml, Nacalai tesque)、ストレプトマイシン(0.1 mg/ml, Nacalai tesque)、L-グルタミン(2 mM)、Y27632(10 μM)、SB431542(1 μM)、EGF(50 ng/ml, Peprotech)、塩基性FGF(100 ng/ml Peprotech)を添加したAdvanced DMEM/F12(Thermo Fisher)中で、5% CO2の中で37℃で細胞を培養した。NCE-SC細胞は過去に記載したようにeL-WRN培地で培養した {Miyoshi et al., 2018}。
RNA sequencing解析
以前報告された方法を用いて {Yamamoto, Miyoshi et al. 2020, Kitano, Yamamoto et al. 2022}、NCE-SCスフェロイド株(GSE189212)のRNA sequencing(RNA-seq)解析はマクロジェン社(Seoul, Korea)により行われた。手短に言えば、合成されたライブラリーはIllumina HighSeq 2000 sequencerを用いて、1サンプルあたり約4000万リードの深さで両端からシーケンスされた(2 × 100 bases)。シーケンスリードはHISAT2プログラムによりhg19レファレンスゲノムにマップされ {Kim, Langmead et al. 2015, Kim, Paggi et al. 2019}、転写産物はStringTieプログラムを用いて統合した {Pertea, Pertea et al. 2015}。リード数はfeatureCountsプログラムを用いて決定した {Liao, Smyth et al. 2014}。
以前報告された方法を用いて {Yamamoto, Miyoshi et al. 2020, Kitano, Yamamoto et al. 2022}、NCE-SCスフェロイド株(GSE189212)のRNA sequencing(RNA-seq)解析はマクロジェン社(Seoul, Korea)により行われた。手短に言えば、合成されたライブラリーはIllumina HighSeq 2000 sequencerを用いて、1サンプルあたり約4000万リードの深さで両端からシーケンスされた(2 × 100 bases)。シーケンスリードはHISAT2プログラムによりhg19レファレンスゲノムにマップされ {Kim, Langmead et al. 2015, Kim, Paggi et al. 2019}、転写産物はStringTieプログラムを用いて統合した {Pertea, Pertea et al. 2015}。リード数はfeatureCountsプログラムを用いて決定した {Liao, Smyth et al. 2014}。
ヒト大腸癌データセットのデータベース解析
我々はHuman Protein Atlas {Uhlen et al., 2017} version 21.0とEnsembl version 103.38.(https://www.proteinatlas.org/about/download)を基に作成されたFPKM(fragments per kilobase of exon per million reads mapped)を用いてTCGA-CRC {TCGA Network, 2012}(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)のRNA-seqデータと臨床データを利用するとともに、cBioportal {Cerami et al., 2012}(https://www.cbioportal.org/datasets)に掲載されているRSEM(RNA-Seq by Expectation Maximization)を用いて正規化されたTCGA-CRCのRNA-seqデータと臨床データを利用した。我々はNational Center for Biotechnology Information(NCBI)(https://www.ncbi.nlm.nih.gov/geo/)のGene Expression Omnibus(GEO)からGSE39582 {Marisa et al. 2013}のマイクロアレイデータと臨床データを収集した。
我々はHuman Protein Atlas {Uhlen et al., 2017} version 21.0とEnsembl version 103.38.(https://www.proteinatlas.org/about/download)を基に作成されたFPKM(fragments per kilobase of exon per million reads mapped)を用いてTCGA-CRC {TCGA Network, 2012}(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)のRNA-seqデータと臨床データを利用するとともに、cBioportal {Cerami et al., 2012}(https://www.cbioportal.org/datasets)に掲載されているRSEM(RNA-Seq by Expectation Maximization)を用いて正規化されたTCGA-CRCのRNA-seqデータと臨床データを利用した。我々はNational Center for Biotechnology Information(NCBI)(https://www.ncbi.nlm.nih.gov/geo/)のGene Expression Omnibus(GEO)からGSE39582 {Marisa et al. 2013}のマイクロアレイデータと臨床データを収集した。
RNA-seqデータの対数変換
本研究では最初FPKMのデータ値を用いて、全ての統計計算を行った後、RSEMのデータでも、最後に再確認を行った。FPKMデータの計算では以前報告された方法を用いて、生のRNA-seqの発現レベルを対数的(log2)に縮尺した。その際にLog2(0)は定義できないので、FPKMに0.1を加えた後に対数変換した: Log2(FPKM+0.1) {Reinhold et al., 2019}。一方、RSEMにより出力されたデータは0.1を加えても負の値を取る遺伝子群が存在したので、以前報告されているように {Jones et al., 2019} 出力値に1を加えた後に対数変換し、全てを正の値とした:Log2(RSEM+1)。TCGA-CRCの大腸がん患者におけるGCSに関してはLog2(FPKM+0.1)とLog2(RSEM+1)のどちらを用いても同様な結果が得られることを確認した(データ表示せず)。
本研究では最初FPKMのデータ値を用いて、全ての統計計算を行った後、RSEMのデータでも、最後に再確認を行った。FPKMデータの計算では以前報告された方法を用いて、生のRNA-seqの発現レベルを対数的(log2)に縮尺した。その際にLog2(0)は定義できないので、FPKMに0.1を加えた後に対数変換した: Log2(FPKM+0.1) {Reinhold et al., 2019}。一方、RSEMにより出力されたデータは0.1を加えても負の値を取る遺伝子群が存在したので、以前報告されているように {Jones et al., 2019} 出力値に1を加えた後に対数変換し、全てを正の値とした:Log2(RSEM+1)。TCGA-CRCの大腸がん患者におけるGCSに関してはLog2(FPKM+0.1)とLog2(RSEM+1)のどちらを用いても同様な結果が得られることを確認した(データ表示せず)。
マイクロアレイ解析
NCE-SCまたはCRC-SCは上記のとおり培養した。培地の吸引後、溶解緩衝液(TaKaRa Bio, Kusatsu, Japan)をスフェロイド培養の各ウェルに直接加えた。NCE-SCとCRC-SCスフェロイド株の総RNAはNucleoSpin RNA II kit(TaKaRa Bio)を用いて、製造元のプロトコルにしたがって準備された。マイクロアレイ解析はMacrogen Inc.(Seoul, Republic of Korea)によって行われた。手短に言えば、RNA標識とハイブリダイゼーションはAgilent One-Color Microarray-Based Gene Expression Analysis protocol(Agilent Technology, V 6.5, 2010)を用いて行われ、それは高いダイナミックレンジを示した。それぞれの標本由来の100 ngの総RNAを線型に増幅し、Cy3-dCTPで標識した。標識されたcRNAはRNAeasy Mini Kit(Qiagen)を用いて精製した。標識されたcRNA調製液(pmol Cy3/μg cRNA)の濃度と比活性はNanoDrop ND-1000(NanoDrop, Wilmington, DE, USA)で測定した。標識されたそれぞれのcRNAの試料(600 ng)は、5 μl 10x blocking agent と1 μl 25x fragmentation buffer で断片化し、それから60℃で30分間加熱した。最後に25 μlの2x GE hybridization buffer を加え、標識されたcRNAを希釈した。40 μlのハイブリダイゼーション溶液をガスケットスライド内に注ぎ、Agilent SurePrint G3 Human GE 8x 60K, V3 Microarrays(Agilent)の上にロードした。スライドはAgilent hybridization oven 内で65℃で17時間保温し、それからAgilent One-Color Microarray-Based Gene Expression Analysis プロトコル(Agilent Technology, V 6.5, 2010)を用いて常温で洗浄した。ハイブリダイズしたアレイスライドはAgilent Microarray Scanner D(Agilent Technologies, Inc.)で直ちにスキャンした。生データはAgilent Feature Extraction ソフトウェア(v11.0.1.1)を用いて抽出した。アレイスライド上の各遺伝子プローブに関する発現データを出力する未加工データのテキストファイルを作成するために、同一遺伝子に関する未加工データをAgilent feature extraction プロトコルを用いて自動的にまとめた。gProcessedSignal値をlog変換し、quantile法で正規化した。発現データの統計的有意性はFalse Discovery Rate(q < 0.1)と倍率変化(FC > 2)を用いて決定した。データ解析はR3.0.2(www.r-project.org)、GraphPad Prismソフトウェア(Dotmatics, San Diego, USA)とMicrosoft Excelソフトウェア(Microsoft, Tokyo, Japan)を用いて行なった。
NCE-SCまたはCRC-SCは上記のとおり培養した。培地の吸引後、溶解緩衝液(TaKaRa Bio, Kusatsu, Japan)をスフェロイド培養の各ウェルに直接加えた。NCE-SCとCRC-SCスフェロイド株の総RNAはNucleoSpin RNA II kit(TaKaRa Bio)を用いて、製造元のプロトコルにしたがって準備された。マイクロアレイ解析はMacrogen Inc.(Seoul, Republic of Korea)によって行われた。手短に言えば、RNA標識とハイブリダイゼーションはAgilent One-Color Microarray-Based Gene Expression Analysis protocol(Agilent Technology, V 6.5, 2010)を用いて行われ、それは高いダイナミックレンジを示した。それぞれの標本由来の100 ngの総RNAを線型に増幅し、Cy3-dCTPで標識した。標識されたcRNAはRNAeasy Mini Kit(Qiagen)を用いて精製した。標識されたcRNA調製液(pmol Cy3/μg cRNA)の濃度と比活性はNanoDrop ND-1000(NanoDrop, Wilmington, DE, USA)で測定した。標識されたそれぞれのcRNAの試料(600 ng)は、5 μl 10x blocking agent と1 μl 25x fragmentation buffer で断片化し、それから60℃で30分間加熱した。最後に25 μlの2x GE hybridization buffer を加え、標識されたcRNAを希釈した。40 μlのハイブリダイゼーション溶液をガスケットスライド内に注ぎ、Agilent SurePrint G3 Human GE 8x 60K, V3 Microarrays(Agilent)の上にロードした。スライドはAgilent hybridization oven 内で65℃で17時間保温し、それからAgilent One-Color Microarray-Based Gene Expression Analysis プロトコル(Agilent Technology, V 6.5, 2010)を用いて常温で洗浄した。ハイブリダイズしたアレイスライドはAgilent Microarray Scanner D(Agilent Technologies, Inc.)で直ちにスキャンした。生データはAgilent Feature Extraction ソフトウェア(v11.0.1.1)を用いて抽出した。アレイスライド上の各遺伝子プローブに関する発現データを出力する未加工データのテキストファイルを作成するために、同一遺伝子に関する未加工データをAgilent feature extraction プロトコルを用いて自動的にまとめた。gProcessedSignal値をlog変換し、quantile法で正規化した。発現データの統計的有意性はFalse Discovery Rate(q < 0.1)と倍率変化(FC > 2)を用いて決定した。データ解析はR3.0.2(www.r-project.org)、GraphPad Prismソフトウェア(Dotmatics, San Diego, USA)とMicrosoft Excelソフトウェア(Microsoft, Tokyo, Japan)を用いて行なった。
リード遺伝子とその関連遺伝子
我々はCRC-SC株においてmRNA発現が極端に変動する遺伝子(SD > 6.5)を見出した。そのような遺伝子の中でも、異なる染色体にコードされ、独立に調節されている5つのリード遺伝子を選択した。つまりそれらの発現レベルは相互に相関しなかった(スピアマン相関係数 |r| < 0.5)。我々はCRC-SC株を、リード遺伝子の発現に関して5つのリード遺伝子サブグループと、未分類サブグループを含めて、計6つのサブグループに分類した。そして、発現が特定のリード遺伝子mRNA種のレベルと相関する12個のリード遺伝子関連遺伝子を同定した。また、大腸がん患者の生存期間を調べた。
我々はCRC-SC株においてmRNA発現が極端に変動する遺伝子(SD > 6.5)を見出した。そのような遺伝子の中でも、異なる染色体にコードされ、独立に調節されている5つのリード遺伝子を選択した。つまりそれらの発現レベルは相互に相関しなかった(スピアマン相関係数 |r| < 0.5)。我々はCRC-SC株を、リード遺伝子の発現に関して5つのリード遺伝子サブグループと、未分類サブグループを含めて、計6つのサブグループに分類した。そして、発現が特定のリード遺伝子mRNA種のレベルと相関する12個のリード遺伝子関連遺伝子を同定した。また、大腸がん患者の生存期間を調べた。
遺伝子発現シグネチュアスコア
遺伝子発現シグネチュアスコアは過去に報告されたように算出した {Jackstadt et al., 2019}。最初に次の式に依ってデータセット内のi番目の患者でj番目の特定の遺伝子に関するZスコアZijを計算した。
ここで、Xij(大文字)は各患者腫瘍のlog2変換後のmRNAの発現レベルの対数値を示す。GSE39582のデータはマイクロアレイによる測定データであり、当初からlog2値で表示されているのに対し、今回用いたTCGA-CRCのデータはRNA-seqデータなので、対数変換していない値が表示されている。そこで、TCGA-CRCのRNA-seqデータの場合には以下の式を用いてlog2変換すると同時に定数を加えた。
ここで、xij(小文字)はi番目の患者データ(RNA-seqで測定されたmRNA量)のj番目遺伝子のmRNAレベルを示し、定数αはFPKM(遺伝子の長さの違いを考慮し断片数を補正するように正規化されたデータ)の時は0.1、RSEMの場合は1を用いた。log2変換時に定数を加算するこの操作は、log2変換した際に数値が負になる場合があるため行うもので、全ての変換値が正になるように加えるルーティンの方法であり、cBioportalに標準手順として推奨されている(https://docs.cbioportal.org/5.1-data-loading/data-loading/file-formats/z-score-normalization-script)。FPKMとRSEMでは正規化の方法などが異なることにより定数値を調整した。
μjおよびσjはそれぞれ、個々のデータセットのj番目遺伝子の発現レベルの対数値の平均と標準偏差を示す。μjおよびσjはそれぞれ次の式で計算した。
ここで、Nはそのデータセットの患者数を示す。
カットオフ値のスコアは結果的に統計のP値が最小となるようにした。
遺伝子発現シグネチュアスコアは過去に報告されたように算出した {Jackstadt et al., 2019}。最初に次の式に依ってデータセット内のi番目の患者でj番目の特定の遺伝子に関するZスコアZijを計算した。
μjおよびσjはそれぞれ、個々のデータセットのj番目遺伝子の発現レベルの対数値の平均と標準偏差を示す。μjおよびσjはそれぞれ次の式で計算した。
カットオフ値のスコアは結果的に統計のP値が最小となるようにした。
遺伝子発現シグネチュアスコアは、次の式で求められる平均Zスコアとした。
すなわち、ラッキー5の遺伝子発現シグネチュアスコアは5個のj番目遺伝子のZスコアを、リード遺伝子のそれはリード遺伝子とそのサブグループ内で発現相関するj番目遺伝子のZスコアを加算した後、遺伝子数(m)(即ち、ラッキー5は5、リード遺伝子シグネチュアは3~4)で割ることで求めた。
これらのシグネチュアに関して全生存期間(OS)、疾患特異的生存期間(DSS)、無増悪生存期間(PFS)、無再発生存期間(RFS)を調べるため、TCGA-CRC、GSE39582データベースの大腸がん患者をシグネチュアスコアの高値群と低値群に振り分けた。カットオフ値のスコアは結果的に統計のP値が最小となるようにした。
これらのシグネチュアに関して全生存期間(OS)、疾患特異的生存期間(DSS)、無増悪生存期間(PFS)、無再発生存期間(RFS)を調べるため、TCGA-CRC、GSE39582データベースの大腸がん患者をシグネチュアスコアの高値群と低値群に振り分けた。カットオフ値のスコアは結果的に統計のP値が最小となるようにした。
大腸がん総合シグネチュア(General Colorectal Cancer Score, GCS)スコア
個々の平均Zスコアに正または負の予後予測係数を乗じて加算し、GCSスコアを得た。
ここで、
は予後の極性を示す係数(予後良好は+1、予後不良は-1)であり、
は、各シグネチュアのZスコアの平均値である。すなわち、ラッキー5サブグループでは5、DEFA6、CXCL14、およびIGF2のサブグループでは3、BST2およびMAGEA6のサブグループでは4というように、シグネチュアグループの遺伝子数で割ったZスコアである。
四分位解析では、大腸がん標本をGCSスコアに順じて4つの均等な部分集団に分け、カプランマイヤー法で解析した後にlogrank検定を行った。最も予後の悪い四分位グループを基準として、他の四分位グループに関して95%CIとHRをGraphPad Prismソフトウェアパッケージのマンテル-ヘンツェル法を用いて計算した。
個々の平均Zスコアに正または負の予後予測係数を乗じて加算し、GCSスコアを得た。
四分位解析では、大腸がん標本をGCSスコアに順じて4つの均等な部分集団に分け、カプランマイヤー法で解析した後にlogrank検定を行った。最も予後の悪い四分位グループを基準として、他の四分位グループに関して95%CIとHRをGraphPad Prismソフトウェアパッケージのマンテル-ヘンツェル法を用いて計算した。
遺伝子エンリッチメント解析
NCE-SCスフェロイド株(GSE189212)とNCE-SCオルガノイド株(GSE125472)の比較によって得られたFalse discovery rate 値(FDR値; q)と平均値(A)はTCC-GUI {Su et al., 2019} を用いて計算された。Differentially expressed genes(DEGs)はq < 0.1 且つ A > 1でフィルタリングされた。細胞型シグネチュア {Subramanian et al., 2005} を用いたエンリッチメント解析はMetascape {Zhou et al., 2019} で実行された。ホールマーク遺伝子セットを用いたGene Set Enrichment Analysis(GSEA)の方法は過去に説明されている {Subramanian et al., 2005}。
NCE-SCスフェロイド株(GSE189212)とNCE-SCオルガノイド株(GSE125472)の比較によって得られたFalse discovery rate 値(FDR値; q)と平均値(A)はTCC-GUI {Su et al., 2019} を用いて計算された。Differentially expressed genes(DEGs)はq < 0.1 且つ A > 1でフィルタリングされた。細胞型シグネチュア {Subramanian et al., 2005} を用いたエンリッチメント解析はMetascape {Zhou et al., 2019} で実行された。ホールマーク遺伝子セットを用いたGene Set Enrichment Analysis(GSEA)の方法は過去に説明されている {Subramanian et al., 2005}。
ホットスポット変異解析
マトリゲル内のスフェロイドはセル・リカバリー溶液(Corning)に懸濁され、1.5 mLチューブ内に集められた。マトリゲルは回転および混合しながら30分間4℃で溶解した。4℃の状態で、スフェロイドは5分間遠心し、PBSで2回洗浄した。スフェロイドのゲノムDNAはDNeasy Blood & Tissue Kit(Qiagen, Hilden, Germany)を用いて、製造元のプロトコルに従って精製した。CRC-SC株における50個または409個のがん関連遺伝子のホットスポット変異はMacrogen Inc.(Seoul, Republic of Korea)により検出された。シーケンスされた遺伝子と変異のリストは製造元ウェブサイトにて閲覧可能であった(https://tools.thermofisher.com/content/sfs/brochures/CO25560_Ion_AmpliSeq_Comprehensive_Cancer_Panel_Gene_List_final9062012.pdf)。データセットはIntegrative Genomics Viewer software(Broad Institute)を用いて解析した。
マトリゲル内のスフェロイドはセル・リカバリー溶液(Corning)に懸濁され、1.5 mLチューブ内に集められた。マトリゲルは回転および混合しながら30分間4℃で溶解した。4℃の状態で、スフェロイドは5分間遠心し、PBSで2回洗浄した。スフェロイドのゲノムDNAはDNeasy Blood & Tissue Kit(Qiagen, Hilden, Germany)を用いて、製造元のプロトコルに従って精製した。CRC-SC株における50個または409個のがん関連遺伝子のホットスポット変異はMacrogen Inc.(Seoul, Republic of Korea)により検出された。シーケンスされた遺伝子と変異のリストは製造元ウェブサイトにて閲覧可能であった(https://tools.thermofisher.com/content/sfs/brochures/CO25560_Ion_AmpliSeq_Comprehensive_Cancer_Panel_Gene_List_final9062012.pdf)。データセットはIntegrative Genomics Viewer software(Broad Institute)を用いて解析した。
k-means 解析
NCE-SC株と比較した時にCRC-SC株で高発現している遺伝子のうち、100個の最も変動した遺伝子に関してIntegrated Differential Expression and Pathway analysis v0.951 (iDEP.951) {Ge, Son et al. 2018} を用いた遺伝子のクラスター解析を行った。
NCE-SC株と比較した時にCRC-SC株で高発現している遺伝子のうち、100個の最も変動した遺伝子に関してIntegrated Differential Expression and Pathway analysis v0.951 (iDEP.951) {Ge, Son et al. 2018} を用いた遺伝子のクラスター解析を行った。
シングルセルRNA-seq(scRNA-seq)のライブラリーの準備、データ処理および品質の点検
scRNA-seqのライブラリー作製は、過去に記述されたように {Joanito, Wirapati et al. 2022} 株式会社Rhelixa(Tokyo, Japan)によって行われた。簡潔に述べると、新鮮な70N-NCE-SCを浮遊状態の単一細胞にして、1ウェルあたり5,000細胞を解析対象としたChromium system (10X Genomics)にロードした。バーコード化されたシークエンスライブラリーはChromium Single Cell 3’ v3.1 reagent Kit Dual (10X Genomics)を用いて作製された。そのライブラリーはIllumina NovaSeq 6000により十分に飽和するまでシークエンスされた。検出直後のシークエンスリードの配列情報は参照ゲノム hg38 に照合され、更にCellRanger v6.1.2 (10X Genomics)を用いて処理され、各細胞(ドロップレット)の各遺伝子に関してunique molecular identifier値(UMI値; 検出された単一のRNA分子の数を示すもの)の基盤の発現マトリックスが作製された。検出された遺伝子発現の数が2500個未満、6000個以上、もしくはミトコンドリアゲノムを15%より多く持つドロップレットは、それぞれ目的のものが入っていない、マルチプレットである、あるいは低品質/死細胞のドロップレットとして除外された。UMI値はSeurat 4.0 {Hao, Hao et al. 2021} のLogNormalize関数を用いて正規化され、結果的にそれぞれの細胞が総遺伝子に関して合計10,000 UMIになるように処理されるとともに、正規化された値は擬似カウントの1を付加された後にlog変換された。
scRNA-seqのライブラリー作製は、過去に記述されたように {Joanito, Wirapati et al. 2022} 株式会社Rhelixa(Tokyo, Japan)によって行われた。簡潔に述べると、新鮮な70N-NCE-SCを浮遊状態の単一細胞にして、1ウェルあたり5,000細胞を解析対象としたChromium system (10X Genomics)にロードした。バーコード化されたシークエンスライブラリーはChromium Single Cell 3’ v3.1 reagent Kit Dual (10X Genomics)を用いて作製された。そのライブラリーはIllumina NovaSeq 6000により十分に飽和するまでシークエンスされた。検出直後のシークエンスリードの配列情報は参照ゲノム hg38 に照合され、更にCellRanger v6.1.2 (10X Genomics)を用いて処理され、各細胞(ドロップレット)の各遺伝子に関してunique molecular identifier値(UMI値; 検出された単一のRNA分子の数を示すもの)の基盤の発現マトリックスが作製された。検出された遺伝子発現の数が2500個未満、6000個以上、もしくはミトコンドリアゲノムを15%より多く持つドロップレットは、それぞれ目的のものが入っていない、マルチプレットである、あるいは低品質/死細胞のドロップレットとして除外された。UMI値はSeurat 4.0 {Hao, Hao et al. 2021} のLogNormalize関数を用いて正規化され、結果的にそれぞれの細胞が総遺伝子に関して合計10,000 UMIになるように処理されるとともに、正規化された値は擬似カウントの1を付加された後にlog変換された。
監督なしクラスタリングを用いた次元削減解析
過去の報告で説明されたように {Wang, Dang et al. 2021}、監督なし細胞クラスタリング用の高度可変遺伝子群(highly variable genes)を同定するため、正規化済みのgene-cellマトリックスにSeurat 4.0 {Hao, Hao et al. 2021} を用いた。高度可変遺伝子を同定するため、細胞ごとの正規化済み発現カウント数の平均と分散の関係を算出することにSeuratパッケージ内のMeanVarPlot法を用いた。そこでは2000個の高度可変遺伝子群が選ばれた。SeuratのPCelbowPlot関数を用いてエルボープロットを作成し、そしてそれを基盤に有意な主成分の数を決定した。そして監督なしクラスタリング用に異なる解像度のパラメーターを試験し、最適なクラスター数を決定した。本研究では、Seuratによって同定された最初の10個の主成分と高度可変遺伝子群が解像度0.5の監督なしクラスタリングに用いられ、合計7群の細胞集団が示された。それらを可視化するために、Seurat関数のRunUMAPによるUMAP法を用いて次元を更に削減し、70N-NCE-SCの細胞集団がおおよそ単一の集団であることが示された(図2B、左)。その埋め込みを算出するのに用いられた主成分はクラスタリングに使われたものと同一のものである。マーカー遺伝子群に関する単一細胞のプロット(図2B、右)はSeurat関数のFindMarkersで色付けした。
過去の報告で説明されたように {Wang, Dang et al. 2021}、監督なし細胞クラスタリング用の高度可変遺伝子群(highly variable genes)を同定するため、正規化済みのgene-cellマトリックスにSeurat 4.0 {Hao, Hao et al. 2021} を用いた。高度可変遺伝子を同定するため、細胞ごとの正規化済み発現カウント数の平均と分散の関係を算出することにSeuratパッケージ内のMeanVarPlot法を用いた。そこでは2000個の高度可変遺伝子群が選ばれた。SeuratのPCelbowPlot関数を用いてエルボープロットを作成し、そしてそれを基盤に有意な主成分の数を決定した。そして監督なしクラスタリング用に異なる解像度のパラメーターを試験し、最適なクラスター数を決定した。本研究では、Seuratによって同定された最初の10個の主成分と高度可変遺伝子群が解像度0.5の監督なしクラスタリングに用いられ、合計7群の細胞集団が示された。それらを可視化するために、Seurat関数のRunUMAPによるUMAP法を用いて次元を更に削減し、70N-NCE-SCの細胞集団がおおよそ単一の集団であることが示された(図2B、左)。その埋め込みを算出するのに用いられた主成分はクラスタリングに使われたものと同一のものである。マーカー遺伝子群に関する単一細胞のプロット(図2B、右)はSeurat関数のFindMarkersで色付けした。
57症例のCRC-SC株のリード遺伝子サブタイプの割り当て
表2で計算されるように、57個のCRC-SC株のサブタイプは最も高発現したリード遺伝子により決定した。すなわち、図5Aの一番上の四角に示されるように、5つのリード遺伝子候補のうち一番高い値の一つをサブタイプの決定因子として用いた。リード遺伝子の倍率変化で70倍未満を示すCRC-SC株は分類されない「Others」に割り当てた。
表2で計算されるように、57個のCRC-SC株のサブタイプは最も高発現したリード遺伝子により決定した。すなわち、図5Aの一番上の四角に示されるように、5つのリード遺伝子候補のうち一番高い値の一つをサブタイプの決定因子として用いた。リード遺伝子の倍率変化で70倍未満を示すCRC-SC株は分類されない「Others」に割り当てた。
ラッキー5遺伝子の単離
我々は発見コホートとして、NCE-SCスフェロイド株に対するCRC-SCスフェロイド株のmRNA発現データを比較し、検証コホートとしてNCE-SCスフェロイドと比較した際にCRC-SCで最も発現の低いmRNAと患者生存との関係性を評価した。
発見コホートにおけるスクリーニング:19個の大腸がん転帰良好マーカー群の候補は、NCE-SC株のトランスクリプトームと比較してCRC-SC株のそれの倍率変化の順位が最下位20のマイクロアレイプローブで検出されたものであった。
検証コホートにおける1つ目の評価基準;TCGA-CRC-OS(n = 597)、TCGA-CRC-DSS(n = 545)、TCGA-CRC-PFS(n = 564)のデータセットにおける、19個の候補遺伝子の発現レベルに関する高値群と低値群との患者生存の比較において、logrank検定のP値が0.05以下であること。11個の遺伝子、CLCA4、ZG16、AQP8、CA2、CEACAM7、PIGR、SLC26A3、MUC12、NXPE4、SLC4A4、およびPLA2G2Aが基準を満たした。
検証コホートにおける2つ目の評価基準;GSE39582-OS(n = 556)およびGSE39582-RFS(n = 564)のデータセットにおける、11個の候補遺伝子の発現レベルに関する高値群と低値群との患者生存の比較において、logrank検定のP値が0.05以下であること。5個の遺伝子、ZG16、PIGR、MUC12、SLC4A4、およびPLA2G2Aがこの基準を満たした。
候補遺伝子の発現の閾値はmaximally selected logrank statistics(MSRS)を用いて設定された {Hothorn, Lausen et al. 2003}。
我々は発見コホートとして、NCE-SCスフェロイド株に対するCRC-SCスフェロイド株のmRNA発現データを比較し、検証コホートとしてNCE-SCスフェロイドと比較した際にCRC-SCで最も発現の低いmRNAと患者生存との関係性を評価した。
発見コホートにおけるスクリーニング:19個の大腸がん転帰良好マーカー群の候補は、NCE-SC株のトランスクリプトームと比較してCRC-SC株のそれの倍率変化の順位が最下位20のマイクロアレイプローブで検出されたものであった。
検証コホートにおける1つ目の評価基準;TCGA-CRC-OS(n = 597)、TCGA-CRC-DSS(n = 545)、TCGA-CRC-PFS(n = 564)のデータセットにおける、19個の候補遺伝子の発現レベルに関する高値群と低値群との患者生存の比較において、logrank検定のP値が0.05以下であること。11個の遺伝子、CLCA4、ZG16、AQP8、CA2、CEACAM7、PIGR、SLC26A3、MUC12、NXPE4、SLC4A4、およびPLA2G2Aが基準を満たした。
検証コホートにおける2つ目の評価基準;GSE39582-OS(n = 556)およびGSE39582-RFS(n = 564)のデータセットにおける、11個の候補遺伝子の発現レベルに関する高値群と低値群との患者生存の比較において、logrank検定のP値が0.05以下であること。5個の遺伝子、ZG16、PIGR、MUC12、SLC4A4、およびPLA2G2Aがこの基準を満たした。
候補遺伝子の発現の閾値はmaximally selected logrank statistics(MSRS)を用いて設定された {Hothorn, Lausen et al. 2003}。
患者由来スフェロイド同所移植(PDSOX)モデル
10週齢のNSGマウスはヒートマット(KN-475、夏目製作所)の上で、イソフルラン麻酔装置(NARCOBI-E、夏目製作所)を用いて麻酔をかけた。腹部の毛はバリカン(ER807PP-A、パナソニック)で剃毛した。剃毛された腹部を、80%エタノール(#699749、丸三産業)とポビドンヨード(#46026800、建栄製薬)で除菌した。その後、腹部を小動物用ドレープ(Cleyera)で覆った。滅菌済みのハサミ(大祐医科工業)で中央よりやや左側の腹部を切開した。腹腔内からリングピンセット(大祐医科工業)を用いて盲腸の端を引き出し、ドレープの上にのせた。この時点で、マウスの頭部が手前側、尾が奥側になるようにマウスの体の向きを調整した。盲腸の先端を左手人差し指で固定し、右手の26-G注射針(TERUMO)で盲腸の平滑筋層のみを切開し、粘膜と平滑筋の間にスペースを作った。次に18-G注射針でさらにそのスペースを広げた。長焦点顕微鏡下で(M651-1, ライカマイクロシステムズ)、スフェロイド(約10,000個のCRC-SC細胞)の塊を平滑筋のポケット内にピンセット(11252-30 Dumont #5, Fine Science Tools)を用いて移植した。盲腸を注意深く腹腔内に戻し、切開された腹壁と表皮を縫合した。このPDSOXマウスは移植後26週間観察された。瀕死のPDSOXマウスは苦痛軽減のために安楽死させ、がん死とみなした。その後、肉眼的・病理学的に解析された。この生存期間は2匹のPDSOXマウスの平均生存期間により決定した。全ての動物実験は京都大学の動物実験委員会により承認されたプロトコールに従って行われた。
10週齢のNSGマウスはヒートマット(KN-475、夏目製作所)の上で、イソフルラン麻酔装置(NARCOBI-E、夏目製作所)を用いて麻酔をかけた。腹部の毛はバリカン(ER807PP-A、パナソニック)で剃毛した。剃毛された腹部を、80%エタノール(#699749、丸三産業)とポビドンヨード(#46026800、建栄製薬)で除菌した。その後、腹部を小動物用ドレープ(Cleyera)で覆った。滅菌済みのハサミ(大祐医科工業)で中央よりやや左側の腹部を切開した。腹腔内からリングピンセット(大祐医科工業)を用いて盲腸の端を引き出し、ドレープの上にのせた。この時点で、マウスの頭部が手前側、尾が奥側になるようにマウスの体の向きを調整した。盲腸の先端を左手人差し指で固定し、右手の26-G注射針(TERUMO)で盲腸の平滑筋層のみを切開し、粘膜と平滑筋の間にスペースを作った。次に18-G注射針でさらにそのスペースを広げた。長焦点顕微鏡下で(M651-1, ライカマイクロシステムズ)、スフェロイド(約10,000個のCRC-SC細胞)の塊を平滑筋のポケット内にピンセット(11252-30 Dumont #5, Fine Science Tools)を用いて移植した。盲腸を注意深く腹腔内に戻し、切開された腹壁と表皮を縫合した。このPDSOXマウスは移植後26週間観察された。瀕死のPDSOXマウスは苦痛軽減のために安楽死させ、がん死とみなした。その後、肉眼的・病理学的に解析された。この生存期間は2匹のPDSOXマウスの平均生存期間により決定した。全ての動物実験は京都大学の動物実験委員会により承認されたプロトコールに従って行われた。
統計解析
統計解析はGraphPad Prism ソフトウェア(Dotmatics, San Diego, USA)またはMicrosoft Excel software(Microsoft, Tokyo, Japan)を用いて実行した。データはカプラン-マイヤー生存曲線、logrank検定、マンテル-ヘンツェル検定、スピアマン相関検定、マンホイットニーU検定、クラスカル-ウォリス検定、ウェルチのt検定、Benjamini-Hochberg 法を用いて解析した。
統計解析はGraphPad Prism ソフトウェア(Dotmatics, San Diego, USA)またはMicrosoft Excel software(Microsoft, Tokyo, Japan)を用いて実行した。データはカプラン-マイヤー生存曲線、logrank検定、マンテル-ヘンツェル検定、スピアマン相関検定、マンホイットニーU検定、クラスカル-ウォリス検定、ウェルチのt検定、Benjamini-Hochberg 法を用いて解析した。
2.結果
正常大腸上皮幹細胞(NCE-SC)の遺伝子発現解析
ヒトNCE-SCは幾つかの方法で培養されてきた。我々は血清を含む培地を用いて160人を超える大腸がん患者からNCE-SCを確立した。マイクロアレイのハイブリダイゼーションに基づいたmRNA定量法とRNA配列決定による定量法を用いて、我々は最初にNCE-SCのスフェロイド細胞株5株についてmRNA発現レベルを測定した(データ表示せず)。その結果得られたデータは独特のパターンを示した。すなわち、mRNA発現の複雑さとレベルは異なった患者間でも基本的に同一で、異なっていたのは性染色体上に位置する遺伝子で男女差が見られただけであった。このことは大腸がん幹細胞(CRC-SC)スフェロイド株の集団がより広いmRNAレベルの分布を示したことと対照的であった。
正常大腸上皮幹細胞(NCE-SC)の遺伝子発現解析
ヒトNCE-SCは幾つかの方法で培養されてきた。我々は血清を含む培地を用いて160人を超える大腸がん患者からNCE-SCを確立した。マイクロアレイのハイブリダイゼーションに基づいたmRNA定量法とRNA配列決定による定量法を用いて、我々は最初にNCE-SCのスフェロイド細胞株5株についてmRNA発現レベルを測定した(データ表示せず)。その結果得られたデータは独特のパターンを示した。すなわち、mRNA発現の複雑さとレベルは異なった患者間でも基本的に同一で、異なっていたのは性染色体上に位置する遺伝子で男女差が見られただけであった。このことは大腸がん幹細胞(CRC-SC)スフェロイド株の集団がより広いmRNAレベルの分布を示したことと対照的であった。
一方Metascapeプログラムによる解析では、我々のNCE-SCスフェロイド株は、オルガノイド培養 {Michels et al., 2019} による細胞と比べて、胎児の消化器系に発現されているmRNA種が高い比率で発現されていることが目立つ(図2C)。また、Gene Set Enrichment Analysis(GSEA)の結果はいくつかの遺伝子セットで顕著な差異が見られた(データ表示せず)。これらの結果は文献 {Sato, T. et al. 2011} の“original medium”よりは“refined medium”で培養されたNCE-SCオルガノイドに似ていた。念のため、我々が確立して使用したNCE-SCの細胞タイプの組成を単一細胞RNA(scRNA)解析で分析したところ、基本的に単一の未分化細胞種から構成されていることを確認した(図2B)。
大腸がん幹細胞株での高いmRNA発現レベルは良好な予後と相関する; ラッキーペンタッド(5)シグネチュア
我々は先に大腸がん原発巣から幹細胞(別名、腫瘍始原細胞)株をスフェロイドとして培養し、約160株を報告した。これらのCRC-SC細胞株に最近の株を加えた集団から、臨床的に重要性の高い、ステージIIIおよびIV(79%)腫瘍由来のものを相対的に多く含む57株を(腫瘍間質ではなく上皮幹細胞)CRC-SCに内在的なマーカーの詳細検討のための対象集団として選択した。男女比は34:23だった。それらはドライバー遺伝子変異やステージについては広範な組み合わせとなっている(データ表示せず)。これらの大腸がんはAPC、TP53、およびRASなどの予想されたドライバー遺伝子変異に加え、SMAD4、FBXW7などの変異もあった。原発腫瘍の組織病理像は多くは高分化から中程度分化または低分化の腺癌で、幾らかの粘液型や、BRAF V600E 変異を伴う鋸歯状腺腫由来と思われるもの2例やマイクロサテライトDNA不安定性(MSI-H)の1例が含まれる。MSI-H症例の頻度が低い理由は、それらの75%がステージI/IIに含まれ、216例中のステージIII/IVには含まれていなかったことが影響している。
我々は先に大腸がん原発巣から幹細胞(別名、腫瘍始原細胞)株をスフェロイドとして培養し、約160株を報告した。これらのCRC-SC細胞株に最近の株を加えた集団から、臨床的に重要性の高い、ステージIIIおよびIV(79%)腫瘍由来のものを相対的に多く含む57株を(腫瘍間質ではなく上皮幹細胞)CRC-SCに内在的なマーカーの詳細検討のための対象集団として選択した。男女比は34:23だった。それらはドライバー遺伝子変異やステージについては広範な組み合わせとなっている(データ表示せず)。これらの大腸がんはAPC、TP53、およびRASなどの予想されたドライバー遺伝子変異に加え、SMAD4、FBXW7などの変異もあった。原発腫瘍の組織病理像は多くは高分化から中程度分化または低分化の腺癌で、幾らかの粘液型や、BRAF V600E 変異を伴う鋸歯状腺腫由来と思われるもの2例やマイクロサテライトDNA不安定性(MSI-H)の1例が含まれる。MSI-H症例の頻度が低い理由は、それらの75%がステージI/IIに含まれ、216例中のステージIII/IVには含まれていなかったことが影響している。
我々は「CRC-SCのトランスクリプトームで発現される遺伝子の一部は、患者のがん全組織を用いて測定しても予後に影響するデータとなる」との仮説を立て、この仮説を検証するために、CRC-SCを予後バイオマーカーの発見コホートとして用いる新戦略を立てた(図3A)。即ち、CRC-SCのmRNA発現データを上記のNCE-SC(図3A)と比較した。そして得られた発現差のある遺伝子リストの最下位と最上位部分にランクされるそれぞれ20個の遺伝子プローブ即ち、NCE-SCと比べて発現が著しく低下した遺伝子群と増加した遺伝子群に注目した(表2)。
最初の解析セットとして、我々は先ずCRC-SC全体としてNCE-SCに比べて発現が最も低いランクにある遺伝子群を調べ、あるサブグループ細胞株を同定した。即ち、19個の遺伝子は大部分のCRC-SCスフェロイド株ではNCE-SCに比べると殆ど発現していないにも拘らず、一部のCRC-SC株(サブセット)で発現がNCE-SCと似たレベルに増加していることを見出した(図3Aおよび表2)。これら19個の遺伝子からTCGA-CRCデータベース(n =約 600)に照らして先ず11個を予後良好マーカーの候補として選び、更にGSE39582データベース(n =約 600)でも予後良好を示す5個の遺伝子に絞り込んだ。それらの遺伝子とは、MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16である(図2A、図3B)。
我々の予測どおり、これら5個の遺伝子の高発現はTCGA-CRCとGSE39582の双方で、何れの遺伝子も患者の良好な予後因子であり、OSデータだけでなくPFS/RFS/DSSデータでも統計上有意差を持っていた(図4A、4B)。それゆえ、我々はこれらの5遺伝子を「ラッキーペンタッド(5)」と命名した。
これら5個の遺伝子発現の臨床的重要性をまとめて評価するために、Zスコア変換によってこれらの標準化した発現レベルをZスコアで正規化し統合した。その結果得られた、ラッキー5シグネチュアスコアの高発現群と低発現群との間の予後の差に関する統計的有意性は、TCGA-CRCについてもGSE39582についても低いHRとP値を示した。即ち、TCGA-CRC-OS/DSS/PFSはHR 0.48/0.48/0.6(P = 0.002/0.01/0.01)、GSE39582-OS/RFSはHR 0.46/0.39(P = 0.003/0.0007)(図4C)であった。
また、これらの遺伝子は正常大腸粘膜を構成する特定のタイプの細胞で高発現している。即ち、MUC12とPIGRは結腸細胞で、PLA2G2AとZG16は杯細胞で、そしてSLC4A4はCA1陽性の結腸細胞で発現している。
その上、これら5個の遺伝子のうちMUC12、SLC4A4、およびZG16は、NCE-SCを細胞培養系でWntリガンドを除去して分化を誘導すると、更に高いレベルで発現した(図3A(下)、左端の行 3N-d)。PIGRおよびPLA2G2Aの発現レベルは、NCE-SCとそれらの分化した細胞とにおいて、いずれも同等レベルであった。したがって、我々が用いている培地でスフェロイド培養されたNCE-SCは、上記Metascapeでの解析データが示唆するように、胎児の大腸や小腸に向かって部分的に分化している様に見える(図2C)。一方、我々のCRC-SCスフェロイドでは、EMT(epithelial-mesenchymal transition)シグネチュア遺伝子群はNCE-SCの幹細胞諸マーカーと同等レベルに発現していた(図3B)。
ヒト大腸がん幹細胞スフェロイド細胞株において互いに交差しないDEFA6、CXCL14、BST2、MAGEA6、およびIGF2のmRNAの高レベル発現によって代表される新規予後予測シグネチュアの候補
我々は第二の解析セットとしてCRC-SCスフェロイド株の、独立して互いに交差しないサブセットでNCE-SCよりも高いレベルで発現を示す遺伝子を探索し、新規の分子サブグループを代表するリード遺伝子候補を5個見出した(表2および図5A)。即ち、それらの遺伝子候補とは、DEFA6、CXCL14、BST2、MAGEA6、IGF2の5つである。これらのリード遺伝子候補は、NCE-SCにおいては中程度のレベルでしか発現せず、また、これらのサブタイプ同士も、ラッキー5遺伝子シグネチュア発現群とも概ね交差重複していない((図2A、図5A)。
我々は第二の解析セットとしてCRC-SCスフェロイド株の、独立して互いに交差しないサブセットでNCE-SCよりも高いレベルで発現を示す遺伝子を探索し、新規の分子サブグループを代表するリード遺伝子候補を5個見出した(表2および図5A)。即ち、それらの遺伝子候補とは、DEFA6、CXCL14、BST2、MAGEA6、IGF2の5つである。これらのリード遺伝子候補は、NCE-SCにおいては中程度のレベルでしか発現せず、また、これらのサブタイプ同士も、ラッキー5遺伝子シグネチュア発現群とも概ね交差重複していない((図2A、図5A)。
これらのリード遺伝子で代表される5つのサブタイプはいずれも左側および右側大腸がん並びに直腸がんで見出されるが、BST2を発現する原発腫瘍は、統計的に有意に結腸に多く(P = 0.0001)、IGF2を発現するものは直腸がんで多く見られた(P = 0.002)。
CRC-SCスフェロイド株の5種の分子サブタイプにおけるこれらのリード遺伝子候補の臨床的重要性を評価するために、我々は上記ラッキー5で調べたのと同様にTCGA-CRCとGSE39582データベースを分析して患者の予後生存との相関性について調べた。即ち、最初に5個のリード遺伝子候補についてカプラン-マイヤー解析を行って公開データベースの患者について高発現と低発現患者での予後の差異について調べた(データ表示せず)。次に個々のサブグループ内でNCE-SCと比較して高発現の(リード遺伝子以外の)遺伝子を上位20遺伝子のリスト(表2)から選び、互いの発現に相関していて、かつ患者の予後とも相関している遺伝子を選んだ。最後に、(リード遺伝子を含めた)これらの遺伝子群についてサブグループとしてのZスコアを計算し、リード遺伝子単独のデータと比較して、統計的により強力な予後予測シグネチュアとなるかを吟味した(図5B、5C)。これらの候補遺伝子群は、(i) DEFA6、DEFA5、およびSPINK1; (ii) CXCL14、MME、およびMSX1; (iii) BST2、BATF、RAMP1、およびTPM2; (iv) MAGEA6、MAGEA3、MAGEA12およびCSAG1; 並びに、(v) IGF2、NELL2、およびRBMS1である。なお、予備検討として、TCGA-CRCデータベースのmRNA発現レベルを対数変換せずに用い、各遺伝子群の遺伝子のZスコアを合計して遺伝子発現シグネチュアスコアを求めた場合も、同様に患者の予後との相関がみられた(データ提示せず)。
ここで行った方法を統計的に吟味するために、我々は代表的なnon-hierarchicalな統計手法である、k-means法を用いて、5つのサブグループに分類したところ、各々独立のクラスターに上記5つのリード遺伝子の候補、即ちDEFA6、CXCL14、BST2、MAGEA6、IGF2が見出され、上述の分類と一貫した結果であった(データ表示せず)。我々は更にk-means法のクラスター数を10に設定したところ、それでも5つのリード遺伝子の候補は各々独立のクラスターに属し、追加されたクラスターのリード遺伝子は非コードRNAや患者生存に関係がない遺伝子であることが示された(データ表示せず)。これらの結果から、CRC-SC固有の転帰予測遺伝子の同定という意味で、基本的には我々の方法に余す所がなかったことを示唆している。
以下では個々のリード遺伝子で代表される5つの分子サブタイプについて説明する。
リード遺伝子シグネチュア(LGS)
DEFA6、BST2、およびMAGEA6シグネチュアについては、TCGA-CRCおよびGSE39582の発現高値の患者群と低値の患者群との予後(OS/DSS/PFS/RFS)の差は、統計的に有意差を示す小さなP値(< 0.05)を示した。CXCL14シグネチュアについては、高発現腫瘍のTCGA-CRC-OSの患者データでは予後良好だったが、PFSでは予後不良となり逆転していた。同様に、GSE39582-OSおよびRFSも予後良好と不良が逆転していた。これらの統計的結果は予後予測因子としての条件を満たさないため、以後、CXCL14とそのシグネチュアを予後予測バイオマーカーから除外することにした。CXCL14が予後マーカーとして問題があるということについては最近の総論でも論じられている {Westrich 2020}。IGF2とそのシグネチュアについては、TCGA-CRCおよびGSE39582ともに有意差を持って予後不良の転帰を示した。GSE39582-OSのみP = 0.1と統計パワーが少し弱いが、予後不良の傾向については矛盾しないので、IGF2はリード遺伝子シグネチュアとして保持した。同様にMAGEA6シグネチュアもGSE39582-OSデータセットではP = 0.07となっているが、他の全てのデータで一貫していたので、リード遺伝子シグネチュアとして保持した。要約すると、DEFA6、BST2、MAGEA6、およびIGF2シグネチュアを最終的に予後予測のためのリード遺伝子シグネチュアとして採用し、CXCL14とそのシグネチュアを除外した。
DEFA6、BST2、およびMAGEA6シグネチュアについては、TCGA-CRCおよびGSE39582の発現高値の患者群と低値の患者群との予後(OS/DSS/PFS/RFS)の差は、統計的に有意差を示す小さなP値(< 0.05)を示した。CXCL14シグネチュアについては、高発現腫瘍のTCGA-CRC-OSの患者データでは予後良好だったが、PFSでは予後不良となり逆転していた。同様に、GSE39582-OSおよびRFSも予後良好と不良が逆転していた。これらの統計的結果は予後予測因子としての条件を満たさないため、以後、CXCL14とそのシグネチュアを予後予測バイオマーカーから除外することにした。CXCL14が予後マーカーとして問題があるということについては最近の総論でも論じられている {Westrich 2020}。IGF2とそのシグネチュアについては、TCGA-CRCおよびGSE39582ともに有意差を持って予後不良の転帰を示した。GSE39582-OSのみP = 0.1と統計パワーが少し弱いが、予後不良の傾向については矛盾しないので、IGF2はリード遺伝子シグネチュアとして保持した。同様にMAGEA6シグネチュアもGSE39582-OSデータセットではP = 0.07となっているが、他の全てのデータで一貫していたので、リード遺伝子シグネチュアとして保持した。要約すると、DEFA6、BST2、MAGEA6、およびIGF2シグネチュアを最終的に予後予測のためのリード遺伝子シグネチュアとして採用し、CXCL14とそのシグネチュアを除外した。
大腸がん総合シグネチュア(GCS); ラッキー5、DEFA6、BST2、MAGEA6、およびIGF2シグネチュアを統合した新規の予後予測パラメーター
上述の様に我々は患者の予後と相関する、5種類の分子サブグループとそのシグネチュアを見出した。それらの内2種類ラッキー5およびDEFA6のシグネチュアは良好な予後を、そして他の3種類BST2、MAGEA6、およびIGF2は悪い予後を表している。我々が確立した、これら5種類の分子サブグループに属する大腸がん幹細胞スフェロイド株は、典型的な株もあるが、境界的な株やどのサブグループにも分類されない株なども存在した(図5A)。また、ラッキー5を発現するCRC-SCスフェロイド株には、上記4個のリード遺伝子のうち、予後不良のBST2やIGF2を高発現するものもあった(図3A(下)、最上列のSubgroup表示参照)。しかし、患者の予後を予測することは臨床的にどのような状況下でも必ず重要である。
上述の様に我々は患者の予後と相関する、5種類の分子サブグループとそのシグネチュアを見出した。それらの内2種類ラッキー5およびDEFA6のシグネチュアは良好な予後を、そして他の3種類BST2、MAGEA6、およびIGF2は悪い予後を表している。我々が確立した、これら5種類の分子サブグループに属する大腸がん幹細胞スフェロイド株は、典型的な株もあるが、境界的な株やどのサブグループにも分類されない株なども存在した(図5A)。また、ラッキー5を発現するCRC-SCスフェロイド株には、上記4個のリード遺伝子のうち、予後不良のBST2やIGF2を高発現するものもあった(図3A(下)、最上列のSubgroup表示参照)。しかし、患者の予後を予測することは臨床的にどのような状況下でも必ず重要である。
この目的のために我々は上記5個のシグネチュアを図6Aの図式に従って統合したmRNA発現の新規シグネチュアを考案した。これは、個々の標準化したシグネチュアを良好な予後を表すものは+の、悪い予後を表すものは-の極性を付与して足し合わせたものであり、GCS(General Colorectal Cancer Signature)と称する。我々が発見コホートとして総mRNAを解析した大腸がん幹細胞スフェロイド株は、臨床的重要性を加味してステージIIIおよびIVを増やしたセットだが、その数は57株と限定されているので、検証コホート(validation cohort)として600症例に近いTCGA-CRCのがん組織mRNAデータベースを用い、まず全生存期間(OS)との相関を解析した。
患者を四分位法で統計解析したところ、段階的にTCGA-CRC-DSSの低下を示す層別化を呈し(Q4-Q1, Ptrend = 0.001, 図6B)、最上位を示す四分位(Q4)と最下位を示す四分位(Q1)では有意差が見られた(P = 0.004, HR, 0.39; 95%CI, 0.20-0.74; 図6B)。
これらの結果は、GCSが大変有用な予後判定のシグネチュアとなり得ることを示している。すなわち、個々の患者がGCS値のどの四分位に位置するかを調べることで、統一的な予後予測が可能となり、GCS高値の患者には比較的マイルドな化学療法で十分かもしれないし、GCS低値の患者には、可能であれば、より強い化学療法が推奨される。
我々は、さらにTCGA-CRC-DSSおよびTCGA-CRC-PFSに加えてほぼ同数の大腸がん患者数を擁するGSE39582のmRNAデータについて、OS/RFSについても解析した。その結果、TCGA-CRC-OSやTCGA-CRC-PFSデータよりも症例数が少ないためP値などの統計的パワーは弱いものの、TCGA-CRC-PFSのデータと類似の傾向を得た(図6C)。
それぞれの患者腫瘍におけるGCSの特徴を直感的に視覚化するため、図6Dを例としてレーダーチャートを用いた。TCGA-CRC Q4(最上位)の患者の腫瘍はラッキー5とDEFA6に関して高いシグネチュアスコアを示し、その一方でQ1(最下位)の患者の腫瘍はMAGEA6シグネチュアに関して著しく高い値であった。興味深いことに、GSE39582の同様な値を示す群の患者はTCGA-CRCのそれとかなり類似した特徴を有していた(図6D)。
われわれがGCSスコアの分布を発見コホート(n = 57)と、TCGA-CRCおよびGSE39582データセットについて調べたところ、当然のことながら、GCSスコア平均値(μ)は3つのデータセットで0に近い値を示した。その一方で、GCSスコア中央値は2つのデータベースが+の値(0.24および0.20)示したことに対し、発見コホートの大腸がん幹細胞では負の値(-0.45)を示した(図6E、上)。その理由は、発見コホートではステージIIIとIVの比率を敢えて高くしたことによるものと考えられる。一方、症例数の多いTCGA-CRC(n = 597)とGSE39582(n = 566)のGCSスコア分布は正規分布に近く、GCSの解釈のしやすさと、一般臨床でより多くの患者を用いた状況への適応性を示すものであった(図6E、下)。
術後の大腸がん患者の予後・転帰を予測するための動物モデルとして、新たな異種移植モデルシステムを開発した。それは患者由来スフェロイド同所移植異種移植片を意味するPDSOXである。簡潔に言うと、約10,000個の限られたCRC-SC細胞を免疫不全マウスの盲腸上皮の下に移植した。そして上記のGCSスコアの四分位Q1~Q4のCRC-SC株を用いて試験した。これらの異種移植片は盲腸の粘膜に原発巣を形成した。予後不良Q1由来のCRC-SC株では、26週という観察期間内において14株中4株が肝臓と肺に複数の転移病変を発症した(図6F、右)。その一方で、予後良好のQ4由来のCRC-SC株を移植したマウスは観察期間を通して生存し(図6F、左上)、それと矛盾なく病理解剖では肝臓や肺に転移病変が全く存在しなかった。Q2やQ3のCRC-SC株のうちそれぞれ2株ずつが移植後26週以内に死亡した(図6F、左下)。また、Q4のCRC-SC株の多くは予後良好のシグネチュアであるラッキー5シグネチュアが高かった(図6G)。これらの結果において腫瘍微小環境の付加的な影響の可能性は残るが、個々のCRC-SCに固有な増殖と転移の特徴を反映する形で、大腸がん患者の転帰にGCSスコアが重要な役割を果たす可能性を強く示唆した。
4つの典型的なリード遺伝子サブタイプが患者人口の約40%を占める
ここまでの解析では、我々は全ての個々の患者に応用可能な診断ツールを考案することに焦点を当ててきた。しかし、リード遺伝子シグネチュア(LGS)スコアの高い患者に限定してみると、極めて典型的な分子サブタイプが存在することが明瞭になった。この目的でそのような独特な分子サブタイプを明確化できる様に、我々は上記とは別の統計解析法を用いて同じ2つの公開データベースを分析した。即ち図7Aに示すように、全ての個々の患者について4つのLGSスコアの中で、その患者が最も高いスコアを示すLGSサブグループに人為的に配属した。これにより、全ての患者を厳格に重複しない4つのサブグループに分類した。(この方法は最近の文献に記載がある。)。こうして出来た4つのサブグループを、次にそれぞれMSRS法で高発現と低発現の亜集団に分け、そのうちの高発現亜集団だけを典型的サブタイプと定義し、低発現亜集団はデータベース中の他のサブグループの低発現亜集団の患者と合わせて残りとした(図7B)。このようにして構成された4つの典型的サブタイプは、それぞれTCGA-CRCやGSE39582の患者の約40%を占め、残りの60%は相対的に特徴の少ない部分集団となった(図7B)。
ここまでの解析では、我々は全ての個々の患者に応用可能な診断ツールを考案することに焦点を当ててきた。しかし、リード遺伝子シグネチュア(LGS)スコアの高い患者に限定してみると、極めて典型的な分子サブタイプが存在することが明瞭になった。この目的でそのような独特な分子サブタイプを明確化できる様に、我々は上記とは別の統計解析法を用いて同じ2つの公開データベースを分析した。即ち図7Aに示すように、全ての個々の患者について4つのLGSスコアの中で、その患者が最も高いスコアを示すLGSサブグループに人為的に配属した。これにより、全ての患者を厳格に重複しない4つのサブグループに分類した。(この方法は最近の文献に記載がある。)。こうして出来た4つのサブグループを、次にそれぞれMSRS法で高発現と低発現の亜集団に分け、そのうちの高発現亜集団だけを典型的サブタイプと定義し、低発現亜集団はデータベース中の他のサブグループの低発現亜集団の患者と合わせて残りとした(図7B)。このようにして構成された4つの典型的サブタイプは、それぞれTCGA-CRCやGSE39582の患者の約40%を占め、残りの60%は相対的に特徴の少ない部分集団となった(図7B)。
これらの結果を基に、TCGA-CRCのデータの典型的サブタイプで無増悪生存(PFS)を調べたところ、段階的にDEFA6、BST2、MAGEA6、およびIGF2と生存期間の低下を示す層別化を呈し(logrank test P = 0.02)、予想通りDEFA6サブタイプでPFSが長く(HR, 0.60; 95%CI, 0.35-1.0)、BST2、MAGEA6、IGF2では短い傾向があった(図7C、左)。これらの結果はそれらのサブタイプが特徴的なシグネチュアとなり得ることを示している。すなわち、DEFA6サブタイプに入る患者は比較的マイルドな化学療法で十分かもしれないし、BST2、MAGEA6、またはIGF2サブタイプの患者には、通常より強めの化学療法が推奨されうる。同様にGSE39582のmRNAデータについてRFSを解析したところ、TCGA-CRC-PFSのデータと極めて類似した傾向が得られた(logrank test P = 0.003)(図7C、右)。
GCSと既存の大腸がん予後予測方法との比較
GCSによる予後予測を既存の大腸がん予後予測方法であるColoGuidePro(Inven2, Oslo, Norway) {Sveen et al. 2012}と比較した。GSE14333 {Jorissen et al. 2009}、GSE17536 {Smith et al. 2009}、GSE17537 {Smith et al. 2009}、GSE33113 {de Sousa E Melo et al. 2011}、GSE37892 {Laibe et al. 2012}、GSE38832 {Tripathi et al. 2014}、およびGSE39582のRFSを統合し、全ステージ(図8A)、ステージII(図8B)、またはステージIII(図8C)の大腸がん患者コホートにおいて、Q1~Q4(左)、最高スコアと最低スコア(Q1とQ4)(中)、または予後良好(80%)と予後不良(20%)(右)の患者のRFSを示した。GCSはColoGuideProよりも統計的優位性が遥かに強かった。
GCSによる予後予測を既存の大腸がん予後予測方法であるColoGuidePro(Inven2, Oslo, Norway) {Sveen et al. 2012}と比較した。GSE14333 {Jorissen et al. 2009}、GSE17536 {Smith et al. 2009}、GSE17537 {Smith et al. 2009}、GSE33113 {de Sousa E Melo et al. 2011}、GSE37892 {Laibe et al. 2012}、GSE38832 {Tripathi et al. 2014}、およびGSE39582のRFSを統合し、全ステージ(図8A)、ステージII(図8B)、またはステージIII(図8C)の大腸がん患者コホートにおいて、Q1~Q4(左)、最高スコアと最低スコア(Q1とQ4)(中)、または予後良好(80%)と予後不良(20%)(右)の患者のRFSを示した。GCSはColoGuideProよりも統計的優位性が遥かに強かった。
以上の結果は、各遺伝子シグネチュアおよびGCSが大変有用な大腸がん患者の予後予測のシグネチュアとなることを示す。特にGCSは、各遺伝子シグネチュアの統合解析を反映する値であり、極めて実用的な予後予測ツールになりうる。結果としてGCSスコアにより、大腸がん患者と治療に加わる医師の病状の理解が促進され、最も適切な治療方針の決定に役立つことが期待できる。
参考文献
Cerami, E., et al. (2012). "The cBio cancer genomics portal: an open platform for exploring multidimensional cancer genomics data." Cancer Discovery 2(5): 401-404.
Ge, SX., et al. (2018). " iDEP: an integrated web application for differential expression and pathway analysis of RNA-Seq data." BMC Bioinformatics 19(534): 1-24.
Hao., Y., et al. (2021). "Integrated analysis of multimodal single-cell data." Cell 184:3573-3587.
Hothorn., Y., et al. (2003). "On the exact distribution of maximally selected rank statistics." Comput. Stat. Data Anal. 43:121-137.
Jackstadt., I., et al. (2019). " Epithelial Notch signaling rewires the tumor microenvironment of colorectal cancer to drive poor-prognosis subtypes and metastasis." Cancer Cell 36: 319-336.
Joanito., et al. (2022). " Single-cell and bulk transcriptome sequencing identifies two epithelial tumor cell states and refines the consensus molecular classification of colorectal cancer." Nat. Genet. 54(7): 963-975.
Jones, W., et al. (2019). "Deleterious effects of formalin-fixation and delays to fixation on RNA and miRNA-seq profiles." Sci. Reports 9: 6980.
Jorissen, R.N. et al. (2009) "Metastasis-associated gene expression changes predict poor outcomes in patients with Dukes stage B and C colorectal cancer." Clin Cancer Res 15, 7642-7651.
Kim, D., et al. (2015). "HISAT: A fast spliced aligner with low memory requirements." Nat. Methods 12: 357-360.
Kim, D., et al. (2019). "Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype." Nat Biotechnol 37: 907-915.
Kitano, S., et al. (2022). "A novel parameter for cancer chemosensitivity to FGFR inhibitors." Cancer Sci. 113(11): 4005-4010
Laibe, S. et al. (2012). "A seven-gene signature aggregates a subgroup of stage II colon cancers with stage III." OMICS 16, 560-565.
Liao, Y., et al. (2014). "featureCounts: an efficient general purpose program for assigning sequence reads to genomic features." Bioinformatics 30(7): 923-930.
Loboda, A., et al. (2011). "EMT is the dominant program in human colon cancer." BMC Medical Genomics 4(9): 1-10.
Marisa, L., et al. (2013). "Gene expression classification of colon cancer into molecular subtypes: characterization, validation and prognostic value." PLoS Med 10: e1001453.
Miyoshi, H., et al. (2018). "An improved method for culturing patient-derived colorectal cancer spheroids." Oncotarget 9(31): 21950-21964.
The Cancer Genome Atlas Research Network (2012). "Comprehensive molecular characterization of human colon and rectal cancer." Nature 489(7407): 330-337.
Pertea, M., et al. (2015). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads." Nat. Biotechnol. 33: 290-295.
Reinhold, W. C., et al. (2019). "RNA sequencing of the NCI-60: integration into CellMiner and CellMiner CDB." Cancer Res. 79(13): 3514-3524.
Smith, J.J. et al. (2009). "Experimentally derived metastasis gene expression profile predicts recurrence and eath in patients with colon cancer." Gastroenterology 138, 958-968.
de Sousa E Melo, F. et al. (2011). "Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients." Cell Stem Cell 9, 476-485.
Su, W., et al. (2019). "TCC-GUI: a Shiny-based application for differential expression anaslysis of RNA-Seq count data." BMC Research Notes 12(133).
Subramanian, A., et al. (2005). "Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles." PNAS 102: 15545-15550.
Sveen, A. et al. (2012). "ColoGuidePro: A prognostic 7-gene expression siganture for stage III colorectal cancer patients." Clin. Cancer Res. 11.
Tripathi, M.K. et al. (2014). "Nuclear factor of activated T-cell activity is associated with metastatic capacity in colon cancer." Cancer Res 74, 6947-6957.
Uhlen, M., et al. (2017). "A pathology atlas of the human cancer transcriptome." Science 357(6352): eaan2507.
Yamamoto, T., et al. (2020). "Chemosensitivity of Patient-Derived Cancer Stem Cells Identifies Colorectal Cancer Patients with Potential Benefit from FGFR Inhibitor Therapy." Cancers 12(8): 2010.
Wang, R., et al. (2021). " Single-cell dissection of intratumoral heterogeneity and lineage diversity in metastatic gastric adenocarcinoma." Nat. Med. 27(1): 141-151.
Zhou, Y., et al. (2019). "Metascape provides a biologist-oriented resource for the analysis of systemes-level datasets." Nat. Comm. 10(1523).
Cerami, E., et al. (2012). "The cBio cancer genomics portal: an open platform for exploring multidimensional cancer genomics data." Cancer Discovery 2(5): 401-404.
Ge, SX., et al. (2018). " iDEP: an integrated web application for differential expression and pathway analysis of RNA-Seq data." BMC Bioinformatics 19(534): 1-24.
Hao., Y., et al. (2021). "Integrated analysis of multimodal single-cell data." Cell 184:3573-3587.
Hothorn., Y., et al. (2003). "On the exact distribution of maximally selected rank statistics." Comput. Stat. Data Anal. 43:121-137.
Jackstadt., I., et al. (2019). " Epithelial Notch signaling rewires the tumor microenvironment of colorectal cancer to drive poor-prognosis subtypes and metastasis." Cancer Cell 36: 319-336.
Joanito., et al. (2022). " Single-cell and bulk transcriptome sequencing identifies two epithelial tumor cell states and refines the consensus molecular classification of colorectal cancer." Nat. Genet. 54(7): 963-975.
Jones, W., et al. (2019). "Deleterious effects of formalin-fixation and delays to fixation on RNA and miRNA-seq profiles." Sci. Reports 9: 6980.
Jorissen, R.N. et al. (2009) "Metastasis-associated gene expression changes predict poor outcomes in patients with Dukes stage B and C colorectal cancer." Clin Cancer Res 15, 7642-7651.
Kim, D., et al. (2015). "HISAT: A fast spliced aligner with low memory requirements." Nat. Methods 12: 357-360.
Kim, D., et al. (2019). "Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype." Nat Biotechnol 37: 907-915.
Kitano, S., et al. (2022). "A novel parameter for cancer chemosensitivity to FGFR inhibitors." Cancer Sci. 113(11): 4005-4010
Laibe, S. et al. (2012). "A seven-gene signature aggregates a subgroup of stage II colon cancers with stage III." OMICS 16, 560-565.
Liao, Y., et al. (2014). "featureCounts: an efficient general purpose program for assigning sequence reads to genomic features." Bioinformatics 30(7): 923-930.
Loboda, A., et al. (2011). "EMT is the dominant program in human colon cancer." BMC Medical Genomics 4(9): 1-10.
Marisa, L., et al. (2013). "Gene expression classification of colon cancer into molecular subtypes: characterization, validation and prognostic value." PLoS Med 10: e1001453.
Miyoshi, H., et al. (2018). "An improved method for culturing patient-derived colorectal cancer spheroids." Oncotarget 9(31): 21950-21964.
The Cancer Genome Atlas Research Network (2012). "Comprehensive molecular characterization of human colon and rectal cancer." Nature 489(7407): 330-337.
Pertea, M., et al. (2015). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads." Nat. Biotechnol. 33: 290-295.
Reinhold, W. C., et al. (2019). "RNA sequencing of the NCI-60: integration into CellMiner and CellMiner CDB." Cancer Res. 79(13): 3514-3524.
Smith, J.J. et al. (2009). "Experimentally derived metastasis gene expression profile predicts recurrence and eath in patients with colon cancer." Gastroenterology 138, 958-968.
de Sousa E Melo, F. et al. (2011). "Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients." Cell Stem Cell 9, 476-485.
Su, W., et al. (2019). "TCC-GUI: a Shiny-based application for differential expression anaslysis of RNA-Seq count data." BMC Research Notes 12(133).
Subramanian, A., et al. (2005). "Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles." PNAS 102: 15545-15550.
Sveen, A. et al. (2012). "ColoGuidePro: A prognostic 7-gene expression siganture for stage III colorectal cancer patients." Clin. Cancer Res. 11.
Tripathi, M.K. et al. (2014). "Nuclear factor of activated T-cell activity is associated with metastatic capacity in colon cancer." Cancer Res 74, 6947-6957.
Uhlen, M., et al. (2017). "A pathology atlas of the human cancer transcriptome." Science 357(6352): eaan2507.
Yamamoto, T., et al. (2020). "Chemosensitivity of Patient-Derived Cancer Stem Cells Identifies Colorectal Cancer Patients with Potential Benefit from FGFR Inhibitor Therapy." Cancers 12(8): 2010.
Wang, R., et al. (2021). " Single-cell dissection of intratumoral heterogeneity and lineage diversity in metastatic gastric adenocarcinoma." Nat. Med. 27(1): 141-151.
Zhou, Y., et al. (2019). "Metascape provides a biologist-oriented resource for the analysis of systemes-level datasets." Nat. Comm. 10(1523).
Claims (14)
- 大腸がん患者の予後を予測するための方法であって、患者のがん試料における遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む、方法。 - 各遺伝子のZスコア(Z)を、式(I):
(式中、xは前記患者の当該遺伝子の発現レベルであり、μおよびσはそれぞれ、複数の大腸がん患者の当該遺伝子の発現レベルの平均および標準偏差である)
により求めること、
各遺伝子群の遺伝子発現シグネチュアスコアを決定すること、ここで、各遺伝子群の遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子のZスコアの合計、または各遺伝子群の遺伝子のZスコアの平均値である、および
前記遺伝子発現シグネチュアスコアをカットオフ値と比較すること
をさらに含む、請求項1に記載の方法。 - 各遺伝子群の遺伝子発現シグネチュアスコアが、各遺伝子群の遺伝子のZスコアの平均値である、請求項2に記載の方法。
- 遺伝子群(a)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、請求項2に記載の方法。
- 遺伝子群(b)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、請求項2に記載の方法。
- 遺伝子群(c)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、請求項2に記載の方法。
- 遺伝子群(d)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、請求項2に記載の方法。
- 遺伝子群(e)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、請求項2に記載の方法。
- 1以上の遺伝子群が、遺伝子群(a)~(e)である、請求項1に記載の方法。
- 1以上の遺伝子群が、遺伝子群(a)~(e)である、および、
大腸がん総合シグネチュア(GCS)スコアを、式(II):
(式中、
は予後の極性を示す係数であり、ここで遺伝子群(a)~(b)の係数は1であり、遺伝子群(c)~(e)の係数は-1であり、
は、各遺伝子群の遺伝子のZスコアの平均値である)
によりを決定すること、および
前記GCSスコアをカットオフ値と比較すること
をさらに含む、請求項1に記載の方法。 - がん試料が、手術試料またはバイオプシー試料である、請求項1~10のいずれかに記載の方法。
- がん試料が、がんスフェロイドである、請求項1~10のいずれかに記載の方法。
- 大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含む、キット。 - 1以上の遺伝子群が、遺伝子群(a)~(e)である、請求項13に記載のキット。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2024-017258 | 2024-02-07 | ||
| JP2024017258 | 2024-02-07 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2025169993A1 true WO2025169993A1 (ja) | 2025-08-14 |
Family
ID=96700053
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2025/003938 Pending WO2025169993A1 (ja) | 2024-02-07 | 2025-02-06 | 大腸がん患者の予後予測方法 |
Country Status (1)
| Country | Link |
|---|---|
| WO (1) | WO2025169993A1 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011015681A (ja) * | 2003-08-08 | 2011-01-27 | Perseus Proteomics Inc | 癌高発現遺伝子 |
| US20110097423A1 (en) * | 2009-10-22 | 2011-04-28 | Vanderbilt University | Gene Prognosis Predictor Signature for Colorectal Carcinoma |
| US20150354009A1 (en) * | 2012-11-26 | 2015-12-10 | Ecole Polytechnique Federale De Lausanne (Epfl) | Colorectal cancer classification with differential prognosis and personalized therapeutic responses |
-
2025
- 2025-02-06 WO PCT/JP2025/003938 patent/WO2025169993A1/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011015681A (ja) * | 2003-08-08 | 2011-01-27 | Perseus Proteomics Inc | 癌高発現遺伝子 |
| US20110097423A1 (en) * | 2009-10-22 | 2011-04-28 | Vanderbilt University | Gene Prognosis Predictor Signature for Colorectal Carcinoma |
| US20150354009A1 (en) * | 2012-11-26 | 2015-12-10 | Ecole Polytechnique Federale De Lausanne (Epfl) | Colorectal cancer classification with differential prognosis and personalized therapeutic responses |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Jiang et al. | Multi-omics analysis identifies osteosarcoma subtypes with distinct prognosis indicating stratified treatment | |
| Xie et al. | A multicenter analysis of genomic profiles and PD-L1 expression of primary lymphoepithelioma-like carcinoma of the lung | |
| US11965215B2 (en) | Methods and systems for analyzing nucleic acid molecules | |
| JP2021525069A (ja) | 癌を査定および/または処置するためのセルフリーdna | |
| US20110189670A1 (en) | Circulating Tumor and Tumor Stem Cell Detection Using Genomic Specific Probes | |
| US20190292600A1 (en) | Nasal epithelium gene expression signature and classifier for the prediction of lung cancer | |
| JP2019531741A (ja) | 胃癌の生物学的特性に基づく群区分および予後予測システム | |
| CN115612734B (zh) | 人食管鳞状细胞癌的分子标记物组及其应用 | |
| JP2019509018A (ja) | 変異に基づく病気の診断および追跡 | |
| WO2023109875A1 (en) | Biomarkers for colorectal cancer treatment | |
| Saleh et al. | Comparative analysis of triple-negative breast cancer transcriptomics of Kenyan, African American and Caucasian Women | |
| WO2015073949A1 (en) | Method of subtyping high-grade bladder cancer and uses thereof | |
| US10036070B2 (en) | Methods and means for molecular classification of colorectal cancers | |
| US20240105281A1 (en) | Methods and Systems for Analyzing Nucleic Acid Molecules | |
| US20230085358A1 (en) | Methods for cancer tissue stratification | |
| US9410205B2 (en) | Methods for predicting survival in metastatic melanoma patients | |
| Oiwa et al. | Clinicopathological, gene expression and genetic features of stage I lung adenocarcinoma with necrosis | |
| US20180044736A1 (en) | Biomarker based prognostic model for predicting overall survival in patients with metastatic clear cell kidney cancer | |
| Smeby et al. | Exploratory analyses of consensus molecular subtype-dependent associations of TP53 mutations with immunomodulation and prognosis in colorectal cancer | |
| CN107287345A (zh) | 用于急性髓系白血病精准诊疗的检测试剂盒及tsen34临床应用 | |
| CN108456730B (zh) | 一种复发风险基因群作为标志物在制备评估乳腺癌分子分型内远处复发风险的产品中的应用 | |
| Di Mauro et al. | MDM2 amplification and fusion gene ss18-ssx in a poorly differentiated synovial sarcoma: A rare but puzzling conjunction | |
| Li et al. | Individual assignment of adult diffuse gliomas into the EM/PM molecular subtypes using a TaqMan low-density array | |
| JP2020529870A (ja) | がんを層別化し、処置するための材料及び方法 | |
| WO2023125788A1 (en) | Biomarkers for colorectal cancer treatment |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 25752218 Country of ref document: EP Kind code of ref document: A1 |