[go: up one dir, main page]

WO2025169993A1 - Method for predicting prognosis of colorectal cancer patient - Google Patents

Method for predicting prognosis of colorectal cancer patient

Info

Publication number
WO2025169993A1
WO2025169993A1 PCT/JP2025/003938 JP2025003938W WO2025169993A1 WO 2025169993 A1 WO2025169993 A1 WO 2025169993A1 JP 2025003938 W JP2025003938 W JP 2025003938W WO 2025169993 A1 WO2025169993 A1 WO 2025169993A1
Authority
WO
WIPO (PCT)
Prior art keywords
gene
genes
score
prognosis
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
PCT/JP2025/003938
Other languages
French (fr)
Japanese (ja)
Inventor
誠 武藤
文彦 柿崎
弘之 三好
健二 河田
和貴 小▲浜▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyoto University NUC
Original Assignee
Kyoto University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyoto University NUC filed Critical Kyoto University NUC
Publication of WO2025169993A1 publication Critical patent/WO2025169993A1/en
Pending legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Definitions

  • CRC Colorectal cancer
  • CMS Consensus Molecular Subtyping
  • the present disclosure aims to provide a method and kit for predicting the prognosis of colorectal cancer patients.
  • the present disclosure provides a kit for predicting the prognosis of a colorectal cancer patient, the kit comprising: a group of genes (a) to (e): (a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16, (b) DEFA6, DEFA5, and SPINK1, (c) BST2, BATF, RAMP1, and TPM2, (d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
  • the present invention provides a kit comprising a reagent for measuring the expression level of one or more genes selected from the group consisting of:
  • CRC-SC colorectal cancer stem cell
  • the nine panels on the right show the expression of marker genes in that cell population (dark grey): MKI67 and PCNA; cell proliferation markers; CD24, CD44, and BMI1; intestinal epithelial stem cell markers; EPCAM; epithelial cell marker; MUC12, PIGR, and PLA2G2A; lucky 5 gene.
  • Gene expression in CRC-SC lines compared to NCE-SC lines. (Top left) Flowchart of this study. Transcriptional activity of NCE-SC and CRC-SC spheroids was measured as mRNA expression levels using microarrays.
  • the graph on the right shows the HR and its 95% CI.
  • the graph on the right shows HR and its 95% CI.
  • Heatmap showing mRNA expression levels in 57 CRC-SC spheroid lines (55T to 83T) and 5 NCE-SC lines (3N to 73N; 3N-d in the leftmost column is a cell line differentiated in vitro from 3N by removing the medium containing Wnt ligands).
  • the graph on the right shows the HR and 95% CI for the five-signature, including the lead gene candidate CXCL14.
  • Flowchart for calculating the colorectal cancer comprehensive signature (GCS).
  • the five signatures were classified into two categories: long-term survival signatures and short-term survival signatures.
  • b and c) The mean Z-scores of the long-term and short-term survival signatures were treated as positive (+) and negative (-) scores, respectively.
  • the GCS score was calculated by summing the signature scores.
  • a retrospective observational study of the GCS score was performed using the TCGA-CRC-DSS, TCGA-CRC-PFS, or GSE39582-RFS datasets as validation cohorts.
  • the primers or probes may comprise or consist of a sequence complementary to a portion of the mRNA sequence encoded by each gene.
  • the primers or probes may be, for example, 10 to 50 nucleotides, 15 to 35 nucleotides, or 20 to 30 nucleotides.
  • the primers or probes comprise or consist of a sequence of 10 to 50 nucleotides, 15 to 35 nucleotides, or 20 to 30 nucleotides complementary to a portion of the mRNA sequence encoded by each gene.
  • the method of the present disclosure calculates a Z-score (Z) for each gene from the expression level of each gene in a patient using formula (I): (where x is the expression level of the gene in the patient, and ⁇ and ⁇ are the mean and standard deviation of the expression levels of the gene in multiple colorectal cancer patients, respectively) To seek by determining a gene expression signature score for each group of genes; and comparing the gene expression signature score to a cutoff value.
  • the gene expression signature score may be compared with multiple cutoff values. For example, for multiple colorectal cancer patients whose prognosis is known, the prognosis of each patient may be ranked into three or more levels, and two or more gene expression signature scores that can separate each rank group with a statistically significant difference may be used as cutoff values. Statistical significance can be determined, for example, by the logrank test.
  • the cutoff values may be multiple values that can separate multiple colorectal cancer patients at a certain ratio in order of their gene expression signature scores, and may be, for example, the quartiles of the gene expression signature scores of multiple colorectal cancer patients. By comparing with multiple cutoff values, colorectal cancer patients can be stratified according to prognosis.
  • the gene expression signature score of gene group (c) is compared with the cutoff value for that gene group. If the gene expression signature score of gene group (c) is higher than the cutoff value, the patient is predicted to have a poor prognosis.
  • the gene expression signature score for gene group (e) is compared with the cutoff value for that gene group. If the gene expression signature score for gene group (e) is higher than the cutoff value, the patient is predicted to have a poor prognosis.
  • the method of the present disclosure includes measuring the expression levels of genes in two gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in three gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in four gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in five gene groups selected from gene groups (a) to (e).
  • the GCS score is compared with a cutoff value.
  • the cutoff value is a GCS score value that can statistically significantly divide multiple colorectal cancer patients with known prognosis into good prognosis and poor prognosis groups.
  • the cutoff value can be, for example, the value that minimizes the P value when multiple colorectal cancer patients are divided into good prognosis and poor prognosis groups using the Kaplan-Meier survival curve.
  • the statistical significance between the good prognosis and poor prognosis groups can be determined, for example, using the logrank test. If the colorectal cancer composite score is higher than the cutoff value, the patient is predicted to have a good prognosis.
  • the present disclosure provides a method for treating colorectal cancer patients, which comprises predicting the prognosis of a colorectal cancer patient using the prognosis prediction method of the present disclosure, and administering to the patient a therapeutic agent or therapy selected based on the prediction results.
  • the therapeutic agent may be an anticancer drug such as 5-fluorouracil (5-FU), tegafur, tegafur-uracil (UFT), doxifluridine (5'-DFUR), carmofur, tegafur-gimeracil-oteracil potassium (S-1), capecitabine (Cape), regorafenib, trifluridine-tipiracil hydrochloride (FTD/TPI), mitomycin C, irinotecan (IRI), oxaliplatin (OX), or vascular endothelial growth factor (VGF).
  • an anticancer drug such as 5-fluorouracil (5-FU), tegafur, tegafur-uracil (UFT), doxifluridine (5'-DFUR), carmofur, tegafur-gimeracil-oteracil potassium (S-1), capecitabine (Cape), regorafenib, trifluridine-tipiracil hydrochloride (FTD
  • a method for predicting the prognosis of a colorectal cancer patient comprising: (a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16, (b) DEFA6, DEFA5, and SPINK1, (c) BST2, BATF, RAMP1, and TPM2, (d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and SPINK1.
  • a kit for predicting the prognosis of a colorectal cancer patient comprising: (a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16, (b) DEFA6, DEFA5, and SPINK1, (c) BST2, BATF, RAMP1, and TPM2, (d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
  • a kit comprising a reagent for measuring the expression level of one or more genes in a group selected from the group consisting of: [14] 14.
  • the kit according to 13 above, wherein the one or more gene groups are gene groups (a) to (e).
  • the reagent is a primer or a probe.
  • a method for treating a patient with colorectal cancer comprising: 13.
  • a method comprising: predicting the prognosis of a colorectal cancer patient by the method according to any one of 1 to 12; and administering to the patient a therapeutic agent or treatment selected based on the result of the prediction.
  • RNA from each specimen was linearly amplified and labeled with Cy3-dCTP.
  • Labeled cRNA was purified using the RNAeasy Mini Kit (Qiagen). The concentration and specific activity of the labeled cRNA preparation (pmol Cy3/ ⁇ g cRNA) were measured using a NanoDrop ND-1000 (NanoDrop, Wilmington, DE, USA).
  • Each labeled cRNA sample 600 ng was fragmented with 5 ⁇ l 10x blocking agent and 1 ⁇ l 25x fragmentation buffer, then heated at 60°C for 30 min. Finally, 25 ⁇ l of 2x GE hybridization buffer was added to dilute the labeled cRNA.
  • Lead genes and their associated genes We identified genes with extremely variable mRNA expression (SD > 6.5) in CRC-SC lines. Among these genes, we selected five lead genes encoded on different chromosomes and independently regulated; their expression levels were not correlated with each other (Spearman correlation coefficient
  • Gene expression signature scores were calculated as previously reported ⁇ Jackstadt et al., 2019 ⁇ .
  • Z-score Zij for the jth specific gene in the ith patient in the dataset was calculated using the following formula:
  • Xij (uppercase letters) indicates the logarithmic value of the mRNA expression level after log2 transformation for each patient's tumor.
  • the GSE39582 data was measured using microarrays and was originally displayed as log2 values, whereas the TCGA-CRC data used in this study was RNA-seq data, so values were displayed without logarithmic transformation.
  • the gene expression signature score was the average Z score calculated using the following formula: That is, the lucky 5 gene expression signature score was calculated by adding the Z scores of the five jth genes, and that of the lead gene was calculated by adding the Z scores of the lead gene and the jth gene whose expression is correlated within that subgroup, and then dividing by the number of genes (m) (i.e., 5 for the lucky 5, 3-4 for the lead gene signature).
  • OS overall survival
  • DSS disease-specific survival
  • PFS progression-free survival
  • RFS recurrence-free survival
  • CRC specimens were divided into four equal subgroups according to GCS score, and analyzed using the Kaplan-Meier method followed by the log-rank test.
  • the 95% CI and HR for the poorest quartile group were calculated using the Mantel-Haenszel method in the GraphPad Prism software package.
  • Matrigel-enclosed spheroids were suspended in cell recovery solution (Corning) and collected in a 1.5 mL tube. Matrigel was dissolved at 4°C for 30 minutes with rotation and mixing. Spheroids were centrifuged at 4°C for 5 minutes and washed twice with PBS. Genomic DNA from the spheroids was purified using the DNeasy Blood & Tissue Kit (Qiagen, Hilden, Germany) according to the manufacturer's protocol. Hotspot mutations in 50 or 409 cancer-related genes in CRC-SC lines were detected by Macrogen Inc. (Seoul, Republic of Korea).
  • k-means analysis Among the genes highly expressed in CRC-SC lines compared to NCE-SC lines, the 100 most differentially expressed genes were subjected to gene cluster analysis using Integrated Differential Expression and Pathway analysis v0.951 (iDEP.951) ⁇ Ge, Son et al. 2018 ⁇ .
  • scRNA-seq Single-cell RNA-seq library preparation, data processing, and quality check.
  • scRNA-seq library preparation was performed by Rhelixa Inc. (Tokyo, Japan) as previously described ⁇ Joanito, Wirapati et al. 2022 ⁇ . Briefly, fresh 70N-NCE-SC were cultured in single suspension and loaded into a Chromium system (10X Genomics) at 5,000 cells per well. Barcoded sequencing libraries were generated using the Chromium Single Cell 3' v3.1 reagent Kit Dual (10X Genomics). The libraries were sequenced on an Illumina NovaSeq 6000 until full saturation was achieved.
  • MUC12 and PIGR are expressed in colonocytes
  • PLA2G2A and ZG16 are expressed in goblet cells
  • SLC4A4 is expressed in CA1-positive colonocytes.
  • NCE-SCs cultured as spheroids in our medium appear to be partially differentiated toward fetal colon and small intestine, as suggested by the Metascape analysis data above (Fig. 2C).
  • EMT epi-mesenchymal transition
  • a novel prognostic signature candidate represented by high, non-intersecting mRNA expression of DEFA6, CXCL14, BST2, MAGEA6, and IGF2 in human colorectal cancer stem cell spheroid cell lines.
  • We found five lead gene candidates representing novel molecular subgroups (Table 2 and Figure 5A). These gene candidates are DEFA6, CXCL14, BST2, MAGEA6, and IGF2.
  • These lead gene candidates are only moderately expressed in NCE-SC, and largely do not intersect with each other or with the lucky 5-gene signature expression group (Figure 2A, Figure 5A).
  • k-means method a representative non-hierarchical statistical method, to classify the data into five subgroups.
  • This signature is the sum of the individual standardized signatures, with + indicating a good prognosis and - indicating a poor prognosis, and is called the General Colorectal Cancer Signature (GCS).
  • GCS General Colorectal Cancer Signature
  • the colorectal cancer stem cell spheroid lines whose total mRNA we analyzed as our discovery cohort were a set that included additional stage III and IV lines in consideration of clinical importance. However, since the number of lines was limited to 57, we first analyzed the correlation with overall survival (OS) using the TCGA-CRC cancer tissue mRNA database of nearly 600 cases as a validation cohort.
  • OS overall survival
  • GCS can be a very useful prognostic signature.
  • a unified prognosis prediction may be possible, and relatively mild chemotherapy may be sufficient for patients with high GCS values, while more intensive chemotherapy may be recommended for patients with low GCS values, if possible.
  • PDSOX patient-derived spheroid orthotopic xenografts
  • mice transplanted with the favorable-prognosis Q4 quartile CRC-SC line survived throughout the observation period ( Figure 6F, upper left), and consistent with this, no metastatic lesions were detected in the liver or lungs at autopsy.
  • Two CRC-SC lines from each of the Q2 and Q3 quartiles died within 26 weeks after transplantation ( Figure 6F, lower left).
  • many of the Q4 CRC-SC lines had high levels of the Lucky 5 signature, a signature associated with a favorable prognosis (Figure 6G).
  • the GCS score may play an important role in the outcome of colorectal cancer patients, reflecting the unique growth and metastatic characteristics of individual CRC-SCs.
  • each gene signature and the GCS can be very useful signatures for predicting the prognosis of colorectal cancer patients.
  • the GCS is a value that reflects the integrated analysis of each gene signature, and can be an extremely practical prognostic prediction tool.
  • the GCS score is expected to facilitate understanding of the condition of colorectal cancer patients and the physicians involved in their treatment, and to be useful in determining the most appropriate treatment plan.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

The present disclosure includes a method for predicting the prognosis of a colorectal cancer patient, the method including the measurement of the expression levels of genes of one or more gene groups selected from gene groups (a) to (e): (a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16, (b) DEFA6, DEFA5, and SPINK1, (c) BST2, BATF, RAMP1, and TPM2, (d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMAS1 in a cancer sample from a patient; and a kit for predicting the prognosis of a colorectal cancer patient, the kit including a reagent for measuring the expression levels of genes of one or more gene groups selected from the gene groups (a) to (e); etc.

Description

大腸がん患者の予後予測方法Method for predicting prognosis of colorectal cancer patients

 本出願は、日本国特許出願第2024-017258号について優先権を主張するものであり、ここに参照することによって、その全体が本明細書中へ組み込まれるものとする。
 本開示は、大腸がん患者の予後を予測するための方法およびキットなどを含む。
This application claims priority to Japanese Patent Application No. 2024-017258, the entire contents of which are incorporated herein by reference.
The present disclosure includes methods and kits for predicting the prognosis of a colorectal cancer patient.

 大腸がん(colorectal cancer; CRC)は、ヒトのがんとして発症頻度で3番目、死亡率で2番目に高い。大腸がんによる死因の多くは肝臓や肺など主要臓器への転移である。CMS(Consensus Molecular Subtyping)分類に代表されるように、多数の大腸がん組織試料のmRNA発現が解析され、分類されてきた。それらの解析のほとんどは新鮮な大腸がんの凍結組織や、パラフィン包埋ブロックの試料を用いているが、それらは「がん上皮」と「間質」から構成されており、後者には血球や脈管内皮細胞、炎症細胞や免疫細胞、線維芽細胞などが含まれ、そのことがデータを複雑なものにしているし、がん上皮そのものの表現型の変化も遺伝子発現に影響する。大腸がん「上皮に特異的なサブグループ」(CRC epithelial cell-intrinsic subtypes; CRIS)の検索に患者由来異種移植腫瘍(PDXs; patient-derived xenografts)も試みられてきた。なぜならヒト腫瘍に由来する間質細胞がマウスの間質細胞に置換されて、上皮のみがヒト由来になるからである。また、個々の腫瘍内の不均一性を避けるために、同じ腫瘍の複数の領域を解析することもなされてきた。しかしながら、これまでのところ遺伝子発現解析による大腸がん患者の予後予測は十分に確立されていない。 Colorectal cancer (CRC) is the third most common cancer in humans and the second most deadly. Most deaths from CRC are due to metastasis to major organs such as the liver and lungs. The mRNA expression of numerous CRC tissue samples has been analyzed and classified, as exemplified by the Consensus Molecular Subtyping (CMS) classification. Most of these analyses use fresh frozen CRC tissue samples or paraffin-embedded blocks. These samples are composed of "cancer epithelium" and "stroma," the latter of which includes blood cells, vascular endothelial cells, inflammatory cells, immune cells, and fibroblasts. This complicates the data, and phenotypic changes in the cancer epithelium itself also affect gene expression. Patient-derived xenografts (PDXs) have also been used to search for "epithelial cell-intrinsic subtypes" (CRC epithelial cell-intrinsic subtypes; CRIS) of CRC. This is because stromal cells derived from human tumors are replaced with mouse stromal cells, leaving only the epithelium of human origin. Furthermore, to avoid heterogeneity within individual tumors, analysis of multiple regions of the same tumor has also been attempted. However, to date, the prognosis prediction of colorectal cancer patients using gene expression analysis has not been fully established.

 本開示は、大腸がん患者の予後を予測するための方法およびキットを提供することを目的とする。 The present disclosure aims to provide a method and kit for predicting the prognosis of colorectal cancer patients.

 一態様において、本開示は、大腸がん患者の予後を予測するための方法であって、患者のがん試料における遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む方法を提供する。
In one aspect, the present disclosure provides a method for predicting the prognosis of a colorectal cancer patient, comprising: determining a set of genes (a) to (e) in a cancer sample from the patient:
(a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16,
(b) DEFA6, DEFA5, and SPINK1,
(c) BST2, BATF, RAMP1, and TPM2,
(d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
The present invention provides a method for measuring the expression level of one or more genes selected from the group consisting of:

 一態様において、本開示は、大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含むキットを提供する。
In one aspect, the present disclosure provides a kit for predicting the prognosis of a colorectal cancer patient, the kit comprising: a group of genes (a) to (e):
(a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16,
(b) DEFA6, DEFA5, and SPINK1,
(c) BST2, BATF, RAMP1, and TPM2,
(d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
The present invention provides a kit comprising a reagent for measuring the expression level of one or more genes selected from the group consisting of:

 本開示により、大腸がん患者の予後を予測するための方法およびキットが提供される。 The present disclosure provides a method and kit for predicting the prognosis of colorectal cancer patients.

大腸がん幹細胞(CRC-SC)固有の発現シグネチュア発見のフローチャート。A, 以前の20株 {Yamamoto, 2020} と追加の37株から成る患者由来CRC-SCのパネル。B, 409または50のがん関連遺伝子変異のホットスポットについてゲノムDNAを解析した。C, 5つの正常大腸上皮幹細胞(NCE-SC)株(3N、50N、59N、70N、73N)を対照として用いた。D, マイクロアレイ解析を用いてトランスクリプトーム解析を行った。EおよびF, 低発現遺伝子と高発現遺伝子は、対照であるNCE-SC株の発現レベルに対するCRC-SC株の発現レベルの倍率変化により決定した。GおよびH, それぞれのリード遺伝子シグネチュアに含めるための、追加遺伝子の各リード遺伝子サブグループ内における検索と同定。追加遺伝子の発現レベルは相互に相関し、且つそのレベルが3つの公開データベースでCRC患者の生存期間と相関した。I-L, 最終的に、個々の標準化したシグネチュアを良好な予後を表すものは正(+)の、悪い予後を表すものは負(-)の極性を付与して足し合わせ、大腸がん総合シグネチュア(GCS)とした。M, CRC-SCスフェロイドを免疫不全マウスの大腸に移植することによるGCSスコアの前臨床評価を行った。Flowchart for the discovery of colorectal cancer stem cell (CRC-SC)-specific expression signatures. A, A panel of patient-derived CRC-SCs consisting of 20 previous lines {Yamamoto, 2020} and 37 additional lines. B, Genomic DNA was analyzed for 409 or 50 cancer-associated gene mutation hotspots. C, Five normal colorectal epithelial stem cell (NCE-SC) lines (3N, 50N, 59N, 70N, and 73N) were used as controls. D, Transcriptome analysis was performed using microarray analysis. E and F, Low- and high-expression genes were determined by fold change in expression levels in CRC-SC lines relative to that of control NCE-SC lines. G and H, Search and identification of additional genes within each lead gene subgroup for inclusion in each lead gene signature. Expression levels of the additional genes correlated with each other and with CRC patient survival in three public databases. I-L, Finally, the individual standardized signatures were summed, with positive (+) representing a good prognosis and negative (-) representing a poor prognosis, to form the colorectal cancer comprehensive signature (GCS). M, Preclinical evaluation of the GCS score was performed by transplanting CRC-SC spheroids into the colon of immunodeficient mice. 3つのNCE-SC株における各遺伝子の平均mRNA発現量(Mean TPM)の順位を示す対数プロット。図の中の丸印は以下の遺伝子群を示す。NCE-SCマーカー(薄い灰色)、ラッキー5遺伝子群(白)、CRC-SCマーカー(濃い灰色)、リード遺伝子(CXCL14・BST2・DEFA6・IGF2・MAGEA6)。括弧内の数字はNCE-SCスフェロイド細胞内のmRNA発現量の順位を示している。ND, 検出限界以下。Logarithmic plot showing the ranking of the mean mRNA expression level (Mean TPM) of each gene in three NCE-SC lines. Circles in the figure represent the following gene groups: NCE-SC markers (light grey), lucky 5 gene group (white), CRC-SC markers (dark grey), and lead genes (CXCL14, BST2, DEFA6, IGF2, MAGEA6). Numbers in parentheses indicate the ranking of mRNA expression levels in NCE-SC spheroid cells. ND, below detection limit. 70N-NCE-SC株のシングルセルRNA発現解析。左のパネルで示されている単一の細胞集団の各領域に記載されている細胞周期はMetascape発現解析 {Zhou et al., 2019} を用いた。右の9つのパネルはその細胞集団におけるマーカー遺伝子群の発現を示している(濃い灰色)。MKI67およびPCNA; 細胞増殖マーカー。CD24、CD44、およびBMI1; 腸管上皮幹細胞マーカー。EPCAM; 上皮細胞マーカー。MUC12、PIGR、およびPLA2G2A; ラッキー5遺伝子。Single-cell RNA expression analysis of the 70N-NCE-SC line. The cell cycle depicted in each region of the single cell population shown in the left panel was analyzed using Metascape expression analysis {Zhou et al., 2019}. The nine panels on the right show the expression of marker genes in that cell population (dark grey): MKI67 and PCNA; cell proliferation markers; CD24, CD44, and BMI1; intestinal epithelial stem cell markers; EPCAM; epithelial cell marker; MUC12, PIGR, and PLA2G2A; lucky 5 gene. オルガノイド培養条件下を基準とした際の、スフェロイド培養条件下のNCE-SCで発現が高い最上位100遺伝子を用いた細胞型シグネチュアのエンリッチメント解析。Enrichment analysis of cell type signatures using the top 100 genes highly expressed in NCE-SCs under spheroid culture conditions compared to organoid culture conditions. NCE-SC株と比較したCRC-SC株における遺伝子発現。(左上)今回の研究のフローチャート。NCE-SCスフェロイドとCRC-SCスフェロイドの転写活性をmRNA発現量としてマイクロアレイを用いて測定した。(右上)NCE-SCの発現レベルに照らしたCRC-SCの発現レベル。遺伝子の発現レベルは1og2縮尺の丸印で示す。濃い灰色、白、薄い灰色の丸印はそれぞれ上位遺伝子、下位遺伝子、リード遺伝子を示す。括弧内の数字は基準となるNCE-SCスフェロイド株に対するCRC-SCスフェロイド株での高発現(+)遺伝子もしくは低発現(-)遺伝子の順位を示す。(下)57株のCRC-SCスフェロイド株(1Tから6T)および5株のNCE-SCスフェロイド株(3Nから37N、一番左の列の3N-dはWntリガンドを含む培地を除くことで3Nをin vitroで分化させた細胞株である。)における、ラッキー5遺伝子および他の候補遺伝子のmRNA発現レベルをZスコアの順に示すヒートマップ。一番上の行の四角は、表2に示す最高相対発現値のサブグループを示す。Gene expression in CRC-SC lines compared to NCE-SC lines. (Top left) Flowchart of this study. Transcriptional activity of NCE-SC and CRC-SC spheroids was measured as mRNA expression levels using microarrays. (Top right) Expression levels of CRC-SC relative to NCE-SC. Gene expression levels are shown as circles in 1og2 scale. Dark gray, white, and light gray circles indicate top, bottom, and lead genes, respectively. Numbers in parentheses indicate the rank order of highly (+) or lowly (-) expressed genes in CRC-SC spheroid lines relative to the reference NCE-SC spheroid line. (Bottom) Heatmap showing the mRNA expression levels of the lucky 5 genes and other candidate genes in 57 CRC-SC spheroid lines (1T to 6T) and 5 NCE-SC spheroid lines (3N to 37N; 3N-d in the leftmost column is a cell line obtained by in vitro differentiation of 3N by removing the medium containing Wnt ligands). The boxes in the top row indicate the subgroups with the highest relative expression values, as shown in Table 2. NCE-SC株のmRNA発現レベルを基準とした際の、CRC-SCスフェロイド57株における36遺伝子(横軸)の相対発現量を示すマイクロアレイプローブのシグナル値を示すバイオリンプロット。角丸長方形で囲まれた株は、ラッキー5遺伝子を高発現するサブグループである。楕円で囲まれた株は、リード遺伝子DEFA6、BST2、MAGEA6、IGF2で代表されるサブグループである。0の横向きの波線はNCE-SC株の平均プローブシグナル値を示している。Violin plot showing the microarray probe signal values for 36 genes (horizontal axis) in 57 CRC-SC spheroid lines relative to the mRNA expression level of NCE-SC lines. Lines enclosed by rounded rectangles represent a subgroup highly expressing the lucky 5 genes. Lines enclosed by ellipses represent a subgroup represented by the lead genes DEFA6, BST2, MAGEA6, and IGF2. The horizontal wavy line at 0 indicates the average probe signal value for NCE-SC lines. TCGA-CRCデータベース(検証コホート1)における大腸がん患者(全ステージ)の全生存期間(OS)、疾患特異的生存期間(DSS)、または無増悪生存期間(PFS)。ラッキー5遺伝子を高レベル(H)または低レベル(L)で発現する患者の生存期間を示す。右のグラフはハザード比(HR)とその95%信頼区間(CI)を示している。Overall survival (OS), disease-specific survival (DSS), and progression-free survival (PFS) for colorectal cancer patients (all stages) in the TCGA-CRC database (validation cohort 1). The graph on the right shows the hazard ratio (HR) and its 95% confidence interval (CI). GSE39582データベース(検証コホート2)における大腸がん患者(全ステージ)のOSまたは無再発生存期間(RFS)。ラッキー5遺伝子を高レベル(H)または低レベル(L)で発現する患者の生存期間を示す。右のグラフはHRとその95%CIを示している。OS or recurrence-free survival (RFS) of colorectal cancer patients (all stages) in the GSE39582 database (validation cohort 2). The graph shows the survival time of patients with high (H) or low (L) expression of the lucky 5 genes. The graph on the right shows the HR and its 95% CI. TCGA-CRC(上)またはGSE39582(下)における大腸がん患者(全ステージ)のOS、DSS、PFS、またはRFS。ラッキー5シグネチュアが高い(High)または低い(Low)患者の生存期間を示す。右のグラフはHRとその95%CIを示している。OS, DSS, PFS, or RFS for colorectal cancer patients (all stages) in TCGA-CRC (top) or GSE39582 (bottom). Survival time for patients with high or low lucky 5 signatures is shown. The graph on the right shows HR and its 95% CI. 57株のCRC-SCスフェロイド株(55Tから83T)および5株のNCE-SC株(3Nから73N、一番左の列の3N-dはWntリガンドを含む培地を除くことで3Nをin vitroで分化させた細胞株である。)でのmRNAの発現レベルを示すヒートマップ。一番上の行の四角は大腸がんのサブグループを示し、そのCRC-SCスフェロイドにおいて5つのリード遺伝子のうち最も発現が高いものを示す(図下の「Keys」を参照)。Heatmap showing mRNA expression levels in 57 CRC-SC spheroid lines (55T to 83T) and 5 NCE-SC lines (3N to 73N; 3N-d in the leftmost column is a cell line differentiated in vitro from 3N by removing the medium containing Wnt ligands). The boxes in the top row represent colorectal cancer subgroups and indicate the five lead genes with the highest expression in those CRC-SC spheroids (see "Keys" below the figure). TCGA-CRCデータベースにおける大腸がん患者(全ステージ)のOS、DSS、またはPFS。4つのリード遺伝子シグネチュアが高い(High)または低い(Low)患者の生存期間を示す。右のグラフは、リード遺伝子の候補CXCL14を加えた5シグネチュアのHRとその95%CIを示している。OS, DSS, and PFS for colorectal cancer patients (all stages) in the TCGA-CRC database. The graph shows the survival time for patients with high or low levels of the four lead gene signature. The graph on the right shows the HR and 95% CI for the five-signature, including the lead gene candidate CXCL14. GSE39582データベースにおける大腸がん患者(全ステージ)のOSまたはRFS。4つのリード遺伝子シグネチュアが高い(High)または低い(Low)患者の生存期間を示す。右のグラフは、リード遺伝子の候補CXCL14を加えた5シグネチュアのHRとその95%CIを示している。OS or RFS of colorectal cancer patients (all stages) in the GSE39582 database. This shows the survival time of patients with high or low levels of the four lead gene signature. The graph on the right shows the HR and 95% CI for the five-signature, including the lead gene candidate CXCL14. 大腸がん総合シグネチュア(GCS)算出のフローチャート。a, 5つのシグネチュアを長期生存のシグネチュアと短期生存のシグネチュアの2つに分類した。bおよびc, 長期生存と短期生存のシグネチュアの平均Zスコアを、正(+)と負(-)のスコアとしてそれぞれ扱った。d, シグネチュアスコアを合計してGCSスコアを算出した。e, TCGA-CRC-DSS、TCGA-CRC-PFS、またはGSE39582-RFSデータセットを検証コホートとして用いて、GCSスコアの後ろ向きの観察研究を行った。f, 最後にマウスモデルを用いた前向き試験として、CRC-SC株をQ1-Q4に分け、NSGマウスの盲腸粘膜に同所移植し、26週後にそのマウスの原発巣及び肝臓と肺の転移巣を調べた。Flowchart for calculating the colorectal cancer comprehensive signature (GCS). a) The five signatures were classified into two categories: long-term survival signatures and short-term survival signatures. b and c) The mean Z-scores of the long-term and short-term survival signatures were treated as positive (+) and negative (-) scores, respectively. d) The GCS score was calculated by summing the signature scores. e) A retrospective observational study of the GCS score was performed using the TCGA-CRC-DSS, TCGA-CRC-PFS, or GSE39582-RFS datasets as validation cohorts. f) Finally, in a prospective study using a mouse model, CRC-SC lines were divided into Q1-Q4 and orthotopically transplanted into the cecal mucosa of NSG mice. 26 weeks later, the mice were examined for primary tumors and metastatic lesions in the liver and lung. GCSの四分位数(GCSスコアの低い方から高い方へ順にQ1-Q4)で分割したTCGA-CRCデータベースの大腸がん患者のDSSまたはPFSの比較を示すカプラン-マイヤープロット(左)およびHRの比較(右)。Ptrend値とP値は傾向のためのlogrank trend検定とlogrank検定を用いてそれぞれ算出した。HR(95%CI)はマンテル-ヘンツェル検定により得た。DSSのサンプル数は、Q1; 0-25%, n = 137; Q2; 25-50%, n = 136; Q3; 50-75%, n = 136; およびQ4; 75-100%, n = 136であった。PFSのサンプル数は、Q1; 0-25%, n = 141; Q2; 25-50%, n = 141; Q3; 50-75%, n = 141; およびQ4; 75-100%, n = 141であった。Kaplan-Meier plots (left) and HR comparisons (right) showing comparisons of DSS or PFS in colorectal cancer patients from the TCGA-CRC database divided by GCS quartiles (Q1-Q4, from lowest to highest GCS score). Ptrend and P values were calculated using the log-rank trend test and log-rank test for trend, respectively. HRs (95% CI) were obtained using the Mantel-Haenszel test. The sample sizes for DSS were Q1; 0-25%, n = 137; Q2; 25-50%, n = 136; Q3; 50-75%, n = 136; and Q4; 75-100%, n = 136. The sample sizes for PFS were Q1; 0-25%, n = 141; Q2; 25-50%, n = 141; Q3; 50-75%, n = 141; and Q4; 75-100%, n = 141. GCSの四分位数(GCSスコアの低い方から高い方へ順にQ1-Q4)で分割したGSE39582データベースの大腸がん患者のRFSの比較を示すカプラン-マイヤープロット(左)およびHRの比較(右)。サンプル数は、Q1; 0-25%, n = 129; Q2; 25-50%, n = 130; Q3; 50-75%, n = 130; およびQ4; 75-100%, n = 130であった。Kaplan-Meier plot (left) and HR comparison (right) showing the comparison of RFS for colorectal cancer patients in the GSE39582 database divided by GCS quartiles (Q1-Q4, from lowest to highest GCS score). Sample sizes were Q1; 0-25%, n = 129; Q2; 25-50%, n = 130; Q3; 50-75%, n = 130; and Q4; 75-100%, n = 130. GCSスコアに対する5つのシグネチュアの貢献度を示すレーダーチャート。GCSが患者数全体の上位25%(Q4)(左)と下位25%(Q1)(右)に含まれる、TCGA-CRCまたはGSE39582の2人の大腸がん患者(D5-6920およびAG-4021またはCIT478およびCIT295)の結果を示す。-4~4の数字はGCSに用いる各シグネチュアの平均Zスコアを示す。予後良好のシグネチュアであるラッキー5およびDEFA6は下側、予後不良のシシグネチュアであるIGF2、BST2、およびMAGEA6は上側に示されている。A radar chart showing the contribution of five signatures to the GCS score. The results are for two colorectal cancer patients (D5-6920 and AG-4021, or CIT478 and CIT295) from TCGA-CRC or GSE39582, whose GCS scores were in the top 25% (Q4) (left) and bottom 25% (Q1) (right) of the total patient population. The numbers from -4 to 4 indicate the average Z-score of each signature used in the GCS. The good-prognosis signatures Lucky 5 and DEFA6 are shown on the bottom, while the poor-prognosis signatures IGF2, BST2, and MAGEA6 are shown on the top. CRC-SCスフェロイド、TCGA-CRC、またはGSE39582におけるGSCの統計値(上)およびGSCの分布を示すヒストグラム(下)。Statistics of GSCs (top) and histograms showing the distribution of GSCs (bottom) in CRC-SC spheroids, TCGA-CRC, or GSE39582. 左上:NSGマウスに同所移植したCRC-SC株のGCSスコア四分位を比較したカプラン-マイヤー図。(マウスの数: Q1 = 14、Q2 = 15、Q3 = 14、Q4 = 14。) 上中央:GCSスコアQ4とQ1を比較したカプラン-マイヤー図。Ptrend値とP値は傾向のためのlogrank検定とlogrank検定でそれぞれ算出した。左下:CRC-SC株の同所移植マウスのがん死亡率。下中央:同所移植マウスのがん死亡数。右:GCSスコアの下位グループ(Q1)の2株、8Tと13Tをマウスに同所移植した結果生じた肝臓と肺の転移巣。それらの担がんマウスは移植後26週以内に死亡した。右上; 切除した肝臓の肉眼所見。右中と右下; H&E染色による肝臓と肺の組織病理像の観察。白いスケールバーは10 mm。黒いスケールバーは400 μm。鏃は転移巣病変。Top left: Kaplan-Meier plot comparing GCS score quartiles of CRC-SC lines orthotopically transplanted into NSG mice. (Number of mice: Q1 = 14, Q2 = 15, Q3 = 14, Q4 = 14.) Top center: Kaplan-Meier plot comparing GCS scores of Q4 and Q1. Ptrend and P values were calculated using the log-rank test for trend and the log-rank test, respectively. Bottom left: Cancer mortality rates in mice orthotopically transplanted with CRC-SC lines. Bottom center: Number of cancer deaths in mice orthotopically transplanted. Right: Liver and lung metastases resulting from orthotopic transplantation of two lines from the lower GCS score group (Q1), 8T and 13T, into mice. These tumor-bearing mice died within 26 weeks after transplantation. Top right: Macroscopic findings of resected livers. Right center and bottom right: Histopathological observations of the liver and lungs by H&E staining. White scale bar is 10 mm. The black scale bar is 400 μm. The arrowhead indicates a metastatic lesion. GCSスコアQ4~Q1のCRC-SC株を同所移植したNSGマウスが6ヶ月後に死亡したか否かの検定。L列はラッキー5シグネチュアが高い(High)または低い(Low)細胞株、P列はマウスが死亡した(Lethal)または生存していた(Viable)細胞株を示す。星印は粘液型病理組織像を示した細胞株を示す。Test to determine whether NSG mice orthotopically transplanted with CRC-SC lines with GCS scores of Q4 to Q1 died 6 months later. Column L indicates cell lines with high or low lucky 5 signatures, and column P indicates cell lines that resulted in lethal or viable mouse deaths. Asterisks indicate cell lines that showed mucinous histopathological findings. 最大シグネチュアスコア(MSS)を用いた患者のサブタイプ決定のフローチャート。a, 4つのリード遺伝子シグネチュア(LGS)スコアのうち最大のスコアをMSSとした。b, MSSに基づき各患者をリード遺伝子サブグループにわけた。c-e, 各サブグループをMSSが高い(High)または低い(Low)亜集団にわけた。スコアが高い患者をサブタイプのプロトタイプとし、各サブグループのスコアが低い患者は残りとして1つにまとめた。TCGA-CRC-PFSまたはGSE39582-RFSデータセットを検証コホートとして用いて、各LGSサブタイプと残りの患者との間の後ろ向きの観察研究を行った。Flowchart of patient subtype determination using maximum signature score (MSS). a, The maximum of the four lead gene signature (LGS) scores was defined as MSS. b, Each patient was divided into lead gene subgroups based on MSS. c-e, Each subgroup was divided into high or low MSS subpopulations. Patients with high scores were used as the subtype prototype, and patients with low scores in each subgroup were combined into one as the remainder. A retrospective observational study was conducted using the TCGA-CRC-PFS or GSE39582-RFS dataset as a validation cohort to compare each LGS subtype with the remaining patients. CRC-SC(上)、TCGA-CRC(中)、およびGSE39582(下)におけるCRC患者のサブタイプ、ステージ、およびLGSスコアを示すヒートマップ。Heatmaps showing the subtype, stage, and LGS score of CRC patients in CRC-SC (top), TCGA-CRC (middle), and GSE39582 (bottom). TCGA-CRCまたはGSE39582の大腸がん患者(全ステージ)のサブタイプごとのPFSまたはRFSのカプラン-マイヤープロットおよび各LGSサブタイプと残りの患者との間のHR。Kaplan-Meier plot of PFS or RFS by subtype for TCGA-CRC or GSE39582 colorectal cancer patients (all stages) and HR between each LGS subtype and the rest of the patients. 大腸がん患者(全ステージ)のRFSにおけるGCSとColoGuideProとの比較。Q1~Q4(左)、最高スコアと最低スコア(Q1とQ4)(中)、または予後良好(80%)と予後不良(20%)(右)の患者のRFSを示す。GCSとColoGuideProはQ1~Q4の順位づけが反対であることに注意。Comparison of GCS and ColoGuidePro in RFS for colorectal cancer patients (all stages). Shown are RFS for patients with Q1 to Q4 (left), the highest and lowest scores (Q1 and Q4) (center), or a good prognosis (80%) and a poor prognosis (20%) (right). Note that GCS and ColoGuidePro rank Q1 to Q4 in opposite ways. 大腸がん患者(ステージII)のRFSにおけるGCSとColoGuideProとの比較。Q1~Q4(左)、最高スコアと最低スコア(Q1とQ4)(中)、または予後良好(80%)と予後不良(20%)(右)の患者のRFSを示す。Comparison of GCS and ColoGuidePro in terms of RFS in stage II colorectal cancer patients. RFS is shown for patients with Q1-Q4 (left), the highest and lowest scores (Q1 and Q4) (center), or a good prognosis (80%) and a poor prognosis (20%) (right). 大腸がん患者(ステージIII)のRFSにおけるGCSとColoGuideProとの比較。Q1~Q4(左)、最高スコアと最低スコア(Q1とQ4)(中)、または予後良好(80%)と予後不良(20%)(右)の患者のRFSを示す。Comparison of GCS and ColoGuidePro in terms of RFS in stage III colorectal cancer patients. RFS is shown for patients with Q1-Q4 (left), the highest and lowest scores (Q1 and Q4) (center), or a good prognosis (80%) and a poor prognosis (20%) (right).

 特に具体的な定めのない限り、本明細書で使用される用語は、有機化学、医学、薬学、分子生物学、微生物学等の分野における当業者に一般に理解されるとおりの意味を有する。以下にいくつかの本明細書で使用される用語についての定義を記載するが、これらの定義は、本明細書において、一般的な理解に優先する。 Unless otherwise specified, terms used herein have the meanings commonly understood by those skilled in the art of organic chemistry, medicine, pharmacology, molecular biology, microbiology, etc. Definitions of some terms used herein are provided below, but these definitions take precedence over common understandings in this specification.

 一態様において、本開示は、大腸がん患者の予後を予測するための方法に関する。本開示の予後予測方法は、表1に示す遺伝子群(a)~(e)から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む。遺伝子群(a)~(e)の各遺伝子群内の遺伝子の大腸がん細胞での発現は相互に相関しており、各遺伝子群はシグネチュアとなる。これら遺伝子シグネチュアは、その遺伝子群に含まれる単独の遺伝子よりも大腸がん患者の予後予測因子として強い統計的有意差を示しうる。各遺伝子にコードされる代表的なmRNA配列およびアミノ酸配列のGenbankアクセッション番号を表1に示す。個々の大腸がん患者における各遺伝子の配列はこれら配列に限定されず、天然の変異を含みうる。

In one aspect, the present disclosure relates to a method for predicting the prognosis of a colorectal cancer patient. The prognosis prediction method of the present disclosure comprises measuring the expression levels of genes in one or more gene groups selected from gene groups (a) to (e) shown in Table 1. The expression of genes in each gene group (a) to (e) in colorectal cancer cells is correlated with each other, and each gene group forms a signature. These gene signatures may exhibit stronger statistical significance as a prognostic predictor for colorectal cancer patients than a single gene included in that gene group. Genbank accession numbers for representative mRNA sequences and amino acid sequences encoded by each gene are shown in Table 1. The sequences of each gene in individual colorectal cancer patients are not limited to these sequences and may include natural mutations.

 遺伝子の発現レベルの測定は、その遺伝子によりコードされるmRNAまたはタンパク質の発現を測定することにより、行うことができる。mRNAまたはタンパク質の発現はいずれの方法により測定してもよい。測定方法としては、PCR(polymerase chain reaction)、RNAシーケンシング(RNA-Seq)、マイクロアレイ、および免疫染色、ELISA、ウェスタンブロット、ドットブロットなどの免疫学的方法などが挙げられる。本明細書において、PCRなる用語は、RT-PCR(reverse transcription PCR)、qPCR(quantitative PCR)、リアルタイムPCRなど、PCRを利用したいずれの方法をも含む意味で用いられる。当業者は、がん試料を測定方法に応じて適切に処理することができ、各遺伝子によりコードされるmRNA配列またはアミノ酸配列に基づき、測定に適するプライマー、プローブまたは抗体などの試薬を適宜作製または選択することができる。一実施形態において、遺伝子の発現レベルの測定は、mRNA発現レベルの測定により行われる。 The expression level of a gene can be measured by measuring the expression of the mRNA or protein encoded by that gene. The expression of mRNA or protein may be measured by any method. Measurement methods include polymerase chain reaction (PCR), RNA sequencing (RNA-Seq), microarrays, and immunological methods such as immunostaining, ELISA, Western blot, and dot blot. In this specification, the term PCR is used to include any method that utilizes PCR, such as reverse transcription PCR (RT-PCR), quantitative PCR (qPCR), and real-time PCR. Those skilled in the art can appropriately process cancer samples according to the measurement method, and can appropriately prepare or select reagents such as primers, probes, or antibodies suitable for measurement based on the mRNA sequence or amino acid sequence encoded by each gene. In one embodiment, the expression level of a gene is measured by measuring the mRNA expression level.

 プライマーまたはプローブは、各遺伝子によりコードされるmRNA配列の一部に相補的な配列を含むか、前記配列からなりうる。プライマーまたはプローブは、例えば、10~50ヌクレオチド、15~35ヌクレオチド、または20~30ヌクレオチドでありうる。一実施形態において、プライマーまたはプローブは、各遺伝子によりコードされるmRNA配列の一部に相補的な10~50ヌクレオチド、15~35ヌクレオチド、または20~30ヌクレオチドの配列を含むか、前記配列からなる。一実施形態において、プライマーまたはプローブは、配列番号1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、および37から選択されるいずれかの配列の一部に相補的な10~50ヌクレオチド、15~35ヌクレオチド、または20~30ヌクレオチドの配列を含むか、前記配列からなる。 The primers or probes may comprise or consist of a sequence complementary to a portion of the mRNA sequence encoded by each gene. The primers or probes may be, for example, 10 to 50 nucleotides, 15 to 35 nucleotides, or 20 to 30 nucleotides. In one embodiment, the primers or probes comprise or consist of a sequence of 10 to 50 nucleotides, 15 to 35 nucleotides, or 20 to 30 nucleotides complementary to a portion of the mRNA sequence encoded by each gene. In one embodiment, the primers or probes comprise or consist of a sequence of 10 to 50 nucleotides, 15 to 35 nucleotides, or 20 to 30 nucleotides complementary to a portion of any sequence selected from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, and 37.

 一実施形態において、遺伝子の発現レベルは、各遺伝子に特異的なプライマーを用いたPCRにより測定される。PCRは、各遺伝子に対する反応を別々の容器で行ってもよく、複数の遺伝子に対する反応を1つの容器で行ってもよい。当業者は好適なPCR条件を適宜設定することができる。 In one embodiment, the gene expression levels are measured by PCR using primers specific to each gene. PCR reactions for each gene may be performed in separate containers, or reactions for multiple genes may be performed in a single container. Those skilled in the art can appropriately determine suitable PCR conditions.

 大腸は結腸および直腸に分けられ、大腸がんには結腸がんおよび直腸がんが含まれる。大腸がんは、進行の程度により、0、I、II、III、およびIVのステージに分けられる。本開示における大腸がんにはいずれのステージの大腸がんも含まれる。一実施形態において、大腸がん患者は、ステージI、II、III、またはIVの患者である。一実施形態において、大腸がん患者は、ステージII、III、またはIVの患者である。一実施形態において、大腸がん患者は、ステージIIIまたはIVの患者である。 The large intestine is divided into the colon and the rectum, and colorectal cancer includes colon cancer and rectal cancer. Colorectal cancer is divided into stages 0, I, II, III, and IV depending on the degree of progression. Colorectal cancer in this disclosure includes colorectal cancer of any stage. In one embodiment, the colorectal cancer patient is a patient at stage I, II, III, or IV. In one embodiment, the colorectal cancer patient is a patient at stage II, III, or IV. In one embodiment, the colorectal cancer patient is a patient at stage III or IV.

 がん試料は、患者の大腸がん組織における遺伝子発現レベルを調べることができるものであればよい。がん試料は、例えば、手術試料、バイオプシー試料、またはがんスフェロイドでありうる。一実施形態において、手術試料は、原発巣切除時の手術試料である。本明細書において、がんスフェロイドとは、腫瘍始原細胞(tumor initiating cell)を含む細胞塊を意味し、腫瘍始原細胞とは免疫不全動物に移植すると腫瘍を形成する細胞を意味する。がんスフェロイドは、患者のがん細胞または組織から作成される。がんスフェロイドはいずれの方法により作成してもよく、例えば国際公開第2019/111998号公報に記載の方法により作成することができる。 A cancer sample may be any sample that can be used to examine gene expression levels in a patient's colon cancer tissue. The cancer sample may be, for example, a surgical sample, a biopsy sample, or a cancer spheroid. In one embodiment, the surgical sample is a sample obtained at the time of resection of the primary lesion. As used herein, cancer spheroid refers to a cell mass containing tumor-initiating cells, and tumor-initiating cells refer to cells that form tumors when transplanted into an immunodeficient animal. Cancer spheroids are created from a patient's cancer cells or tissue. Cancer spheroids may be created by any method, for example, by the method described in WO 2019/111998.

 一実施形態において、本開示の方法は、患者における各遺伝子の発現レベルから、各遺伝子のZスコア(Z)を、式(I):
(式中、xは前記患者の当該遺伝子の発現レベルであり、μおよびσはそれぞれ、複数の大腸がん患者の当該遺伝子の発現レベルの平均および標準偏差である)
により求めること、
 各遺伝子群の遺伝子発現シグネチュアスコアを決定すること、および
 前記遺伝子発現シグネチュアスコアをカットオフ値と比較すること
を含む。
In one embodiment, the method of the present disclosure calculates a Z-score (Z) for each gene from the expression level of each gene in a patient using formula (I):
(where x is the expression level of the gene in the patient, and μ and σ are the mean and standard deviation of the expression levels of the gene in multiple colorectal cancer patients, respectively)
To seek by
determining a gene expression signature score for each group of genes; and comparing the gene expression signature score to a cutoff value.

 μおよびσは、複数の大腸がん患者の当該遺伝子の発現レベルの平均および標準偏差であり、遺伝子ごとに事前に決定された値である。μおよびσの値は、例えば、患者の遺伝子発現レベルの測定に用いる方法と同じ方法で測定された複数の大腸がん患者の遺伝子発現レベルから決定することができる。あるいは、μおよびσの値は、データベースに登録された複数の大腸がん患者の遺伝子発現データに基づき決定することができる。利用可能なデータベースとしては、TCGA-CRC(The Cancer Genome Atlas)(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)、National Center for Biotechnology Information(NCBI)(https://www.ncbi.nlm.nih.gov/geo/)のGene Expression Omnibus(GEO)のGSE39582などが挙げられる。μおよびσの値は、複数の大腸がん患者のがんスフェロイドの遺伝子発現データに基づき決定することもできる。複数の大腸がん患者は、例えば50~1000、50~500、50~200、または50~100例でありうるが、これらに限定されない。当業者は必要な症例数を適宜決定することができ、症例数が増加した際に(例えば、症例数が倍加するごとに)μおよびσの値を補正することもできる。Zスコアの算出に用いる遺伝子発現レベルは、各遺伝子の発現レベルが反映される値であればよく、測定値であっても相対値であっても、これらの対数であってもよく、また適宜補正または標準化された値であってもよい。 μ and σ are the mean and standard deviation of the expression levels of the gene in question in multiple colorectal cancer patients, and are predetermined values for each gene. The values of μ and σ can be determined, for example, from the gene expression levels of multiple colorectal cancer patients measured using the same method as that used to measure the patient's gene expression levels. Alternatively, the values of μ and σ can be determined based on gene expression data of multiple colorectal cancer patients registered in a database. Available databases include TCGA-CRC (The Cancer Genome Atlas) (https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga) and GSE39582 in the Gene Expression Omnibus (GEO) of the National Center for Biotechnology Information (NCBI) (https://www.ncbi.nlm.nih.gov/geo/). The values of μ and σ can also be determined based on gene expression data of cancer spheroids from multiple colorectal cancer patients. The number of colorectal cancer patients can be, for example, but is not limited to, 50 to 1000, 50 to 500, 50 to 200, or 50 to 100. Those skilled in the art can appropriately determine the required number of cases, and can also correct the values of μ and σ when the number of cases increases (e.g., each time the number of cases doubles). The gene expression levels used to calculate the Z-score may be values that reflect the expression level of each gene, and may be measured values, relative values, or logarithms of these, or may be appropriately corrected or standardized values.

 遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子の発現レベルを示す値であり、当該遺伝子群の遺伝子のZスコアの合計、または当該遺伝子群の遺伝子のZスコアの平均値である。例えば、遺伝子群(a)(ラッキー5シグネチュア)の遺伝子発現シグネチュアスコアは、MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16の5種類の遺伝子のZスコアを足し合わせることにより、またはこれら遺伝子のZスコアを足し合わせた値をその遺伝子数である5で割ることにより、決定することができる。一実施形態において、遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子のZスコアの平均値である。 The gene expression signature score is a value indicating the expression level of genes in each gene group, and is the sum of the Z scores of the genes in that gene group, or the average Z score of the genes in that gene group. For example, the gene expression signature score of gene group (a) (Lucky 5 signature) can be determined by adding up the Z scores of the five genes MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16, or by dividing the sum of the Z scores of these genes by 5, which is the number of genes in the gene group. In one embodiment, the gene expression signature score is the average Z score of the genes in each gene group.

 遺伝子発現シグネチュアスコアは、カットオフ値と比較される。カットオフ値は、予後が判明している複数の大腸がん患者を予後良好群と予後不良群とに統計的有意差をもって分けることができる遺伝子発現シグネチュアスコアの値である。カットオフ値は、例えば、カプラン-マイヤー法による生存曲線において複数の大腸がん患者を予後良好群と予後不良群とにわけたときにP値が最小となる値とすることができる。予後良好群と予後不良群との間の統計的有意差は、例えばlogrank検定により決定することができる。 The gene expression signature score is compared with a cutoff value. The cutoff value is the gene expression signature score value that can statistically significantly divide multiple colorectal cancer patients with known prognosis into a good prognosis group and a poor prognosis group. The cutoff value can be, for example, the value that minimizes the P value when multiple colorectal cancer patients are divided into a good prognosis group and a poor prognosis group in a Kaplan-Meier survival curve. The statistical significance between the good prognosis group and the poor prognosis group can be determined, for example, by the logrank test.

 遺伝子発現シグネチュアスコアは、複数のカットオフ値と比較してもよい。例えば、予後が判明している複数の大腸がん患者において、各患者の予後を3段階以上にランク付けし、各ランクの群を統計学的有意差をもって分けることができる2またはそれ以上の遺伝子発現シグネチュアスコアをカットオフ値としてもよい。統計的有意差は、例えばlogrank検定により決定することができる。あるいは、カットオフ値は、複数の大腸がん患者を遺伝子発現シグネチュアスコアの順に一定の割合で区切ることができる複数の値であってもよく、例えば、複数の大腸がん患者の遺伝子発現シグネチュアスコアの四分位数であってもよい。複数のカットオフ値との比較により、大腸がん患者を予後に応じて層別化することができる。 The gene expression signature score may be compared with multiple cutoff values. For example, for multiple colorectal cancer patients whose prognosis is known, the prognosis of each patient may be ranked into three or more levels, and two or more gene expression signature scores that can separate each rank group with a statistically significant difference may be used as cutoff values. Statistical significance can be determined, for example, by the logrank test. Alternatively, the cutoff values may be multiple values that can separate multiple colorectal cancer patients at a certain ratio in order of their gene expression signature scores, and may be, for example, the quartiles of the gene expression signature scores of multiple colorectal cancer patients. By comparing with multiple cutoff values, colorectal cancer patients can be stratified according to prognosis.

 遺伝子発現シグネチュアスコアとカットオフ値との比較は、統計学解析を含んでも、含まなくてもよい。統計学的解析方法としては、一元配置分散分析(one-way ANOVA)、二元配置分散分析(two-way ANOVA)、ダネットの検定(Dunnett's test)、テューキーの検定(Tukey's test)などが挙げられる。 The comparison of the gene expression signature score with the cutoff value may or may not involve statistical analysis. Statistical analysis methods include one-way ANOVA, two-way ANOVA, Dunnett's test, and Tukey's test.

 遺伝子群(a)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(a)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後良好であると予測される。 The gene expression signature score for gene group (a) is compared with the cutoff value for that gene group. If the gene expression signature score for gene group (a) is higher than the cutoff value, the patient is predicted to have a good prognosis.

 遺伝子群(b)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(b)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後良好であると予測される。 The gene expression signature score of gene group (b) is compared with the cutoff value for that gene group. If the gene expression signature score of gene group (b) is higher than the cutoff value, the patient is predicted to have a good prognosis.

 遺伝子群(c)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(c)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後不良であると予測される。 The gene expression signature score of gene group (c) is compared with the cutoff value for that gene group. If the gene expression signature score of gene group (c) is higher than the cutoff value, the patient is predicted to have a poor prognosis.

 遺伝子群(d)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(d)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後不良であると予測される。 The gene expression signature score of gene group (d) is compared with the cutoff value for that gene group. If the gene expression signature score of gene group (d) is higher than the cutoff value, the patient is predicted to have a poor prognosis.

 遺伝子群(e)の遺伝子発現シグネチュアスコアは、当該遺伝子群のカットオフ値と比較される。遺伝子群(e)の遺伝子発現シグネチュアスコアがカットオフ値より高い場合、患者は予後不良であると予測される。 The gene expression signature score for gene group (e) is compared with the cutoff value for that gene group. If the gene expression signature score for gene group (e) is higher than the cutoff value, the patient is predicted to have a poor prognosis.

 一実施形態において、本開示の方法は、遺伝子群(a)~(e)から選択される2つの遺伝子群の遺伝子の発現レベルを測定することを含む。一実施形態において、本開示の方法は、遺伝子群(a)~(e)から選択される3つの遺伝子群の遺伝子の発現レベルを測定することを含む。一実施形態において、本開示の方法は、遺伝子群(a)~(e)から選択される4つの遺伝子群の遺伝子の発現レベルを測定することを含む。一実施形態において、本開示の方法は、遺伝子群(a)~(e)から選択される5つの遺伝子群の遺伝子の発現レベルを測定することを含む。 In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in two gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in three gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in four gene groups selected from gene groups (a) to (e). In one embodiment, the method of the present disclosure includes measuring the expression levels of genes in five gene groups selected from gene groups (a) to (e).

 一実施形態において、本開示の方法は、
 遺伝子群(a)~(e)の遺伝子群の遺伝子の発現レベルを測定すること、
 大腸がん総合シグネチュア(GCS)スコアを、式(II): 
(式中、
は予後の極性を示す係数であり、ここで遺伝子群(a)~(b)の係数は1であり、遺伝子群(c)~(e)の係数は-1であり、
は、各遺伝子群の遺伝子のZスコアの平均値である)
により求めること、および
 前記GCSスコアをカットオフ値と比較すること
を含む。
In one embodiment, the method of the present disclosure comprises:
Measuring the expression levels of genes in gene groups (a) to (e);
The colon cancer comprehensive signature (GCS) score was calculated using formula (II):
(In the formula,
is a coefficient indicating the polarity of prognosis, where the coefficient of gene group (a) to (b) is 1, the coefficient of gene group (c) to (e) is -1,
is the average Z score of the genes in each gene group)
and comparing the GCS score with a cutoff value.

 GCSスコアは、遺伝子群(a)~(e)の5種類のシグネチュアを統合した総合的なシグネチュアである。
は、各遺伝子群(すなわち各遺伝子シグネチュア)の予後の極性を示す係数である。予後良好と相関する遺伝子群(a)~(b)の係数は1であり、予後不良と相関する遺伝子群(c)~(e)の係数は-1である。
は、各遺伝子群の遺伝子のZスコアの平均値であり、各遺伝子群の遺伝子のZスコアの足し合わせ、遺伝子の数で割ることで求められる。すなわち、GCSスコアは、遺伝子群(a)~(e)について、各遺伝子群の遺伝子のZスコアの平均値に予後の極性を示す係数を乗じた値を求め、これらを足し合わせることで求められる。
The GCS score is a comprehensive signature that integrates five types of signatures from gene groups (a) to (e).
is a coefficient indicating the polarity of the prognosis of each gene group (i.e., each gene signature). The coefficient of gene groups (a) to (b) correlated with a good prognosis is 1, and the coefficient of gene groups (c) to (e) correlated with a poor prognosis is -1.
is the average Z score of the genes in each gene group, and is calculated by adding up the Z scores of the genes in each gene group and dividing by the number of genes. In other words, the GCS score is calculated for gene groups (a) to (e) by multiplying the average Z score of the genes in each gene group by a coefficient indicating the polarity of prognosis and then adding these values together.

 GCSスコアは、カットオフ値と比較される。カットオフ値は、予後が判明している複数の大腸がん患者を予後良好群と予後不良群とに統計的有意差をもって分けることができるGCSスコアの値である。カットオフ値は、例えば、カプラン-マイヤー法による生存曲線において複数の大腸がん患者を予後良好群と予後不良群とにわけたときにP値が最小となる値とすることができる。予後良好群と予後不良群との間の統計的有意差は、例えばlogrank検定により決定することができる。大腸がん総合スコアがカットオフ値より高い場合、患者は予後良好であると予測される。 The GCS score is compared with a cutoff value. The cutoff value is a GCS score value that can statistically significantly divide multiple colorectal cancer patients with known prognosis into good prognosis and poor prognosis groups. The cutoff value can be, for example, the value that minimizes the P value when multiple colorectal cancer patients are divided into good prognosis and poor prognosis groups using the Kaplan-Meier survival curve. The statistical significance between the good prognosis and poor prognosis groups can be determined, for example, using the logrank test. If the colorectal cancer composite score is higher than the cutoff value, the patient is predicted to have a good prognosis.

 GCSスコアは、複数のカットオフ値と比較してもよい。例えば、予後が判明している複数の大腸がん患者において、各患者の予後を3段階以上にランク付けし、各ランクの群を統計学的有意差をもって分けることができる2またはそれ以上の大腸がん総合スコアをカットオフ値としてもよい。統計的有意差は、例えばlogrank検定により決定することができる。あるいは、カットオフ値は、複数の大腸がん患者をGCSスコアの順に一定の割合で区切ることができる複数の値であってもよく、例えば、複数の大腸がん患者の大腸がん総合スコアの四分位数であってもよい。複数のカットオフ値との比較により、大腸がん患者を予後に応じて層別化することができる。 The GCS score may be compared with multiple cutoff values. For example, for multiple colorectal cancer patients whose prognosis is known, the prognosis of each patient may be ranked into three or more levels, and two or more colorectal cancer comprehensive scores that can separate each ranked group with a statistically significant difference may be used as cutoff values. Statistical significance can be determined, for example, by the log-rank test. Alternatively, the cutoff values may be multiple values that can separate multiple colorectal cancer patients at a certain ratio in order of GCS score, and may be, for example, the quartiles of the colorectal cancer comprehensive scores of multiple colorectal cancer patients. By comparing with multiple cutoff values, colorectal cancer patients can be stratified according to prognosis.

 GCSスコアとカットオフ値との比較は、統計学解析を含んでも、含まなくてもよい。統計学的解析方法としては、一元配置分散分析(one-way ANOVA)、2元配置分散分析(two-way ANOVA)、ダネットの検定(Dunnett's test)、テューキーの検定(Tukey's test)などが挙げられる。 Comparison of GCS scores with cutoff values may or may not involve statistical analysis. Statistical analysis methods include one-way ANOVA, two-way ANOVA, Dunnett's test, and Tukey's test.

 大腸がんは治療ガイドラインにステージごとの治療方針が定められており、例えば、ステージIIは原則化学療法の対象外だが、本開示の方法により予後不良と予測されれば化学療法を行う、といった治療選択が可能である。また、ステージIIIは原則化学療法を行うよう定められているが、本開示の方法により予後良好と予測されれば化学療法を行わないか、副作用の少ない薬剤を使用する、予後不良と予測されれば作用の強い薬剤を使用する、などの治療選択が可能である。すなわち、本開示の予後予測方法は治療方法の最適化に貢献する。 For colorectal cancer, treatment guidelines stipulate treatment strategies for each stage. For example, stage II cancer is generally not a candidate for chemotherapy, but if the method disclosed herein predicts a poor prognosis, chemotherapy can be administered. Furthermore, while chemotherapy is generally prescribed for stage III cancer, if the method disclosed herein predicts a good prognosis, chemotherapy can be avoided or a drug with fewer side effects can be used, and if a poor prognosis is predicted, a drug with stronger effects can be used. In other words, the prognosis prediction method disclosed herein contributes to optimizing treatment methods.

 このように、本開示の方法により予後を予測された大腸がん患者は、予測結果に基づき選択した治療薬または治療法で処置されうる。それゆえ、本開示は、一態様において、大腸がん患者の治療方法であって、本開示の予後予測方法により大腸がん患者の予後を予測すること、および予測結果に基づき選択した治療薬または治療法を前記患者に施すことを含む方法を提供する。治療薬としては、5-フルオロウラシル(5-FU)、テガフール、テガフール-ウラシル(UFT)、ドキシフルリジン(5’-DFUR)、カルモフール、テガフール-ギメラシル-オテラシルカリウム(S-1)、カペシタビン(Cape)、レゴラフェニブ、トリフルリジン-チピラシル塩酸塩(FTD/TPI)、マイトマイシンC、イリノテカン(IRI)、オキサリプラチン(OX)などの抗がん剤、および血管内皮細胞増殖因子(VEGF)阻害薬(例えば、ベバシズマブ、アフリベルセプト)、血管内皮細胞増殖因子受容体(VEGFR)阻害薬(例えば、ラムシルマブ)、FGFR阻害薬(例えば、エルダフィチニブ、ロガラチニブ、AZD4547、インフィグラチニブ、フィソガチニブ、LY2874455、フチバチニブ、ASP5878、デラザンチニブ)、EGFR阻害薬(例えば、セツキシマブ、パニツムマブ、エルロチニブ)などの分子標的薬が挙げられる。治療法としては、FOLFOX療法(点滴5-FU+レボホリナート+OX)、FOLFIRI療法(5-FU+レボホリナート+IRI)、FOLFOXIRI療法(5-FU+レボホリナート+OX+IRI)、CapeOX療法(Cape+OX)、SOX療法(S-1+OX)、IRIS療法(S-1+IRI)などの化学療法、内視鏡的切除、外科的切除、放射線療法が挙げられる。 In this way, colorectal cancer patients whose prognosis has been predicted by the method of the present disclosure can be treated with a therapeutic agent or therapy selected based on the prediction results. Therefore, in one aspect, the present disclosure provides a method for treating colorectal cancer patients, which comprises predicting the prognosis of a colorectal cancer patient using the prognosis prediction method of the present disclosure, and administering to the patient a therapeutic agent or therapy selected based on the prediction results. The therapeutic agent may be an anticancer drug such as 5-fluorouracil (5-FU), tegafur, tegafur-uracil (UFT), doxifluridine (5'-DFUR), carmofur, tegafur-gimeracil-oteracil potassium (S-1), capecitabine (Cape), regorafenib, trifluridine-tipiracil hydrochloride (FTD/TPI), mitomycin C, irinotecan (IRI), oxaliplatin (OX), or vascular endothelial growth factor (VGF). Examples of molecular targeted drugs include VEGF inhibitors (e.g., bevacizumab, aflibercept), vascular endothelial growth factor receptor (VEGFR) inhibitors (e.g., ramucirumab), FGFR inhibitors (e.g., erdafitinib, rogaratinib, AZD4547, infigratinib, fisogatinib, LY2874455, futibatinib, ASP5878, derazantinib), and EGFR inhibitors (e.g., cetuximab, panitumumab, erlotinib). Treatment options include chemotherapy such as FOLFOX therapy (intravenous 5-FU + levofolinate + OX), FOLFIRI therapy (5-FU + levofolinate + IRI), FOLFOXIRI therapy (5-FU + levofolinate + OX + IRI), CapeOX therapy (Cape + OX), SOX therapy (S-1 + OX), and IRIS therapy (S-1 + IRI), as well as endoscopic resection, surgical resection, and radiation therapy.

 一態様において、本開示は、大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含むキットに関する。
In one aspect, the present disclosure provides a kit for predicting the prognosis of a colorectal cancer patient, the kit comprising: a group of genes (a) to (e):
(a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16,
(b) DEFA6, DEFA5, and SPINK1,
(c) BST2, BATF, RAMP1, and TPM2,
(d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
The present invention relates to a kit comprising a reagent for measuring the expression level of one or more genes in a group selected from the group consisting of:

 試薬は、本開示の予後予測方法に関して記載されるように、各遺伝子によりコードされるmRNA配列またはアミノ酸配列に基づき作製または選択することができる。一実施形態において、試薬は、プライマーまたはプローブである。一実施形態において、試薬は、PCR用プライマーである。キットは、試薬に加え、測定用容器、緩衝液、使用説明書などを含んでもよい。 The reagents can be prepared or selected based on the mRNA sequence or amino acid sequence encoded by each gene, as described in relation to the prognosis prediction method of the present disclosure. In one embodiment, the reagents are primers or probes. In one embodiment, the reagents are PCR primers. In addition to the reagents, the kit may also include measurement containers, buffer solutions, instructions for use, etc.

 本開示の例示的実施形態を以下に記載する。
[1]
 大腸がん患者の予後を予測するための方法であって、患者のがん試料における遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびSPINK1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む、方法。
[2]
 各遺伝子のZスコア(Z)を、式(I):
(式中、xは前記患者の当該遺伝子の発現レベルであり、μおよびσはそれぞれ、複数の大腸がん患者の当該遺伝子の発現レベルの平均および標準偏差である)
により求めること、
 各遺伝子群の遺伝子発現シグネチュアスコアを決定すること、ここで、各遺伝子群の遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子のZスコアの合計、または各遺伝子群の遺伝子のZスコアの平均値である、および
 前記遺伝子発現シグネチュアスコアをカットオフ値と比較すること
をさらに含む、前記1に記載の方法。
[3]
 各遺伝子群の遺伝子発現シグネチュアスコアが、各遺伝子群の遺伝子のZスコアの平均値である、前記2に記載の方法。
[4]
 遺伝子群(a)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、前記2または3のいずれかに記載の方法。
[5]
 遺伝子群(b)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、前記2~4のいずれかに記載の方法。
[6]
 遺伝子群(c)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~5のいずれかに記載の方法。
[7]
 遺伝子群(d)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~6のいずれかに記載の方法。
[8]
 遺伝子群(e)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、前記2~7のいずれかに記載の方法。
[9]
 1以上の遺伝子群が、遺伝子群(a)~(e)である、前記1~8のいずれかに記載の方法。
[10]
 1以上の遺伝子群が、遺伝子群(a)~(e)である、および、
 大腸がん総合シグネチュア(GCS)スコアを、式(II): 
(式中、
は予後の極性を示す係数であり、ここで遺伝子群(a)~(b)の係数は1であり、遺伝子群(c)~(e)の係数は-1であり、
は、各遺伝子群の遺伝子のZスコアの平均値である)
により決定すること、および
 前記GCSスコアををカットオフ値と比較すること
をさらに含む、前記1に記載の方法。
[11]
 がん試料が、手術試料またはバイオプシー試料である、前記1~10のいずれかに記載の方法。
[12]
 がん試料が、がんスフェロイドである、前記1~10のいずれかに記載の方法。
Exemplary embodiments of the present disclosure are described below.
[1]
A method for predicting the prognosis of a colorectal cancer patient, comprising:
(a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16,
(b) DEFA6, DEFA5, and SPINK1,
(c) BST2, BATF, RAMP1, and TPM2,
(d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and SPINK1.
and measuring the expression levels of one or more genes selected from the group consisting of:
[2]
The Z-score (Z) of each gene was calculated using the formula (I):
(where x is the expression level of the gene in the patient, and μ and σ are the mean and standard deviation of the expression levels of the gene in multiple colorectal cancer patients, respectively)
To seek by
2. The method of claim 1, further comprising determining a gene expression signature score for each gene group, wherein the gene expression signature score for each gene group is the sum of the Z-scores of the genes in each gene group or the average of the Z-scores of the genes in each gene group; and comparing the gene expression signature score to a cutoff value.
[3]
3. The method according to 2, wherein the gene expression signature score of each gene group is the average value of the Z scores of the genes in each gene group.
[4]
4. The method according to any one of 2 and 3, comprising comparing the gene expression signature score of the gene group (a) with a cutoff value, wherein if the gene expression signature score is higher than the cutoff value, the patient is predicted to have a good prognosis.
[5]
5. The method according to any one of 2 to 4, further comprising comparing a gene expression signature score of the gene group (b) with a cutoff value, wherein the patient is predicted to have a good prognosis if the gene expression signature score is higher than the cutoff value.
[6]
6. The method according to any one of 2 to 5, further comprising comparing a gene expression signature score of the gene group (c) with a cutoff value, wherein the patient is predicted to have a poor prognosis if the gene expression signature score is higher than the cutoff value.
[7]
7. The method according to any one of 2 to 6, further comprising comparing a gene expression signature score of the gene group (d) with a cutoff value, wherein the patient is predicted to have a poor prognosis if the gene expression signature score is higher than the cutoff value.
[8]
8. The method according to any one of 2 to 7, further comprising comparing a gene expression signature score of the gene group (e) with a cutoff value, wherein the patient is predicted to have a poor prognosis if the gene expression signature score is higher than the cutoff value.
[9]
9. The method according to any one of 1 to 8 above, wherein the one or more gene groups are gene groups (a) to (e).
[10]
The one or more gene groups are gene groups (a) to (e), and
The colon cancer comprehensive signature (GCS) score was calculated using formula (II):
(In the formula,
is a coefficient indicating the polarity of prognosis, where the coefficient of gene group (a) to (b) is 1, the coefficient of gene group (c) to (e) is -1,
is the average Z score of the genes in each gene group)
and comparing the GCS score to a cutoff value.
[11]
11. The method according to any one of 1 to 10, wherein the cancer sample is a surgical sample or a biopsy sample.
[12]
11. The method according to any one of 1 to 10, wherein the cancer sample is a cancer spheroid.

[13]
 大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含む、キット。
[14]
 1以上の遺伝子群が、遺伝子群(a)~(e)である、前記13に記載のキット。
[15]
 試薬が、プライマーまたはプローブである、前記13または14に記載のキット。
[13]
A kit for predicting the prognosis of a colorectal cancer patient, comprising:
(a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16,
(b) DEFA6, DEFA5, and SPINK1,
(c) BST2, BATF, RAMP1, and TPM2,
(d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
A kit comprising a reagent for measuring the expression level of one or more genes in a group selected from the group consisting of:
[14]
14. The kit according to 13 above, wherein the one or more gene groups are gene groups (a) to (e).
[15]
15. The kit according to 13 or 14 above, wherein the reagent is a primer or a probe.

 大腸がん患者の治療方法であって、
 前記1~12のいずれかに記載の方法により大腸がん患者の予後を予測すること、および
 予測結果に基づき選択した治療薬または治療法を前記患者に施すこと
を含む、方法。
1. A method for treating a patient with colorectal cancer, comprising:
13. A method comprising: predicting the prognosis of a colorectal cancer patient by the method according to any one of 1 to 12; and administering to the patient a therapeutic agent or treatment selected based on the result of the prediction.

 以下、本発明を実施例によりさらに説明するが、本発明は如何なる意味においても以下の実施例に限定されない。 The present invention will be further explained below using examples, but the present invention is not limited to the following examples in any way.

1.材料と方法
ヒト標本
 合計216個の腫瘍標本は2014年10月から2018年8月の間に京都大学附属病院(KUHP)で原発巣切除術を受けた合計208人の大腸癌患者から採取された。KUHPにおいて病理専門医による組織病理学的検査を通して、彼らの診断は高・中・低分化大腸がん、粘液大腸がん、乳頭状大腸がんのいずれかとして確認された。ヒト標本の研究プロトコルは日本国京都市の京都大学における医の倫理委員会に承認され(承認番号R0915およびR0857, 2015年から2024年まで)、標本の使用とそのデータ解析に関して患者は同意書を提出した。
1. Materials and Methods Human Specimens A total of 216 tumor specimens were collected from 208 patients with colorectal cancer who underwent primary tumor resection at Kyoto University Hospital (KUHP) between October 2014 and August 2018. Their diagnoses were confirmed as well-, moderately, or poorly differentiated colorectal cancer, mucinous colorectal cancer, or papillary colorectal cancer through histopathological examination by a pathologist at KUHP. The research protocol for human specimens was approved by the Medical Ethics Committee of Kyoto University, Kyoto, Japan (approval numbers R0915 and R0857, from 2015 to 2024), and patients provided written informed consent for the use of their specimens and data analysis.

患者由来CRC-SCのスフェロイドとしての分離と培養
 方法は以前に記述した {Miyoshi et al., 2018}。手短に言えば、2片の腫瘍組織片(それぞれ 約1 cm3)を大腸がん病変の隆起部位から、1片の正常粘膜組織片(約1 cm2)をその周辺の正常大腸組織から、それぞれ採取した。それら組織片は氷冷の洗浄用培地 [HEPESとL-グルタミン入りDMEM/F12(Nacalai tesque, Kyoto, Japan)に100 units/ml ペニシリン(Nacalai tesque)、0.1 mg/ml ストレプトマイシン(Nacalai tesque)、および10% 仔牛血清(Sigma)が含まれている] に入れて研究室に移送された。組織は術後24時間以内に処理された。大腸がん摘出標本の組織片と正常大腸粘膜の試料は60 mm ペトリ皿上でハサミを用いてそれぞれ別個に細かく刻まれた。それぞれの標本は2 mlのコラーゲナーゼ溶液 [0.2% collagenase type I(Thermo Fisher Scientific, Waltham, MA, USA)と50 μg/ml ゲンタマイシン(Thermo Fisher)を添加した洗浄用培地] 中で37℃で40-60分間消化され、細胞はピペッティングにより分離された。その後、CRC細胞とNCE細胞は直径100 μmのセルストレイナー(Corning Inc., Corning, NY)で一度濾過され、遠心法で回収された。それから単離された細胞はマトリゲル(Corning)内に懸濁され、12ウェル細胞培養プレート(TPP, Trasadingen, Switzerland)のそれぞれのウェルの中心に載せられた(1ウェルあたり30 μlずつ)。37℃でのマトリゲルのゲル化の後、ペニシリン(100 units/ml, Nacalai tesque)、ストレプトマイシン(0.1 mg/ml, Nacalai tesque)、L-グルタミン(2 mM)、Y27632(10 μM)、SB431542(1 μM)、EGF(50 ng/ml, Peprotech)、塩基性FGF(100 ng/ml Peprotech)を添加したAdvanced DMEM/F12(Thermo Fisher)中で、5% CO2の中で37℃で細胞を培養した。NCE-SC細胞は過去に記載したようにeL-WRN培地で培養した {Miyoshi et al., 2018}。
Isolation and culture of patient-derived CRC-SCs as spheroids was previously described {Miyoshi et al., 2018}. Briefly, two tumor tissue fragments (approximately 1 cm each) were collected from the protruding portion of the colon cancer lesion, and one normal mucosal tissue fragment (approximately 1 cm) was collected from the surrounding normal colon tissue. The tissue fragments were transported to the laboratory in ice-cold wash medium [DMEM/F12 with HEPES and L-glutamine (Nacalai tesque, Kyoto, Japan) containing 100 units/ml penicillin (Nacalai tesque), 0.1 mg/ml streptomycin (Nacalai tesque), and 10% fetal bovine serum (Sigma)]. Tissues were processed within 24 hours after surgery. Colon cancer tissue fragments and normal colon mucosa samples were separately minced with scissors on 60-mm Petri dishes. Each specimen was digested in 2 ml of collagenase solution (washing medium supplemented with 0.2% collagenase type I (Thermo Fisher Scientific, Waltham, MA, USA) and 50 μg/ml gentamicin (Thermo Fisher)) at 37°C for 40–60 min, and the cells were separated by pipetting. CRC and NCE cells were then filtered once through a 100 μm cell strainer (Corning Inc., Corning, NY) and collected by centrifugation. The isolated cells were then suspended in Matrigel (Corning) and placed in the center of each well of a 12-well cell culture plate (TPP, Trasadingen, Switzerland) (30 μl per well). After Matrigel gelation at 37°C, cells were cultured in Advanced DMEM/F12 (Thermo Fisher Scientific) supplemented with penicillin (100 units/ml, Nacalai tesque), streptomycin (0.1 mg/ml, Nacalai tesque), L-glutamine (2 mM), Y27632 (10 μM), SB431542 (1 μM), EGF (50 ng/ml, Peprotech), and basic FGF (100 ng/ml, Peprotech) in 5% CO2 at 37°C. NCE-SC cells were cultured in eL-WRN medium as previously described {Miyoshi et al., 2018}.

RNA sequencing解析
 以前報告された方法を用いて {Yamamoto, Miyoshi et al. 2020, Kitano, Yamamoto et al. 2022}、NCE-SCスフェロイド株(GSE189212)のRNA sequencing(RNA-seq)解析はマクロジェン社(Seoul, Korea)により行われた。手短に言えば、合成されたライブラリーはIllumina HighSeq 2000 sequencerを用いて、1サンプルあたり約4000万リードの深さで両端からシーケンスされた(2 × 100 bases)。シーケンスリードはHISAT2プログラムによりhg19レファレンスゲノムにマップされ {Kim, Langmead et al. 2015, Kim, Paggi et al. 2019}、転写産物はStringTieプログラムを用いて統合した {Pertea, Pertea et al. 2015}。リード数はfeatureCountsプログラムを用いて決定した {Liao, Smyth et al. 2014}。
RNA sequencing analysis. RNA sequencing (RNA-seq) analysis of the NCE-SC spheroid line (GSE189212) was performed by Macrogen (Seoul, Korea) using a previously reported method {Yamamoto, Miyoshi et al. 2020, Kitano, Yamamoto et al. 2022}. Briefly, synthesized libraries were sequenced from both ends (2 × 100 bases) using an Illumina HighSeq 2000 sequencer at a depth of approximately 40 million reads per sample. Sequence reads were mapped to the hg19 reference genome using the HISAT2 program {Kim, Langmead et al. 2015, Kim, Paggi et al. 2019}, and transcripts were integrated using the StringTie program {Pertea, Pertea et al. 2015}. Read counts were determined using the featureCounts program {Liao, Smyth et al. 2014}.

ヒト大腸癌データセットのデータベース解析
 我々はHuman Protein Atlas {Uhlen et al., 2017} version 21.0とEnsembl version 103.38.(https://www.proteinatlas.org/about/download)を基に作成されたFPKM(fragments per kilobase of exon per million reads mapped)を用いてTCGA-CRC {TCGA Network, 2012}(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)のRNA-seqデータと臨床データを利用するとともに、cBioportal {Cerami et al., 2012}(https://www.cbioportal.org/datasets)に掲載されているRSEM(RNA-Seq by Expectation Maximization)を用いて正規化されたTCGA-CRCのRNA-seqデータと臨床データを利用した。我々はNational Center for Biotechnology Information(NCBI)(https://www.ncbi.nlm.nih.gov/geo/)のGene Expression Omnibus(GEO)からGSE39582 {Marisa et al. 2013}のマイクロアレイデータと臨床データを収集した。
Database analysis of human colorectal cancer datasets. We used RNA-seq and clinical data from TCGA-CRC {TCGA Network, 2012} (https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga) using FPKM (fragments per kilobase of exon per million reads mapped) based on the Human Protein Atlas {Uhlen et al., 2017} version 21.0 and Ensembl version 103.38 (https://www.proteinatlas.org/about/download). We also used RNA-seq and clinical data from TCGA-CRC normalized using RSEM (RNA-Seq by Expectation Maximization) from cBioportal {Cerami et al., 2012} (https://www.cbioportal.org/datasets). We collected microarray and clinical data for GSE39582 {Marisa et al. 2013} from the Gene Expression Omnibus (GEO) of the National Center for Biotechnology Information (NCBI) (https://www.ncbi.nlm.nih.gov/geo/).

RNA-seqデータの対数変換
 本研究では最初FPKMのデータ値を用いて、全ての統計計算を行った後、RSEMのデータでも、最後に再確認を行った。FPKMデータの計算では以前報告された方法を用いて、生のRNA-seqの発現レベルを対数的(log2)に縮尺した。その際にLog2(0)は定義できないので、FPKMに0.1を加えた後に対数変換した: Log2(FPKM+0.1) {Reinhold et al., 2019}。一方、RSEMにより出力されたデータは0.1を加えても負の値を取る遺伝子群が存在したので、以前報告されているように {Jones et al., 2019} 出力値に1を加えた後に対数変換し、全てを正の値とした:Log2(RSEM+1)。TCGA-CRCの大腸がん患者におけるGCSに関してはLog2(FPKM+0.1)とLog2(RSEM+1)のどちらを用いても同様な結果が得られることを確認した(データ表示せず)。
Logarithmic transformation of RNA-seq data. In this study, we initially performed all statistical calculations using FPKM data values, and then finally double-checked the results using RSEM data. To calculate FPKM data, raw RNA-seq expression levels were logarithmically scaled (log2) using a previously reported method. Because Log2(0) cannot be defined, FPKM was added to the logarithmic scale before being transformed: Log2(FPKM+0.1) {Reinhold et al., 2019}. However, because some genes in the RSEM output still had negative values even after adding 0.1, we added 1 to the output values and then transformed them into logarithmic scales, converting all values to positive values: Log2(RSEM+1), as previously reported {Jones et al., 2019}. We confirmed that similar results were obtained for GCS in TCGA-CRC colorectal cancer patients using both Log2(FPKM+0.1) and Log2(RSEM+1) (data not shown).

マイクロアレイ解析
 NCE-SCまたはCRC-SCは上記のとおり培養した。培地の吸引後、溶解緩衝液(TaKaRa Bio, Kusatsu, Japan)をスフェロイド培養の各ウェルに直接加えた。NCE-SCとCRC-SCスフェロイド株の総RNAはNucleoSpin RNA II kit(TaKaRa Bio)を用いて、製造元のプロトコルにしたがって準備された。マイクロアレイ解析はMacrogen Inc.(Seoul, Republic of Korea)によって行われた。手短に言えば、RNA標識とハイブリダイゼーションはAgilent One-Color Microarray-Based Gene Expression Analysis protocol(Agilent Technology, V 6.5, 2010)を用いて行われ、それは高いダイナミックレンジを示した。それぞれの標本由来の100 ngの総RNAを線型に増幅し、Cy3-dCTPで標識した。標識されたcRNAはRNAeasy Mini Kit(Qiagen)を用いて精製した。標識されたcRNA調製液(pmol Cy3/μg cRNA)の濃度と比活性はNanoDrop ND-1000(NanoDrop, Wilmington, DE, USA)で測定した。標識されたそれぞれのcRNAの試料(600 ng)は、5 μl 10x blocking agent と1 μl 25x fragmentation buffer で断片化し、それから60℃で30分間加熱した。最後に25 μlの2x GE hybridization buffer を加え、標識されたcRNAを希釈した。40 μlのハイブリダイゼーション溶液をガスケットスライド内に注ぎ、Agilent SurePrint G3 Human GE 8x 60K, V3 Microarrays(Agilent)の上にロードした。スライドはAgilent hybridization oven 内で65℃で17時間保温し、それからAgilent One-Color Microarray-Based Gene Expression Analysis プロトコル(Agilent Technology, V 6.5, 2010)を用いて常温で洗浄した。ハイブリダイズしたアレイスライドはAgilent Microarray Scanner D(Agilent Technologies, Inc.)で直ちにスキャンした。生データはAgilent Feature Extraction ソフトウェア(v11.0.1.1)を用いて抽出した。アレイスライド上の各遺伝子プローブに関する発現データを出力する未加工データのテキストファイルを作成するために、同一遺伝子に関する未加工データをAgilent feature extraction プロトコルを用いて自動的にまとめた。gProcessedSignal値をlog変換し、quantile法で正規化した。発現データの統計的有意性はFalse Discovery Rate(q < 0.1)と倍率変化(FC > 2)を用いて決定した。データ解析はR3.0.2(www.r-project.org)、GraphPad Prismソフトウェア(Dotmatics, San Diego, USA)とMicrosoft Excelソフトウェア(Microsoft, Tokyo, Japan)を用いて行なった。
Microarray Analysis: NCE-SC or CRC-SC were cultured as described above. After aspirating the medium, lysis buffer (TaKaRa Bio, Kusatsu, Japan) was added directly to each well of the spheroid culture. Total RNA from NCE-SC and CRC-SC spheroid lines was prepared using the NucleoSpin RNA II kit (TaKaRa Bio) according to the manufacturer's protocol. Microarray analysis was performed by Macrogen Inc. (Seoul, Republic of Korea). Briefly, RNA labeling and hybridization were performed using the Agilent One-Color Microarray-Based Gene Expression Analysis protocol (Agilent Technology, V 6.5, 2010), which exhibits a high dynamic range. 100 ng of total RNA from each specimen was linearly amplified and labeled with Cy3-dCTP. Labeled cRNA was purified using the RNAeasy Mini Kit (Qiagen). The concentration and specific activity of the labeled cRNA preparation (pmol Cy3/μg cRNA) were measured using a NanoDrop ND-1000 (NanoDrop, Wilmington, DE, USA). Each labeled cRNA sample (600 ng) was fragmented with 5 μl 10x blocking agent and 1 μl 25x fragmentation buffer, then heated at 60°C for 30 min. Finally, 25 μl of 2x GE hybridization buffer was added to dilute the labeled cRNA. 40 μl of hybridization solution was poured into a gasket slide and loaded onto Agilent SurePrint G3 Human GE 8x 60K, V3 Microarrays (Agilent). Slides were incubated at 65°C for 17 hours in an Agilent hybridization oven and then washed at room temperature using the Agilent One-Color Microarray-Based Gene Expression Analysis protocol (Agilent Technology, v6.5, 2010). Hybridized array slides were immediately scanned using an Agilent Microarray Scanner D (Agilent Technologies, Inc.). Raw data were extracted using Agilent Feature Extraction software (v11.0.1.1). To create a raw data text file containing expression data for each gene probe on the array slide, raw data for the same gene were automatically aggregated using the Agilent feature extraction protocol. gProcessedSignal values were log-transformed and normalized using the quantile method. Statistical significance of expression data was determined using the false discovery rate (q < 0.1) and fold change (FC > 2). Data analysis was performed using R3.0.2 (www.r-project.org), GraphPad Prism software (Dotmatics, San Diego, USA), and Microsoft Excel software (Microsoft, Tokyo, Japan).

リード遺伝子とその関連遺伝子
 我々はCRC-SC株においてmRNA発現が極端に変動する遺伝子(SD > 6.5)を見出した。そのような遺伝子の中でも、異なる染色体にコードされ、独立に調節されている5つのリード遺伝子を選択した。つまりそれらの発現レベルは相互に相関しなかった(スピアマン相関係数 |r| < 0.5)。我々はCRC-SC株を、リード遺伝子の発現に関して5つのリード遺伝子サブグループと、未分類サブグループを含めて、計6つのサブグループに分類した。そして、発現が特定のリード遺伝子mRNA種のレベルと相関する12個のリード遺伝子関連遺伝子を同定した。また、大腸がん患者の生存期間を調べた。
Lead genes and their associated genes: We identified genes with extremely variable mRNA expression (SD > 6.5) in CRC-SC lines. Among these genes, we selected five lead genes encoded on different chromosomes and independently regulated; their expression levels were not correlated with each other (Spearman correlation coefficient |r| < 0.5). We classified CRC-SC lines into six subgroups based on lead gene expression, including five lead gene subgroups and an unclassified subgroup. We then identified 12 lead gene-associated genes whose expression correlated with the levels of specific lead gene mRNA species. We also investigated the survival time of colorectal cancer patients.

遺伝子発現シグネチュアスコア
 遺伝子発現シグネチュアスコアは過去に報告されたように算出した {Jackstadt et al., 2019}。最初に次の式に依ってデータセット内のi番目の患者でj番目の特定の遺伝子に関するZスコアZijを計算した。
 ここで、Xij(大文字)は各患者腫瘍のlog2変換後のmRNAの発現レベルの対数値を示す。GSE39582のデータはマイクロアレイによる測定データであり、当初からlog2値で表示されているのに対し、今回用いたTCGA-CRCのデータはRNA-seqデータなので、対数変換していない値が表示されている。そこで、TCGA-CRCのRNA-seqデータの場合には以下の式を用いてlog2変換すると同時に定数を加えた。
 ここで、xij(小文字)はi番目の患者データ(RNA-seqで測定されたmRNA量)のj番目遺伝子のmRNAレベルを示し、定数αはFPKM(遺伝子の長さの違いを考慮し断片数を補正するように正規化されたデータ)の時は0.1、RSEMの場合は1を用いた。log2変換時に定数を加算するこの操作は、log2変換した際に数値が負になる場合があるため行うもので、全ての変換値が正になるように加えるルーティンの方法であり、cBioportalに標準手順として推奨されている(https://docs.cbioportal.org/5.1-data-loading/data-loading/file-formats/z-score-normalization-script)。FPKMとRSEMでは正規化の方法などが異なることにより定数値を調整した。
 μjおよびσjはそれぞれ、個々のデータセットのj番目遺伝子の発現レベルの対数値の平均と標準偏差を示す。μjおよびσjはそれぞれ次の式で計算した。
 ここで、Nはそのデータセットの患者数を示す。
カットオフ値のスコアは結果的に統計のP値が最小となるようにした。
Gene expression signature scores Gene expression signature scores were calculated as previously reported {Jackstadt et al., 2019}. First, the Z-score Zij for the jth specific gene in the ith patient in the dataset was calculated using the following formula:
Here, Xij (uppercase letters) indicates the logarithmic value of the mRNA expression level after log2 transformation for each patient's tumor. The GSE39582 data was measured using microarrays and was originally displayed as log2 values, whereas the TCGA-CRC data used in this study was RNA-seq data, so values were displayed without logarithmic transformation. Therefore, for the TCGA-CRC RNA-seq data, a constant was added while log2 transformation was performed using the following formula:
Here, xij (lowercase) denotes the mRNA level of the jth gene in the ith patient data (mRNA amount measured by RNA-seq), and the constant α was set to 0.1 for FPKM (data normalized to correct for differences in gene length and the number of fragments), and 1 for RSEM. Adding a constant during log2 transformation is performed because log2 transformation can result in negative values. This routine method ensures that all transformed values are positive, and is recommended as a standard procedure by cBioportal (https://docs.cbioportal.org/5.1-data-loading/data-loading/file-formats/z-score-normalization-script). The constant value was adjusted due to differences in normalization methods between FPKM and RSEM.
μj and σj represent the mean and standard deviation of the logarithmic expression level of the jth gene in each dataset, respectively. μj and σj were calculated using the following formulas:
Here, N denotes the number of patients in the dataset.
The cutoff score was chosen to result in the smallest statistical P value.

 遺伝子発現シグネチュアスコアは、次の式で求められる平均Zスコアとした。
 すなわち、ラッキー5の遺伝子発現シグネチュアスコアは5個のj番目遺伝子のZスコアを、リード遺伝子のそれはリード遺伝子とそのサブグループ内で発現相関するj番目遺伝子のZスコアを加算した後、遺伝子数(m)(即ち、ラッキー5は5、リード遺伝子シグネチュアは3~4)で割ることで求めた。
 これらのシグネチュアに関して全生存期間(OS)、疾患特異的生存期間(DSS)、無増悪生存期間(PFS)、無再発生存期間(RFS)を調べるため、TCGA-CRC、GSE39582データベースの大腸がん患者をシグネチュアスコアの高値群と低値群に振り分けた。カットオフ値のスコアは結果的に統計のP値が最小となるようにした。
The gene expression signature score was the average Z score calculated using the following formula:
That is, the lucky 5 gene expression signature score was calculated by adding the Z scores of the five jth genes, and that of the lead gene was calculated by adding the Z scores of the lead gene and the jth gene whose expression is correlated within that subgroup, and then dividing by the number of genes (m) (i.e., 5 for the lucky 5, 3-4 for the lead gene signature).
To investigate the overall survival (OS), disease-specific survival (DSS), progression-free survival (PFS), and recurrence-free survival (RFS) of these signatures, colorectal cancer patients in the TCGA-CRC and GSE39582 databases were divided into high and low signature score groups. The cutoff score was determined to minimize the statistical P value.

大腸がん総合シグネチュア(General Colorectal Cancer Score, GCS)スコア
 個々の平均Zスコアに正または負の予後予測係数を乗じて加算し、GCSスコアを得た。
ここで、
は予後の極性を示す係数(予後良好は+1、予後不良は-1)であり、
は、各シグネチュアのZスコアの平均値である。すなわち、ラッキー5サブグループでは5、DEFA6、CXCL14、およびIGF2のサブグループでは3、BST2およびMAGEA6のサブグループでは4というように、シグネチュアグループの遺伝子数で割ったZスコアである。
 四分位解析では、大腸がん標本をGCSスコアに順じて4つの均等な部分集団に分け、カプランマイヤー法で解析した後にlogrank検定を行った。最も予後の悪い四分位グループを基準として、他の四分位グループに関して95%CIとHRをGraphPad Prismソフトウェアパッケージのマンテル-ヘンツェル法を用いて計算した。
General Colorectal Cancer Score (GCS) score Individual mean Z scores were multiplied by positive or negative prognostic coefficients and added to obtain the GCS score.
where:
is a coefficient indicating the polarity of the prognosis (good prognosis is +1, poor prognosis is -1),
is the mean Z-score for each signature, i.e., Z-score divided by the number of genes in the signature group, such as 5 for the lucky 5 subgroup, 3 for the DEFA6, CXCL14, and IGF2 subgroups, and 4 for the BST2 and MAGEA6 subgroups.
For quartile analysis, CRC specimens were divided into four equal subgroups according to GCS score, and analyzed using the Kaplan-Meier method followed by the log-rank test. The 95% CI and HR for the poorest quartile group were calculated using the Mantel-Haenszel method in the GraphPad Prism software package.

遺伝子エンリッチメント解析
 NCE-SCスフェロイド株(GSE189212)とNCE-SCオルガノイド株(GSE125472)の比較によって得られたFalse discovery rate 値(FDR値; q)と平均値(A)はTCC-GUI {Su et al., 2019} を用いて計算された。Differentially expressed genes(DEGs)はq < 0.1 且つ A > 1でフィルタリングされた。細胞型シグネチュア {Subramanian et al., 2005} を用いたエンリッチメント解析はMetascape {Zhou et al., 2019} で実行された。ホールマーク遺伝子セットを用いたGene Set Enrichment Analysis(GSEA)の方法は過去に説明されている {Subramanian et al., 2005}。
Gene enrichment analysis. False discovery rate (FDR; q) and mean (A) values obtained by comparing the NCE-SC spheroid line (GSE189212) and NCE-SC organoid line (GSE125472) were calculated using TCC-GUI {Su et al., 2019}. Differentially expressed genes (DEGs) were filtered for q < 0.1 and A > 1. Enrichment analysis using cell type signatures {Subramanian et al., 2005} was performed in Metascape {Zhou et al., 2019}. Gene set enrichment analysis (GSEA) using hallmark gene sets was previously described {Subramanian et al., 2005}.

ホットスポット変異解析
 マトリゲル内のスフェロイドはセル・リカバリー溶液(Corning)に懸濁され、1.5 mLチューブ内に集められた。マトリゲルは回転および混合しながら30分間4℃で溶解した。4℃の状態で、スフェロイドは5分間遠心し、PBSで2回洗浄した。スフェロイドのゲノムDNAはDNeasy Blood & Tissue Kit(Qiagen, Hilden, Germany)を用いて、製造元のプロトコルに従って精製した。CRC-SC株における50個または409個のがん関連遺伝子のホットスポット変異はMacrogen Inc.(Seoul, Republic of Korea)により検出された。シーケンスされた遺伝子と変異のリストは製造元ウェブサイトにて閲覧可能であった(https://tools.thermofisher.com/content/sfs/brochures/CO25560_Ion_AmpliSeq_Comprehensive_Cancer_Panel_Gene_List_final9062012.pdf)。データセットはIntegrative Genomics Viewer software(Broad Institute)を用いて解析した。
Hotspot Mutation Analysis. Matrigel-enclosed spheroids were suspended in cell recovery solution (Corning) and collected in a 1.5 mL tube. Matrigel was dissolved at 4°C for 30 minutes with rotation and mixing. Spheroids were centrifuged at 4°C for 5 minutes and washed twice with PBS. Genomic DNA from the spheroids was purified using the DNeasy Blood & Tissue Kit (Qiagen, Hilden, Germany) according to the manufacturer's protocol. Hotspot mutations in 50 or 409 cancer-related genes in CRC-SC lines were detected by Macrogen Inc. (Seoul, Republic of Korea). A list of sequenced genes and mutations was available on the manufacturer's website (https://tools.thermofisher.com/content/sfs/brochures/CO25560_Ion_AmpliSeq_Comprehensive_Cancer_Panel_Gene_List_final9062012.pdf). The dataset was analyzed using Integrative Genomics Viewer software (Broad Institute).

k-means 解析
 NCE-SC株と比較した時にCRC-SC株で高発現している遺伝子のうち、100個の最も変動した遺伝子に関してIntegrated Differential Expression and Pathway analysis v0.951 (iDEP.951) {Ge, Son et al. 2018} を用いた遺伝子のクラスター解析を行った。
k-means analysis. Among the genes highly expressed in CRC-SC lines compared to NCE-SC lines, the 100 most differentially expressed genes were subjected to gene cluster analysis using Integrated Differential Expression and Pathway analysis v0.951 (iDEP.951) {Ge, Son et al. 2018}.

シングルセルRNA-seq(scRNA-seq)のライブラリーの準備、データ処理および品質の点検
 scRNA-seqのライブラリー作製は、過去に記述されたように {Joanito, Wirapati et al. 2022} 株式会社Rhelixa(Tokyo, Japan)によって行われた。簡潔に述べると、新鮮な70N-NCE-SCを浮遊状態の単一細胞にして、1ウェルあたり5,000細胞を解析対象としたChromium system (10X Genomics)にロードした。バーコード化されたシークエンスライブラリーはChromium Single Cell 3’ v3.1 reagent Kit Dual (10X Genomics)を用いて作製された。そのライブラリーはIllumina NovaSeq 6000により十分に飽和するまでシークエンスされた。検出直後のシークエンスリードの配列情報は参照ゲノム hg38 に照合され、更にCellRanger v6.1.2 (10X Genomics)を用いて処理され、各細胞(ドロップレット)の各遺伝子に関してunique molecular identifier値(UMI値; 検出された単一のRNA分子の数を示すもの)の基盤の発現マトリックスが作製された。検出された遺伝子発現の数が2500個未満、6000個以上、もしくはミトコンドリアゲノムを15%より多く持つドロップレットは、それぞれ目的のものが入っていない、マルチプレットである、あるいは低品質/死細胞のドロップレットとして除外された。UMI値はSeurat 4.0 {Hao, Hao et al. 2021} のLogNormalize関数を用いて正規化され、結果的にそれぞれの細胞が総遺伝子に関して合計10,000 UMIになるように処理されるとともに、正規化された値は擬似カウントの1を付加された後にlog変換された。
Single-cell RNA-seq (scRNA-seq) library preparation, data processing, and quality check. scRNA-seq library preparation was performed by Rhelixa Inc. (Tokyo, Japan) as previously described {Joanito, Wirapati et al. 2022}. Briefly, fresh 70N-NCE-SC were cultured in single suspension and loaded into a Chromium system (10X Genomics) at 5,000 cells per well. Barcoded sequencing libraries were generated using the Chromium Single Cell 3' v3.1 reagent Kit Dual (10X Genomics). The libraries were sequenced on an Illumina NovaSeq 6000 until full saturation was achieved. Immediately after detection, sequence information from the sequence reads was matched to the hg38 reference genome and further processed using CellRanger v6.1.2 (10X Genomics) to generate an expression matrix based on unique molecular identifier (UMI) values (representing the number of single RNA molecules detected) for each gene in each cell (droplet). Droplets with fewer than 2500 detected gene expressions, more than 6000 detected genes, or more than 15% mitochondrial genome were excluded as droplets containing no target genes, multiplets, or low-quality/dead cells, respectively. UMI values were normalized using the LogNormalize function in Seurat 4.0 {Hao, Hao et al. 2021} to result in a total of 10,000 UMIs for all genes in each cell. Normalized values were then log-transformed after adding a pseudocount of 1.

監督なしクラスタリングを用いた次元削減解析
 過去の報告で説明されたように {Wang, Dang et al. 2021}、監督なし細胞クラスタリング用の高度可変遺伝子群(highly variable genes)を同定するため、正規化済みのgene-cellマトリックスにSeurat 4.0 {Hao, Hao et al. 2021} を用いた。高度可変遺伝子を同定するため、細胞ごとの正規化済み発現カウント数の平均と分散の関係を算出することにSeuratパッケージ内のMeanVarPlot法を用いた。そこでは2000個の高度可変遺伝子群が選ばれた。SeuratのPCelbowPlot関数を用いてエルボープロットを作成し、そしてそれを基盤に有意な主成分の数を決定した。そして監督なしクラスタリング用に異なる解像度のパラメーターを試験し、最適なクラスター数を決定した。本研究では、Seuratによって同定された最初の10個の主成分と高度可変遺伝子群が解像度0.5の監督なしクラスタリングに用いられ、合計7群の細胞集団が示された。それらを可視化するために、Seurat関数のRunUMAPによるUMAP法を用いて次元を更に削減し、70N-NCE-SCの細胞集団がおおよそ単一の集団であることが示された(図2B、左)。その埋め込みを算出するのに用いられた主成分はクラスタリングに使われたものと同一のものである。マーカー遺伝子群に関する単一細胞のプロット(図2B、右)はSeurat関数のFindMarkersで色付けした。
Dimensionality Reduction Analysis Using Unsupervised Clustering As previously described {Wang, Dang et al. 2021}, we used Seurat 4.0 {Hao, Hao et al. 2021} on the normalized gene-cell matrix to identify highly variable genes for unsupervised cell clustering. To identify highly variable genes, we used the MeanVarPlot method in the Seurat package to calculate the mean-variance relationship between normalized expression counts per cell. A set of 2,000 highly variable genes was selected. An elbow plot was created using the PCelbowPlot function in Seurat, and the number of significant principal components was determined based on this. Different resolution parameters were then tested for unsupervised clustering to determine the optimal number of clusters. In this study, the first 10 principal components and highly variable genes identified by Seurat were used for unsupervised clustering at a resolution of 0.5, resulting in a total of seven cell populations. To visualize these, we further reduced the dimensionality using the UMAP method with the Seurat function RunUMAP, which showed that the 70N-NCE-SC cell population was roughly a single population (Fig. 2B, left). The principal components used to calculate the embedding were the same as those used for clustering. The plot of single cells with respect to the marker gene group (Fig. 2B, right) was colored by the Seurat function FindMarkers.

57症例のCRC-SC株のリード遺伝子サブタイプの割り当て
 表2で計算されるように、57個のCRC-SC株のサブタイプは最も高発現したリード遺伝子により決定した。すなわち、図5Aの一番上の四角に示されるように、5つのリード遺伝子候補のうち一番高い値の一つをサブタイプの決定因子として用いた。リード遺伝子の倍率変化で70倍未満を示すCRC-SC株は分類されない「Others」に割り当てた。
Lead gene subtype assignment for 57 CRC-SC strains. The subtypes of the 57 CRC-SC strains were determined by the most highly expressed lead gene, as calculated in Table 2. That is, the highest value among the five lead gene candidates was used as the determinant of the subtype, as shown in the top box in Figure 5A. CRC-SC strains showing a lead gene fold change of less than 70-fold were assigned to the unclassified "Others" category.

ラッキー5遺伝子の単離
 我々は発見コホートとして、NCE-SCスフェロイド株に対するCRC-SCスフェロイド株のmRNA発現データを比較し、検証コホートとしてNCE-SCスフェロイドと比較した際にCRC-SCで最も発現の低いmRNAと患者生存との関係性を評価した。
 発見コホートにおけるスクリーニング:19個の大腸がん転帰良好マーカー群の候補は、NCE-SC株のトランスクリプトームと比較してCRC-SC株のそれの倍率変化の順位が最下位20のマイクロアレイプローブで検出されたものであった。
 検証コホートにおける1つ目の評価基準;TCGA-CRC-OS(n = 597)、TCGA-CRC-DSS(n = 545)、TCGA-CRC-PFS(n = 564)のデータセットにおける、19個の候補遺伝子の発現レベルに関する高値群と低値群との患者生存の比較において、logrank検定のP値が0.05以下であること。11個の遺伝子、CLCA4、ZG16、AQP8、CA2、CEACAM7、PIGR、SLC26A3、MUC12、NXPE4、SLC4A4、およびPLA2G2Aが基準を満たした。
 検証コホートにおける2つ目の評価基準;GSE39582-OS(n = 556)およびGSE39582-RFS(n = 564)のデータセットにおける、11個の候補遺伝子の発現レベルに関する高値群と低値群との患者生存の比較において、logrank検定のP値が0.05以下であること。5個の遺伝子、ZG16、PIGR、MUC12、SLC4A4、およびPLA2G2Aがこの基準を満たした。
 候補遺伝子の発現の閾値はmaximally selected logrank statistics(MSRS)を用いて設定された {Hothorn, Lausen et al. 2003}。
Isolation of the lucky 5 genes We compared mRNA expression data of CRC-SC spheroid lines to NCE-SC spheroid lines as a discovery cohort, and evaluated the relationship between the lowest expressed mRNAs in CRC-SC and patient survival when compared with NCE-SC spheroids as a validation cohort.
Screening in the discovery cohort: The set of 19 candidate markers for favorable CRC outcome was detected by the microarray probes with the lowest ranked fold change in the transcriptome of CRC-SC lines compared with that of NCE-SC lines.
The first evaluation criterion for the validation cohort was that the log-rank P value for the comparison of patient survival between high and low expression levels of 19 candidate genes in the TCGA-CRC-OS (n = 597), TCGA-CRC-DSS (n = 545), and TCGA-CRC-PFS (n = 564) datasets was 0.05 or less. Eleven genes met the criterion: CLCA4, ZG16, AQP8, CA2, CEACAM7, PIGR, SLC26A3, MUC12, NXPE4, SLC4A4, and PLA2G2A.
The second evaluation criterion for the validation cohort was that the log-rank P value for the comparison of patient survival between high and low expression levels of 11 candidate genes in the GSE39582-OS (n = 556) and GSE39582-RFS (n = 564) datasets was 0.05 or less. Five genes, ZG16, PIGR, MUC12, SLC4A4, and PLA2G2A, met this criterion.
Expression thresholds for candidate genes were set using maximally selected logrank statistics (MSRS) {Hothorn, Lausen et al. 2003}.

患者由来スフェロイド同所移植(PDSOX)モデル
 10週齢のNSGマウスはヒートマット(KN-475、夏目製作所)の上で、イソフルラン麻酔装置(NARCOBI-E、夏目製作所)を用いて麻酔をかけた。腹部の毛はバリカン(ER807PP-A、パナソニック)で剃毛した。剃毛された腹部を、80%エタノール(#699749、丸三産業)とポビドンヨード(#46026800、建栄製薬)で除菌した。その後、腹部を小動物用ドレープ(Cleyera)で覆った。滅菌済みのハサミ(大祐医科工業)で中央よりやや左側の腹部を切開した。腹腔内からリングピンセット(大祐医科工業)を用いて盲腸の端を引き出し、ドレープの上にのせた。この時点で、マウスの頭部が手前側、尾が奥側になるようにマウスの体の向きを調整した。盲腸の先端を左手人差し指で固定し、右手の26-G注射針(TERUMO)で盲腸の平滑筋層のみを切開し、粘膜と平滑筋の間にスペースを作った。次に18-G注射針でさらにそのスペースを広げた。長焦点顕微鏡下で(M651-1, ライカマイクロシステムズ)、スフェロイド(約10,000個のCRC-SC細胞)の塊を平滑筋のポケット内にピンセット(11252-30 Dumont #5, Fine Science Tools)を用いて移植した。盲腸を注意深く腹腔内に戻し、切開された腹壁と表皮を縫合した。このPDSOXマウスは移植後26週間観察された。瀕死のPDSOXマウスは苦痛軽減のために安楽死させ、がん死とみなした。その後、肉眼的・病理学的に解析された。この生存期間は2匹のPDSOXマウスの平均生存期間により決定した。全ての動物実験は京都大学の動物実験委員会により承認されたプロトコールに従って行われた。
Patient-derived spheroid orthotopic transplantation (PDSOX) model. Ten-week-old NSG mice were anesthetized using an isoflurane anesthesia system (NARCOBI-E, Natsume Seisakusho) on a heat mat (KN-475, Natsume Seisakusho). Abdominal hair was shaved with clippers (ER807PP-A, Panasonic). The shaved abdomen was disinfected with 80% ethanol (#699749, Marusan Sangyo) and povidone-iodine (#46026800, Kenei Pharmaceutical). The abdomen was then covered with a small animal drape (Cleyera). An abdominal incision was made slightly left of the center with sterilized scissors (Daiyu Medical Industries). The end of the cecum was extracted from the abdominal cavity using ring forceps (Daiyu Medical Industries) and placed on the drape. At this point, the mouse's body was positioned so that its head was facing forward and its tail was facing backward. The tip of the cecum was held in place with the index finger of the left hand, and the smooth muscle layer of the cecum was incised with a 26-gauge needle (TERUMO) in the right hand, creating a space between the mucosa and the smooth muscle. The space was then further widened with an 18-gauge needle. Under a long-focus microscope (M651-1, Leica Microsystems), a cluster of spheroids (approximately 10,000 CRC-SC cells) was transplanted into the smooth muscle pocket using tweezers (11252-30 Dumont #5, Fine Science Tools). The cecum was carefully returned to the abdominal cavity, and the incised abdominal wall and epidermis were sutured. The PDSOX mice were observed for 26 weeks after transplantation. Moribund PDSOX mice were euthanized for pain relief and considered to have died from cancer. Subsequently, they were analyzed macroscopically and pathologically. Survival time was determined as the average survival time of two PDSOX mice. All animal experiments were conducted in accordance with protocols approved by the Kyoto University Animal Care and Use Committee.

統計解析
 統計解析はGraphPad Prism ソフトウェア(Dotmatics, San Diego, USA)またはMicrosoft Excel software(Microsoft, Tokyo, Japan)を用いて実行した。データはカプラン-マイヤー生存曲線、logrank検定、マンテル-ヘンツェル検定、スピアマン相関検定、マンホイットニーU検定、クラスカル-ウォリス検定、ウェルチのt検定、Benjamini-Hochberg 法を用いて解析した。
Statistical analysis was performed using GraphPad Prism software (Dotmatics, San Diego, USA) or Microsoft Excel software (Microsoft, Tokyo, Japan). Data were analyzed using Kaplan-Meier survival curves, the log-rank test, the Mantel-Haenszel test, the Spearman correlation test, the Mann-Whitney U test, the Kruskal-Wallis test, the Welch t test, and the Benjamini-Hochberg method.

2.結果
正常大腸上皮幹細胞(NCE-SC)の遺伝子発現解析
 ヒトNCE-SCは幾つかの方法で培養されてきた。我々は血清を含む培地を用いて160人を超える大腸がん患者からNCE-SCを確立した。マイクロアレイのハイブリダイゼーションに基づいたmRNA定量法とRNA配列決定による定量法を用いて、我々は最初にNCE-SCのスフェロイド細胞株5株についてmRNA発現レベルを測定した(データ表示せず)。その結果得られたデータは独特のパターンを示した。すなわち、mRNA発現の複雑さとレベルは異なった患者間でも基本的に同一で、異なっていたのは性染色体上に位置する遺伝子で男女差が見られただけであった。このことは大腸がん幹細胞(CRC-SC)スフェロイド株の集団がより広いmRNAレベルの分布を示したことと対照的であった。
2. Results Gene Expression Analysis of Normal Colon Epithelial Stem Cells (NCE-SCs) Human NCE-SCs have been cultured using several methods. We established NCE-SCs from over 160 colorectal cancer patients using serum-containing medium. We first measured mRNA expression levels in five NCE-SC spheroid cell lines using microarray hybridization-based mRNA quantification and RNA sequencing (data not shown). The resulting data revealed a unique pattern: the complexity and levels of mRNA expression were essentially identical across different patients, with only gender differences observed for genes located on the sex chromosomes. This contrasts with the colorectal cancer stem cell (CRC-SC) spheroid line population, which showed a broader distribution of mRNA levels.

 一方Metascapeプログラムによる解析では、我々のNCE-SCスフェロイド株は、オルガノイド培養 {Michels et al., 2019} による細胞と比べて、胎児の消化器系に発現されているmRNA種が高い比率で発現されていることが目立つ(図2C)。また、Gene Set Enrichment Analysis(GSEA)の結果はいくつかの遺伝子セットで顕著な差異が見られた(データ表示せず)。これらの結果は文献 {Sato, T. et al. 2011} の“original medium”よりは“refined medium”で培養されたNCE-SCオルガノイドに似ていた。念のため、我々が確立して使用したNCE-SCの細胞タイプの組成を単一細胞RNA(scRNA)解析で分析したところ、基本的に単一の未分化細胞種から構成されていることを確認した(図2B)。 Meanwhile, analysis using the Metascape program revealed that our NCE-SC spheroid lines conspicuously expressed a higher proportion of mRNA species expressed in the fetal digestive system compared to cells cultured in organoids {Michels et al., 2019} (Figure 2C). Furthermore, Gene Set Enrichment Analysis (GSEA) results revealed significant differences in several gene sets (data not shown). These results were more similar to those of NCE-SC organoids cultured in "refined medium" than in the "original medium" described in the literature {Sato, T. et al. 2011}. To be sure, we analyzed the cell type composition of the NCE-SC we established and used using single-cell RNA (scRNA) analysis, confirming that they were essentially composed of a single undifferentiated cell type (Figure 2B).

 大腸がん幹細胞株での高いmRNA発現レベルは良好な予後と相関する; ラッキーペンタッド(5)シグネチュア
 我々は先に大腸がん原発巣から幹細胞(別名、腫瘍始原細胞)株をスフェロイドとして培養し、約160株を報告した。これらのCRC-SC細胞株に最近の株を加えた集団から、臨床的に重要性の高い、ステージIIIおよびIV(79%)腫瘍由来のものを相対的に多く含む57株を(腫瘍間質ではなく上皮幹細胞)CRC-SCに内在的なマーカーの詳細検討のための対象集団として選択した。男女比は34:23だった。それらはドライバー遺伝子変異やステージについては広範な組み合わせとなっている(データ表示せず)。これらの大腸がんはAPC、TP53、およびRASなどの予想されたドライバー遺伝子変異に加え、SMAD4、FBXW7などの変異もあった。原発腫瘍の組織病理像は多くは高分化から中程度分化または低分化の腺癌で、幾らかの粘液型や、BRAF V600E 変異を伴う鋸歯状腺腫由来と思われるもの2例やマイクロサテライトDNA不安定性(MSI-H)の1例が含まれる。MSI-H症例の頻度が低い理由は、それらの75%がステージI/IIに含まれ、216例中のステージIII/IVには含まれていなかったことが影響している。
High mRNA expression levels in colorectal cancer stem cells correlate with favorable prognosis; the lucky pentad (5) signature. We previously reported approximately 160 stem cell (also known as tumor-initiating cell) lines cultured as spheroids from primary colorectal cancer tumors. From these CRC-SC cell lines and recent additions, we selected 57 lines, relatively enriched for clinically relevant stage III and IV tumors (79%) (epithelial stem cells, not tumor stroma), for further characterization of intrinsic markers of CRC-SC. The male/female ratio was 34:23. They represented a wide variety of driver gene mutations and stages (data not shown). These colorectal cancers harbored mutations in expected driver genes, such as APC, TP53, and RAS, as well as mutations in SMAD4 and FBXW7. The histopathological findings of the primary tumors were mostly well- to moderately- or poorly differentiated adenocarcinomas, including some myxoid types, two cases likely derived from serrated adenomas with BRAF V600E mutations, and one case with microsatellite DNA instability (MSI-H). The low frequency of MSI-H cases is due to the fact that 75% of them were in stage I/II disease, and none of the 216 cases were in stage III/IV disease.

 我々は「CRC-SCのトランスクリプトームで発現される遺伝子の一部は、患者のがん全組織を用いて測定しても予後に影響するデータとなる」との仮説を立て、この仮説を検証するために、CRC-SCを予後バイオマーカーの発見コホートとして用いる新戦略を立てた(図3A)。即ち、CRC-SCのmRNA発現データを上記のNCE-SC(図3A)と比較した。そして得られた発現差のある遺伝子リストの最下位と最上位部分にランクされるそれぞれ20個の遺伝子プローブ即ち、NCE-SCと比べて発現が著しく低下した遺伝子群と増加した遺伝子群に注目した(表2)。 We hypothesized that some of the genes expressed in the CRC-SC transcriptome would provide data that influence prognosis even when measured using the patient's entire cancer tissue. To test this hypothesis, we devised a new strategy using CRC-SC as a prognostic biomarker discovery cohort (Figure 3A). Specifically, we compared the mRNA expression data of CRC-SC with that of the above-mentioned NCE-SC (Figure 3A). We then focused on the 20 gene probes ranked at the bottom and top of the resulting list of differentially expressed genes, i.e., the groups of genes whose expression was significantly decreased and increased compared to NCE-SC (Table 2).

 最初の解析セットとして、我々は先ずCRC-SC全体としてNCE-SCに比べて発現が最も低いランクにある遺伝子群を調べ、あるサブグループ細胞株を同定した。即ち、19個の遺伝子は大部分のCRC-SCスフェロイド株ではNCE-SCに比べると殆ど発現していないにも拘らず、一部のCRC-SC株(サブセット)で発現がNCE-SCと似たレベルに増加していることを見出した(図3Aおよび表2)。これら19個の遺伝子からTCGA-CRCデータベース(n =約 600)に照らして先ず11個を予後良好マーカーの候補として選び、更にGSE39582データベース(n =約 600)でも予後良好を示す5個の遺伝子に絞り込んだ。それらの遺伝子とは、MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16である(図2A、図3B)。 For the first set of analyses, we first examined the genes ranked lowest in expression in CRC-SC as a whole compared with NCE-SC to identify a subgroup of cell lines. Specifically, we found that 19 genes were expressed at a low level in most CRC-SC spheroid lines compared with NCE-SC, but their expression was increased to levels similar to those in NCE-SC in a subset of CRC-SC lines (Fig. 3A and Table 2). From these 19 genes, we initially selected 11 as candidate markers for favorable prognosis based on the TCGA-CRC database (n = approximately 600), and further narrowed it down to five genes that also showed favorable prognosis in the GSE39582 database (n = approximately 600). These genes were MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16 (Fig. 2A, Fig. 3B).

 我々の予測どおり、これら5個の遺伝子の高発現はTCGA-CRCとGSE39582の双方で、何れの遺伝子も患者の良好な予後因子であり、OSデータだけでなくPFS/RFS/DSSデータでも統計上有意差を持っていた(図4A、4B)。それゆえ、我々はこれらの5遺伝子を「ラッキーペンタッド(5)」と命名した。 As expected, high expression of these five genes was associated with favorable prognosis in both TCGA-CRC and GSE39582 patients, and each gene was associated with statistically significant differences in not only OS data but also PFS/RFS/DSS data (Figures 4A and 4B). Therefore, we named these five genes the "lucky pentad (5)."

 これら5個の遺伝子発現の臨床的重要性をまとめて評価するために、Zスコア変換によってこれらの標準化した発現レベルをZスコアで正規化し統合した。その結果得られた、ラッキー5シグネチュアスコアの高発現群と低発現群との間の予後の差に関する統計的有意性は、TCGA-CRCについてもGSE39582についても低いHRとP値を示した。即ち、TCGA-CRC-OS/DSS/PFSはHR 0.48/0.48/0.6(P = 0.002/0.01/0.01)、GSE39582-OS/RFSはHR 0.46/0.39(P = 0.003/0.0007)(図4C)であった。 To assess the clinical significance of these five gene expressions collectively, these standardized expression levels were normalized by Z-score and integrated using Z-score transformation. The resulting statistical significance of the difference in prognosis between the high and low Lucky 5 signature score expression groups showed low HRs and P values for both TCGA-CRC and GSE39582. TCGA-CRC-OS/DSS/PFS were HR 0.48/0.48/0.6 (P = 0.002/0.01/0.01), and GSE39582-OS/RFS were HR 0.46/0.39 (P = 0.003/0.0007) (Figure 4C).

 また、これらの遺伝子は正常大腸粘膜を構成する特定のタイプの細胞で高発現している。即ち、MUC12とPIGRは結腸細胞で、PLA2G2AとZG16は杯細胞で、そしてSLC4A4はCA1陽性の結腸細胞で発現している。 Furthermore, these genes are highly expressed in specific cell types that make up the normal colonic mucosa: MUC12 and PIGR are expressed in colonocytes, PLA2G2A and ZG16 are expressed in goblet cells, and SLC4A4 is expressed in CA1-positive colonocytes.

 その上、これら5個の遺伝子のうちMUC12、SLC4A4、およびZG16は、NCE-SCを細胞培養系でWntリガンドを除去して分化を誘導すると、更に高いレベルで発現した(図3A(下)、左端の行 3N-d)。PIGRおよびPLA2G2Aの発現レベルは、NCE-SCとそれらの分化した細胞とにおいて、いずれも同等レベルであった。したがって、我々が用いている培地でスフェロイド培養されたNCE-SCは、上記Metascapeでの解析データが示唆するように、胎児の大腸や小腸に向かって部分的に分化している様に見える(図2C)。一方、我々のCRC-SCスフェロイドでは、EMT(epithelial-mesenchymal transition)シグネチュア遺伝子群はNCE-SCの幹細胞諸マーカーと同等レベルに発現していた(図3B)。 Furthermore, of these five genes, MUC12, SLC4A4, and ZG16 were expressed at even higher levels when NCE-SCs were induced to differentiate in a cell culture system by depriving them of Wnt ligands (Fig. 3A (bottom), leftmost row 3N-d). The expression levels of PIGR and PLA2G2A were comparable in both NCE-SCs and their differentiated cells. Therefore, NCE-SCs cultured as spheroids in our medium appear to be partially differentiated toward fetal colon and small intestine, as suggested by the Metascape analysis data above (Fig. 2C). On the other hand, in our CRC-SC spheroids, the EMT (epithelial-mesenchymal transition) signature genes were expressed at levels comparable to those of NCE-SC stem cell markers (Fig. 3B).

ヒト大腸がん幹細胞スフェロイド細胞株において互いに交差しないDEFA6、CXCL14、BST2、MAGEA6、およびIGF2のmRNAの高レベル発現によって代表される新規予後予測シグネチュアの候補
 我々は第二の解析セットとしてCRC-SCスフェロイド株の、独立して互いに交差しないサブセットでNCE-SCよりも高いレベルで発現を示す遺伝子を探索し、新規の分子サブグループを代表するリード遺伝子候補を5個見出した(表2および図5A)。即ち、それらの遺伝子候補とは、DEFA6、CXCL14、BST2、MAGEA6、IGF2の5つである。これらのリード遺伝子候補は、NCE-SCにおいては中程度のレベルでしか発現せず、また、これらのサブタイプ同士も、ラッキー5遺伝子シグネチュア発現群とも概ね交差重複していない((図2A、図5A)。
A novel prognostic signature candidate represented by high, non-intersecting mRNA expression of DEFA6, CXCL14, BST2, MAGEA6, and IGF2 in human colorectal cancer stem cell spheroid cell lines. In a second analysis, we searched for genes that were expressed at higher levels in independent, non-intersecting subsets of CRC-SC spheroids than in NCE-SC. We found five lead gene candidates representing novel molecular subgroups (Table 2 and Figure 5A). These gene candidates are DEFA6, CXCL14, BST2, MAGEA6, and IGF2. These lead gene candidates are only moderately expressed in NCE-SC, and largely do not intersect with each other or with the lucky 5-gene signature expression group (Figure 2A, Figure 5A).

 これらのリード遺伝子で代表される5つのサブタイプはいずれも左側および右側大腸がん並びに直腸がんで見出されるが、BST2を発現する原発腫瘍は、統計的に有意に結腸に多く(P = 0.0001)、IGF2を発現するものは直腸がんで多く見られた(P = 0.002)。 All five subtypes represented by these lead genes were found in left-sided and right-sided colon cancers as well as rectal cancers, but primary tumors expressing BST2 were statistically significantly more common in colon cancers (P = 0.0001), and those expressing IGF2 were more common in rectal cancers (P = 0.002).

 CRC-SCスフェロイド株の5種の分子サブタイプにおけるこれらのリード遺伝子候補の臨床的重要性を評価するために、我々は上記ラッキー5で調べたのと同様にTCGA-CRCとGSE39582データベースを分析して患者の予後生存との相関性について調べた。即ち、最初に5個のリード遺伝子候補についてカプラン-マイヤー解析を行って公開データベースの患者について高発現と低発現患者での予後の差異について調べた(データ表示せず)。次に個々のサブグループ内でNCE-SCと比較して高発現の(リード遺伝子以外の)遺伝子を上位20遺伝子のリスト(表2)から選び、互いの発現に相関していて、かつ患者の予後とも相関している遺伝子を選んだ。最後に、(リード遺伝子を含めた)これらの遺伝子群についてサブグループとしてのZスコアを計算し、リード遺伝子単独のデータと比較して、統計的により強力な予後予測シグネチュアとなるかを吟味した(図5B、5C)。これらの候補遺伝子群は、(i) DEFA6、DEFA5、およびSPINK1; (ii) CXCL14、MME、およびMSX1; (iii) BST2、BATF、RAMP1、およびTPM2; (iv) MAGEA6、MAGEA3、MAGEA12およびCSAG1; 並びに、(v) IGF2、NELL2、およびRBMS1である。なお、予備検討として、TCGA-CRCデータベースのmRNA発現レベルを対数変換せずに用い、各遺伝子群の遺伝子のZスコアを合計して遺伝子発現シグネチュアスコアを求めた場合も、同様に患者の予後との相関がみられた(データ提示せず)。 To evaluate the clinical significance of these lead gene candidates in the five molecular subtypes of CRC-SC spheroid lines, we analyzed the TCGA-CRC and GSE39582 databases to examine their correlation with patient prognosis and survival, similar to the Lucky 5 analysis described above. Specifically, we first performed Kaplan-Meier analysis of the five lead gene candidates to examine the difference in prognosis between high- and low-expressing patients in the public database (data not shown). Next, we selected genes (excluding the lead gene) that were highly expressed within each subgroup compared with NCE-SC from the list of the top 20 genes (Table 2), and selected genes whose expression correlated with each other and with patient prognosis. Finally, we calculated Z-scores for these gene groups (including the lead gene) as subgroups to examine whether they formed statistically stronger prognostic signatures compared with the data for the lead gene alone (Figures 5B and 5C). These candidate gene groups are: (i) DEFA6, DEFA5, and SPINK1; (ii) CXCL14, MME, and MSX1; (iii) BST2, BATF, RAMP1, and TPM2; (iv) MAGEA6, MAGEA3, MAGEA12, and CSAG1; and (v) IGF2, NELL2, and RBMS1. In a preliminary study, we used the mRNA expression levels from the TCGA-CRC database without logarithmic transformation and calculated a gene expression signature score by summing the Z scores of the genes in each gene group. A similar correlation with patient prognosis was observed (data not shown).

 ここで行った方法を統計的に吟味するために、我々は代表的なnon-hierarchicalな統計手法である、k-means法を用いて、5つのサブグループに分類したところ、各々独立のクラスターに上記5つのリード遺伝子の候補、即ちDEFA6、CXCL14、BST2、MAGEA6、IGF2が見出され、上述の分類と一貫した結果であった(データ表示せず)。我々は更にk-means法のクラスター数を10に設定したところ、それでも5つのリード遺伝子の候補は各々独立のクラスターに属し、追加されたクラスターのリード遺伝子は非コードRNAや患者生存に関係がない遺伝子であることが示された(データ表示せず)。これらの結果から、CRC-SC固有の転帰予測遺伝子の同定という意味で、基本的には我々の方法に余す所がなかったことを示唆している。 To statistically examine the method used here, we used the k-means method, a representative non-hierarchical statistical method, to classify the data into five subgroups. The five lead gene candidates mentioned above, namely, DEFA6, CXCL14, BST2, MAGEA6, and IGF2, were found in each independent cluster, a result consistent with the classification described above (data not shown). We further set the number of clusters in the k-means method to 10, but the five lead gene candidates still belonged to independent clusters, and the lead genes in the additional clusters were found to be genes unrelated to non-coding RNAs or patient survival (data not shown). These results suggest that our method essentially left no stone unturned in identifying genes specific to CRC-SC that predict outcome.

 以下では個々のリード遺伝子で代表される5つの分子サブタイプについて説明する。 Below we explain the five molecular subtypes represented by individual lead genes.

リード遺伝子シグネチュア(LGS)
 DEFA6、BST2、およびMAGEA6シグネチュアについては、TCGA-CRCおよびGSE39582の発現高値の患者群と低値の患者群との予後(OS/DSS/PFS/RFS)の差は、統計的に有意差を示す小さなP値(< 0.05)を示した。CXCL14シグネチュアについては、高発現腫瘍のTCGA-CRC-OSの患者データでは予後良好だったが、PFSでは予後不良となり逆転していた。同様に、GSE39582-OSおよびRFSも予後良好と不良が逆転していた。これらの統計的結果は予後予測因子としての条件を満たさないため、以後、CXCL14とそのシグネチュアを予後予測バイオマーカーから除外することにした。CXCL14が予後マーカーとして問題があるということについては最近の総論でも論じられている {Westrich 2020}。IGF2とそのシグネチュアについては、TCGA-CRCおよびGSE39582ともに有意差を持って予後不良の転帰を示した。GSE39582-OSのみP = 0.1と統計パワーが少し弱いが、予後不良の傾向については矛盾しないので、IGF2はリード遺伝子シグネチュアとして保持した。同様にMAGEA6シグネチュアもGSE39582-OSデータセットではP = 0.07となっているが、他の全てのデータで一貫していたので、リード遺伝子シグネチュアとして保持した。要約すると、DEFA6、BST2、MAGEA6、およびIGF2シグネチュアを最終的に予後予測のためのリード遺伝子シグネチュアとして採用し、CXCL14とそのシグネチュアを除外した。
Lead Gene Signature (LGS)
For the DEFA6, BST2, and MAGEA6 signatures, the differences in prognosis (OS/DSS/PFS/RFS) between patients with high and low expression of TCGA-CRC and GSE39582 showed statistically significant differences with small P values (<0.05). For the CXCL14 signature, patients with high expression in TCGA-CRC-OS tumors had a favorable prognosis, but PFS was reversed to a poor prognosis. Similarly, GSE39582-OS and RFS also reversed between favorable and poor prognosis. Because these statistical results do not meet the criteria for a prognostic predictor, we have decided to exclude CXCL14 and its signature from our prognostic biomarkers. The questionable prognostic value of CXCL14 has been discussed in a recent review {Westrich 2020}. IGF2 and its signature significantly correlated with poor prognosis in both TCGA-CRC and GSE39582. Although the statistical power was weaker in GSE39582-OS (P = 0.1), the trend toward poor prognosis was consistent, and IGF2 was retained as the lead gene signature. Similarly, the MAGEA6 signature showed a P = 0.07 in the GSE39582-OS dataset, but was consistent across all other data sets, and was therefore retained as the lead gene signature. In summary, the DEFA6, BST2, MAGEA6, and IGF2 signatures were ultimately adopted as the lead gene signature for prognosis prediction, while CXCL14 and its signature were excluded.

 大腸がん総合シグネチュア(GCS); ラッキー5、DEFA6、BST2、MAGEA6、およびIGF2シグネチュアを統合した新規の予後予測パラメーター
 上述の様に我々は患者の予後と相関する、5種類の分子サブグループとそのシグネチュアを見出した。それらの内2種類ラッキー5およびDEFA6のシグネチュアは良好な予後を、そして他の3種類BST2、MAGEA6、およびIGF2は悪い予後を表している。我々が確立した、これら5種類の分子サブグループに属する大腸がん幹細胞スフェロイド株は、典型的な株もあるが、境界的な株やどのサブグループにも分類されない株なども存在した(図5A)。また、ラッキー5を発現するCRC-SCスフェロイド株には、上記4個のリード遺伝子のうち、予後不良のBST2やIGF2を高発現するものもあった(図3A(下)、最上列のSubgroup表示参照)。しかし、患者の予後を予測することは臨床的にどのような状況下でも必ず重要である。
Colon Cancer Comprehensive Signature (GCS): A Novel Prognostic Parameter Integrating Lucky 5, DEFA6, BST2, MAGEA6, and IGF2 Signatures. As described above, we identified five molecular subgroups and their signatures that correlate with patient prognosis. Two of these, Lucky 5 and DEFA6, are associated with a favorable prognosis, while the remaining three, BST2, MAGEA6, and IGF2, are associated with a poor prognosis. Our established CRC stem cell spheroid lines belonging to these five molecular subgroups included some typical lines, but also borderline lines and lines that did not fit into any subgroup (Figure 5A). Furthermore, some CRC-SC spheroid lines expressing Lucky 5 also expressed high levels of BST2 and IGF2, two of the four lead genes mentioned above, which are associated with poor prognosis (Figure 3A (bottom), see the subgroups in the top row). However, predicting patient prognosis is always important in any clinical setting.

 この目的のために我々は上記5個のシグネチュアを図6Aの図式に従って統合したmRNA発現の新規シグネチュアを考案した。これは、個々の標準化したシグネチュアを良好な予後を表すものは+の、悪い予後を表すものは-の極性を付与して足し合わせたものであり、GCS(General Colorectal Cancer Signature)と称する。我々が発見コホートとして総mRNAを解析した大腸がん幹細胞スフェロイド株は、臨床的重要性を加味してステージIIIおよびIVを増やしたセットだが、その数は57株と限定されているので、検証コホート(validation cohort)として600症例に近いTCGA-CRCのがん組織mRNAデータベースを用い、まず全生存期間(OS)との相関を解析した。 To this end, we devised a new mRNA expression signature that integrates the above five signatures according to the diagram in Figure 6A. This signature is the sum of the individual standardized signatures, with + indicating a good prognosis and - indicating a poor prognosis, and is called the General Colorectal Cancer Signature (GCS). The colorectal cancer stem cell spheroid lines whose total mRNA we analyzed as our discovery cohort were a set that included additional stage III and IV lines in consideration of clinical importance. However, since the number of lines was limited to 57, we first analyzed the correlation with overall survival (OS) using the TCGA-CRC cancer tissue mRNA database of nearly 600 cases as a validation cohort.

 患者を四分位法で統計解析したところ、段階的にTCGA-CRC-DSSの低下を示す層別化を呈し(Q4-Q1, Ptrend = 0.001, 図6B)、最上位を示す四分位(Q4)と最下位を示す四分位(Q1)では有意差が見られた(P = 0.004, HR, 0.39; 95%CI, 0.20-0.74; 図6B)。 Statistical analysis of patients by quartile revealed a stratification of patients with a gradual decline in TCGA-CRC-DSS scores (Q4-Q1, Ptrend = 0.001, Figure 6B), with a significant difference observed between the highest quartile (Q4) and the lowest quartile (Q1) (P = 0.004, HR, 0.39; 95% CI, 0.20-0.74; Figure 6B).

 これらの結果は、GCSが大変有用な予後判定のシグネチュアとなり得ることを示している。すなわち、個々の患者がGCS値のどの四分位に位置するかを調べることで、統一的な予後予測が可能となり、GCS高値の患者には比較的マイルドな化学療法で十分かもしれないし、GCS低値の患者には、可能であれば、より強い化学療法が推奨される。 These results suggest that the GCS can be a very useful prognostic signature. In other words, by examining which quartile an individual patient's GCS value falls in, a unified prognosis prediction may be possible, and relatively mild chemotherapy may be sufficient for patients with high GCS values, while more intensive chemotherapy may be recommended for patients with low GCS values, if possible.

 我々は、さらにTCGA-CRC-DSSおよびTCGA-CRC-PFSに加えてほぼ同数の大腸がん患者数を擁するGSE39582のmRNAデータについて、OS/RFSについても解析した。その結果、TCGA-CRC-OSやTCGA-CRC-PFSデータよりも症例数が少ないためP値などの統計的パワーは弱いものの、TCGA-CRC-PFSのデータと類似の傾向を得た(図6C)。 We also analyzed OS/RFS using mRNA data from GSE39582, which contains roughly the same number of colorectal cancer patients as TCGA-CRC-DSS and TCGA-CRC-PFS. Although the statistical power, such as P values, was weaker due to the smaller number of cases compared to the TCGA-CRC-OS and TCGA-CRC-PFS data, we observed trends similar to those observed in the TCGA-CRC-PFS data (Figure 6C).

 それぞれの患者腫瘍におけるGCSの特徴を直感的に視覚化するため、図6Dを例としてレーダーチャートを用いた。TCGA-CRC Q4(最上位)の患者の腫瘍はラッキー5とDEFA6に関して高いシグネチュアスコアを示し、その一方でQ1(最下位)の患者の腫瘍はMAGEA6シグネチュアに関して著しく高い値であった。興味深いことに、GSE39582の同様な値を示す群の患者はTCGA-CRCのそれとかなり類似した特徴を有していた(図6D)。 To intuitively visualize the GCS features of each patient's tumor, we used a radar chart as an example in Figure 6D. Tumors from patients in TCGA-CRC Q4 (highest) showed high signature scores for Lucky 5 and DEFA6, while tumors from patients in Q1 (lowest) showed significantly higher values for the MAGEA6 signature. Interestingly, patients in groups showing similar GSE39582 values had features quite similar to those of TCGA-CRC (Figure 6D).

 われわれがGCSスコアの分布を発見コホート(n = 57)と、TCGA-CRCおよびGSE39582データセットについて調べたところ、当然のことながら、GCSスコア平均値(μ)は3つのデータセットで0に近い値を示した。その一方で、GCSスコア中央値は2つのデータベースが+の値(0.24および0.20)示したことに対し、発見コホートの大腸がん幹細胞では負の値(-0.45)を示した(図6E、上)。その理由は、発見コホートではステージIIIとIVの比率を敢えて高くしたことによるものと考えられる。一方、症例数の多いTCGA-CRC(n = 597)とGSE39582(n = 566)のGCSスコア分布は正規分布に近く、GCSの解釈のしやすさと、一般臨床でより多くの患者を用いた状況への適応性を示すものであった(図6E、下)。 We examined the distribution of GCS scores in the discovery cohort (n = 57) and the TCGA-CRC and GSE39582 datasets. Unsurprisingly, the mean GCS score (μ) was close to 0 in all three datasets. Meanwhile, the median GCS score was positive (0.24 and 0.20) in the two databases, while negative (-0.45) in the discovery cohort's CRC stem cells (Figure 6E, top). This is likely due to the intentionally high proportion of stage III and IV cases in the discovery cohort. Meanwhile, the GCS score distributions in TCGA-CRC (n = 597) and GSE39582 (n = 566), which have larger case numbers, were close to normal, demonstrating the ease of interpretation of the GCS and its adaptability to clinical situations involving larger numbers of patients (Figure 6E, bottom).

 術後の大腸がん患者の予後・転帰を予測するための動物モデルとして、新たな異種移植モデルシステムを開発した。それは患者由来スフェロイド同所移植異種移植片を意味するPDSOXである。簡潔に言うと、約10,000個の限られたCRC-SC細胞を免疫不全マウスの盲腸上皮の下に移植した。そして上記のGCSスコアの四分位Q1~Q4のCRC-SC株を用いて試験した。これらの異種移植片は盲腸の粘膜に原発巣を形成した。予後不良Q1由来のCRC-SC株では、26週という観察期間内において14株中4株が肝臓と肺に複数の転移病変を発症した(図6F、右)。その一方で、予後良好のQ4由来のCRC-SC株を移植したマウスは観察期間を通して生存し(図6F、左上)、それと矛盾なく病理解剖では肝臓や肺に転移病変が全く存在しなかった。Q2やQ3のCRC-SC株のうちそれぞれ2株ずつが移植後26週以内に死亡した(図6F、左下)。また、Q4のCRC-SC株の多くは予後良好のシグネチュアであるラッキー5シグネチュアが高かった(図6G)。これらの結果において腫瘍微小環境の付加的な影響の可能性は残るが、個々のCRC-SCに固有な増殖と転移の特徴を反映する形で、大腸がん患者の転帰にGCSスコアが重要な役割を果たす可能性を強く示唆した。 We developed a new xenograft model system, called patient-derived spheroid orthotopic xenografts (PDSOX), as an animal model for predicting the prognosis and outcome of postoperative colorectal cancer patients. Briefly, approximately 10,000 limited CRC-SC cells were transplanted under the cecal epithelium of immunodeficient mice. CRC-SC lines from the above-mentioned GCS score quartiles Q1 to Q4 were then tested. These xenografts formed primary tumors in the cecal mucosa. Four of the 14 CRC-SC lines derived from the poor-prognosis Q1 quartile developed multiple metastatic lesions in the liver and lungs over the 26-week observation period (Figure 6F, right). Meanwhile, mice transplanted with the favorable-prognosis Q4 quartile CRC-SC line survived throughout the observation period (Figure 6F, upper left), and consistent with this, no metastatic lesions were detected in the liver or lungs at autopsy. Two CRC-SC lines from each of the Q2 and Q3 quartiles died within 26 weeks after transplantation (Figure 6F, lower left). Furthermore, many of the Q4 CRC-SC lines had high levels of the Lucky 5 signature, a signature associated with a favorable prognosis (Figure 6G). Although the possibility remains that the tumor microenvironment may have an additional influence on these results, these results strongly suggest that the GCS score may play an important role in the outcome of colorectal cancer patients, reflecting the unique growth and metastatic characteristics of individual CRC-SCs.

4つの典型的なリード遺伝子サブタイプが患者人口の約40%を占める
 ここまでの解析では、我々は全ての個々の患者に応用可能な診断ツールを考案することに焦点を当ててきた。しかし、リード遺伝子シグネチュア(LGS)スコアの高い患者に限定してみると、極めて典型的な分子サブタイプが存在することが明瞭になった。この目的でそのような独特な分子サブタイプを明確化できる様に、我々は上記とは別の統計解析法を用いて同じ2つの公開データベースを分析した。即ち図7Aに示すように、全ての個々の患者について4つのLGSスコアの中で、その患者が最も高いスコアを示すLGSサブグループに人為的に配属した。これにより、全ての患者を厳格に重複しない4つのサブグループに分類した。(この方法は最近の文献に記載がある。)。こうして出来た4つのサブグループを、次にそれぞれMSRS法で高発現と低発現の亜集団に分け、そのうちの高発現亜集団だけを典型的サブタイプと定義し、低発現亜集団はデータベース中の他のサブグループの低発現亜集団の患者と合わせて残りとした(図7B)。このようにして構成された4つの典型的サブタイプは、それぞれTCGA-CRCやGSE39582の患者の約40%を占め、残りの60%は相対的に特徴の少ない部分集団となった(図7B)。
Four typical lead gene subtypes account for approximately 40% of the patient population. Up to this point, we have focused on developing diagnostic tools applicable to all individual patients. However, when we limited our analysis to patients with high lead gene signature (LGS) scores, it became clear that highly typical molecular subtypes exist. To this end, we analyzed the same two public databases using a different statistical analysis method to identify such unique molecular subtypes. Specifically, as shown in Figure 7A, we artificially assigned each individual patient to the LGS subgroup with the highest score out of four LGS scores. This resulted in a strict classification of all patients into four distinct subgroups (this method has been described in a recent paper). Each of these four subgroups was then divided into high- and low-expressing subgroups using the MSRS method. Only the high-expressing subgroup was defined as the typical subtype, while the low-expressing subgroup was combined with patients from the low-expressing subgroups of the other subgroups in the database (Figure 7B). The four typical subtypes thus constructed accounted for approximately 40% of TCGA-CRC and GSE39582 patients, respectively, with the remaining 60% being relatively poorly characterized subgroups (Figure 7B).

 これらの結果を基に、TCGA-CRCのデータの典型的サブタイプで無増悪生存(PFS)を調べたところ、段階的にDEFA6、BST2、MAGEA6、およびIGF2と生存期間の低下を示す層別化を呈し(logrank test P = 0.02)、予想通りDEFA6サブタイプでPFSが長く(HR, 0.60; 95%CI, 0.35-1.0)、BST2、MAGEA6、IGF2では短い傾向があった(図7C、左)。これらの結果はそれらのサブタイプが特徴的なシグネチュアとなり得ることを示している。すなわち、DEFA6サブタイプに入る患者は比較的マイルドな化学療法で十分かもしれないし、BST2、MAGEA6、またはIGF2サブタイプの患者には、通常より強めの化学療法が推奨されうる。同様にGSE39582のmRNAデータについてRFSを解析したところ、TCGA-CRC-PFSのデータと極めて類似した傾向が得られた(logrank test P = 0.003)(図7C、右)。 Based on these results, we examined progression-free survival (PFS) among typical subtypes in the TCGA-CRC data and found a stratification of DEFA6, BST2, MAGEA6, and IGF2, which showed progressively decreased survival (logrank test P = 0.02). As expected, the DEFA6 subtype tended to have a longer PFS (HR, 0.60; 95% CI, 0.35-1.0), while the BST2, MAGEA6, and IGF2 subtypes tended to have a shorter PFS (Figure 7C, left). These results suggest that these subtypes may form distinctive signatures. That is, patients in the DEFA6 subtype may be able to receive relatively mild chemotherapy, while more intensive chemotherapy may be recommended for patients with the BST2, MAGEA6, or IGF2 subtypes. Similarly, when RFS was analyzed for the mRNA data of GSE39582, a trend very similar to that of the TCGA-CRC-PFS data was observed (logrank test P = 0.003) (Figure 7C, right).

GCSと既存の大腸がん予後予測方法との比較
 GCSによる予後予測を既存の大腸がん予後予測方法であるColoGuidePro(Inven2, Oslo, Norway) {Sveen et al. 2012}と比較した。GSE14333 {Jorissen et al. 2009}、GSE17536 {Smith et al. 2009}、GSE17537 {Smith et al. 2009}、GSE33113 {de Sousa E Melo et al. 2011}、GSE37892 {Laibe et al. 2012}、GSE38832 {Tripathi et al. 2014}、およびGSE39582のRFSを統合し、全ステージ(図8A)、ステージII(図8B)、またはステージIII(図8C)の大腸がん患者コホートにおいて、Q1~Q4(左)、最高スコアと最低スコア(Q1とQ4)(中)、または予後良好(80%)と予後不良(20%)(右)の患者のRFSを示した。GCSはColoGuideProよりも統計的優位性が遥かに強かった。
Comparison of GCS with existing colon cancer prognosis prediction methods Prognosis prediction by GCS was compared with an existing colon cancer prognosis prediction method, ColoGuidePro (Inven2, Oslo, Norway) {Sveen et al. 2012}. We combined the RFS data from GSE14333 {Jorissen et al. 2009}, GSE17536 {Smith et al. 2009}, GSE17537 {Smith et al. 2009}, GSE33113 {de Sousa E Melo et al. 2011}, GSE37892 {Laibe et al. 2012}, GSE38832 {Tripathi et al. 2014}, and GSE39582 to show the RFS of patients with Q1–Q4 (left), the highest and lowest scores (Q1 and Q4) (center), or a favorable (80%) and poor (20%) prognosis (right) in a cohort of patients with colorectal cancer of all stages (Figure 8A), stage II (Figure 8B), or stage III (Figure 8C). GCS showed a much stronger statistical significance than ColoGuidePro.

 以上の結果は、各遺伝子シグネチュアおよびGCSが大変有用な大腸がん患者の予後予測のシグネチュアとなることを示す。特にGCSは、各遺伝子シグネチュアの統合解析を反映する値であり、極めて実用的な予後予測ツールになりうる。結果としてGCSスコアにより、大腸がん患者と治療に加わる医師の病状の理解が促進され、最も適切な治療方針の決定に役立つことが期待できる。 These results indicate that each gene signature and the GCS can be very useful signatures for predicting the prognosis of colorectal cancer patients. In particular, the GCS is a value that reflects the integrated analysis of each gene signature, and can be an extremely practical prognostic prediction tool. As a result, the GCS score is expected to facilitate understanding of the condition of colorectal cancer patients and the physicians involved in their treatment, and to be useful in determining the most appropriate treatment plan.

参考文献
Cerami, E., et al. (2012). "The cBio cancer genomics portal: an open platform for exploring multidimensional cancer genomics data." Cancer Discovery 2(5): 401-404.

Ge, SX., et al. (2018). " iDEP: an integrated web application for differential expression and pathway analysis of RNA-Seq data." BMC Bioinformatics 19(534): 1-24.

Hao., Y., et al. (2021). "Integrated analysis of multimodal single-cell data." Cell 184:3573-3587.

Hothorn., Y., et al. (2003). "On the exact distribution of maximally selected rank statistics." Comput. Stat. Data Anal. 43:121-137.

Jackstadt., I., et al. (2019). " Epithelial Notch signaling rewires the tumor microenvironment of colorectal cancer to drive poor-prognosis subtypes and metastasis." Cancer Cell 36: 319-336.

Joanito., et al. (2022). " Single-cell and bulk transcriptome sequencing identifies two epithelial tumor cell states and refines the consensus molecular classification of colorectal cancer." Nat. Genet. 54(7): 963-975.

Jones, W., et al. (2019). "Deleterious effects of formalin-fixation and delays to fixation on RNA and miRNA-seq profiles." Sci. Reports 9: 6980.

Jorissen, R.N. et al. (2009) "Metastasis-associated gene expression changes predict poor outcomes in patients with Dukes stage B and C colorectal cancer." Clin Cancer Res 15, 7642-7651.

Kim, D., et al. (2015). "HISAT: A fast spliced aligner with low memory requirements." Nat. Methods 12: 357-360.

Kim, D., et al. (2019). "Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype." Nat Biotechnol 37: 907-915.

Kitano, S., et al. (2022). "A novel parameter for cancer chemosensitivity to FGFR inhibitors." Cancer Sci. 113(11): 4005-4010

Laibe, S. et al. (2012). "A seven-gene signature aggregates a subgroup of stage II colon cancers with stage III." OMICS 16, 560-565.

Liao, Y., et al. (2014). "featureCounts: an efficient general purpose program for assigning sequence reads to genomic features." Bioinformatics 30(7): 923-930.

Loboda, A., et al. (2011). "EMT is the dominant program in human colon cancer." BMC Medical Genomics 4(9): 1-10.

Marisa, L., et al. (2013). "Gene expression classification of colon cancer into molecular subtypes: characterization, validation and prognostic value." PLoS Med 10: e1001453.

Miyoshi, H., et al. (2018). "An improved method for culturing patient-derived colorectal cancer spheroids." Oncotarget 9(31): 21950-21964.

The Cancer Genome Atlas Research Network (2012). "Comprehensive molecular characterization of human colon and rectal cancer." Nature 489(7407): 330-337.

Pertea, M., et al. (2015). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads." Nat. Biotechnol. 33: 290-295.

Reinhold, W. C., et al. (2019). "RNA sequencing of the NCI-60: integration into CellMiner and CellMiner CDB." Cancer Res. 79(13): 3514-3524.

Smith, J.J. et al. (2009). "Experimentally derived metastasis gene expression profile predicts recurrence and eath in patients with colon cancer." Gastroenterology 138, 958-968.

de Sousa E Melo, F. et al. (2011). "Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients." Cell Stem Cell 9, 476-485.

Su, W., et al. (2019). "TCC-GUI: a Shiny-based application for differential expression anaslysis of RNA-Seq count data." BMC Research Notes 12(133).

Subramanian, A., et al. (2005). "Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles." PNAS 102: 15545-15550.

Sveen, A. et al. (2012). "ColoGuidePro: A prognostic 7-gene expression siganture for stage III colorectal cancer patients." Clin. Cancer Res. 11.

Tripathi, M.K. et al. (2014). "Nuclear factor of activated T-cell activity is associated with metastatic capacity in colon cancer." Cancer Res 74, 6947-6957.

Uhlen, M., et al. (2017). "A pathology atlas of the human cancer transcriptome." Science 357(6352): eaan2507.

Yamamoto, T., et al. (2020). "Chemosensitivity of Patient-Derived Cancer Stem Cells Identifies Colorectal Cancer Patients with Potential Benefit from FGFR Inhibitor Therapy." Cancers 12(8): 2010.

Wang, R., et al. (2021). " Single-cell dissection of intratumoral heterogeneity and lineage diversity in metastatic gastric adenocarcinoma." Nat. Med. 27(1): 141-151.

Zhou, Y., et al. (2019). "Metascape provides a biologist-oriented resource for the analysis of systemes-level datasets." Nat. Comm. 10(1523).
References
Cerami, E., et al. (2012). "The cBio cancer genomics portal: an open platform for exploring multidimensional cancer genomics data." Cancer Discovery 2(5): 401-404.

Ge, SX., et al. (2018). "iDEP: an integrated web application for differential expression and pathway analysis of RNA-Seq data." BMC Bioinformatics 19(534): 1-24.

Hao., Y., et al. (2021). "Integrated analysis of multimodal single-cell data." Cell 184:3573-3587.

Hothorn., Y., et al. (2003). "On the exact distribution of maximally selected rank statistics." Comput. Stat. Data Anal. 43:121-137.

Jackstadt., I., et al. (2019). "Epithelial Notch signaling rewires the tumor microenvironment of colorectal cancer to drive poor-prognosis subtypes and metastasis." Cancer Cell 36: 319-336.

Joanito., et al. (2022). "Single-cell and bulk transcriptome sequencing identifies two epithelial tumor cell states and refines the molecular consensus classification of colorectal cancer." Nat. Genet. 54(7): 963-975.

Jones, W., et al. (2019). "Deleterious effects of formalin-fixation and delays to fixation on RNA and miRNA-seq profiles." Sci. Reports 9: 6980.

Jorissen, RN et al. (2009) "Metastasis-associated gene expression changes predict poor outcomes in patients with Dukes stage B and C colorectal cancer." Clin Cancer Res 15, 7642-7651.

Kim, D., et al. (2015). "HISAT: A fast spliced aligner with low memory requirements." Nat. Methods 12: 357-360.

Kim, D., et al. (2019). "Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype." Nat Biotechnol 37: 907-915.

Kitano, S., et al. (2022). "A novel parameter for cancer chemosensitivity to FGFR inhibitors." Cancer Sci. 113(11): 4005-4010

Laibe, S. et al. (2012). "A seven-gene signature aggregates a subgroup of stage II colon cancers with stage III." OMICS 16, 560-565.

Liao, Y., et al. (2014). "featureCounts: an efficient general purpose program for assigning sequence reads to genomic features." Bioinformatics 30(7): 923-930.

Loboda, A., et al. (2011). "EMT is the dominant program in human colon cancer." BMC Medical Genomics 4(9): 1-10.

Marisa, L., et al. (2013). "Gene expression classification of colon cancer into molecular subtypes: characterization, validation and prognostic value." PLoS Med 10: e1001453.

Miyoshi, H., et al. (2018). "An improved method for culturing patient-derived colorectal cancer spheroids." Oncotarget 9(31): 21950-21964.

The Cancer Genome Atlas Research Network (2012). "Comprehensive molecular characterization of human colon and rectal cancer." Nature 489(7407): 330-337.

Pertea, M., et al. (2015). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads." Nat. Biotechnol. 33: 290-295.

Reinhold, W. C., et al. (2019). "RNA sequencing of the NCI-60: integration into CellMiner and CellMiner CDB." Cancer Res. 79(13): 3514-3524.

Smith, JJ et al. (2009). "Experimentally derived metastasis gene expression profile predicts recurrence and eath in patients with colon cancer." Gastroenterology 138, 958-968.

de Sousa E Melo, F. et al. (2011). "Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients." Cell Stem Cell 9, 476-485.

Su, W., et al. (2019). "TCC-GUI: a Shiny-based application for differential expression analysis of RNA-Seq count data." BMC Research Notes 12(133).

Subramanian, A., et al. (2005). "Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles." PNAS 102: 15545-15550.

Sveen, A. et al. (2012). "ColoGuidePro: A prognostic 7-gene expression siganture for stage III colorectal cancer patients." Clin. Cancer Res. 11.

Tripathi, MK et al. (2014). "Nuclear factor of activated T-cell activity is associated with metastatic capacity in colon cancer." Cancer Res 74, 6947-6957.

Uhlen, M., et al. (2017). "A pathology atlas of the human cancer transcriptome." Science 357(6352): eaan2507.

Yamamoto, T., et al. (2020). "Chemosensitivity of Patient-Derived Cancer Stem Cells Identifies Colorectal Cancer Patients with Potential Benefit from FGFR Inhibitor Therapy." Cancers 12(8): 2010.

Wang, R., et al. (2021). "Single-cell dissection of intratumoral heterogeneity and lineage diversity in metastatic gastric adenocarcinoma." Nat. Med. 27(1): 141-151.

Zhou, Y., et al. (2019). "Metascape provides a biologist-oriented resource for the analysis of systems-level datasets." Nat. Comm. 10(1523).






















Claims (14)

 大腸がん患者の予後を予測するための方法であって、患者のがん試料における遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定することを含む、方法。
A method for predicting the prognosis of a colorectal cancer patient, comprising:
(a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16,
(b) DEFA6, DEFA5, and SPINK1,
(c) BST2, BATF, RAMP1, and TPM2,
(d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
and measuring the expression levels of one or more genes selected from the group consisting of:
 各遺伝子のZスコア(Z)を、式(I):
(式中、xは前記患者の当該遺伝子の発現レベルであり、μおよびσはそれぞれ、複数の大腸がん患者の当該遺伝子の発現レベルの平均および標準偏差である)
により求めること、
 各遺伝子群の遺伝子発現シグネチュアスコアを決定すること、ここで、各遺伝子群の遺伝子発現シグネチュアスコアは、各遺伝子群の遺伝子のZスコアの合計、または各遺伝子群の遺伝子のZスコアの平均値である、および
 前記遺伝子発現シグネチュアスコアをカットオフ値と比較すること
をさらに含む、請求項1に記載の方法。
The Z-score (Z) of each gene was calculated using the formula (I):
(where x is the expression level of the gene in the patient, and μ and σ are the mean and standard deviation of the expression levels of the gene in multiple colorectal cancer patients, respectively)
To seek by
2. The method of claim 1, further comprising: determining a gene expression signature score for each gene group, wherein the gene expression signature score for each gene group is the sum of the Z-scores of the genes in each gene group or the average of the Z-scores of the genes in each gene group; and comparing the gene expression signature score to a cutoff value.
 各遺伝子群の遺伝子発現シグネチュアスコアが、各遺伝子群の遺伝子のZスコアの平均値である、請求項2に記載の方法。 The method of claim 2, wherein the gene expression signature score for each gene group is the average Z-score of the genes in each gene group.  遺伝子群(a)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、請求項2に記載の方法。 The method of claim 2, further comprising comparing the gene expression signature score of the gene group (a) with a cutoff value, and predicting that the patient will have a good prognosis if the gene expression signature score is higher than the cutoff value.  遺伝子群(b)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後良好であると予測される、請求項2に記載の方法。 The method of claim 2, further comprising comparing the gene expression signature score of gene group (b) with a cutoff value, wherein the patient is predicted to have a good prognosis if the gene expression signature score is higher than the cutoff value.  遺伝子群(c)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、請求項2に記載の方法。 The method of claim 2, further comprising comparing the gene expression signature score of gene group (c) with a cutoff value, wherein the patient is predicted to have a poor prognosis if the gene expression signature score is higher than the cutoff value.  遺伝子群(d)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、請求項2に記載の方法。 The method of claim 2, further comprising comparing the gene expression signature score of gene group (d) with a cutoff value, wherein the patient is predicted to have a poor prognosis if the gene expression signature score is higher than the cutoff value.  遺伝子群(e)の遺伝子発現シグネチュアスコアをカットオフ値と比較することを含み、遺伝子発現シグネチュアスコアがカットオフ値より高い場合、前記患者は予後不良であると予測される、請求項2に記載の方法。 The method of claim 2, further comprising comparing the gene expression signature score of the gene group (e) with a cutoff value, wherein the patient is predicted to have a poor prognosis if the gene expression signature score is higher than the cutoff value.  1以上の遺伝子群が、遺伝子群(a)~(e)である、請求項1に記載の方法。 The method of claim 1, wherein the one or more gene groups are gene groups (a) to (e).  1以上の遺伝子群が、遺伝子群(a)~(e)である、および、
 大腸がん総合シグネチュア(GCS)スコアを、式(II): 
(式中、
は予後の極性を示す係数であり、ここで遺伝子群(a)~(b)の係数は1であり、遺伝子群(c)~(e)の係数は-1であり、
は、各遺伝子群の遺伝子のZスコアの平均値である)
によりを決定すること、および
 前記GCSスコアをカットオフ値と比較すること
をさらに含む、請求項1に記載の方法。
The one or more gene groups are gene groups (a) to (e), and
The colon cancer comprehensive signature (GCS) score was calculated using formula (II):
(In the formula,
is a coefficient indicating the polarity of prognosis, where the coefficient of gene group (a) to (b) is 1, the coefficient of gene group (c) to (e) is -1,
is the average Z score of the genes in each gene group)
and comparing the GCS score to a cutoff value.
 がん試料が、手術試料またはバイオプシー試料である、請求項1~10のいずれかに記載の方法。 The method of any one of claims 1 to 10, wherein the cancer sample is a surgical sample or a biopsy sample.  がん試料が、がんスフェロイドである、請求項1~10のいずれかに記載の方法。 The method of any one of claims 1 to 10, wherein the cancer sample is a cancer spheroid.  大腸がん患者の予後を予測するためのキットであって、遺伝子群(a)~(e):
(a)MUC12、PIGR、PLA2G2A、SLC4A4、およびZG16、
(b)DEFA6、DEFA5、およびSPINK1、
(c)BST2、BATF、RAMP1、およびTPM2、
(d)MAGEA6、MAGEA3、MAGEA12およびCSAG1、並びに
(e)IGF2、NELL2、およびRBMS1
から選択される1以上の遺伝子群の遺伝子の発現レベルを測定するための試薬を含む、キット。
A kit for predicting the prognosis of a colorectal cancer patient, comprising:
(a) MUC12, PIGR, PLA2G2A, SLC4A4, and ZG16,
(b) DEFA6, DEFA5, and SPINK1,
(c) BST2, BATF, RAMP1, and TPM2,
(d) MAGEA6, MAGEA3, MAGEA12, and CSAG1, and (e) IGF2, NELL2, and RBMS1.
A kit comprising a reagent for measuring the expression level of one or more genes in a group selected from the group consisting of:
 1以上の遺伝子群が、遺伝子群(a)~(e)である、請求項13に記載のキット。 The kit described in claim 13, wherein the one or more gene groups are gene groups (a) to (e).
PCT/JP2025/003938 2024-02-07 2025-02-06 Method for predicting prognosis of colorectal cancer patient Pending WO2025169993A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2024-017258 2024-02-07
JP2024017258 2024-02-07

Publications (1)

Publication Number Publication Date
WO2025169993A1 true WO2025169993A1 (en) 2025-08-14

Family

ID=96700053

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2025/003938 Pending WO2025169993A1 (en) 2024-02-07 2025-02-06 Method for predicting prognosis of colorectal cancer patient

Country Status (1)

Country Link
WO (1) WO2025169993A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011015681A (en) * 2003-08-08 2011-01-27 Perseus Proteomics Inc Gene overexpressed in cancer
US20110097423A1 (en) * 2009-10-22 2011-04-28 Vanderbilt University Gene Prognosis Predictor Signature for Colorectal Carcinoma
US20150354009A1 (en) * 2012-11-26 2015-12-10 Ecole Polytechnique Federale De Lausanne (Epfl) Colorectal cancer classification with differential prognosis and personalized therapeutic responses

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011015681A (en) * 2003-08-08 2011-01-27 Perseus Proteomics Inc Gene overexpressed in cancer
US20110097423A1 (en) * 2009-10-22 2011-04-28 Vanderbilt University Gene Prognosis Predictor Signature for Colorectal Carcinoma
US20150354009A1 (en) * 2012-11-26 2015-12-10 Ecole Polytechnique Federale De Lausanne (Epfl) Colorectal cancer classification with differential prognosis and personalized therapeutic responses

Similar Documents

Publication Publication Date Title
Jiang et al. Multi-omics analysis identifies osteosarcoma subtypes with distinct prognosis indicating stratified treatment
Xie et al. A multicenter analysis of genomic profiles and PD-L1 expression of primary lymphoepithelioma-like carcinoma of the lung
US11965215B2 (en) Methods and systems for analyzing nucleic acid molecules
JP2021525069A (en) Cell-free DNA for assessing and / or treating cancer
US20110189670A1 (en) Circulating Tumor and Tumor Stem Cell Detection Using Genomic Specific Probes
US20190292600A1 (en) Nasal epithelium gene expression signature and classifier for the prediction of lung cancer
JP2019531741A (en) Group division and prognosis prediction system based on biological characteristics of gastric cancer
CN115612734B (en) Molecular markers of human esophageal squamous cell carcinoma and their applications
JP2019509018A (en) Diagnosis and tracking of mutation-based diseases
WO2023109875A1 (en) Biomarkers for colorectal cancer treatment
Saleh et al. Comparative analysis of triple-negative breast cancer transcriptomics of Kenyan, African American and Caucasian Women
WO2015073949A1 (en) Method of subtyping high-grade bladder cancer and uses thereof
US10036070B2 (en) Methods and means for molecular classification of colorectal cancers
US20240105281A1 (en) Methods and Systems for Analyzing Nucleic Acid Molecules
US20230085358A1 (en) Methods for cancer tissue stratification
US9410205B2 (en) Methods for predicting survival in metastatic melanoma patients
Oiwa et al. Clinicopathological, gene expression and genetic features of stage I lung adenocarcinoma with necrosis
US20180044736A1 (en) Biomarker based prognostic model for predicting overall survival in patients with metastatic clear cell kidney cancer
Smeby et al. Exploratory analyses of consensus molecular subtype-dependent associations of TP53 mutations with immunomodulation and prognosis in colorectal cancer
CN107287345A (en) Detection kit and TSEN34 clinical practices for the accurate diagnosis and treatment of acute myeloid leukemia
CN108456730B (en) Application of recurrence risk gene group as marker in preparation of product for evaluating recurrence risk at distant place in breast cancer molecular typing
Di Mauro et al. MDM2 amplification and fusion gene ss18-ssx in a poorly differentiated synovial sarcoma: A rare but puzzling conjunction
Li et al. Individual assignment of adult diffuse gliomas into the EM/PM molecular subtypes using a TaqMan low-density array
JP2020529870A (en) Materials and methods for stratifying and treating cancer
WO2023125788A1 (en) Biomarkers for colorectal cancer treatment

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 25752218

Country of ref document: EP

Kind code of ref document: A1