WO2025127679A1 - Method for predicting prognosis of breast cancer by using immunosuppressive fibroblast activity measurement data - Google Patents
Method for predicting prognosis of breast cancer by using immunosuppressive fibroblast activity measurement data Download PDFInfo
- Publication number
- WO2025127679A1 WO2025127679A1 PCT/KR2024/020184 KR2024020184W WO2025127679A1 WO 2025127679 A1 WO2025127679 A1 WO 2025127679A1 KR 2024020184 W KR2024020184 W KR 2024020184W WO 2025127679 A1 WO2025127679 A1 WO 2025127679A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- breast cancer
- prognosis
- predicting
- providing information
- fibroblasts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
Definitions
- the present disclosure relates to a method for providing information for predicting the prognosis of breast cancer using data measuring the activity of immunosuppressive fibroblasts, and more specifically, to a method for providing information for predicting the prognosis of breast cancer using cell state scores and MYC target activity levels of immunosuppressive fibroblasts, myofibroblasts, or immunosuppressive fibroblasts and myofibroblasts.
- Breast cancer is one of the most prevalent diseases, affecting nearly 1 in 8 women in the United States. It is also the most commonly diagnosed cancer in women worldwide and the leading cause of cancer death in women. Both the incidence and mortality rates of breast cancer have been increasing over the past several decades. Risk factors for breast cancer include genetics, lifestyle, obesity, hormones, and age. Surprisingly, the incidence of breast cancer is closely related to age, and in Korea, it is reported to occur most frequently in women aged 40 to 49 years.
- Breast cancer is a heterogeneous disease with significant differences between individual patients (inter-tumor heterogeneity) and even within each individual tumor (intra-tumor heterogeneity). Inter-tumor heterogeneity contributes to differences in disease stage and histopathologic characteristics. These differences are reflected in subtype classification, providing important insights into prognosis and treatment approaches.
- Breast cancer is generally classified into four subtypes: luminal A, luminal B, HER2, and triple negative breast cancer (TNBC).
- TNBC is characterized by being negative for ER, PR, and HER-2, and accounts for about 15-20% of cases.
- the subtype based on the PAM50 method is a unique subtype of breast cancer based on the gene expression of 50 genes.
- the PAM50-based subtype offers improvements in risk prediction and disease management compared to the IHC-based subtype.
- the choice of treatment varies depending on the subtype. For example, Luminal A responds better to endocrine therapy, whereas TNBC responds better to chemotherapy. Therefore, accurate subtype classification is essential to select the most effective treatment strategy. Nevertheless, accurate subtype classification still remains a challenge.
- multi-omics data for 289 Korean breast cancer samples, including 178 YBC and 111 OBC samples.
- the multi-omics data in this invention includes six data types, ranging from genome, exome, and transcriptome sequencing to methylome, proteome, and phosphorylome data.
- the integrated multi-omics study will provide novel, clinically relevant insights that may be difficult to obtain when examining only single-omics data.
- another object of the present invention is to provide a method for providing information for predicting the prognosis of breast cancer, including the steps of obtaining multi-omics data from a separated sample of a cancer patient; performing a hierarchical clustering analysis to classify each sample into a subclass of breast cancer based on the multi-omics data; and predicting the prognosis based on the classified subclass.
- the step of predicting breast cancer prognosis using the cell status score of step (c) may be performed by comparing the cell status score with a given reference value.
- the method for providing information for predicting breast cancer prognosis may further include, after the step of classifying into subclasses, a step of comparing the age group, TP53 mutation status, and existing breast cancer subtype distribution of the subclasses to confirm the heterogeneity of breast cancer subtypes between each cluster.
- the method for providing information for predicting breast cancer prognosis may further include, after the step of classifying into subclasses, a step of analyzing tumor microenvironment (TME) and immune components by subclassification to identify molecular characteristics of each subclassification.
- TEE tumor microenvironment
- a method for providing information for predicting the prognosis of breast cancer can provide information related to predicting the prognosis of a breast cancer patient.
- multi-omics-based clustering analysis can systematically understand the various subcategories of breast cancer, which can be used to develop more accurate prognostic assessments and personalized treatment strategies.
- Fig. 3a shows a new unsupervised hierarchical clustering of breast cancer subtypes into nine detailed subcategories using multi-omics data.
- the distribution of age group, TP53 mutation status, and PAM50 subtype for each multi-omics subcategory is shown at the top, and sample information is shown along with the levels of each subcategory of MYC expression, MYC target activity, IL6+ inflammatory fibroblasts, and myofibroblasts.
- the bottom shows markers normalized to z-scores including genetic mutations, tumor microenvironment components, and immune scores including immune cell fraction and immune signature.
- Fig. 3b is an enlarged view of the classification name (indicated by 'a') described on the right side of Fig. 3a.
- the method for providing information for predicting the prognosis of breast cancer of the present invention may include the steps of obtaining multi-omics data from a separated sample of a cancer patient; performing a hierarchical clustering analysis to classify each sample into a subclass of breast cancer based on the multi-omics data; and predicting the prognosis based on the classified subclass.
- the method for providing information for predicting the prognosis of breast cancer may be to integrate the collected multi-omics data, and then analyze the data using a hierarchical clustering technique to classify breast cancer subtypes. At this time, more detailed subclassification of breast cancer may be possible, and the detailed classification may enable the development of a customized treatment strategy. More specifically, when classifying breast cancer subtypes using the multi-omics clustering data according to the present invention, it may be possible to confirm heterogeneity between tumors by assigning them to different subclassifications.
- the method for providing information for prognosis and prediction of breast cancer may further include a step of evaluating the consistency between the results of multi-omics-based clustering and existing PAM50 or IHC subtypes, and confirming heterogeneity between tumors by comparing the age group of each classification, the presence or absence of TP53 mutations, and the distribution of existing breast cancer subtypes, thereby confirming the heterogeneity of breast cancer subtypes between each cluster.
- samples with the same PAM50 or IHC subtype generally belong to the same cluster, in some cases, the same subtype may be assigned to a different subclassification, thereby confirming heterogeneity between tumors.
- the method for providing information for prognosis and prediction of breast cancer may further include a step of analyzing genetic mutations, tumor microenvironment (TME), and immune components to confirm unique molecular characteristics of each subclass, and through the analysis, the complex heterogeneity of breast cancer can be more deeply understood.
- TEE tumor microenvironment
- the method for providing information for prognosis and prediction of breast cancer may further include a step of comparing the ratio of immune cells correlated with age by multi-omics sub-classification in order to understand the relationship between age and breast cancer subtype by confirming the difference in immune cell composition according to age.
- NEF non-negative matrix factorization
- the analysis method identified various mesenchymal cell states including IL6+ inflammatory fibroblasts, CCL19+ fibroblasts, and myofibroblasts. Based on the protein levels of the above markers, a cell state score was calculated for each breast cancer sample. Meanwhile, the IL6+ inflammatory fibroblasts can be identified by the expression of marker genes including AKR1C1, IL-6, FOSL1, and CXCL1/3/8.
- IL6+ inflammatory fibroblast status was identified by marker genes including AKR1C1, IL-6, FOSL1, and CXCL1/3/8.
- AKR1C1 which encodes a member of the aldo/keto reductase superfamily, regulates the metabolism of hormones such as estrogen and progesterone.
- fibroblast status was overexpressed in organs associated with reproductive hormones, including the breast, uterus, fallopian tubes, ovaries, and prostate.
- estrogen and progesterone levels are regulated by AKR1C1 and AKR1C3.
- MYC protein synthesis is influenced by posttranscriptional regulation involving the internal ribosome entry site in the 5'-untranslated region.
- IL-6 one of the marker genes for the IL6+ inflammatory fibroblast state, has been reported to enhance MYC translation through this mechanism.
- This translational control of MYC by IL-6 has been proposed as a pathway linking inflammation and cancer. Therefore, it was suggested that IL-6 released from IL6+ inflammatory fibroblasts could potentially be the cause of increased MYC signaling in relation to hormone metabolism in young breast cancer patients.
- OBCs Unlike YBCs, which are enriched for MYC targeting, OBCs appear to be more enriched for myofibroblast status.
- the negative correlations between myofibroblast status and MYC target activity and patient age are consistent with the above findings.
- cell state scores calculated using transcriptomes instead of proteome data showed a decreased correlation between IL6+ inflammatory fibroblasts and myofibroblasts and MYC target activity.
- Macrophages, ⁇ T cells, and DCs were identified as three immune cell types that were inversely correlated with the myofibroblast status (Figure 1F).
- Neutrophils showed a positive correlation with the IL6+ inflammatory fibroblast status ( Figure 1F).
- CXCL1/2/3, markers of IL6+ inflammatory fibroblast state, are known to recruit neutrophils. These genes may contribute to poor prognosis and resistance to immunotherapy in breast cancer by protecting tumor cells from cytotoxic T cells.
- the evaluation criteria for the scores of IL6+ inflammatory fibroblasts and myofibroblasts were categorized as high and low based on the median value of each score in the cohort used for analysis. In addition, if the IL6+ inflammatory fibroblast status value was higher than the median value, it was evaluated as a case with a poor prognosis, and if the myofibroblast status value was higher than the median value, it was evaluated as a case with a good prognosis.
- IL6+ inflammatory fibroblasts may contribute to T cell exclusion by recruiting pro-tumorigenic immune cells, such as macrophages, ⁇ T cells, DCs, and neutrophils.
- pro-tumorigenic immune cells such as macrophages, ⁇ T cells, DCs, and neutrophils.
- the activity of MYC target genes showed a similar correlation pattern with immune cell fractions, especially in terms of T cell repulsion, which was consistent with the T cell exclusion signature observed in the MYC-activated tumors (Fig. 1C).
- IL6+ inflammatory fibroblasts may play a role in generating an inflammatory, immunosuppressive tumor microenvironment in MYC-activated breast cancer.
- Example 3 Breast cancer subtype classification using multi-omics data
- the luminal A/B-enriched subclasses mainly showed a high proportion of TP53 wild type samples.
- OBC samples were abundant in C4, C7, and C8, whereas YBC samples were prominent in C5 and C6.
- C9 consisted only of TP53 mutant samples and was mostly classified as HER2 subtype according to PAM50 criteria.
- TME markers formed an independent cluster with myofibroblasts and vascular CAF (vCAF), and were expressed at high levels in C3, C4, and C7, whereas they were expressed at low levels in C1, C5, and C9.
- IL6+ inflammatory fibroblasts clustered with tumor-like CAF (tCAF), stromal CAF (mCAF), and dividing CAF (dCAF) and were mainly expressed in C1 and C9. These were a group mainly composed of TP53 mutant YBC, and their expression was low in C3 and C4.
- TNBC-enriched subclasses C3 showed the highest levels of myofibroblasts and vCAFs, suggesting a relatively stable and less aggressive nature, and despite being classified as TNBC, its characteristics were different.
- CD4+ T cells were abundant in C2, C3, and C7, whereas immune cells that were high in YBC were less abundant in these subclasses, suggesting that the active immune activity of C2 and C3 may induce a stronger antitumor response than C1.
- immune-related cell status markers and interferon CAF (ifnCAF) were highly expressed in C2 and C3. These subclasses showed high immune signature scores, suggesting an active immune response such as strong lymphocytic infiltration. These results support the strong immune activity that characterizes these subclasses.
- the multi-omics clustering analysis according to the present invention the complex heterogeneity of breast cancer in the tumor microenvironment and immune environment was confirmed. Their complex interactions characterize breast cancer subtypes, and the importance of molecular profiling to capture this complexity was confirmed. These research results indicate that the multi-omics approach is an essential element in cancer research, and it was confirmed that it can more precisely understand the dynamic changes of tumors and develop more effective customized treatment strategies.
- Example 4 To confirm the clinical significance of the multi-omics subclassification of Example 4 above, the clinical prognosis of each subclassification was evaluated, and the results are shown in Fig. 4A.
- the evaluation results showed that TNBC is generally associated with a poor prognosis, but TNBC tumors belonging to C3 showed a good prognosis reflecting non-malignant molecular characteristics (left).
- a large difference in survival outcomes was observed in the luminal A/B-enriched subclassifications (C4–C7).
- C5 the most malignant luminal A/B subclass, showed the worst survival rate
- C4 the most non-malignant, showed the best survival rate (middle).
- the prognosis of C9 was worse than that of C8, which is interpreted as being due to the high MYC score and low myofibroblast score in C9 (right).
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Description
본 개시는 면역억제 섬유아세포 활성 측정 데이터를 이용한 유방암 예후 예측을 위한 정보를 제공하는 방법에 관한 것으로서, 보다 구체적으로는 면역억제 섬유아세포, 근섬유아세포 또는 면역억제 섬유아세포 및 근섬유아세포의 세포 상태 점수와 MYC 표적 활성 수준을 이용하여 유방암의 예후 예측을 위한 정보를 제공하는 방법에 관한 것이다.The present disclosure relates to a method for providing information for predicting the prognosis of breast cancer using data measuring the activity of immunosuppressive fibroblasts, and more specifically, to a method for providing information for predicting the prognosis of breast cancer using cell state scores and MYC target activity levels of immunosuppressive fibroblasts, myofibroblasts, or immunosuppressive fibroblasts and myofibroblasts.
유방암은 미국 여성 8명 중 거의 1명에게 영향을 미치는 가장 널리 퍼진 질병 중 하나이다. 또한, 전 세계적으로 유방암은 여성에게서 가장 흔히 진단되는 암이자, 여성 암 사망의 주요 원인이기도 하다. 지난 수십 년 동안 유방암 발병률과 사망률은 모두 증가하는 추세를 보여왔다. 유방암의 위험 요인에는 유전, 생활습관, 비만, 호르몬, 연령 등 다양한 요인이 포함된다. 놀랍게도, 유방암 발병률은 연령과 밀접한 관련이 있으며, 한국에서는 40~49세 여성에게서 가장 많이 발병하는 것으로 보고된다.Breast cancer is one of the most prevalent diseases, affecting nearly 1 in 8 women in the United States. It is also the most commonly diagnosed cancer in women worldwide and the leading cause of cancer death in women. Both the incidence and mortality rates of breast cancer have been increasing over the past several decades. Risk factors for breast cancer include genetics, lifestyle, obesity, hormones, and age. Surprisingly, the incidence of breast cancer is closely related to age, and in Korea, it is reported to occur most frequently in women aged 40 to 49 years.
유방암은 개별 환자 간의 상당한 차이(종양 간 이질성) 및 심지어 각 개별 종양 내에서도 상당한 차이(종양 내 이질성)가 있는 이질적인 질병이다. 종양 간 이질성은 질병 단계 및 조직병리학적 특성의 차이에 기여한다. 이러한 차이는 아형(subtype) 분류에 반영되어 예후 및 치료 접근법에 대한 중요한 통찰력을 제공한다. 일반적으로 유방암은 루미날 A(luminal A), 루미날 B(luminal B), HER2 및 삼중음성유방암(triple negative breast cancer, TNBC)의 네 가지 아형으로 분류된다.Breast cancer is a heterogeneous disease with significant differences between individual patients (inter-tumor heterogeneity) and even within each individual tumor (intra-tumor heterogeneity). Inter-tumor heterogeneity contributes to differences in disease stage and histopathologic characteristics. These differences are reflected in subtype classification, providing important insights into prognosis and treatment approaches. Breast cancer is generally classified into four subtypes: luminal A, luminal B, HER2, and triple negative breast cancer (TNBC).
상기 유방암 아형을 구별하기 위해서는 면역조직화학(Immunohistochemistry, IHC)과 마이크로어레이 예측 분석 50 (Prediction analysis of microarray 50, PAM50) 방법론이 일반적으로 사용된다. 상기 IHC 기반 아형은 에스트로겐 및 프로게스테론 핵 호르몬 수용체(ER/PR) 및 인간 표피 성장 인자 수용체-2(HER-2)의 발현에 의존한다. 케이스의 약 40%를 차지하는 가장 널리 퍼진 아형인 루미날 A(Luminal A)는 ER 및/또는 PR 양성인 반면 HER-2 음성인 것이 특징이다. 케이스의 약 20%를 차지하는 루미날(Luminal B)는 ER, PR 및 HER-2 양성을 특징으로 한다. 또한, HER2 양성 유방암은 사례의 약 10~15%를 나타내며 ER 및 PR 음성이지만 HER-2 양성이다. 마지막으로, TNBC는 ER, PR 및 HER-2에 대해 음성인 것이 특징이며, 케이스의 약 15-20%를 차지한다. 반면, 상기 PAM50 방법에 기반한 아형은 50개 유전자의 유전자 발현을 기반으로 한 유방암의 고유 아형이다. PAM50 기반 아형은 IHC 기반 아형에 비해 위험 예측 및 질병 관리 측면에서 향상된 부분들을 제공한다. 특히, 치료법의 선택은 아형에 따라 달라진다. 예를 들어, 루미날 A(Luminal A)는 내분비 요법에 더 잘 반응하는 반면, TNBC는 화학 요법에 더 잘 반응한다. 따라서 가장 효과적인 치료 전략을 선택하려면 정확한 아형 분류가 필수적인 것이다. 그럼에도 불구하고, 아형의 정확한 분류는 여전히 과제로 남아 있다.Immunohistochemistry (IHC) and Prediction analysis of microarray 50 (PAM50) methodologies are commonly used to distinguish the above breast cancer subtypes. The IHC-based subtypes depend on the expression of estrogen and progesterone nuclear hormone receptors (ER/PR) and human epidermal growth factor receptor-2 (HER-2). Luminal A, the most prevalent subtype, accounting for approximately 40% of cases, is characterized by ER and/or PR positivity, while being HER-2 negative. Luminal B, accounting for approximately 20% of cases, is characterized by ER, PR, and HER-2 positivity. In addition, HER2-positive breast cancers account for approximately 10-15% of cases and are ER and PR negative, but HER-2 positive. Finally, TNBC is characterized by being negative for ER, PR, and HER-2, and accounts for about 15-20% of cases. In contrast, the subtype based on the PAM50 method is a unique subtype of breast cancer based on the gene expression of 50 genes. The PAM50-based subtype offers improvements in risk prediction and disease management compared to the IHC-based subtype. In particular, the choice of treatment varies depending on the subtype. For example, Luminal A responds better to endocrine therapy, whereas TNBC responds better to chemotherapy. Therefore, accurate subtype classification is essential to select the most effective treatment strategy. Nevertheless, accurate subtype classification still remains a challenge.
더 어린 나이에 진단된 유방암은 더 공격적인 특성과 더 나쁜 생존 결과와 관련이 있다. 또한, 젊은 유방암(young breast cancer, YBC) 환자는 나이든 유방암(old breast cancer, OBC) 환자에 비해 전이 및 재발 위험이 더 높다. 그러나 나이와 종양 악성도와 관련된 기저 메커니즘은 여전히 알려지지 않은 채로 남아 있다. 더욱이 암의 생물학적 특성은 DNA, RNA, 단백질, 소분자 등 세포를 구성하는 수많은 구성 요소 간의 복잡한 상호 작용에서 비롯된다. 특히 암에서 세포 신호 전달 경로의 실제 중재자와 조절자는 대부분 단백질 수준에서 관찰되므로 YBC의 생물학적 메커니즘을 밝히기 위해서는 전사 수준을 넘어 번역 수준으로 확장하는 것이 필요하다. 결론적으로, 유전자 변형(genomic alterations)에만 의존하는 것은 종양 형성 과정의 복잡성으로 인해 상당한 어려움을 야기하며, 이러한 메커니즘을 보다 압축적으로 이해하려면 genomic, transcriptomic, epigenomic 및 proteomic 영역을 포함하여 여러 계층의 오믹스 데이터를 통합해야 한다.Breast cancer diagnosed at a younger age is associated with more aggressive characteristics and worse survival outcomes. In addition, young breast cancer (YBC) patients have a higher risk of metastasis and recurrence compared to old breast cancer (OBC) patients. However, the underlying mechanisms related to age and tumor malignancy remain unknown. Furthermore, the biological characteristics of cancer arise from complex interactions among numerous components that constitute cells, including DNA, RNA, proteins, and small molecules. In particular, since most of the actual mediators and regulators of cell signaling pathways in cancer are observed at the protein level, it is necessary to expand beyond the transcriptional level to the translational level to elucidate the biological mechanisms of YBC. In conclusion, relying solely on genomic alterations poses significant challenges due to the complexity of tumorigenesis, and a more concise understanding of these mechanisms requires the integration of multiple layers of omics data, including genomic, transcriptomic, epigenomic, and proteomic domains.
본 연구에서는 178개의 YBC와 111개의 OBC 샘플을 포함하여 289개의 한국 유방암 샘플에 대한 다중 데이터를 생성하고 분석하였다. 본 발명에서의 다중오믹스 데이터(multiomics data)는 게놈, 엑솜 및 전사체 시퀀싱부터 메틸롬, 프로테옴 및 인산화체(genome, exome, and transcriptome sequencing to methylome, proteome, and phosphorylome) 데이터에 이르는 6가지 데이터 유형을 포함한다. 상기 통합 다중오믹스 연구는 단일 오믹스 데이터만 조사할 때는 파악하기 어려울 수 있는 새롭고, 임상적으로 관련된 통찰력을 제공할 것이다. In this study, we generated and analyzed multi-omics data for 289 Korean breast cancer samples, including 178 YBC and 111 OBC samples. The multi-omics data in this invention includes six data types, ranging from genome, exome, and transcriptome sequencing to methylome, proteome, and phosphorylome data. The integrated multi-omics study will provide novel, clinically relevant insights that may be difficult to obtain when examining only single-omics data.
본 발명의 목적은 암 환자로부터 생물학적 시료를 수득하는 단계; 상기 수득된 시료로부터 면역억제 섬유아세포, 근섬유아세포 또는 면역억제 섬유아세포 및 근섬유아세포의 세포 상태 점수를 측정하는 단계; 및 상기 측정된 세포 상태 점수를 이용하여 유방암 예후를 예측하는 단계;를 포함하는 유방암의 예후 예측을 위한 정보제공 방법을 제공하는 것이다.The purpose of the present invention is to provide a method for providing information for predicting the prognosis of breast cancer, comprising the steps of: obtaining a biological sample from a cancer patient; measuring a cell status score of immunosuppressive fibroblasts, myofibroblasts, or immunosuppressive fibroblasts and myofibroblasts from the obtained sample; and predicting the prognosis of breast cancer using the measured cell status score.
또한, 본 발명의 다른 목적은 암 환자의 분리된 시료로부터 다중오믹스 데이터를 수득하는 단계; 상기 다중오믹스 데이터를 기반으로, 각 시료를 유방암의 하위 분류로 분류하기 위해 계층적 군집화(hierarchical clustering) 분석을 수행하는 단계; 및 상기 분류된 하위 분류군에 기반하여 예후를 예측하는 단계;를 포함하는 유방암의 예후 예측을 위한 정보제공 방법을 제공하는 것이다. In addition, another object of the present invention is to provide a method for providing information for predicting the prognosis of breast cancer, including the steps of obtaining multi-omics data from a separated sample of a cancer patient; performing a hierarchical clustering analysis to classify each sample into a subclass of breast cancer based on the multi-omics data; and predicting the prognosis based on the classified subclass.
그러나, 본 발명이 해결하고자 하는 과제는 이상에서 언급한 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 해당 기술분야의 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.However, the problems to be solved by the present invention are not limited to the problems mentioned above, and other problems not mentioned can be clearly understood by a person having ordinary skill in the relevant technical field from the description below.
본 발명의 일 실시예에 따른 유방암 예후 예측을 위한 정보제공 방법은, a) 암 환자로부터 생물학적 시료를 수득하는 단계; b) 상기 수득된 시료로부터 면역억제 섬유아세포, 근섬유아세포 또는 면역억제 섬유아세포 및 근섬유아세포의 세포 상태 점수를 측정하는 단계; 및 c) 상기 측정된 세포 상태 점수를 이용하여 유방암 예후를 예측하는 단계;를 포함한다. A method for providing information for predicting breast cancer prognosis according to one embodiment of the present invention comprises the steps of: a) obtaining a biological sample from a cancer patient; b) measuring a cell status score of immunosuppressed fibroblasts, myofibroblasts, or immunosuppressed fibroblasts and myofibroblasts from the obtained sample; and c) predicting breast cancer prognosis using the measured cell status score.
본 발명의 일 실시예에 따르면, 상기 면역억제 섬유아세포를 특정하는 유전자는 GEM, CXCL8, CXCL3, CXCL2, CXCL1, IL6, TNFAIP6, MT1A, THAP2, AKR1C1, FOSL1, CEBPB, IER3, LIF, SOD2, C11orf96, CD44, GPRC5A, KDM6B, TNFRSF12A, DDX21, NFKBIA, MAFF, UAP1, SLC3A2, WTAP, PPP1R15A, RND3, MYC, ADAMTS4, HSPD1, PTGS2, CREM, PLIN2, CYCS, BAG3, REL, NAMPT, CYTOR, ZC3H12A, BTG3, XBP1, HSPH1, HSPA9, EIF4A3, EIF5 및 ERRFI1로 이루어진 군으로부터 선택되는 1종 이상일 수 있다.According to one embodiment of the present invention, the genes specifying the immunosuppressive fibroblasts are composed of GEM, CXCL8, CXCL3, CXCL2, CXCL1, IL6, TNFAIP6, MT1A, THAP2, AKR1C1, FOSL1, CEBPB, IER3, LIF, SOD2, C11orf96, CD44, GPRC5A, KDM6B, TNFRSF12A, DDX21, NFKBIA, MAFF, UAP1, SLC3A2, WTAP, PPP1R15A, RND3, MYC, ADAMTS4, HSPD1, PTGS2, CREM, PLIN2, CYCS, BAG3, REL, NAMPT, CYTOR, ZC3H12A, BTG3, XBP1, HSPH1, HSPA9, EIF4A3, EIF5 and ERRFI1. There may be one or more types selected from the military.
본 발명의 일 실시예에 따르면, 상기 면역억제 섬유아세포는 IL6+ 염증성 섬유아세포인 것일 수 있다.According to one embodiment of the present invention, the immunosuppressive fibroblasts may be IL6+ inflammatory fibroblasts.
본 발명의 일 실시예에 따르면, 상기 (c) 단계의 세포 상태 점수를 이용하여 유방암 예후를 예측하는 단계는, 상기 세포 상태 점수를 주어진 기준값과 비교하여 이루어지는 것일 수 있다.According to one embodiment of the present invention, the step of predicting breast cancer prognosis using the cell status score of step (c) may be performed by comparing the cell status score with a given reference value.
본 발명의 일 실시예에 따르면, 상기 측정된 섬유아세포의 세포 상태 점수가 중앙값(median)보다 높게 평가된 경우 나쁜 예후인 것으로 평가하는 것일 수 있다.According to one embodiment of the present invention, if the cell status score of the measured fibroblasts is evaluated to be higher than the median, it may be evaluated as a poor prognosis.
본 발명의 일 실시예에 따르면, 상기 측정된 근섬유아세포의 세포 상태 점수가 중앙값(median) 보다 높게 평가된 경우 좋은 예후인 것으로 평가하는 것일 수 있다.According to one embodiment of the present invention, if the cell status score of the measured myofibroblasts is evaluated to be higher than the median, it may be evaluated as a good prognosis.
또한, 본 발명은 암 환자의 분리된 시료로부터 다중오믹스 데이터를 수득하는 단계; 상기 다중오믹스 데이터를 기반으로, 각 시료를 유방암의 하위 분류로 분류하기 위해 계층적 군집화(hierarchical clustering) 분석을 수행하는 단계; 및 상기 분류된 하위 분류군에 기반하여 예후를 예측하는 단계;를 포함하는 유방암의 예후 예측을 위한 정보제공 방법을 제공한다.In addition, the present invention provides a method for providing information for predicting the prognosis of breast cancer, including the steps of obtaining multi-omics data from a separated sample of a cancer patient; performing a hierarchical clustering analysis to classify each sample into a subclass of breast cancer based on the multi-omics data; and predicting the prognosis based on the classified subclass.
본 발명의 일 실시예에 따르면, 상기 다중오믹스 데이터는 유전적 변이,종양 미세환경 구성 요소, 면역 세포 비율, 면역특성 점수, 섬유아세포 활성, TP53 돌연변이 상태 및 MYC 활성 점수 중 적어도 하나를 포함하는 것일 수 있다.According to one embodiment of the present invention, the multi-omics data may include at least one of genetic variation, tumor microenvironment components, immune cell proportion, immune signature score, fibroblast activity, TP53 mutation status, and MYC activity score.
본 발명의 일 실시예에 따르면, 상기 유방암 예후 예측을 위한 정보제공 방법은 상기 하위 분류로 분류하는 단계 이후에, 상기 하위 분류의 연령 그룹, TP53 돌연변이 여부 및 기존 유방암 아형 분포를 비교하여 각 군집 간 유방암 아형의 이질성을 확인하는 단계;를 더 포함하는 것일 수 있다.According to one embodiment of the present invention, the method for providing information for predicting breast cancer prognosis may further include, after the step of classifying into subclasses, a step of comparing the age group, TP53 mutation status, and existing breast cancer subtype distribution of the subclasses to confirm the heterogeneity of breast cancer subtypes between each cluster.
본 발명의 일 실시예에 따르면, 상기 유방암 예후 예측을 위한 정보제공 방법은 상기 하위 분류로 분류하는 단계 이후에, 상기 하위 분류별로 종양 미세환경(TME) 및 면역 구성 요소를 분석하여 각 하위 분류의 분자적 특성을 식별하는 단계;를 더 포함하는 것일 수 있다.According to one embodiment of the present invention, the method for providing information for predicting breast cancer prognosis may further include, after the step of classifying into subclasses, a step of analyzing tumor microenvironment (TME) and immune components by subclassification to identify molecular characteristics of each subclassification.
본 발명의 일 실시예에 따르면, 상기 유방암 예후 예측을 위한 정보제공 방법은 상기 하위 분류별로 연령에 따른 면역 세포 비율을 분석하여 연령에 따른 면역 세포 구성을 확인하는 단계;를 더 포함하는 것일 수 있다.According to one embodiment of the present invention, the method for providing information for predicting breast cancer prognosis may further include a step of analyzing the immune cell ratio according to age by sub-classification to confirm the immune cell composition according to age.
본 발명의 일 실시예에 따르면, 상기 군집화를 통해 도출된 유방암의 하위 분류는 9가지로 분류되는 것일 수 있다.According to one embodiment of the present invention, the sub-classification of breast cancer derived through the clustering may be classified into nine types.
본 발명의 일 실시예에 따른 유방암 예후 예측을 위한 정보제공 방법은 유방암 환자의 예후 예측과 관련된 정보를 제공할 수 있다.A method for providing information for predicting the prognosis of breast cancer according to one embodiment of the present invention can provide information related to predicting the prognosis of a breast cancer patient.
본 발명의 일 실시예에 따른 유방암 예후 예측을 위한 정보제공 방법은 유방암 종양 생태계를 더욱 이해할 수 있도록 하고, 특히 젊은 나이에 진단된 유방암(YBC)에서 관찰되는 보다 공격적인 특성에 대한 기초 메커니즘을 밝히는데 도움이 될 수 있다. The information providing method for predicting breast cancer prognosis according to one embodiment of the present invention may help to further understand the breast cancer tumor ecology and, in particular, to elucidate the underlying mechanisms for the more aggressive characteristics observed in breast cancer diagnosed at a young age (YBC).
또한, 다중오믹스 기반 군집화 분석을 통해 유방암의 다양한 하위 분류를 체계적으로 이해할 수 있고, 이를 기반으로 보다 정확한 예후 평가와 개인 맞춤형 치료 전략을 마련할 수 있게 한다.In addition, multi-omics-based clustering analysis can systematically understand the various subcategories of breast cancer, which can be used to develop more accurate prognostic assessments and personalized treatment strategies.
그러나 본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.However, the effects of the present invention are not limited to the above-mentioned effects, and it should be understood that they include all effects that can be inferred from the composition of the invention described in the detailed description or claims of the present invention.
도 1은 면역억제 섬유아세포의 활성이 높은 종양과 낮은 종양의 종양 미세환경 차이에 관한 것으로, (A) 세포 유형별로 착색된 단일 세포 전사체의 UMAP 시각화, (B) 중간엽 세포 상태로 착색된 단일 세포 전사체의 UMAP 시각화, (C) MYC-높은 샘플과 MYC-낮은 샘플 간의 단백질 세포 상태 점수의 다중 비교(통계 분석은 Wilcoxon 부호 순위 테스트를 사용하여 수행되었으며, FDR(false discovery rate)은 < 0.1로 제어됨), (D) IL6+ 염증성 섬유아세포(상부) 및 근섬유아세포(하부) 단백질 점수에 대한 MYC 표적 활성 및 연령의 영향에 대하여 상관 분석으로 조사한 결과(왼쪽)와 MYC-높은 종양과 MYC-낮은 종양 사이의 세포 상태 점수(중간) 및 YBC와 OBC 사이의 세포 상태 점수를 비교한 결과(오른쪽), (E) IL6+ 염증성 섬유아세포(상부) 및 근섬유아세포(하부) 점수와 다중 면역 점수의 상관관계, (F) IL6+ 염증성 섬유아세포(상부) 및 근섬유아세포(하부) 점수와 여러 면역 세포 분획의 상관관계를 나타낸다.Figure 1. Differences in the tumor microenvironment between tumors with high and low immunosuppressive fibroblast activity: (A) UMAP visualization of single-cell transcriptomes colored by cell type, (B) UMAP visualization of single-cell transcriptomes colored by mesenchymal cell state, (C) multiple comparisons of protein cell state scores between MYC-high and MYC-low samples (statistical analysis was performed using the Wilcoxon signed-rank test, with a false discovery rate (FDR) of <0.1), (D) correlation analysis investigating the effect of MYC target activity and age on IL6+ inflammatory fibroblast (top) and myofibroblast (bottom) protein scores (left) and comparison of cell state scores between MYC-high and MYC-low tumors (middle) and between YBC and OBC (right), (E) correlation of IL6+ inflammatory fibroblast (top) and myofibroblast (bottom) scores with multiple immune scores, (F) Correlation between IL6+ inflammatory fibroblast (top) and myofibroblast (bottom) scores and several immune cell fractions.
도 2는 IL6+ 염증성 섬유아세포 및 근섬유아세포의 예후 효과에 관한 것으로, 유방암 코호트의 (A) IL6+ 염증성 섬유아세포(왼쪽) 및 근섬유아세포(오른쪽) 점수를 기준으로 점수가 높은 그룹과 낮은 점수 그룹 간의 생존 분석(Kaplan-Meier 곡선은 무진행 생존(PFS)(상부)과 전체 생존(OS)(하부)을 보여줌), (B) 유방암 TCGA 코호트 (왼쪽)와 다중 암 CPTAC (오른쪽)의 IL6+ 염증성 섬유아세포 점수가 높은 그룹과 낮은 그룹 사이의 생존 분석, (C) 면역항암치료 코호트에서 durable clinical benefit (DCB)와 no clinical benefits(NCB) 사이의 IL6+ 염증성 섬유아세포 (왼쪽), 근섬유아세포 (오른쪽) 점수 비교를 통해 자연 면역 반응 및 면역항암치료의 임상 결과 예측에 대한 IL6+ 염증성 섬유아세포 및 근섬유아세포 점수의 평가를 나타낸다.Figure 2. Prognostic effects of IL6+ inflammatory fibroblasts and myofibroblasts: (A) survival analysis between high and low score groups based on IL6+ inflammatory fibroblast (left) and myofibroblast (right) scores in breast cancer cohort (Kaplan-Meier curves showing progression-free survival (PFS) (top) and overall survival (OS) (bottom)); (B) survival analysis between high and low IL6+ inflammatory fibroblast score groups in breast cancer TCGA cohort (left) and multi-cancer CPTAC (right); (C) evaluation of IL6+ inflammatory fibroblast and myofibroblast scores in predicting innate immune response and clinical outcome of immunotherapy by comparing IL6+ inflammatory fibroblast (left) and myofibroblast (right) scores between durable clinical benefit (DCB) and no clinical benefits (NCB) in immunotherapy cohort.
도 3a는 다중오믹스 데이터를 이용하여 유방암 아형을 9개의 세부 하위 분류로 새롭게 비지도 계층적 군집화 (unsupervised hierarchical clustering)한 것으로서, 각 다중오믹스 하위 분류에 대한 연령 그룹, TP53 돌연변이 상태 및 PAM50 아형의 분포가 상단에 표시되어 있으며, MYC 발현, MYC 표적 활성도, IL6+ 염증성 섬유아세포 및 근섬유아세포의 각 하위 분류별 수준과 함께 샘플 정보를 보여준다. 하단에서는 유전자 변이, 종양 미세환경(tumor microenvironment) 구성 요소 및 면역 세포 비율(immune cell fraction)와 면역 특성 점수(immune signature)을 포함한 면역 점수를 z-score로 정규화한 마커들을 표시하였다. 한편, 도 3b는 도 3a의 우측에 기재된 분류명('a'로 표시됨)을 확대하여 나타낸 것이다.Fig. 3a shows a new unsupervised hierarchical clustering of breast cancer subtypes into nine detailed subcategories using multi-omics data. The distribution of age group, TP53 mutation status, and PAM50 subtype for each multi-omics subcategory is shown at the top, and sample information is shown along with the levels of each subcategory of MYC expression, MYC target activity, IL6+ inflammatory fibroblasts, and myofibroblasts. The bottom shows markers normalized to z-scores including genetic mutations, tumor microenvironment components, and immune scores including immune cell fraction and immune signature. Meanwhile, Fig. 3b is an enlarged view of the classification name (indicated by 'a') described on the right side of Fig. 3a.
도 4는 다중오믹스 군집화에 대한 분석을 진행한 것으로, (A) 새로운 아형에 대한 생존 분석을 TNBC(왼쪽), 루미날(중간), HER2(오른쪽) 하위 분류 내에서 무진행 생존(PFS)을 이용해 진행한 결과 및 (B) 각 다중오믹스 아형에 대한 면역 세포 비율, 섬유아세포, MYC 표적 활성도, TP53 돌연변이 상태와 같은 마커들의 흐름을 나타낸다.Figure 4 shows the analysis of multi-omics clustering, (A) the results of survival analysis for new subtypes using progression-free survival (PFS) within the TNBC (left), luminal (middle), and HER2 (right) subcategories, and (B) the flow of markers such as the proportion of immune cells, fibroblasts, MYC target activity, and TP53 mutation status for each multi-omics subtype.
이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 실시예들에는 다양한 변경이 가해질 수 있어서 특허출원의 권리 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 실시예들에 대한 모든 변경, 균등물 내지 대체물이 권리 범위에 포함되는 것으로 이해되어야 한다.Hereinafter, embodiments will be described in detail with reference to the attached drawings. However, since various modifications may be made to the embodiments, the scope of the patent application rights is not limited or restricted by these embodiments. It should be understood that all modifications, equivalents, or substitutes to the embodiments are included in the scope of the rights.
실시예에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안 된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the examples are for the purpose of description only and should not be construed as limiting. The singular expression includes the plural expression unless the context clearly indicates otherwise. In this specification, the terms "comprises" or "has" and the like are intended to specify the presence of a feature, number, step, operation, component or combination thereof described in the specification, but should be understood to not exclude in advance the possibility of the presence or addition of one or more other features, numbers, steps, operations, components or combinations thereof.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which the embodiment belongs. Terms defined in commonly used dictionaries, such as those defined in common usage dictionaries, should be interpreted as having a meaning consistent with the meaning they have in the context of the relevant art, and will not be interpreted in an idealized or overly formal sense unless expressly defined in this application.
본 명세서에서, 용어 '+' 또는 '양성'은 세포를 특징화 할 수 있는 마커가 발현되었음을 의미할 수 있다.In this specification, the term '+' or 'positive' may mean that a marker capable of characterizing a cell is expressed.
본 명세서에서, 용어 'MYC'는 여러 세포의 생장 촉진 신호경로들의 교차지점에 놓여있어서, 여러 리간드-막수용체 복합체들의 하류 유전자에 대해 즉각적으로 반응하여 세포의 생장과 증식을 조절하는 원발암유전자를 의미하는 것일 수 있다.In this specification, the term 'MYC' may mean a proto-oncogene that is located at the intersection of several cell growth-promoting signaling pathways and responds immediately to downstream genes of several ligand-membrane receptor complexes to regulate cell growth and proliferation.
실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. When describing an embodiment, if it is judged that a detailed description of a related known technology may unnecessarily obscure the gist of the embodiment, the detailed description is omitted.
본 발명의 유방암 예후 예측을 위한 정보제공 방법은 a) 암 환자로부터 생물학적 시료를 수득하는 단계; b) 상기 수득된 시료로부터 면역억제 섬유아세포, 근섬유아세포 또는 면역억제 섬유아세포 및 근섬유아세포의 세포 상태 점수를 측정하는 단계; 및 c) 상기 측정된 세포 상태 점수를 이용하여 유방암 예후를 예측하는 단계;를 포함한다.The method for providing information for predicting breast cancer prognosis of the present invention comprises the steps of: a) obtaining a biological sample from a cancer patient; b) measuring a cell status score of immunosuppressed fibroblasts, myofibroblasts, or immunosuppressed fibroblasts and myofibroblasts from the obtained sample; and c) predicting breast cancer prognosis using the measured cell status score.
본 발명에 있어서, 상기 유방암 예후 예측을 위한 정보제공 방법은 Non-negative matrix factorization(NMF) 분석을 통해 면역억제 섬유아세포, 근섬유아세포 또는 면역억제 섬유아세포 및 근섬유아세포의 다양한 중간엽 세포 상태를 식별하는 것일 수 있다.In the present invention, the method for providing information for predicting the prognosis of breast cancer may be to identify various mesenchymal cell states of immunosuppressed fibroblasts, myofibroblasts, or immunosuppressed fibroblasts and myofibroblasts through non-negative matrix factorization (NMF) analysis.
본 발명에 있어서, 상기 면역억제 섬유아세포를 특정하는 유전자는 GEM, CXCL8, CXCL3, CXCL2, CXCL1, IL6, TNFAIP6, MT1A, THAP2, AKR1C1, FOSL1, CEBPB, IER3, LIF, SOD2, C11orf96, CD44, GPRC5A, KDM6B, TNFRSF12A, DDX21, NFKBIA, MAFF, UAP1, SLC3A2, WTAP, PPP1R15A, RND3, MYC, ADAMTS4, HSPD1, PTGS2, CREM, PLIN2, CYCS, BAG3, REL, NAMPT, CYTOR, ZC3H12A, BTG3, XBP1, HSPH1, HSPA9, EIF4A3, EIF5 및 ERRFI1로 이루어진 군으로부터 선택되는 1종 이상인 것일 수 있으며, 보다 바람직하게는 상기 면역억제 섬유아세포를 특정하는 유전자는 AKR1C1, IL-6, FOSL1, CXCL1, CXCL3 및 CXCL8 로 이루어진 군으로부터 선택되는 1종 이상인 것일 수 있으나, 이에 제한되는 것은 아니다.In the present invention, the genes specifying the immunosuppressive fibroblasts are selected from the group consisting of GEM, CXCL8, CXCL3, CXCL2, CXCL1, IL6, TNFAIP6, MT1A, THAP2, AKR1C1, FOSL1, CEBPB, IER3, LIF, SOD2, C11orf96, CD44, GPRC5A, KDM6B, TNFRSF12A, DDX21, NFKBIA, MAFF, UAP1, SLC3A2, WTAP, PPP1R15A, RND3, MYC, ADAMTS4, HSPD1, PTGS2, CREM, PLIN2, CYCS, BAG3, REL, NAMPT, CYTOR, ZC3H12A, BTG3, XBP1, HSPH1, HSPA9, EIF4A3, EIF5 and ERRFI1. It may be at least one selected, and more preferably, the gene specifying the immunosuppressive fibroblasts may be at least one selected from the group consisting of AKR1C1, IL-6, FOSL1, CXCL1, CXCL3 and CXCL8, but is not limited thereto.
본 발명에 있어서, 상기 면역억제 섬유아세포는 IL6+ 염증성 섬유아세포인 것일 수 있으며, 상기 IL6+ 염증성 섬유아세포는 MYC 표적 활성 및 환자 연령 간에 각각 강한 양의 상관관계와 음의 상관관계를 나타내는 것일 수 있다. In the present invention, the immunosuppressive fibroblasts may be IL6+ inflammatory fibroblasts, and the IL6+ inflammatory fibroblasts may show a strong positive correlation and a negative correlation between MYC target activity and patient age, respectively.
또한, 본 발명에 있어서, 상기 IL6+ 염증성 섬유아세포 상태는 면역 세포와의 상관관계에서 대식세포, γδ T 세포, DC와 음의 상관관계를 가지는 것일 수 있고, 호중구와는 양의 상관관계를 나타내는 것일 수 있다.In addition, in the present invention, the IL6+ inflammatory fibroblast state may have a negative correlation with macrophages, γδ T cells, and DCs in correlation with immune cells, and may have a positive correlation with neutrophils.
본 발명에 있어서, 상기 유방암 예후, 예측을 위한 정보제공 방법은 유방암 시료로부터 각 세포 상태를 활성도를 측정한 후, 분석에 사용한 코호트에서 각 점수들의 중앙값을 기준으로 하여 높고 낮음을 구분함으로써 점수를 평가하는 것일 수 있다.In the present invention, the method for providing information for breast cancer prognosis and prediction may be to measure the activity of each cell state from a breast cancer sample, and then evaluate the score by distinguishing between high and low based on the median value of each score in the cohort used for analysis.
본 발명에 있어서, 상기 (c) 단계의 세포 상태 점수를 이용하여 유방암 예후를 예측하는 단계는, 상기 세포 상태 점수를 기준값, 즉 분석에 사용한 코호트에서 각 점수들의 중앙값과 비교하여 이루어지는 것일 수 있으며, 보다 구체적으로, 상기 측정된 면역억제 섬유아세포의 세포 상태 점수가 중앙값(median) 보다 높게 평가된 경우 나쁜 예후인 것으로 평가하는 것일 수 있으며, 상기 측정된 근섬유아세포의 세포 상태 점수가 중앙값(median) 보다 높게 평가된 경우 좋은 예후인 것으로 평가하는 것일 수 있다.In the present invention, the step of predicting the prognosis of breast cancer using the cell status score of step (c) may be performed by comparing the cell status score with a reference value, i.e., the median of each score in the cohort used for analysis, and more specifically, if the cell status score of the measured immunosuppressive fibroblasts is evaluated to be higher than the median, it may be evaluated as a poor prognosis, and if the cell status score of the measured myofibroblasts is evaluated to be higher than the median, it may be evaluated as a good prognosis.
본 발명에 있어서, 상기 유방암 예후 예측을 위한 정보제공 방법은 특정 세포 상태, 보다 구체적으로는 IL6+ 염증성 섬유아세포의 비율이 높은 경우 면역치료 저항성, 나쁜 예후로 평가하는 것일 수 있다.In the present invention, the method for providing information for predicting the prognosis of breast cancer may be to evaluate a specific cell state, more specifically, a case in which the proportion of IL6+ inflammatory fibroblasts is high, as immunotherapy resistance and a poor prognosis.
또한, 본 발명에 있어서, 상기 측정된 IL6+ 염증성 섬유아세포 수준과 근섬유아세포 수준을 이용하여 유방암의 예후, 예측을 평가할 수 있으며, 이때, 상기 측정된 면역억제 섬유아세포 활성도가 중앙값(median) 보다 높게 평가된 경우 나쁜 예후인 것으로 평가되는 것일 수 있고, 상기 측정된 근섬유아세포 활성도가 중앙값(median) 보다 높으면 예후가 좋은 경우로 평가되는 것일 수 있다.In addition, in the present invention, the prognosis and prediction of breast cancer can be evaluated using the measured IL6+ inflammatory fibroblast level and myofibroblast level. In this case, if the measured immunosuppressive fibroblast activity is evaluated as higher than the median, it can be evaluated as a poor prognosis, and if the measured myofibroblast activity is higher than the median, it can be evaluated as a good prognosis.
본 발명의 유방암의 예후 예측을 위한 정보제공 방법은 암 환자의 분리된 시료로부터 다중오믹스 데이터를 수득하는 단계;상기 다중오믹스 데이터를 기반으로, 각 시료를 유방암의 하위 분류로 분류하기 위해 계층적 군집화(hierarchical clustering) 분석을 수행하는 단계; 및 상기 분류된 하위 분류군에 기반하여 예후를 예측하는 단계;를 포함하는 것일 수 있다.The method for providing information for predicting the prognosis of breast cancer of the present invention may include the steps of obtaining multi-omics data from a separated sample of a cancer patient; performing a hierarchical clustering analysis to classify each sample into a subclass of breast cancer based on the multi-omics data; and predicting the prognosis based on the classified subclass.
본 발명에 있어서, 상기 다중오믹스 데이터를 수득하는 단계는 유방암 환자의 시료로부터 유전자, 전사체, 단백질, 대사체 등의 다중오믹스 데이터를 수집하는 것일 수 있으며, 상기 데이터는 유전적 변이,종양 미세환경 구성 요소, 면역 세포 비율, 면역 특성 점수, 섬유아세포 활성, TP53 돌연변이 상태 및 MYC 활성 점수를 포함하는 것일 수 있다.In the present invention, the step of obtaining the multi-omics data may be collecting multi-omics data such as genes, transcriptomes, proteins, and metabolites from a sample of a breast cancer patient, and the data may include genetic mutations, tumor microenvironment components, immune cell ratios, immune characteristic scores, fibroblast activity, TP53 mutation status, and MYC activity scores.
본 발명에 있어서, 상기 유방암의 예후 예측을 위한 정보제공 방법은 상기 수집된 다중오믹스 데이터를 통합한 후, 계층적 군집화(hierarchical clustering) 기법을 사용해 데이터를 분석하여 유방암 아형을 분류하는 것일 수 있으며, 이때, 유방암의 보다 세밀한 하위 분류가 가능한 것일 수 있으며, 세부 분류를 통해 맞춤형 치료 전략을 개발 가능하게 한다. 보다 구체적으로, 본 발명에 따른 다중오믹스 군집화 데이터를 이용하여 유방암 아형을 분류하는 경우 다른 하위 분류에 배정되어 종양 간 이질성을 확인하는 것일 수 있다.In the present invention, the method for providing information for predicting the prognosis of breast cancer may be to integrate the collected multi-omics data, and then analyze the data using a hierarchical clustering technique to classify breast cancer subtypes. At this time, more detailed subclassification of breast cancer may be possible, and the detailed classification may enable the development of a customized treatment strategy. More specifically, when classifying breast cancer subtypes using the multi-omics clustering data according to the present invention, it may be possible to confirm heterogeneity between tumors by assigning them to different subclassifications.
본 발명에 있어서, 상기 군집화를 통해 도출된 유방암의 하위 분류는 9가지로 분류되는 것일 수 있으며, 상기 9개의 하위 분류는 C1 내지 C9로 지칭되는 것일 수 있다.In the present invention, the subclassification of breast cancer derived through the clustering may be classified into nine types, and the nine subclassifications may be referred to as C1 to C9.
본 발명에 있어서, 상기 유방암의 예후, 예측을 위한 정보제공 방법은 다중오믹스 기반 군집화 결과와 기존의 PAM50 또는 IHC 아형 간의 일치도를 평가하고, 종양 간 이질성을 확인하고자, 각 분류의 연령 그룹, TP53 돌연변이 여부 및 기존 유방암 아형 분포를 비교하여 각 군집 간 유방암 아형의 이질성을 확인하는 단계를 더 포함하는 것일 수 있으며, 이때, PAM50 또는 IHC 아형이 동일한 샘플들이 대체로 같은 군집에 속했지만, 일부 경우에서는 동일한 아형이 다른 하위 분류에 배정됨으로써 종양 간의 이질성을 확인하는 것일 수 있다.In the present invention, the method for providing information for prognosis and prediction of breast cancer may further include a step of evaluating the consistency between the results of multi-omics-based clustering and existing PAM50 or IHC subtypes, and confirming heterogeneity between tumors by comparing the age group of each classification, the presence or absence of TP53 mutations, and the distribution of existing breast cancer subtypes, thereby confirming the heterogeneity of breast cancer subtypes between each cluster. At this time, although samples with the same PAM50 or IHC subtype generally belong to the same cluster, in some cases, the same subtype may be assigned to a different subclassification, thereby confirming heterogeneity between tumors.
본 발명에 있어서, 상기 유방암의 예후, 예측을 위한 정보제공 방법은 각 하위 분류의 고유한 분자적 특성을 확인하기 위하여, 유전적 변이, 종양 미세환경(TME) 및 면역 구성 요소를 분석하는 단계를 더 포함하는 것일 수 있으며, 상기 분석을 통해 유방암의 복잡한 이질성을 더 깊이 이해할 수 있는 것이다.In the present invention, the method for providing information for prognosis and prediction of breast cancer may further include a step of analyzing genetic mutations, tumor microenvironment (TME), and immune components to confirm unique molecular characteristics of each subclass, and through the analysis, the complex heterogeneity of breast cancer can be more deeply understood.
본 발명에 있어서, 상기 유방암의 예후, 예측을 위한 정보제공 방법은 연령에 따른 면역 세포 구성의 차이를 확인하여 연령과 유방암 아형 간의 관계를 이해하기 위해서, 연령과 상관관계가 있는 면역 세포 비율을 다중오믹스 하위 분류별로 비교하는 단계를 더 포함하는 것일 수 있다.In the present invention, the method for providing information for prognosis and prediction of breast cancer may further include a step of comparing the ratio of immune cells correlated with age by multi-omics sub-classification in order to understand the relationship between age and breast cancer subtype by confirming the difference in immune cell composition according to age.
이하 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다Hereinafter, preferred examples are presented to help understand the present invention. However, the following examples are provided only to help understand the present invention more easily, and the content of the present invention is not limited by the examples.
실시예 1: 유방암의 종양 생태계에서 MYC 활성과 면역 세포의 상관관계 분석Example 1: Correlation Analysis of MYC Activity and Immune Cells in the Tumor Ecosystem of Breast Cancer
MYC 활성과 관련된 유방암의 종양 생태계를 체계적으로 특성화하기 위해 106개의 종양 샘플과 28개의 정상 샘플로부터 획득된 450,877개 세포의 단일 세포 전사체를 분석하여 다양한 세포 상태를 정의하였다. 구체적으로, NMF(Non-negative matrix factorization) 분석을 적용하여 각 세포 유형에 대해 최대 50개의 마커 유전자를 특징으로 하는 여러 세포 상태로 유전자 발현을 분리하였다. 예를 들면, 상기 분석 방법은 IL6+ 염증성 섬유아세포, CCL19+ 섬유아세포 및 근섬유아세포를 포함한 다양한 중간엽 세포 상태를 식별하였다. 상기 마커들의 단백질 수준을 기반으로, 각각의 유방암 샘플에 대한 세포 상태 점수를 계산하였다. 한편, 상기 IL6+ 염증성 섬유아세포는 AKR1C1, IL-6, FOSL1 및 CXCL1/3/8을 포함한 마커 유전자 발현에 의해 확인될 수 있다.To systematically characterize the tumor ecology of breast cancer associated with MYC activity, single-cell transcriptomes of 450,877 cells obtained from 106 tumor samples and 28 normal samples were analyzed to define various cell states. Specifically, non-negative matrix factorization (NMF) analysis was applied to decompose gene expression into multiple cell states characterized by up to 50 marker genes for each cell type. For example, the analysis method identified various mesenchymal cell states including IL6+ inflammatory fibroblasts, CCL19+ fibroblasts, and myofibroblasts. Based on the protein levels of the above markers, a cell state score was calculated for each breast cancer sample. Meanwhile, the IL6+ inflammatory fibroblasts can be identified by the expression of marker genes including AKR1C1, IL-6, FOSL1, and CXCL1/3/8.
다음으로, 상기 세포 상태 점수와 MYC 표적 활성 또는 코호트 샘플 전체에서 진단된 연령과의 상관 관계를 계산하였다. MYC 표적 활성 및 환자 연령에 대해 일관되게, IL6+ 염증성 섬유아세포 상태와 근섬유아세포 상태는 각각 강한 양수 및 음의 상관관계를 나타냈다(도 1C 및 1D). 상기 IL6+ 염증성 섬유아세포는 AKR1C1, IL-6, FOSL1 및 CXCL1/3/8을 포함한 마커 유전자로 확인되었다. 알도/케토 환원효소 슈퍼패밀리의 구성원을 코딩하는 AKR1C1은 에스트로겐 및 프로게스테론과 같은 호르몬의 대사를 조절한다. 실제로, 이 섬유아세포 상태는 유방, 자궁, 나팔관, 난소 및 전립선을 포함한 생식 호르몬과 관련된 기관에서 과도하게 발현되었다. 자궁내막암에서 에스트로겐과 프로게스테론 수치는 AKR1C1과 AKR1C3에 의해 조절된다. MYC 단백질 합성은 5'-비번역 영역의 내부 리보솜 진입 부위와 관련된 전사 후 조절에 영향을 받는다. 특히, IL6+ 염증성 섬유아세포 상태에 대한 마커 유전자 중 하나인 IL-6은 이 메커니즘을 통해 MYC 번역을 향상시키는 것으로 보고되었다. 이러한 IL-6에 의한 MYC의 번역제어는 염증과 암을 연결하는 경로로 제안되었다. 따라서, IL6+ 염증성 섬유아세포에서 방출된 IL-6이 잠재적으로 젊은 유방암 환자의 호르몬 대사와 관련하여 MYC 신호 증가의 원인이 될 수 있음을 시사하였다.Next, we calculated the correlation between the above cell status score and MYC target activity or age at diagnosis across the cohort samples. Consistent with MYC target activity and patient age, the IL6+ inflammatory fibroblast status and the myofibroblast status showed strong positive and negative correlations, respectively ( Figures 1C and 1D ). The IL6+ inflammatory fibroblasts were identified by marker genes including AKR1C1, IL-6, FOSL1, and CXCL1/3/8. AKR1C1, which encodes a member of the aldo/keto reductase superfamily, regulates the metabolism of hormones such as estrogen and progesterone. Indeed, this fibroblast status was overexpressed in organs associated with reproductive hormones, including the breast, uterus, fallopian tubes, ovaries, and prostate. In endometrial cancer, estrogen and progesterone levels are regulated by AKR1C1 and AKR1C3. MYC protein synthesis is influenced by posttranscriptional regulation involving the internal ribosome entry site in the 5'-untranslated region. In particular, IL-6, one of the marker genes for the IL6+ inflammatory fibroblast state, has been reported to enhance MYC translation through this mechanism. This translational control of MYC by IL-6 has been proposed as a pathway linking inflammation and cancer. Therefore, it was suggested that IL-6 released from IL6+ inflammatory fibroblasts could potentially be the cause of increased MYC signaling in relation to hormone metabolism in young breast cancer patients.
MYC 표적이 강화된 YBC와는 달리 OBC는 근섬유아세포 상태가 더 강화되어 있는 것으로 나타난다. 근섬유아세포 상태와 MYC 표적 활동 및 환자 연령과의 음의 상관관계는 상기 발견과 일치한다. 특히, 단백체(proteome) 데이터 대신 전사체를 사용하여 계산된 세포 상태 점수는 IL6+ 염증성 섬유아세포 및 근섬유아세포와 MYC 표적 활성의 상관관계가 감소한 것으로 나타났다. 따라서 유방암의 분자 역학을 이해하는 데 있어 단백질 활성 측정의 중요성과 단백질 데이터를 활용하면 종양 생태계를 더욱 정확하게 특성화할 수 있음을 확인하였다.Unlike YBCs, which are enriched for MYC targeting, OBCs appear to be more enriched for myofibroblast status. The negative correlations between myofibroblast status and MYC target activity and patient age are consistent with the above findings. In particular, cell state scores calculated using transcriptomes instead of proteome data showed a decreased correlation between IL6+ inflammatory fibroblasts and myofibroblasts and MYC target activity. Thus, we confirm the importance of protein activity measurements in understanding the molecular epidemiology of breast cancer and that utilizing protein data can more accurately characterize the tumor ecosystem.
다음으로, 유방암 샘플 전체에서 확인된 두 가지 섬유아세포 상태와 면역 점수 및 면역 세포 분획의 상관관계를 조사하였다. 그 결과, 두 가지 면역 활동 매개변수 모두 IL6+ 염증성 섬유아세포 점수와 전반적으로 음의 상관관계를 보였지만 근섬유아세포 점수와는 양의 상관관계를 보였다(도 1E 및 1F). 보다 구체적으로, 다양한 유형의 T 세포가 대식세포, γδ T 세포 및 DC와 달리 IL6+ 염증성 섬유아세포 상태와 음의 상관관계를 나타냈다(도 1F). 대식세포는 혈관신생, 면역억제, 종양 침입 및 전이와 같은 과정을 통해 유방암의 종양발생을 촉진하는 것으로 알려져 있다. 종양 침윤(Tumor-infiltrating) γδ T 세포 및 DC는 유방암에서 불리한 생존 결과의 예측 인자로 확인되었다. 대식세포, γδ T 세포 및 DC는 근섬유아세포 상태와 반비례하는 세 가지 면역 세포 유형으로 확인되었다(도 1F). 호중구는 IL6+ 염증성 섬유아세포 상태와 양의 상관관계를 나타냈다(도 1F). IL6+ 염증성 섬유아세포 상태의 마커인 CXCL1/2/3은 호중구를 모집하는 것으로 알려져 있다. 이들 유전자는 세포독성 T 세포로부터 종양 세포를 지킴으로써 유방암의 나쁜 예후와 면역요법에 대한 저항성에 기여할 수 있다.Next, we investigated the correlation between the two fibroblast statuses identified across breast cancer samples and the immune score and immune cell fraction. As a result, both immune activity parameters showed an overall negative correlation with the IL6+ inflammatory fibroblast score, but a positive correlation with the myofibroblast score (Figures 1E and 1F). More specifically, various types of T cells showed a negative correlation with the IL6+ inflammatory fibroblast status, unlike macrophages, γδ T cells, and DCs (Figure 1F). Macrophages are known to promote tumorigenesis in breast cancer through processes such as angiogenesis, immunosuppression, tumor invasion, and metastasis. Tumor-infiltrating γδ T cells and DCs have been identified as predictors of adverse survival outcomes in breast cancer. Macrophages, γδ T cells, and DCs were identified as three immune cell types that were inversely correlated with the myofibroblast status (Figure 1F). Neutrophils showed a positive correlation with the IL6+ inflammatory fibroblast status (Figure 1F). CXCL1/2/3, markers of IL6+ inflammatory fibroblast state, are known to recruit neutrophils. These genes may contribute to poor prognosis and resistance to immunotherapy in breast cancer by protecting tumor cells from cytotoxic T cells.
한편, IL6+ 염증성 섬유아세포 및 근섬유아세포의 점수의 평가 기준은 분석에 사용한 코호트에서 각 점수들의 중앙값을 기준으로 높고 낮음을 구분하였다. 또한, IL6+ 염증성 섬유아세포 상태값이 중앙값보다 높으면 예후가 나쁜 경우로 평가하고, 근섬유아세포 상태값이 중앙값보다 높으면 예후가 좋은 경우로 평가하였다.Meanwhile, the evaluation criteria for the scores of IL6+ inflammatory fibroblasts and myofibroblasts were categorized as high and low based on the median value of each score in the cohort used for analysis. In addition, if the IL6+ inflammatory fibroblast status value was higher than the median value, it was evaluated as a case with a poor prognosis, and if the myofibroblast status value was higher than the median value, it was evaluated as a case with a good prognosis.
결론적으로, 상기 발견들은 IL6+ 염증성 섬유아세포가 대식세포, γδ T 세포, DC 및 호중구와 같은 전종양(pro-tumorigenic) 면역 세포를 유인하면서 T 세포 배제에 기여할 수 있음을 시사하였다. MYC 표적 유전자의 활성은 특히 T 세포 반발(T cell repulsion) 측면에서 면역 세포 분획과 유사한 상관 관계 패턴을 나타냈는데, 이는 상기 MYC-활성 종양에서 관찰된 T 세포 배제 시그니처와 일치하였다(도 1C). 즉, IL6+ 염증성 섬유아세포는 MYC 활성 유방암에서 염증 유발 면역억제 종양 미세환경을 생성하는 역할을 할 수 있음을 확인하였다.In conclusion, these findings suggest that IL6+ inflammatory fibroblasts may contribute to T cell exclusion by recruiting pro-tumorigenic immune cells, such as macrophages, γδ T cells, DCs, and neutrophils. The activity of MYC target genes showed a similar correlation pattern with immune cell fractions, especially in terms of T cell repulsion, which was consistent with the T cell exclusion signature observed in the MYC-activated tumors (Fig. 1C). Thus, we confirmed that IL6+ inflammatory fibroblasts may play a role in generating an inflammatory, immunosuppressive tumor microenvironment in MYC-activated breast cancer.
실시예 2: 연령 관련 분자 특징의 임상적 의미Example 2: Clinical significance of age-related molecular features
연령 관련 특징들의 예후 가능성은 코호트의 무진행 생존(PFS) 및 전체 생존(OS) 데이터 측면에서 평가하였다. 먼저, 각 특징들의 중앙값을 기준으로 모든 샘플을 높은 그룹과 낮은 그룹으로 나누었다. 두 가지 섬유아세포 상태에 있어서, IL6+ 염증성 섬유아세포는 더 나쁜 생존율과 관련이 있는 반면, 근섬유아세포는 더 나은 생존율과 상관관계가 있었다(도 2A). 이는 면역 미세 환경과의 관계로 부분적으로 설명될 수 있었다(도 1D 및 1E). 종합하면, 진단 연령과 연관되어 있는 것으로 확인된 마커는 생존 결과에 상당한 영향을 미치는 것으로 나타났다. 이는 유방암 TCGA 코호트와 다중 암 CPTAC 코호트에서도 IL6+ 염증성 섬유아세포 점수가 높은 그룹에서 전체 생존(OS)가 낮게 나타남을 확인했다(도 2B).The prognostic potential of age-related features was evaluated in terms of progression-free survival (PFS) and overall survival (OS) data of the cohort. First, all samples were divided into high and low groups based on the median value of each feature. In the two fibroblast states, IL6+ inflammatory fibroblasts were associated with worse survival, whereas myofibroblasts were correlated with better survival (Fig. 2A). This could be partly explained by the relationship with the immune microenvironment (Figs. 1D and 1E). Taken together, markers identified as being associated with age at diagnosis appeared to have a significant impact on survival outcomes. This was also confirmed in the breast cancer TCGA cohort and the multi-cancer CPTAC cohort, where the group with a high IL6+ inflammatory fibroblast score showed a worse overall survival (OS) (Fig. 2B).
두 가지 섬유아세포 상태의 면역학적 측면을 더 깊이 조사하기 위해 면역 관문 차단(immune checkpoint blockade, ICB) 치료를 받은 다양한 암 유형에 걸쳐 다른 집단의 전사체 데이터를 수집하였다. 샘플을 반응에 따라 지속성 임상적 이점(DCB) 또는 임상적 이점 없음(NCB)으로 분류한 후 ICB 반응에 관한 두 섬유아세포 상태의 예측력을 평가한 결과, IL6+ 염증성 섬유아세포 상태는 NCB 그룹에서 더 일반적인 반면 근섬유아세포 상태는 DCB 그룹에서 더 많이 나타났다(도 2C). 이러한 발견은 섬유아세포 상태가 면역 미세환경의 중요한 조절 인자로 작용하며, 자연 면역 반응과 ICB 치료에 대한 반응을 모두 설명할 수 있다는 것을 시사한다. 다양한 암에서 이 마커들의 예측력이 입증된 만큼, 이들은 면역치료 전략을 안내할 수 있는 바이오마커로 활용될 가능성이 높다.To further investigate the immunological aspects of the two fibroblast states, we collected transcriptome data from different cohorts across different cancer types treated with immune checkpoint blockade (ICB). After classifying samples according to response as either sustained clinical benefit (DCB) or no clinical benefit (NCB), we evaluated the predictive power of the two fibroblast states on ICB response. The IL6+ inflammatory fibroblast state was more prevalent in the NCB group, whereas the myofibroblast state was more prevalent in the DCB group (Fig. 2C). These findings suggest that the fibroblast state acts as an important modulator of the immune microenvironment, which may explain both the innate immune response and the response to ICB treatment. Given the proven predictive power of these markers in a variety of cancers, they have the potential to be utilized as biomarkers to guide immunotherapy strategies.
실시예 3: 다중오믹스 데이터를 이용한 유방암 아형 분류Example 3: Breast cancer subtype classification using multi-omics data
다중오믹스 데이터가 유방암 아형을 더욱 정밀하게 세부 분류할 수 있는지 조사하기 위해 모든 데이터 유형이 확보된 142명의 샘플에서 6,000개의 데이터를 이용하여 계층적 군집화(hierarchical clustering)를 진행한 결과 9개의 뚜렷한 하위 분류(C1 내지 C9)가 확인되었다 (도 3). 연령 그룹, TP53 돌연변이 및 PAM50 아형의 분포를 분석한 결과, PAM50 또는 IHC 아형이 동일한 샘플들이 대체로 같은 군집에 속했지만, 일부 경우에서는 다중오믹스 군집화에서 동일한 아형이 다른 하위 분류에 배정되면서 종양 간 이질성이 드러난 것을 확인하였다. 구체적으로, TNBC 샘플이 주로 C1, C2, C3에 집중되었으나, C1과 C2는 대부분 TP53 돌연변이를 보유한 YBC 샘플로 구성된 반면, C3는 TP53 야생형 OBC 샘플이 주를 이루었다. 또한, 루미날 A/B가 풍부한 하위 분류들은 주로 TP53 야생형(wild type) 샘플 비율이 높게 나타났다. 특히, OBC 샘플은 C4, C7, C8에 많이 포함된 반면, YBC 샘플은 C5와 C6에서 두드러지게 나타났다. C9는 TP53 돌연변이(mutant) 샘플로만 구성되었으며, PAM50 기준에 따라 대부분 HER2 아형으로 분류되었다. 이러한 결과는 유방암의 복잡한 분자적 다양성을 보여주며, 다중오믹스 기반 군집화가 유방암의 이질성을 더 깊이 이해할 수 있도록 한다는 점을 강조한다. 이 접근법은 유방암에 대한 세부 분류와 맞춤형 치료 전략 개발에 새로운 통찰을 제공할 수 있다. 다중오믹스 군집화를 통해 유방암의 심각도에 대한 예측력을 향상시키고, 보다 맞춤화된 치료 전략을 안내할 수 있을 것으로 기대된다. To investigate whether multi-omics data can further refine breast cancer subtypes, we performed hierarchical clustering using 6,000 data from 142 samples for which all data types were available, and identified nine distinct subtypes (C1 to C9) (Fig. 3). Analysis of the distribution of age groups, TP53 mutations, and PAM50 subtypes revealed that samples with the same PAM50 or IHC subtype generally belonged to the same cluster, but in some cases, the same subtype was assigned to different subtypes in the multi-omics clustering, revealing heterogeneity between tumors. Specifically, TNBC samples were mainly concentrated in C1, C2, and C3, but C1 and C2 were composed mostly of YBC samples with TP53 mutations, whereas C3 was mainly composed of TP53 wild-type OBC samples. In addition, the luminal A/B-enriched subclasses mainly showed a high proportion of TP53 wild type samples. In particular, OBC samples were abundant in C4, C7, and C8, whereas YBC samples were prominent in C5 and C6. C9 consisted only of TP53 mutant samples and was mostly classified as HER2 subtype according to PAM50 criteria. These results demonstrate the complex molecular diversity of breast cancer and emphasize that multi-omics-based clustering can provide a deeper understanding of the heterogeneity of breast cancer. This approach can provide new insights into the subclassification of breast cancer and the development of personalized treatment strategies. Multi-omics clustering is expected to improve the predictive power of breast cancer severity and guide more personalized treatment strategies.
또한, 각 하위 분류의 분자적 특성을 포괄적으로 이해하기 위해 유전적 변이, 종양 미세환경(TME) 구성 요소, 면역 세포 비율 (immune cell fraction) 및 면역 특성 점수(immune signature)을 포함한 다양한 마커를 분석하였다. 기능적 차이를 탐구하기 위해 마커들을 발현 패턴에 따라 군집화를 진행하여 다중오믹스 하위 분류별로 고유한 분자적 특성을 확인하였다. 구체적으로, TME 마커들은 근섬유아세포와 혈관 CAF(vCAF)가 하나의 독립적인 군집을 형성하였으며, C3, C4, C7에서 높은 수준으로 나타난 반면, C1, C5, C9에서는 낮은 수준을 보였다. 반대로, IL6+ 염증성 섬유아세포는 종양 유사 CAF(tCAF), 기질 CAF(mCAF), 분열 CAF(dCAF)와 함께 군집을 이루며 C1과 C9에서 주로 발현되었다. 이들은 TP53 돌연변이 YBC가 주를 이루는 그룹으로, C3와 C4에서는 발현이 낮았다.In addition, to comprehensively understand the molecular characteristics of each subclass, we analyzed various markers including genetic mutations, tumor microenvironment (TME) components, immune cell fraction, and immune signature. To explore functional differences, we clustered the markers according to their expression patterns to identify unique molecular characteristics for each multi-omics subclass. Specifically, TME markers formed an independent cluster with myofibroblasts and vascular CAF (vCAF), and were expressed at high levels in C3, C4, and C7, whereas they were expressed at low levels in C1, C5, and C9. In contrast, IL6+ inflammatory fibroblasts clustered with tumor-like CAF (tCAF), stromal CAF (mCAF), and dividing CAF (dCAF) and were mainly expressed in C1 and C9. These were a group mainly composed of TP53 mutant YBC, and their expression was low in C3 and C4.
연령에 따른 면역 세포 구성의 차이를 검증하기 위해 연령과 상관관계가 있는 면역 세포 비율(도 1F)을 다중오믹스 하위 분류별로 비교하였다. 군집화 분석 결과에서 YBC에서 풍부한 면역 세포(대식세포, 호중구, 단핵구)들은 하나의 군집으로 묶였고, OBC에서 풍부한 면역 세포들은 각각 CD4+ T 세포와 보조 T 세포로 구성된 두 개의 독립 군집을 형성하였다. 또한, TNBC가 풍부한 하위 분류(C1-C3)에서는 항종양 반응을 촉진하는데 중요한 역할을 하는 보조 T 세포의 비율이 낮은 것으로 나타났으며, 이는 TNBC 종양에서 면역 회피를 촉진할 가능성이 있음을 시사한다. To verify the differences in immune cell composition by age, we compared the proportion of immune cells correlated with age (Fig. 1F) by multi-omics subclassification. The clustering analysis results showed that immune cells (macrophages, neutrophils, monocytes) abundant in YBC were clustered into one cluster, while immune cells abundant in OBC formed two independent clusters consisting of CD4+ T cells and helper T cells, respectively. In addition, the TNBC-enriched subclassification (C1-C3) showed a low proportion of helper T cells, which play an important role in promoting anti-tumor responses, suggesting that they may promote immune evasion in TNBC tumors.
그럼에도 불구하고, 이들 TNBC가 풍부한 하위 분류 내에서도 상당한 이질성이 관찰되었다. 예를 들어, C3은 근섬유아세포와 vCAFs가 가장 높은 수준으로 나타나 비교적 안정적이고 덜 공격적인 성질을 시사하였으며, TNBC로 분류되었음에도 불구하고 그 특성이 다르게 나타났다. 또한, C2, C3, C7에서는 CD4+ T 세포가 풍부하게 관찰된 반면, YBC에서 높은 면역 세포들은 이들 하위 분류에서 적게 나타나 C2와 C3의 활발한 면역 활동이 C1보다 더 강력한 항종양 반응을 유도할 수 있음을 시사한다. 더불어, 면역 관련 세포 상태 마커와 인터페론 CAF(ifnCAF)가 C2, C3에서 높게 발현되는 것을 확인하였다. 이들 분류는 높은 면역 특성 점수를 보이며, 강력한 림프구 침윤과 같은 활발한 면역 반응을 시사하였다. 이러한 결과는 이들 하위 분류를 특징짓는 강력한 면역 활동을 뒷받침한다.Nonetheless, considerable heterogeneity was observed even within these TNBC-enriched subclasses. For example, C3 showed the highest levels of myofibroblasts and vCAFs, suggesting a relatively stable and less aggressive nature, and despite being classified as TNBC, its characteristics were different. In addition, CD4+ T cells were abundant in C2, C3, and C7, whereas immune cells that were high in YBC were less abundant in these subclasses, suggesting that the active immune activity of C2 and C3 may induce a stronger antitumor response than C1. In addition, immune-related cell status markers and interferon CAF (ifnCAF) were highly expressed in C2 and C3. These subclasses showed high immune signature scores, suggesting an active immune response such as strong lymphocytic infiltration. These results support the strong immune activity that characterizes these subclasses.
즉, 본 발명에 따른 다중오믹스 군집화 분석을 통해 종양 미세환경, 면역 환경에서 유방암의 복잡한 이질성을 확인하였다. 이들의 복잡한 상호작용이 유방암 아형을 특징짓고 있으며, 이러한 복잡성을 포착하기 위해 분자적 프로파일링의 중요성을 확인하였다. 이러한 연구 결과는 다중오믹스 접근법이 암 연구에서 필수적인 요소임을 나타내며, 이를 통해 종양의 동적 변화를 보다 정밀하게 이해할 수 있고, 보다 효과적인 맞춤형 치료 전략을 개발할 수 있음을 확인하였다.That is, through the multi-omics clustering analysis according to the present invention, the complex heterogeneity of breast cancer in the tumor microenvironment and immune environment was confirmed. Their complex interactions characterize breast cancer subtypes, and the importance of molecular profiling to capture this complexity was confirmed. These research results indicate that the multi-omics approach is an essential element in cancer research, and it was confirmed that it can more precisely understand the dynamic changes of tumors and develop more effective customized treatment strategies.
실시예 4: 다중오믹스 데이터를 이용한 임상적 예후 평가Example 4: Clinical prognosis assessment using multi-omics data
상기 실시예 4의 다중오믹스 하위 분류에 대한 임상적 의미를 확인하기 위해 각 하위 분류의 임상적 예후를 평가하였으며, 그 결과를 도 4A에 나타내었다. 평가 결과, 일반적으로 TNBC는 불량한 예후와 연관되지만, C3에 속한 TNBC 종양들은 비악성적인 분자적 특성을 반영하며 좋은 예후를 보였다(왼쪽). 루미날 A/B-풍부한 하위 분류(C4~C7)에서는 생존 결과에서 큰 차이가 관찰되었다. 특히, 가장 악성인 루미날 A/B 하위 분류인 C5는 가장 나쁜 생존율을 보였고, 가장 비악성인 C4는 가장 좋은 생존율을 나타냈다(중간). 또한, C9의 예후는 C8보다 나빴는데, 이는 C9에서 높은 MYC 점수와 낮은 근섬유아세포 점수 때문으로 해석된다(오른쪽). To confirm the clinical significance of the multi-omics subclassification of Example 4 above, the clinical prognosis of each subclassification was evaluated, and the results are shown in Fig. 4A. The evaluation results showed that TNBC is generally associated with a poor prognosis, but TNBC tumors belonging to C3 showed a good prognosis reflecting non-malignant molecular characteristics (left). A large difference in survival outcomes was observed in the luminal A/B-enriched subclassifications (C4–C7). In particular, C5, the most malignant luminal A/B subclass, showed the worst survival rate, and C4, the most non-malignant, showed the best survival rate (middle). In addition, the prognosis of C9 was worse than that of C8, which is interpreted as being due to the high MYC score and low myofibroblast score in C9 (right).
또한, 연령그룹과 PAM50 아형을 포함하여 하위 분류별 주요 마커의 분포를 통합적으로 시각화하여 각 유방암 하위 분류의 분자적 특성을 요약하였다(도 4B). 이 분석은 연령 관련 면역 세포 비율, 섬유아세포 상태, MYC 표적 활성, TP53 돌연변이 상태와 같은 주요 요소들이 포함되어 있어, 유방암 샘플 내의 복잡한 이질성을 효과적으로 포착하였다. 이 결과는 각 하위 분류를 정의하는 고유한 분자적 특성과 연령, 면역 세포 구성, 섬유아세포 활성, MYC와 같은 주요 발암 경로 간의 상호작용에 대한 중요한 통찰을 제공한다. 특히, 연령 그룹과 섬유아세포 상태 사이에 강한 상관관계가 관찰되었으며, 상기 상호작용이 종양의 공격성과 임상적 결과에 영향을 미칠 가능성 있음이 제시되는 바이다. 결론적으로, 본 발명에 따른 다중오믹스적 접근법은 유방암의 정밀한 하위 분류를 가능하게 하고, 질병 진행을 주도하는 분자적 이질성에 대한 이해를 가능하게 하며, 이는 보다 정확한 예후 평가와 맞춤형 치료 전략 개발을 위한 지침을 제공할 수 있는 것이다.In addition, the distribution of key markers by subtype, including age group and PAM50 subtype, was comprehensively visualized to summarize the molecular characteristics of each breast cancer subtype (Fig. 4B). This analysis effectively captured the complex heterogeneity within breast cancer samples, including key factors such as age-related immune cell proportion, fibroblast status, MYC target activity, and TP53 mutation status. These results provide important insights into the unique molecular characteristics defining each subtype and the interactions between age, immune cell composition, fibroblast activity, and key oncogenic pathways such as MYC. In particular, a strong correlation was observed between age group and fibroblast status, suggesting that the interactions may affect tumor aggressiveness and clinical outcome. In conclusion, the multi-omics approach according to the present invention enables precise subtype classification of breast cancer and provides an understanding of the molecular heterogeneity driving disease progression, which may provide guidance for more accurate prognostic assessment and development of personalized therapeutic strategies.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.Although the embodiments have been described with limited drawings as described above, those skilled in the art can apply various technical modifications and variations based on the above. For example, even if the described techniques are performed in a different order than the described method, and/or the described components are combined or combined in a different form than the described method, or are replaced or substituted by other components or equivalents, appropriate results can be achieved.
그러므로 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also included in the scope of the claims described below.
Claims (12)
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2023-0178905 | 2023-12-11 | ||
| KR20230178905 | 2023-12-11 | ||
| KR1020240179302A KR20250089438A (en) | 2023-12-11 | 2024-12-05 | Method for predicting prognosis of breast cancer using immunosuppressive fibroblast activity measurement data |
| KR10-2024-0179302 | 2024-12-05 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2025127679A1 true WO2025127679A1 (en) | 2025-06-19 |
Family
ID=96057794
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/KR2024/020184 Pending WO2025127679A1 (en) | 2023-12-11 | 2024-12-10 | Method for predicting prognosis of breast cancer by using immunosuppressive fibroblast activity measurement data |
Country Status (1)
| Country | Link |
|---|---|
| WO (1) | WO2025127679A1 (en) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20220094193A (en) * | 2019-11-07 | 2022-07-05 | 온세르나 테라퓨틱스, 인크. | Classification of the tumor microenvironment |
| US20220328129A1 (en) * | 2021-03-31 | 2022-10-13 | PrognomIQ, Inc. | Multi-omic assessment |
| US20220372580A1 (en) * | 2021-04-29 | 2022-11-24 | Bostongene Corporation | Machine learning techniques for estimating tumor cell expression in complex tumor tissue |
| KR20230088045A (en) * | 2021-12-10 | 2023-06-19 | 가톨릭대학교 산학협력단 | Biomarker for identifying subtypes of cancer-associated fibroblasts and use thereof |
| US11823799B2 (en) * | 2015-11-20 | 2023-11-21 | Universite De Strasbourg | Method for identifying personalized therapeutic strategies for patients affected with a cancer |
-
2024
- 2024-12-10 WO PCT/KR2024/020184 patent/WO2025127679A1/en active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11823799B2 (en) * | 2015-11-20 | 2023-11-21 | Universite De Strasbourg | Method for identifying personalized therapeutic strategies for patients affected with a cancer |
| KR20220094193A (en) * | 2019-11-07 | 2022-07-05 | 온세르나 테라퓨틱스, 인크. | Classification of the tumor microenvironment |
| US20220328129A1 (en) * | 2021-03-31 | 2022-10-13 | PrognomIQ, Inc. | Multi-omic assessment |
| US20220372580A1 (en) * | 2021-04-29 | 2022-11-24 | Bostongene Corporation | Machine learning techniques for estimating tumor cell expression in complex tumor tissue |
| KR20230088045A (en) * | 2021-12-10 | 2023-06-19 | 가톨릭대학교 산학협력단 | Biomarker for identifying subtypes of cancer-associated fibroblasts and use thereof |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Chen et al. | Ligand-receptor interaction atlas within and between tumor cells and T cells in lung adenocarcinoma | |
| Milioli et al. | Basal-like breast cancer: molecular profiles, clinical features and survival outcomes | |
| Isella et al. | Stromal contribution to the colorectal cancer transcriptome | |
| Zhao et al. | Breast cancer heterogeneity through the lens of single-cell analysis and spatial pathologies | |
| Jones et al. | Gene signatures of progression and metastasis in renal cell cancer | |
| Nambiar et al. | An “Omics” based survey of human colon cancer | |
| KR102170726B1 (en) | Method for selecting biomarker and method for providing information for diagnosis of cancer using thereof | |
| CN111564214B (en) | Establishment and verification method of a breast cancer prognosis assessment model based on 7 special genes | |
| CN113195733A (en) | Method for quantifying molecular activity in human tumor cancer cells | |
| Mumme et al. | Single-cell RNA sequencing distinctly characterizes the wide heterogeneity in pediatric mixed phenotype acute leukemia | |
| Wang et al. | Identification of IMPA2 as the hub gene associated with colorectal cancer and liver metastasis by integrated bioinformatics analysis | |
| CN113444794A (en) | Application of combined genome in preparation of renal clear cell carcinoma prognosis evaluation system | |
| Yang et al. | Genome wide-scale CRISPR-Cas9 knockout screens identify a fitness score for optimized risk stratification in colorectal cancer | |
| WO2025127679A1 (en) | Method for predicting prognosis of breast cancer by using immunosuppressive fibroblast activity measurement data | |
| Zhang et al. | Increased co-expression of MEST and BRCA1 is associated with worse prognosis and immune infiltration in ovarian cancer | |
| KR20250089438A (en) | Method for predicting prognosis of breast cancer using immunosuppressive fibroblast activity measurement data | |
| Liu et al. | The gene mutation spectrum of breast cancer analyzed by semiconductor sequencing platform | |
| Wang et al. | N6-methyladenosine methylation-related genes YTHDF2, METTL3, and ZC3H13 predict the prognosis of hepatocellular carcinoma patients | |
| Xu et al. | A comparative study of gastric adenocarcinoma HER2 IHC phenotype and mass spectrometry-based quantification | |
| Zhang et al. | Combined single cell and spatial transcriptome analysis reveals cellular heterogeneity of hedgehog pathway in gastric cancer | |
| WO2020112611A1 (en) | Cancer detection utilizing normal tissue adjacent to breast tumors with genetic ancestry-mapping | |
| US20070275380A1 (en) | Method for Distinguishing Aml Subtypes With Aberrant and Prognostically Intermediate Karyotypes | |
| Yu et al. | Knockdown TNF family prognosis index crucial gene PDE4B promoted PANoptosis of ovarian carcinoma cell: Based in vitro and in vivo experiments | |
| Mamoor | Differential expression of thyroid hormone receptor, alpha in human epithelial ovarian cancer. | |
| Mamoor | Differential expression of collagen type I alpha 1 chain in human epithelial ovarian cancer. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 24904244 Country of ref document: EP Kind code of ref document: A1 |