RU2846177C1 - Method and system for determining probability of presence of chromosomal abnormality in foetus - Google Patents
Method and system for determining probability of presence of chromosomal abnormality in foetusInfo
- Publication number
- RU2846177C1 RU2846177C1 RU2025111530A RU2025111530A RU2846177C1 RU 2846177 C1 RU2846177 C1 RU 2846177C1 RU 2025111530 A RU2025111530 A RU 2025111530A RU 2025111530 A RU2025111530 A RU 2025111530A RU 2846177 C1 RU2846177 C1 RU 2846177C1
- Authority
- RU
- Russia
- Prior art keywords
- data
- pixels
- color
- machine learning
- probability
- Prior art date
Links
Abstract
Description
Область техники, к которой относится изобретениеField of technology to which the invention relates
Группа изобретений относится к области биоинформатики, а именно к методам машинного обучения, обработки и анализа данных, направленных на раннее выявление аномалий у плода во время беременности.The group of inventions relates to the field of bioinformatics, namely to methods of machine learning, processing and analysis of data aimed at early detection of abnormalities in the fetus during pregnancy.
В современной медицине и биоинформатике, где потоки данных становятся все более обширными и сложными, использование методов машинного обучения для обработки и анализа данных приобретает особую важность. Одной из важных задач в области здравоохранения является раннее выявление аномалий у плода во время беременности, что позволяет своевременно принимать меры по предотвращению или минимизации возможных осложнений для здоровья ребенка и матери.In modern medicine and bioinformatics, where data flows are becoming increasingly extensive and complex, the use of machine learning methods for data processing and analysis is of particular importance. One of the important tasks in the field of healthcare is the early detection of fetal abnormalities during pregnancy, which allows timely measures to prevent or minimize possible complications for the health of the child and mother.
Для того, чтобы определить наличие хромосомных аномалий у плода, проводится неинвазивный пренатальный тест (НИПТ), результаты которого формируют данные, содержащие разнообразную информацию. Использование методов машинного обучения позволяет эффективно обрабатывать эти данные, выявляя скрытые закономерности и паттерны, которые могут дополнительно указывать на наличие аномалий у плода. Такой подход помогает создавать модели, способные предсказывать вероятность развития конкретных аномалий, что обеспечивает врачам и родителям дополнительную информацию для принятия решений.In order to determine the presence of chromosomal abnormalities in the fetus, a non-invasive prenatal test (NIPT) is performed, the results of which form data containing a variety of information. The use of machine learning methods allows us to effectively process this data, identifying hidden patterns that may further indicate the presence of abnormalities in the fetus. This approach helps to create models that can predict the likelihood of developing specific abnormalities, which provides doctors and parents with additional information for decision-making.
В процессе НИПТ Halos (программное обеспечение для автоматической биоинформатической обработки результатов, полученных с секвенатора) строит и оценивает хромосомный профильный график и выдает прогноз. Однако этот прогноз не всегда идеально точен. В связи с этим возникает необходимость в разработке инструментов, которые помогут улучшить точность скрининга и снизить вероятность ошибочных результатов.During the NIPT process, Halos (software for automated bioinformatics processing of results obtained from the sequencer) builds and evaluates a chromosomal profile graph and provides a prognosis. However, this prognosis is not always perfectly accurate. In this regard, there is a need to develop tools that will help improve the accuracy of screening and reduce the likelihood of erroneous results.
С развитием технологий машинного обучения и алгоритмов анализа данных возникают новые возможности для создания таких инструментов, способных эффективно обрабатывать и интерпретировать результаты НИПТ. Методы машинного обучения могут использоваться для создания моделей, которые учитывают разнообразные факторы, что может позволить более точно предсказывать наличие аномалий у плода.With the development of machine learning technologies and data analysis algorithms, new opportunities arise to create such tools that can effectively process and interpret NIPT results. Machine learning methods can be used to create models that take into account a variety of factors, which can allow for more accurate prediction of fetal abnormalities.
Разработка дополнительных инструментов на основе методов машинного обучения для анализа результатов НИПТ является актуальной задачей в современной медицинской науке. Улучшение точности диагностики позволит своевременно выявлять аномалии у плода и принимать соответствующие меры для защиты здоровья как матери, так и будущего ребенка.The development of additional tools based on machine learning methods for analyzing NIPT results is a pressing issue in modern medical science. Improving diagnostic accuracy will allow timely detection of fetal abnormalities and taking appropriate measures to protect the health of both the mother and the unborn child.
Уровень техникиState of the art
Известна технология проведения неинвазивного пренатального тестирования с использованием модели искусственного интеллекта (US 2022343178 A1, «Method and system for performing non-invasive genetic testing using an artificial intelligence (ai) model» PRESAGEN PTY LTD, 27.10.2022). Вычислительная система на основе искусственного интеллекта (ИИ) используется для неинвазивной оценки наличия ряда анеуплоидий и мозаицизма у эмбриона перед имплантацией посредством анализа изображений. Анеуплоидии и мозаицизм со схожими рисками неблагоприятных исходов группируются, а обучающие изображения помечаются своей группой. Отдельные модели ИИ обучаются для каждой группы с использованием одного и того же обучающего набора данных, а затем отдельные модели объединяются, например, с использованием подхода ансамбля или дистилляции для разработки модели, которая может идентифицировать широкий спектр рисков анеуплоидии и мозаицизма. Модель ИИ для группы генерируется путем обучения нескольких моделей, включая бинарные модели, иерархические многоуровневые модели и многоклассовую модель. В частности, иерархические многоуровневые модели генерируются путем назначения меток качества изображениям. На каждом уровне обучающий набор разделяется на изображения наилучшего качества и другие изображения. Модель на этом уровне обучается на изображениях наилучшего качества, а другие изображения передаются на следующий уровень, и процесс повторяется (таким образом, оставшиеся изображения разделяются на изображения следующего наилучшего качества и другие изображения). Окончательную модель затем можно использовать для неинвазивного выявления анеуплоидии и мозаицизма, а также связанного с ними риска неблагоприятных исходов с помощью изображения эмбриона до имплантации.A technology for performing non-invasive prenatal testing using an artificial intelligence model is known (US 2022343178 A1, “Method and system for performing non-invasive genetic testing using an artificial intelligence (AI) model” PRESAGEN PTY LTD, 27.10.2022). An artificial intelligence (AI)-based computing system is used to non-invasively assess the presence of a range of aneuploidies and mosaicism in an embryo before implantation through image analysis. Aneuploidies and mosaicisms with similar risks of adverse outcomes are grouped, and training images are labeled with their group. Separate AI models are trained for each group using the same training dataset, and then the individual models are combined, for example, using an ensemble or distillation approach, to develop a model that can identify a wide range of aneuploidy and mosaicism risks. The AI model for the group is generated by training multiple models, including binary models, hierarchical multi-level models, and a multi-class model. Specifically, hierarchical multi-level models are generated by assigning quality labels to images. At each level, the training set is split into the best quality images and other images. The model at that level is trained on the best quality images, and the other images are passed to the next level, and the process is repeated (so that the remaining images are split into the next best quality images and other images). The final model can then be used to non-invasively detect aneuploidy and mosaicism, and their associated risk of adverse outcomes, using pre-implantation embryo imaging.
Недостатком данной технологии, по сравнению с описанной ниже, является использование для каждой группы изображений (объединенных общими недостатками, патологиями) отдельной модели. Таким образом, используется несколько разных моделей обучения, что значительно увеличивает требуемые вычислительные мощности и время проведения анализа. При этом, как известно, у каждой модели своя точность вынесения вердикта, а объединение нескольких моделей в одну может привести к увеличению количества ложных вердиктов.The disadvantage of this technology, compared to the one described below, is the use of a separate model for each group of images (united by common deficiencies, pathologies). Thus, several different training models are used, which significantly increases the required computing power and analysis time. At the same time, as is known, each model has its own accuracy of verdict, and combining several models into one can lead to an increase in the number of false verdicts.
Из уровня техники известна система выявления вероятности наличия хромосомной аномалии у плода (US 12020492 B2, «Cell analysis method, cell analysis device, and cell analysis system», SYSMEX CORP, 25.06.2024). Настоящее изобретение предлагает способ анализа клеток, устройство для анализа клеток, систему анализа клеток и программу анализа клеток, которые облегчают анализ множества элементов анализа. Метод анализа клеток генерирует данные для анализа клеток, содержащихся в образце, выбирает алгоритм искусственного интеллекта из множества алгоритмов искусственного интеллекта, вводит сгенерированные данные для анализа в выбранный алгоритм искусственного интеллекта и генерирует с помощью выбранного алгоритма искусственного интеллекта данные, указывающие свойства клеток на основе сгенерированных данных для анализа.A system for detecting the probability of a chromosomal abnormality in a fetus is known from the prior art (US 12020492 B2, "Cell analysis method, cell analysis device, and cell analysis system", SYSMEX CORP, 06/25/2024). The present invention proposes a cell analysis method, a cell analysis device, a cell analysis system, and a cell analysis program that facilitate the analysis of a plurality of analysis elements. The cell analysis method generates data for analyzing cells contained in a sample, selects an artificial intelligence algorithm from a plurality of artificial intelligence algorithms, inputs the generated data for analysis into the selected artificial intelligence algorithm, and generates, using the selected artificial intelligence algorithm, data indicating the properties of cells based on the generated data for analysis.
В данном решении рассматривается в основном только анализ клеток, а в результате исследования на основе моделей искусственного интеллекта не выводится вердикт о наличии каких-либо хромосомных патологий и дефектов.This solution mainly considers only the analysis of cells, and the result of the study based on artificial intelligence models does not result in a verdict on the presence of any chromosomal pathologies and defects.
Из уровня техники известен способ выявления вероятности наличия хромосомной аномалии у плода (CN 110265087 А, «Chromosome abnormality detection model» UNIV MEDICAL HOSPITAL CHINA, 20.09.2019). Данный способ является наиболее близким аналогом разработанного способа и может быть выбран в качестве прототипа. Изобретение представляет собой систему обнаружения хромосомных аномалий. Система обнаружения хромосомных аномалий состоит из блока получения изображений и постоянного машиночитаемого носителя. Блок получения изображений используется для получения изображения метафазы деления целевой хромосомы клетки субъекта. Непереходный машиночитаемый носитель используется для хранения программы, и при выполнении процессором программа используется для определения наличия у субъекта хромосомных аномалий. Таким образом, система обнаружения хромосомных аномалий может эффективно повысить точность и чувствительность обнаружения хромосомных аномалий и сократить время оценки наличия или отсутствия у субъекта хромосомной аномалии.A method for detecting the probability of a chromosomal abnormality in a fetus is known from the prior art (CN 110265087 A, "Chromosome abnormality detection model" UNIV MEDICAL HOSPITAL CHINA, 09/20/2019). This method is the closest analogue of the developed method and can be selected as a prototype. The invention is a chromosomal abnormality detection system. The chromosomal abnormality detection system consists of an image acquisition unit and a non-transient machine-readable medium. The image acquisition unit is used to obtain an image of the division metaphase of the target chromosome of the subject's cell. The non-transient machine-readable medium is used to store the program, and when executed by the processor, the program is used to determine whether the subject has chromosomal abnormalities. Thus, the chromosomal abnormality detection system can effectively improve the accuracy and sensitivity of chromosomal abnormality detection and reduce the time for assessing the presence or absence of a chromosomal abnormality in a subject.
Однако в данном техническом решении не раскрывается предобработка получаемых изображений, полученных в результате тестирования, а как известно и будет отражено ниже, реальные изображения содержат большое количества информации, которая при последующей обработке данных может влиять на точность вынесения вердикта. Таким образом, для непосредственного обучения модели важным этапом является предварительная обработка, которая позволяет повысить точность, исключив данные, которые не вносят вклад в характеристику хромосомы.However, this technical solution does not disclose the pre-processing of the images obtained as a result of testing, and as is known and will be reflected below, real images contain a large amount of information, which during subsequent data processing can affect the accuracy of the verdict. Thus, for direct training of the model, an important stage is pre-processing, which allows increasing the accuracy by excluding data that do not contribute to the characteristics of the chromosome.
Предложенное решение лишено перечисленных недостатков, выявленных при анализе уровня техники. Оно нацелено на решение проблемы создания инструмента по более точной обработке результатов, полученных в виде профильных графиков хромосом для определения наличия хромосомных аномалий у плода на основании размеченных графических данных.The proposed solution is free from the listed shortcomings identified during the analysis of the state of the art. It is aimed at solving the problem of creating a tool for more accurate processing of results obtained in the form of profile graphs of chromosomes to determine the presence of chromosomal abnormalities in the fetus based on marked graphic data.
Раскрытие сущности Revealing the essence
Техническим результатом разработанного способа и системы является повышение точности выявления хромосомной аномалии у плода по результатам неинвазивного пренатального тестирования.The technical result of the developed method and system is an increase in the accuracy of detecting chromosomal abnormalities in the fetus based on the results of non-invasive prenatal testing.
Технический результат достигается за счет использования способа выявления вероятности наличия хромосомной аномалии у плода и системы выявления вероятности наличия хромосомной аномалии у плода, способной реализовать заявленный способ.The technical result is achieved by using a method for identifying the probability of the presence of a chromosomal abnormality in a fetus and a system for identifying the probability of the presence of a chromosomal abnormality in a fetus, capable of implementing the claimed method.
Один из вариантов способа выявления вероятности наличия хромосомной аномалии у плода, выполняемый вычислительным устройством, реализуется посредством выполнения следующих шагов, на которых:One of the variants of the method for detecting the probability of the presence of a chromosomal abnormality in the fetus, performed by a computing device, is implemented by performing the following steps, in which:
на предварительном этапе:at the preliminary stage:
• получают размеченные данные, причем данные представляют собой изображения хромосом плода,• receive labeled data, where the data are images of fetal chromosomes,
• выполняют обработку размеченных данных, причем для каждого изображения:• perform processing of the marked data, and for each image:
- выделяют области изображения, содержащие точки заданного цвета,- select areas of the image containing dots of a given color,
- находят координаты всех пикселей, из которых состоят точки заданного цвета,- find the coordinates of all pixels that make up the points of a given color,
- вычисляют медианное значение координаты X каждой точки заданного цвета,- calculate the median value of the X coordinate of each point of a given color,
- вычисляют расстояние от начала координат до каждого из пикселей, из которых состоят точки заданного цвета, - calculate the distance from the origin to each of the pixels that make up the points of a given color,
- вычисляют для каждой точки заданного цвета медианное значение расстояний от начала координат до каждого из пикселей, из которых состоит данная точка,- calculate for each point of a given color the median value of the distances from the origin to each of the pixels that make up the given point,
- сохраняют полученные данные в виде численного вектора, поставленного в соответствие данному изображению,- save the obtained data in the form of a numerical vector, assigned to the given image,
• обучают на обработанных данных по меньшей мере одну модель машинного обучения выносить вердикт о вероятности наличии хромосомной аномалии у плода;• train at least one machine learning model on the processed data to make a verdict on the probability of the presence of a chromosomal abnormality in the fetus;
на рабочем этапе:at the working stage:
• получают данные, причем данные представляют собой изображения хромосом плода,• receive data, where the data are images of fetal chromosomes,
• выполняют обработку данных,• perform data processing,
• подают обработанные данные на вход обученной модели машинного обучения,• feed the processed data into the trained machine learning model,
• получают вердикт обученной модели машинного обучения,• receive the verdict of the trained machine learning model,
• передают содержащиеся в вердикте обученной модели машинного обучения сведения о вероятности наличия хромосомной аномалии у плода уполномоченному медицинскому персоналу.• transmit the information contained in the verdict of the trained machine learning model about the probability of the presence of a chromosomal abnormality in the fetus to authorized medical personnel.
В другом варианте способа выявления вероятности наличия хромосомной аномалии у плода, выполняемый вычислительным устройством, реализуются шаги, на которых:In another version of the method for identifying the probability of the presence of a chromosomal abnormality in a fetus, performed by a computing device, the following steps are implemented:
на предварительном этапе:at the preliminary stage:
• получают размеченные данные, причем данные представляют собой изображения хромосом плода,• receive labeled data, where the data are images of fetal chromosomes,
• выполняют обработку размеченных данных, причем для каждого изображения:• perform processing of the marked data, and for each image:
- выполняют кадрирование, в результате которого на изображении остается только область графиков,- perform cropping, as a result of which only the area of the graphs remains on the image,
- заменяют все пиксели, относящиеся к черному или серому цветам, на пиксели белого цвета, - replace all pixels that are black or gray with white pixels,
- сохраняют для каждого оставшегося пикселя его координаты по осям X и Y, а также цвет в цветовом пространстве RGB,- save for each remaining pixel its coordinates along the X and Y axes, as well as the color in the RGB color space,
- кластеризуют все пиксели, относя каждый из них, на основании его цвета в цветовом пространстве RGB, к одному из четырех классов:- cluster all pixels, assigning each of them, based on its color in the RGB color space, to one of four classes:
• пиксели, цвет которых совпадает с заранее известным цветом линии T-score,• pixels whose color matches the pre-known color of the T-score line,
• пиксели, цвет которых совпадает с заранее известным цветом линии и Segment,• pixels whose color matches the previously known color of the line and Segment,
• пиксели, цвет которых совпадает с цветом, являющимся результатом смешивания цвета линии T-score и цвета линии Segment,• pixels whose color matches the color resulting from mixing the color of the T-score line and the color of the Segment line,
• все остальные пиксели,• all other pixels,
- вычисляют величину Tsmed как среднее отклонение от нуля координаты Y для всех точек, составляющих линию T-score,- calculate the value of Tsmed as the average deviation from zero of the Y coordinate for all points that make up the T-score line,
- вычисляют величину Tsso как стандартное отклонение координаты Y для всех точек, составляющих линию T-score,- calculate the value of Tsso as the standard deviation of the Y coordinate for all points that make up the T-score line,
- вычисляют в отношении точек, составляющих линию T-score, результат теста Дики-Фуллера на уровне значимости 5%,- the result of the Dickey-Fuller test is calculated at a significance level of 5% in relation to the points that make up the T-score line,
- вычисляют величину Sgmed как среднее отклонение от нуля координаты Y для всех точек, составляющих линию Segment,- calculate the value of Sgmed as the average deviation from zero of the Y coordinate for all points that make up the Segment line,
- вычисляют величину Sgso как стандартное отклонение координаты Y для всех точек, составляющих линию Segment,- calculate the value of Sgso as the standard deviation of the Y coordinate for all points that make up the Segment line,
- вычисляют модальное значение Sgmd, то есть значение координаты Y, которое чаще всего встречается у точек, составляющих линию Segment,- calculate the modal value Sgmd, that is, the value of the Y coordinate that is most often found at the points that make up the Segment line,
- вычисляют долю Sgd точек, составляющих линию Segment, у которых величина Y находится в пределах плюс-минус 5 пикселей от модального значения Sgmd,- calculate the proportion Sgd of points that make up the Segment line, for which the Y value is within plus or minus 5 pixels of the modal value Sgmd,
- сохраняют полученные данные в виде численного вектора, поставленного в соответствие данному изображению,- save the obtained data in the form of a numerical vector, assigned to the given image,
• обучают на обработанных данных по меньшей мере одну модель машинного обучения выносить вердикт о вероятности наличии хромосомной аномалии у плода;• train at least one machine learning model on the processed data to make a verdict on the probability of the presence of a chromosomal abnormality in the fetus;
на рабочем этапе:at the working stage:
• получают данные, причем данные представляют собой изображения хромосом плода,• receive data, where the data are images of fetal chromosomes,
• выполняют обработку данных,• perform data processing,
• подают обработанные данные на вход обученной модели машинного обучения,• feed the processed data into the trained machine learning model,
• получают вердикт обученной модели машинного обучения,• receive the verdict of the trained machine learning model,
• передают содержащиеся в вердикте обученной модели машинного обучения сведения о вероятности наличия хромосомной аномалии у плода уполномоченному медицинскому персоналу.• transmit the information contained in the verdict of the trained machine learning model about the probability of the presence of a chromosomal abnormality in the fetus to authorized medical personnel.
В частных случаях осуществления указанных выше вариантов способов осуществления выявления вероятности наличия хромосомной аномалии у плода, выполняемых вычислительным устройством:In particular cases of the implementation of the above-mentioned variants of methods for identifying the probability of the presence of a chromosomal abnormality in the fetus, performed by a computing device:
изображения хромосом плода генерируют посредством биоинформатического программного обеспечения;images of fetal chromosomes are generated using bioinformatics software;
размеченные данные содержат как результаты обследования плодов без хромосомных аномалий, так и результаты обследования плодов с хромосомными аномалиями;the marked data contain both the results of examination of fetuses without chromosomal abnormalities and the results of examination of fetuses with chromosomal abnormalities;
данные представляют собой изображения формата PNG, полученные в результате выполнения неинвазивного пренатального тестирования;The data are PNG images obtained as a result of non-invasive prenatal testing;
в ходе обработки данных дополнительноduring data processing additionally
• преобразуют изображение из цветового пространства RGB в цветовое пространство HSV,• convert an image from RGB color space to HSV color space,
• исключают из множества найденных пикселей те пиксели, которые находятся вне зоны, имеющей заранее заданные координаты по оси x и по оси y;• exclude from the set of found pixels those pixels that are outside the zone that has pre-set coordinates along the x-axis and y-axis;
по меньшей мере одна модель машинного обучения представляет собой по меньшей мере одну из следующих моделей:at least one machine learning model is at least one of the following models:
• деревья решений,• decision trees,
• деревья решений с использованием градиентного бустинга, CatBoost,• decision trees using gradient boosting, CatBoost,
• деревья решений с использованием градиентного бустинга, LightGBM,• decision trees using gradient boosting, LightGBM,
• линейная регрессия, • linear regression,
• логистическая регрессия,• logistic regression,
• метод К Ближайших соседей, KNeighbors Classifier,• K Nearest Neighbors Classifier,
• многослойный перцептрон, MLP Classifier,• Multilayer Perceptron, MLP Classifier,
• наивный Байесовский классификатор, Gaussian NB,• Naive Bayes classifier, Gaussian NB,
• опорные вектора, SVC,• support vector machines, SVC,
• решающие деревья с алгоритмом коррекции Ада, DTC with Ada,• decision trees with Ada correction algorithm, DTC with Ada,
• случайный лес, Random Forest Classifier;• random forest, Random Forest Classifier;
в качестве метрики качества обучения модели используют одну из следующих величин:As a metric for the quality of training, the model uses one of the following values:
• чувствительность,• sensitivity,
• True Positive Rate, • True Positive Rate,
• recall score,• recall score,
• общая точность;• overall accuracy;
обучение модели считают успешным, если общая точность превышает 85%;Model training is considered successful if the overall accuracy exceeds 85%;
содержащиеся в вердикте обученной модели машинного обучения сведения о вероятности наличия аномалии плода передают уполномоченному медицинскому персоналу одним из следующих способов:The information contained in the verdict of the trained machine learning model about the probability of the presence of a fetal anomaly is transmitted to authorized medical personnel in one of the following ways:
• посредством вывода сообщения в пользовательском интерфейсе системы, реализующей данный способ,• by displaying a message in the user interface of the system implementing this method,
• посредством отправки сообщения по электронной почте,• by sending an email message,
• посредством отправки SMS либо MMS,• by sending SMS or MMS,
• посредством отправки push-уведомления, • by sending a push notification,
• посредством API, реализующего обмен информацией между системой, реализующей данный способ, с другими информационными системами.• through an API that implements the exchange of information between the system implementing this method and other information systems.
Создана система выявления вероятности наличия хромосомной аномалии у плода, содержащая по меньшей мере:A system for identifying the probability of the presence of a chromosomal abnormality in a fetus has been created, containing at least:
• процессор,• processor,
• оперативную память,• RAM,
• шину данных,• data bus,
• средства ввода-вывода, • input/output means,
• интерфейсы ввода-вывода,• input/output interfaces,
• постоянное запоминающее устройство, • read-only memory,
• устройство, хранящее машиночитаемые инструкции, исполнение которых процессором приводит к реализации одного из описанных выше способов.• a device storing machine-readable instructions, the execution of which by the processor results in the implementation of one of the methods described above.
Краткое описание чертежейBrief description of the drawings
Сопровождающие чертежи, которые включены для обеспечения дополнительного понимания решения, показывают варианты осуществления изобретения и служат для объяснения принципов решения.The accompanying drawings, which are included to provide further understanding of the solution, show embodiments of the invention and serve to explain the principles of the solution.
Заявленное решение поясняется следующими чертежами, на которых:The stated solution is illustrated by the following drawings, which show:
Фиг. 1 иллюстрирует блок-схему алгоритма одного из вариантов реализации подготовительного этапа способа выявления вероятности наличия хромосомной аномалии у плода.Fig. 1 illustrates a block diagram of the algorithm of one of the variants of implementing the preparatory stage of the method for identifying the probability of the presence of a chromosomal abnormality in the fetus.
Фиг. 2А, 2Б иллюстрируют примеры изображения хромосом плода без аномалий и с аномалиями соответственно.Fig. 2A, 2B illustrate examples of images of fetal chromosomes without anomalies and with anomalies, respectively.
Фиг. 2В, 2Г иллюстрируют примеры обработанных изображений хромосом плода.Fig. 2B, 2G illustrate examples of processed images of fetal chromosomes.
Фиг. 3 иллюстрирует блок-схему алгоритма другого возможного варианта реализации подготовительного этапа способа выявления вероятности наличия хромосомной аномалии у плода.Fig. 3 illustrates a block diagram of the algorithm of another possible embodiment of the preparatory stage of the method for identifying the probability of the presence of a chromosomal abnormality in the fetus.
Фиг. 4 иллюстрирует алгоритма рабочего этапа описываемого способа.Fig. 4 illustrates the algorithm of the working stage of the described method.
Фиг. 5 иллюстрирует пример общей схемы вычислительного устройства, обеспечивающего обработку данных, необходимую для реализации заявленного решения.Fig. 5 illustrates an example of a general diagram of a computing device that provides the data processing necessary for implementing the claimed solution.
Осуществление изобретенияImplementation of the invention
Ниже будет приведено описание примерных вариантов осуществления заявленного решения.Below is a description of exemplary embodiments of the claimed solution.
Объекты и признаки настоящего решения, способы для достижения этих объектов и признаков станут очевидными посредством отсылки к примерным вариантам осуществления. Однако настоящее решение не ограничивается примерными вариантами осуществления, раскрытыми ниже, оно может воплощаться в различных видах. Сущность, приведенная в описании, является ничем иным, как конкретными деталями, обеспеченными для помощи специалисту в области техники в исчерпывающем понимании изобретения, и настоящее решение определяется только в объеме приложенной формулы.The objects and features of the present solution, the methods for achieving these objects and features will become obvious by reference to exemplary embodiments. However, the present solution is not limited to the exemplary embodiments disclosed below, it can be embodied in various forms. The essence given in the description is nothing more than specific details provided to help a person skilled in the art in a comprehensive understanding of the invention, and the present solution is defined only in the scope of the appended claims.
Работа способа выявления вероятности наличия хромосомной аномалии у плода начинается с предварительного этапа. В соответствии с описываемым способом, предварительный этап может выполняться в любом из двух равноценных, независимых вариантов. The method for identifying the probability of a chromosomal abnormality in a fetus begins with a preliminary stage. According to the method described, the preliminary stage can be performed in either of two equivalent, independent variants.
В одном из возможных вариантов выполняется предварительный этап 100, который будет описан ниже со ссылкой на чертеж Фиг. 1.In one possible embodiment, a preliminary step 100 is performed, which will be described below with reference to the drawing Fig. 1.
В другом из возможных вариантов выполняется предварительный этап 300, который будет описан ниже со ссылкой на чертёж Фиг. 3.In another possible embodiment, a preliminary step 300 is performed, which will be described below with reference to the drawing Fig. 3.
Как показано на Фиг. 1, предварительный этап 100 начинается с шага 110, на котором получают размеченные данные, причем эти данные представляют собой изображения хромосом плода. Примеры такого изображения приведены на Фиг. 2А, Фиг. 2Б.As shown in Fig. 1, the preliminary step 100 begins with step 110, in which labeled data is obtained, wherein these data are images of fetal chromosomes. Examples of such an image are shown in Fig. 2A, Fig. 2B.
Размеченные данные получают любым общеизвестным способом.The labeled data is obtained in any well-known way.
Например, система, реализующая способ, может быть выполнена с возможностью получения данных по вычислительной сети, такой как вычислительная сеть Интернет. Размеченные данные на шаге 110 могут поступать в систему, реализующую способ, посредством пересылки по электронной почте, автоматической загрузки с удаленного веб-сервера, выполняющего функции хранилища файлов, или любым другим способом, известным из уровня техники.For example, the system implementing the method may be designed to receive data over a computer network, such as the Internet. The labeled data in step 110 may be received by the system implementing the method by sending via e-mail, automatically downloading from a remote web server that functions as a file storage, or by any other method known from the prior art.
В качестве входных данных в описываемом способе могут использоваться изображения, полученные с секвенатора, например, такого, как секвенатор BGISEQ-500 или секвенатор DNBSEQ-G400, функционирующего совместно с программным обеспечением Halos. Данное оборудование и программное обеспечение названо в качестве неограничивающего примера осуществления, в заявленном способе возможно использовать данные, полученные от любого другого функционально аналогичного программно-аппаратного комплекса.The input data in the described method may be images obtained from a sequencer, such as a BGISEQ-500 sequencer or a DNBSEQ-G400 sequencer, operating in conjunction with the Halos software. This equipment and software are named as a non-limiting example of implementation; in the claimed method, it is possible to use data obtained from any other functionally similar software and hardware complex.
Сами изображения при этом могут быть любого известного компьютерного формата, например, формата PNG.The images themselves can be of any known computer format, for example, PNG.
Следует отметить, что данные, полученные на шаге 110, являются размеченными. Это означает, что полученный набор данных содержит как изображения хромосом плода, соответствующие нормам развития (то есть это такие изображения, на которых отсутствуют хромосомные аномалии), так и изображения хромосом плода, указывающие на какие-либо патологии развития (то есть это такие изображения, на которых есть хромосомные аномалии). It should be noted that the data obtained in step 110 is labeled. This means that the resulting data set contains both images of fetal chromosomes that correspond to developmental norms (i.e., these are images that do not contain chromosomal abnormalities) and images of fetal chromosomes that indicate any developmental pathologies (i.e., these are images that contain chromosomal abnormalities).
Полученные размеченные данные сохраняют любым общеизвестным способом, и шаг 110 завершается. The resulting labeled data is saved in any generally known manner, and step 110 is completed.
Способ переходит к шагу 120, на котором выполняют обработку полученных размеченных данных, для чего последовательно берут из набора размеченных данных одно изображение за другим. The method proceeds to step 120, where the obtained labeled data is processed by sequentially taking one image after another from the set of labeled data.
На каждом изображении, как это показано на Фиг. 1, на шаге 122 выделяют области, которые содержат точки наперёд заданного, например, синего, цвета (подобные точки и характер их расположения на исходных изображениях показаны на Фиг. 2А, Фиг. 2Б). Конкретный цвет, например, синий (RGB 0, 0, 255) выбирают заблаговременно, при проектировании системы, реализующей способ, в зависимости от цветов, которые использует для формирования изображений, служащих исходными данными описываемого способа, конкретная модель секвенсора и используемого им программного обеспечения. Там, где далее по тексту цветные точки на анализируемых изображениях называются синими, следует понимать, что это сделано лишь для простоты описания; это неограничивающий пример, а конкретный цвет может быть любым из числа присутствующих в цветовом пространстве RGB.On each image, as shown in Fig. 1, at step 122, areas are selected that contain dots of a predetermined color, for example, blue (similar dots and the nature of their arrangement on the original images are shown in Fig. 2A, Fig. 2B). A specific color, for example, blue (RGB 0, 0, 255) is selected in advance, when designing a system implementing the method, depending on the colors that a specific model of the sequencer and the software used by it uses to form images that serve as the original data of the described method. Where further in the text the colored dots on the analyzed images are called blue, it should be understood that this is done only for simplicity of description; this is a non-limiting example, and the specific color can be any of those present in the RGB color space.
Для выделения областей на шаге 122 любым общеизвестным способом, например, заблаговременно подготовленной маской, опирающейся на диапазон синего цвета в цветовом пространстве изображения, выделяют области, содержащие синие пиксели. Следует заметить, что в некоторых случаях на данном шаге может дополнительно потребоваться преобразование анализируемого изображения, например из цветового пространства RGB в цветовое пространство HSV. Такое преобразование при необходимости выполняют любым общеизвестным образом, например, посредством вызова заблаговременно подготовленным скриптом функции RGB-to-HUE системной утилиты DirectX.To select areas in step 122 by any generally known method, for example, by a previously prepared mask based on the range of blue color in the color space of the image, select areas containing blue pixels. It should be noted that in some cases, this step may additionally require converting the analyzed image, for example, from the RGB color space to the HSV color space. Such conversion is performed, if necessary, by any generally known method, for example, by calling the RGB-to-HUE function of the DirectX system utility with a previously prepared script.
Выделенные области изображения, содержащие точки синего цвета, сохраняют, и на этом шаг 122 завершается.The selected areas of the image containing the blue dots are saved, and this completes step 122.
Способ переходит к шагу 124, на котором находят координаты всех пикселей, из которых состоят найденные на предыдущем шаге точки синего цвета.The method proceeds to step 124, where the coordinates of all pixels that make up the blue dots found in the previous step are found.
На шаге 124 находят координаты пикселей, найденных на предыдущем шаге по маске синего цвета. Таким образом, на данном шаге имеют дело с пикселями, заведомо имеющими нужный цвет, и задача заключается лишь в определении их координат. At step 124, the coordinates of the pixels found at the previous step using the blue mask are found. Thus, at this step, we are dealing with pixels that are obviously of the desired color, and the task is only to determine their coordinates.
Это может быть выполнено любым общеизвестным способом, например, посредством заблаговременно подготовленного скрипта, последовательно перебирающего все имеющиеся пиксели изображения и записывающего координаты тех, которые имеют синий цвет.This can be done in any well-known way, for example, by means of a pre-prepared script that sequentially goes through all the available pixels of the image and records the coordinates of those that are blue.
Возможна такая реализация описываемого способа, при которой на данном шаге дополнительно любым общеизвестным образом фильтруют отобранные пиксели по координатам, чтобы исключить пиксели синего цвета, находящиеся вне графика. Подобная фильтрация включает установку пороговых значений для значений X и по оси Y, а также удаление пикселей, координаты которых находятся внутри установленных порогов. Фильтрация координатных данных может осуществляется любым общеизвестным из уровня техники способом. It is possible to implement the described method in such a way that at this step the selected pixels are additionally filtered by coordinates in any generally known way in order to exclude blue pixels located outside the graph. Such filtering includes setting threshold values for the X values and along the Y axis, as well as removing pixels whose coordinates are within the set thresholds. Filtering of coordinate data can be carried out in any generally known way from the state of the art.
После сохранения всех полученных координат пикселей синего цвета шаг 124 завершается. After storing all the obtained blue pixel coordinates, step 124 is completed.
Далее способ переходит к шагу 125, на котором осуществляют вычисление медианного значения координаты X для каждой точки синего цвета. Для этого любым общеизвестным образом упорядочивают значения координат Х по возрастанию и выбирают значение, которое больше примерно половины значений и меньше также примерно половины значений. Вычисленные медианные значения координат Х для всех найденных точек синего цвета сохраняют, после чего шаг 125 завершается.The method then moves to step 125, where the median value of the X coordinate is calculated for each blue point. To do this, the X coordinate values are ordered in ascending order in any generally known manner, and a value is selected that is greater than approximately half of the values and also less than approximately half of the values. The calculated median values of the X coordinates for all blue points found are saved, after which step 125 is completed.
На графике 200, показанном на Фиг. 2В, приведено графическое отображение результата выполнения шагов 122-125, имеющее на чертеже вид набора точек 201.The graph 200 shown in Fig. 2B shows a graphical representation of the result of performing steps 122-125, which has the form of a set of points 201 in the drawing.
После шага 125 способ переходит к шагу 126, на котором вычисляют расстояния от начала координат (0,0) до каждого из пикселей, из которых состоят точки синего цвета. Для наглядности шаг 126 поясняется чертежом Фиг. 2Г, где показан график 210. Набор отрезков прямой 211, каждый из которых соединяет начало координат (0;0) и текущие (x;y) координаты очередного пикселя, проведен по кратчайшему пути, то есть каждый отрезок из набора отрезков 211 является графическим отображением расстояния от начала координат до определенного пикселя.After step 125, the method proceeds to step 126, where the distances from the origin (0,0) to each of the pixels that make up the blue dots are calculated. For clarity, step 126 is illustrated by the drawing Fig. 2G, which shows a graph 210. A set of straight line segments 211, each of which connects the origin (0;0) and the current (x;y) coordinates of the next pixel, is drawn along the shortest path, i.e., each segment from the set of segments 211 is a graphical representation of the distance from the origin to a specific pixel.
Вычисление расстояний Di производят любым общеизвестным способом по известной формуле The calculation of distances D i is carried out in any well-known way according to the well-known formula
Di = , D i = ,
где Xi, Yi – координаты очередного пикселя.where X i , Y i are the coordinates of the next pixel.
Вычисленные расстояния сохраняют, и на этом шаг 126 завершается.The calculated distances are saved, and this completes step 126.
Затем способ переходит к шагу 127, на котором для каждой точки заданного, например, синего цвета вычисляют медианное значение расстояний от начала координат до каждого из пикселей, из которых состоит данная точка. Для этого любым общеизвестным образом для каждой точки упорядочивают вычисленные на предыдущем шаге расстояния Di по возрастанию и выбирают значение, которое больше примерно половины значений и меньше также примерно половины значений.The method then moves to step 127, where for each point of a given, for example, blue color, the median value of the distances from the origin to each of the pixels that make up the given point is calculated. To do this, in any generally known way, the distances D i calculated in the previous step are ordered in ascending order for each point, and a value is selected that is greater than approximately half of the values and also less than approximately half of the values.
После шага 127 осуществляют шаг 128, на котором сохраняют полученные данные в виде численного вектора, причем полученный вектор ставят в соответствие обработанному изображению. Таким образом формируют обучающую выборку, где вычисленные медианные расстояния используют в качестве признаков для классификации наличия или отсутствия аномалий в хромосомах плода.After step 127, step 128 is performed, where the obtained data is saved as a numerical vector, and the obtained vector is put in correspondence with the processed image. In this way, a training sample is formed, where the calculated median distances are used as features for classifying the presence or absence of anomalies in the chromosomes of the fetus.
Далее предварительный этап 100 переходит к шагу 129, на котором определяют, было ли обработанное изображение последним из набора полученных данных. В ответ на то, что обработанное изображение не было последним, то есть обработка набора полученных данных еще не завершена, возвращаются к шагу 120, на котором выбирают очередное изображение для обработки. В ответ на то, что обработанное изображение было последним, переходят к шагу 130.Next, the preliminary step 100 proceeds to step 129, where it is determined whether the processed image was the last one from the set of received data. In response to the fact that the processed image was not the last one, i.e., the processing of the set of received data is not yet complete, they return to step 120, where the next image is selected for processing. In response to the fact that the processed image was the last one, they proceed to step 130.
На шаге 130 обучают на обработанных данных по меньшей мере одну модель машинного обучения выносить вердикт о вероятности наличия хромосомной аномалии у плода.In step 130, at least one machine learning model is trained on the processed data to make a verdict on the probability of the presence of a chromosomal abnormality in the fetus.
Тренировку модели машинного обучения на шаге 130 проводят на обучающей выборке, полученной в ходе описанной выше предварительной обработки изображений. При этом используют критерий максимизации точности классификации, а также кросс-валидационные проверки. При этом обучение считают успешным, если точность предсказаний на тестовой выборке превышает заблаговременно заданное значение. В одном неограничивающем примере пороговое значение точности предсказаний может быть выбрано равным 92%. В другом неограничивающем примере эта величина может быть выбрана равной 85%.The machine learning model is trained in step 130 on the training sample obtained during the above-described image preprocessing. The criterion for maximizing classification accuracy is used, as well as cross-validation checks. The training is considered successful if the accuracy of predictions on the test sample exceeds a predetermined value. In one non-limiting example, the threshold value for prediction accuracy may be chosen to be 92%. In another non-limiting example, this value may be chosen to be 85%.
Собственно обучение модели выполняют любым общеизвестным образом.The actual training of the model is carried out in any generally known way.
В различных возможных вариантах реализации описываемого решения в качестве обучаемой модели могут быть использованы: деревья решений, деревья решений с использованием градиентного бустинга, CatBoost, деревья решений с использованием градиентного бустинга, LightGBM, линейная регрессия, логистическая регрессия, метод К Ближайших соседей, KNeighbors Classifier, многослойный перцептрон, MLP Classifier, наивный Байесовский классификатор, Gaussian NB, опорные вектора, SVC, решающие деревья с алгоритмом коррекции Ада, DTC with Ada, случайный лес, Random Forest Classifier.In various possible implementation options of the described solution, the following can be used as a training model: decision trees, decision trees using gradient boosting, CatBoost, decision trees using gradient boosting, LightGBM, linear regression, logistic regression, K Nearest Neighbors Classifier, KNeighbors Classifier, multilayer perceptron, MLP Classifier, naive Bayes classifier, Gaussian NB, support vectors, SVC, decision trees with Ada correction algorithm, DTC with Ada, random forest, Random Forest Classifier.
После обучения модели машинного обучения выносить вердикт о вероятности наличия хромосомной аномалии у плода обученную модель сохраняют. На этом шаг 130 и предварительный этап 100 завершаются.Once the machine learning model has been trained to make a verdict on the probability of a fetus having a chromosomal abnormality, the trained model is saved. This completes step 130 and pre-step 100.
Ниже со ссылкой на Фиг. 3 будет описан предварительный этап 300, представляющий собой альтернативный вариант предварительной обработки изображений, полученных в наборе предварительно размеченных данных. Below, with reference to Fig. 3, a preliminary step 300 will be described, which represents an alternative embodiment of pre-processing images obtained in a set of pre-labeled data.
Предварительный этап 300 также выполняется с целью получить обучающую выборку и обучить модель машинного обучения. Отличие предварительного этапа 300 от описанного выше предварительного этапа 100 заключается в том, что в данном случае в качестве признаков используют не координаты точек заданного цвета, а особенности поведения кривых T-score и Segment на изображениях, получаемых в качестве исходных данных способа.The preliminary stage 300 is also performed in order to obtain a training sample and train the machine learning model. The difference between the preliminary stage 300 and the preliminary stage 100 described above is that in this case, the features used are not the coordinates of the points of a given color, but the behavioral features of the T-score and Segment curves on the images obtained as the initial data of the method.
Кривые T-score (стандартное отклонение) и Segment строятся на исходных изображениях секвенсорами. Сам по себе алгоритм построения этих кривых представляет собой коммерческую тайну производителей секвенсоров, но в рамках описываемого способа данное обстоятельство несущественно, поскольку подлежащие извлечению и дальнейшему анализу признаки содержатся не в способах построения, а в форме и расположении уже построенных кривых на изображении.The T-score (standard deviation) and Segment curves are constructed on the original images by sequencers. The algorithm for constructing these curves is a commercial secret of the sequencer manufacturers, but within the framework of the described method this circumstance is insignificant, since the features to be extracted and further analyzed are contained not in the construction methods, but in the form and location of the already constructed curves on the image.
Как показано на Фиг. 3, предварительный этап 300 начинается с шага 310, на котором получают размеченные данные, причём данные представляют собой изображения хромосом плода. Этот шаг не имеет особенностей и выполняется полностью аналогично описанному выше шагу 110.As shown in Fig. 3, the preliminary step 300 begins with step 310, in which labeled data is obtained, wherein the data are images of the chromosomes of the fetus. This step has no special features and is performed completely analogously to the step 110 described above.
После завершения шага 310 этап 300 переходит к шагу 320, на котором выполняют обработку полученных размеченных данных, для чего последовательно берут из набора размеченных данных одно изображение за другим. After completing step 310, step 300 proceeds to step 320, in which the obtained labeled data is processed by sequentially taking one image after another from the set of labeled data.
На каждом изображении, как это показано на Фиг. 3, на шаге 321 выполняют кадрирование, в результате которого на изображении остаётся только область графиков. Каждое изображение содержит область построения графика с легендой (внутренняя область в прямоугольной рамке) и подписи осей. Ключевая информация на каждом изображении ограничивается областью построения графика, поэтому каждое изображение обрезают, оставляя только область графика. На шаге 321 выполняют кадрирование, в результате которого на изображении остается только область графиков. Этот процесс выполняется любым общеизвестным способом, например, вызовом заблаговременно подготовленного скрипта на языке Python. Собственно кадрирование, то есть обрезание изображения по заданным координатам может быть реализовано, например, вызовом соответствующей функции открытой библиотеки OpenCV с аргументами, представляющими собой координаты X и Y противоположных углов прямоугольного фрагмента изображения, который должен остаться в результате описанной операции.On each image, as shown in Fig. 3, at step 321 cropping is performed, as a result of which only the graph area remains on the image. Each image contains a graph plotting area with a legend (the inner area in a rectangular frame) and axis labels. The key information on each image is limited to the graph plotting area, so each image is cropped, leaving only the graph area. At step 321 cropping is performed, as a result of which only the graph area remains on the image. This process is performed in any well-known way, for example, by calling a pre-prepared Python script. The cropping itself, i.e. cropping the image by specified coordinates, can be implemented, for example, by calling the corresponding function of the open OpenCV library with arguments representing the X and Y coordinates of the opposite corners of the rectangular fragment of the image that should remain as a result of the described operation.
Кадрированные изображения сохраняют и предварительный этап 300 переходит к шагу 322. На шаге 322 заменяют все пиксели, относящиеся к черному или серому цветам, на пиксели белого цвета. Таким образом, в результате выполнения шага 322 область легенды каждого графика и линии сетки (пиксели от темно-серого до черного оттенков) окажутся закрашены белым цветом. После описанной обработки каждое изображение будет содержать исключительно информацию о линиях T-score и Segment.The cropped images are saved and the preliminary step 300 proceeds to step 322. In step 322, all pixels that are black or gray are replaced with white pixels. Thus, as a result of step 322, the legend area of each graph and the grid lines (pixels from dark gray to black shades) will be filled with white. After the described processing, each image will contain only information about the T-score and Segment lines.
Замену выполняют любым общеизвестным образом, например, посредством предварительно подготовленного скрипта, который поочерёдно перебирает пиксели изображения и у всех пикселей, относящихся к тёмно-серому или чёрному цветам, то есть имеющим значения RGB-компонент в интервале от (0, 0, 0) до, например, (30, 30, 30) изменяет эти значения на соответствующие белому цвету, то есть (255, 255, 255). Конкретный оттенок тёмно-серого цвета, в приведённом примере соответствующий RGB (30, 30, 30), может быть выбран заблаговременно в зависимости от параметров исходных изображений и быть каким-либо другим, например, (50, 50, 50) или каким-либо ещё.The replacement is performed in any well-known way, for example, by means of a previously prepared script that alternately goes through the pixels of the image and changes these values for all pixels related to dark gray or black colors, i.e. having RGB component values in the range from (0, 0, 0) to, for example, (30, 30, 30) to those corresponding to white color, i.e. (255, 255, 255). A specific shade of dark gray color, in the given example corresponding to RGB (30, 30, 30), can be selected in advance depending on the parameters of the original images and be some other, for example, (50, 50, 50) or some other.
Измененные изображения сохраняют и предварительный этап 300 переходит к шагу 323. На шаге 323 сохраняют для каждого не белого пикселя его координаты по осям X и Y, а также его цвет в цветовом пространстве RGB. Это может быть выполнено любым общеизвестным способом, например, посредством заблаговременно подготовленного скрипта, последовательно перебирающего все имеющиеся пиксели изображения и записывающего координаты и значения цветовых компонент R, G, B для каждого пикселя, у которого эти значения отличаются от RGB-компонент белого цвета (255, 255, 255).The modified images are saved and the preliminary step 300 proceeds to step 323. In step 323, the coordinates of each non-white pixel along the X and Y axes, as well as its color in the RGB color space, are saved. This can be done in any well-known way, for example, by means of a script prepared in advance, successively going through all available pixels of the image and recording the coordinates and values of the color components R, G, B for each pixel for which these values differ from the RGB components of white color (255, 255, 255).
Затем предварительный этап 300 переходит к шагу 324, на котором кластеризуют пиксели изображения в соответствии с их цветом. Следует отметить, что все цвета на графиках T-score и Segment после выполнения всех описанных выше шагов обработки могут относиться к одному из четырех классов:The preliminary step 300 then proceeds to step 324, where the image pixels are clustered according to their color. It should be noted that all colors in the T-score and Segment graphs after all the processing steps described above have been performed can belong to one of four classes:
1. Цвета пикселей, относящиеся исключительно к линии T-score.1. Pixel colors that are related exclusively to the T-score line.
2. Цвета пикселей, относящиеся исключительно к линии Segment.2. Pixel colors that are specific to the Segment line.
3. Цвета пикселей, относящиеся к пересечению линий T-score и Segment. 3. Pixel colors related to the intersection of the T-score and Segment lines.
4. Цвета пикселей, которые не относятся ни к одной из линий T-score и Segment. 4. Pixel colors that do not belong to any of the T-score and Segment lines.
Кластеризацию выполняют посредством заранее обученной модели машинного обучения. Для этого заблаговременно, до начала работы способа, создают обучающую выборку, состоящую из изображений, аналогичных тем, что используются в качестве входных в описываемом способе, и осуществляют ручную разметку обучающей выборки.Clustering is performed using a pre-trained machine learning model. To do this, a training sample consisting of images similar to those used as input in the described method is created in advance, before the method starts working, and the training sample is manually marked.
Ручная разметка обучающей выборки заключается в оценке оператором всех пикселей, относящихся к каким-либо кривым, оценке их RGB-значений и ручного, выполняемого оператором, назначению каждому такому пикселю одного из вышеназванных четырёх классов. Таким образом оказывается сформирован массив данных, который содержит цвета пикселей в системе RGB и класс каждого пикселя. Этот массив размеченных данных используют для обучения модели распознаванию типа (класса) пикселя по его цвету в координатах RGB.В качестве обучаемой модели может быть использована любая из перечисленных ниже:Manual labeling of the training sample consists of the operator evaluating all pixels related to any curves, evaluating their RGB values, and manually assigning one of the above-mentioned four classes to each such pixel. In this way, a data array is formed that contains the colors of the pixels in the RGB system and the class of each pixel. This array of labeled data is used to train the model to recognize the type (class) of a pixel by its color in RGB coordinates. Any of the following can be used as a training model:
• Логистическая регрессия, в любой известной реализации,• Logistic regression, in any known implementation,
• Деревья решения, в любой известной реализации,• Decision trees, in any known implementation,
• Случайный лес, в любой известной реализации,• Random forest, in any known implementation,
• LightGBM (деревья решений с использованием градиентного бустинга), в любой известной реализации,• LightGBM (decision trees using gradient boosting), in any known implementation,
• CatBoost (деревья решений с использованием градиентного бустинга), в любой известной реализации. • CatBoost (decision trees using gradient boosting), in any known implementation.
В качестве метрики качества модели используют общую точность (долю верно определенных классов). При обучении используют подход кросс-валидации. Кросс-валидация — это метод оценки производительности модели машинного обучения, используемый для проверки её способности обобщать данные на новых, ранее не встречавшихся случаях. Суть метода заключается в разделении имеющегося набора данных на две или более части. Одна часть используется для обучения модели, а другая — для проверки её качества. Этот процесс повторяется несколько раз с использованием разных разбиений данных, чтобы получить более надёжную оценку производительности модели. В одной из возможных реализаций описываемого способа для кросс-валидации исходный массив разделяли на 5 равных частей. The overall accuracy (the proportion of correctly identified classes) is used as a metric for the quality of the model. The cross-validation approach is used for training. Cross-validation is a method for assessing the performance of a machine learning model, used to test its ability to generalize data to new, previously unseen cases. The essence of the method is to divide the existing data set into two or more parts. One part is used to train the model, and the other is used to test its quality. This process is repeated several times using different data partitions to obtain a more reliable assessment of the model's performance. In one possible implementation of the described method, the original array was divided into 5 equal parts for cross-validation.
На шаге 324 анализируемое изображение передают модели, заблаговременно обученной указанным способом. Модель интерпретирует цветовые координаты (RGB-компоненты) пикселей, и относит каждый из них к одному из вышеописанных классов, осуществляя таким образом классификацию. Следует отметить, что ряд возможных ошибок классификации не будет значительно влиять на конечный результат оцифровки графика (в частности, это касается ошибок, когда пиксель, находящийся на пересечении линий T-score и Segment, будет отнесен исключительно к одной из этих линий). Технически это означает, что на данном шаге координаты пикселей, относящихся к каждому из классов, по результатам шага 340 сохраняют обособленно, например, в выделенном для этого разделе базы данных. Таким образом, по завершении данного шага будет получают и сохраняют координаты пикселей, каждый из которых относится к одному из вышеперечисленных классов.At step 324, the analyzed image is transferred to a model previously trained in the specified manner. The model interprets the color coordinates (RGB components) of the pixels and assigns each of them to one of the above-described classes, thus performing classification. It should be noted that a number of possible classification errors will not significantly affect the final result of the graph digitization (in particular, this concerns errors when a pixel located at the intersection of the T-score and Segment lines is assigned exclusively to one of these lines). Technically, this means that at this step, the coordinates of the pixels belonging to each of the classes, based on the results of step 340, are saved separately, for example, in a section of the database dedicated to this. Thus, upon completion of this step, the coordinates of the pixels, each of which belongs to one of the above-mentioned classes, will be obtained and saved.
Иными словами, в результате выполнения шага 324 получают списки пикселей, составляющих линии T-score и Segment, а также координаты Х и Y каждого из них. In other words, step 324 results in lists of pixels that make up the T-score and Segment lines, as well as the X and Y coordinates of each of them.
Затем предварительный этап 300 переходит к шагу 325. На шаге 325 вычисляют следующие величины: среднее отклонение от нуля координаты Y точек, составляющих линию T-score, стандартное отклонение координаты Y точек, составляющих линию T-score, результат теста Дики-Фуллера на уровне значимости 5% в отношении координат Y точек, составляющих линию T-Score, среднее отклонение от нуля координаты Y для всех точек, составляющих линию Segment, стандартное отклонение координаты Y для всех точек, составляющих линию Segment, значение координаты Y, которое чаще всего встречается у точек, составляющих линию Segment, а также долю точек, составляющих линию Segment, у которых величина Y находится в пределах плюс-минус 5 пикселей от модального значения.Then, the preliminary step 300 proceeds to step 325. In step 325, the following quantities are calculated: the average deviation from zero of the Y coordinate of the points that make up the T-score line, the standard deviation of the Y coordinate of the points that make up the T-score line, the result of the Dickey-Fuller test at a significance level of 5% with respect to the Y coordinates of the points that make up the T-Score line, the average deviation from zero of the Y coordinate for all the points that make up the Segment line, the standard deviation of the Y coordinate for all the points that make up the Segment line, the value of the Y coordinate that occurs most frequently among the points that make up the Segment line, and the proportion of the points that make up the Segment line whose Y value is within plus or minus 5 pixels of the modal value.
Следует заметить, что приведённый ниже перечень способов вычисления названных величин не следует рассматривать как указание на порядок, в котором проводят вычисления. Порядок вычисления может быть произвольным, в том числе, ряд величин может вычисляться параллельно.It should be noted that the list of methods for calculating the named quantities given below should not be considered as an indication of the order in which the calculations are performed. The order of calculation can be arbitrary, including a number of quantities can be calculated in parallel.
Вычисления производят следующим образом:The calculations are performed as follows:
Величину Tsmed, то есть среднее отклонение от нуля координаты Y для всех точек, составляющих линию T-score, параметр, учитывающий отклонение T-score от нуля, вычисляют по формуле The value of Tsmed, that is, the average deviation from zero of the Y coordinate for all points that make up the T-score line, a parameter that takes into account the deviation of the T-score from zero, is calculated using the formula
где координата Y для i-ой точки, относящейся к линии T-scoreWhere Y coordinate for the i-th point related to the T-score line
точек, относящихся к линии T-score, на анализируемой картинке. points related to the T-score line in the analyzed image.
Величину Tsso, то есть стандартное отклонение координаты Y для всех точек, составляющих линию T-score, параметр, учитывающий степень разброса значений T-score, вычисляют по формуле: The value of Tsso, that is, the standard deviation of the Y coordinate for all points that make up the T-score line, a parameter that takes into account the degree of scatter of T-score values, is calculated using the formula:
Результатом теста Дики-Фуллера в отношении точек, составляющих линию T-score, является бинарная величина: 1 если – ряд является стационарным, и 0 – если ряд не является стационарным. Вообще говоря, в эконометрике стационарность — это свойство временного ряда, которое означает, что его средние и стандартные отклонения не меняются со временем. В описываемом случае данные не представляют собой временной ряд. Однако стационарность в данном контексте может интерпретироваться как постоянство среднего значения и стандартного отклонения T-score относительно хромосом. The result of the Dickey-Fuller test for the points that make up the T-score line is a binary value: 1 if the series is stationary, and 0 if the series is not stationary. Generally speaking, in econometrics, stationarity is a property of a time series that means that its mean and standard deviation do not change over time. In this case, the data are not a time series. However, stationarity in this context can be interpreted as the constancy of the mean and standard deviation of the T-score relative to the chromosomes.
Получение результата теста Дики-Фуллера для ряда данных Y-координат точек, относящихся к линии T-score, состоит из следующих подшагов:Obtaining the Dickey-Fuller test result for a series of Y-coordinate data points related to the T-score line consists of the following substeps:
1. На основании ряда данных Y-координат точек, относящихся к линии T-score, с помощью метода наименьших квадратов оценивают параметр в регрессии вида:1. Based on a series of data on the Y-coordinates of points related to the T-score line, the parameter is estimated using the least squares method. in a regression of the form:
случайная ошибка. random error.
2. Используя значение , получают ряд прогнозных значений:2. Using the meaning , we obtain a number of predicted values:
и оценивают ряд квадратов ошибок модели:and estimate a series of squared errors of the model:
. .
3. Используя полученные величины, рассчитывают тестовую статистику :3. Using the obtained values, calculate the test statistics. :
где общее количество точек в кривой T-score,Where total number of points in the T-score curve,
– координата Y конкретной точки на предобработанном графике, – the Y coordinate of a specific point on the pre-processed graph,
e – ошибка модели. e – model error.
4. Полученное значение сравнивают с критическим значением из специальных таблиц Дики и Фуллера. Если больше табличного значения на уровне значимости 5%, то ряд является стационарным, т.е. значение признака равно 1. В противном случае ряд не является стационарным и значение признака принимают равным 0.4. The resulting value are compared with the critical value from the special tables of Dickey and Fuller. If greater than the table value at a significance level of 5%, then the series is stationary, i.e. the value of the feature is equal to 1. Otherwise, the series is not stationary and the value of the feature is taken to be equal to 0.
Величину Sgmed, среднее отклонение от нуля координаты Y для всех точек, составляющих линию Segment, вычисляют по формулеThe value of Sgmed, the average deviation from zero of the Y coordinate for all points that make up the Segment line, is calculated using the formula
координата Y для i-ой точки, относящейся к линии Segment, Y coordinate for the i-th point related to the line Segment,
точек, относящихся к линии Segment, на анализируемой картинке points related to the Segment line on the analyzed image
Величину Sgso, стандартное отклонение координаты Y для всех точек, составляющих линию Segment, вычисляют по формуле: The value of Sgso, the standard deviation of the Y coordinate for all points that make up the Segment line, is calculated using the formula:
Модальное значение Sgmd, то есть значение координаты Y, которое чаще всего встречается у точек, составляющих линию Segment, вычисляют любым общеизвестным способом, подсчитывая количество точек линии Segment, имеющих одинаковую координату Y и выбирая значение координаты, которому соответствует наибольшее количество точек. Поскольку линия Segment параллельна оси X с возможными дельта-разрывами, модальное значение позволяет понять, насколько наиболее протяженный непрерывный участок линии Segment отклоняется от нуля. The modal value of Sgmd, that is, the Y coordinate value that occurs most often in the points that make up the Segment line, is calculated in any well-known way by counting the number of points of the Segment line that have the same Y coordinate and selecting the coordinate value that corresponds to the largest number of points. Since the Segment line is parallel to the X axis with possible delta breaks, the modal value allows us to understand how much the longest continuous section of the Segment line deviates from zero.
Долю Sgd точек, составляющих линию Segment, у которых величина Y находится в пределах плюс-минус 5 пикселей от вычисленного ранее модального значения Sgmd, вычисляют любым общеизвестным способом, подсчитывая количество точек Nm, удовлетворяющих названному условию, а затем рассчитывая отношение этого количества к общему количеству точек N:The proportion Sgd of points making up the line Segment, for which the value of Y is within plus or minus 5 pixels of the previously calculated modal value Sgmd, is calculated by any well-known method, by counting the number of points Nm satisfying the said condition, and then calculating the ratio of this number to the total number of points N:
Sgd = Nm/N.Sgd = Nm/N.
Этот показатель призван учитывать наличие дельта-разрывов ряда Segment. Чем больше доля значений в окрестности модального значения, тем меньше количество разрывов и/или тем более короткие участки с этими разрывами. Диапазон +/-5 пикселей необходим, поскольку прямая линия Segment, как правило, имеет ширину 4–5 пикселей, т.е. 4–5 рядов. This metric is designed to account for delta breaks in the Segment series. The larger the proportion of values in the vicinity of the modal value, the smaller the number of breaks and/or the shorter the sections with these breaks. The +/- 5 pixel range is necessary because a straight Segment line is typically 4–5 pixels wide, i.e. 4–5 rows.
На этом шаг 325 завершается и способ предварительный этап 300 переходит к шагу 326, на котором сохраняют полученные данные в виде численного вектора, поставленного в соответствие данному изображению.At this point, step 325 is completed and the preliminary stage 300 method proceeds to step 326, where the obtained data is stored in the form of a numerical vector associated with the given image.
Далее предварительный этап 300 переходит к шагу 327, на котором определяют, было ли обработанное изображение последним из набора полученных данных. В ответ на то, что обработанное изображение не было последним, то есть обработка набора полученных данных еще не завершена, возвращаются к шагу 320, на котором выбирают очередное изображение для обработки. В ответ на то, что обработанное изображение было последним, переходят к шагу 330.Next, the preliminary step 300 proceeds to step 327, where it is determined whether the processed image was the last one from the set of received data. In response to the fact that the processed image was not the last one, i.e., the processing of the set of received data is not yet complete, it is returned to step 320, where the next image is selected for processing. In response to the fact that the processed image was the last one, it is proceeded to step 330.
На шаге 330 обучают на обработанных данных по меньшей мере одну модель машинного обучения выносить вердикт о вероятности наличия хромосомной аномалии у плода. Это выполняют полностью аналогично описанному выше применительно к шагу 130.In step 330, at least one machine learning model is trained on the processed data to make a verdict on the probability of the presence of a chromosomal abnormality in the fetus. This is done in a completely analogous manner to that described above in relation to step 130.
Вне зависимости от того, реализован ли в описываемом способе предварительный этап 100 или предварительный этап 300, после обучения по меньшей мере одной модели машинного обучения предварительный этап завершается.Regardless of whether the described method implements the preliminary stage 100 or the preliminary stage 300, after training at least one machine learning model, the preliminary stage is completed.
Ниже со ссылкой на чертеж Фиг. 4 будет описан рабочий этап 400 способа выявления вероятности наличия хромосомной аномалии у плода.Below, with reference to the drawing Fig. 4, the working step 400 of the method for detecting the probability of the presence of a chromosomal abnormality in a fetus will be described.
Как показано на Фиг. 4, рабочий этап 400 начинается с шага 410, на котором получают данные, причем эти данные представляют собой изображения хромосом плода. Пример подобных данных иллюстрирует Фиг. 2Б. Это выполняют совершенно аналогично описанным выше шагам 110 и 310. As shown in Fig. 4, the working step 400 begins with step 410, in which data is obtained, wherein these data are images of fetal chromosomes. An example of such data is illustrated in Fig. 2B. This is performed in a completely analogous manner to the steps 110 and 310 described above.
Следующим шагом 420 является предварительная обработка данных. The next step 420 is data preprocessing.
В зависимости от того, был ли реализован предварительный этап 100 или предварительный этап 300, на шаге 420 выполняют предварительную обработку данных либо в соответствии с описанным выше алгоритмом предварительного этапа 100, либо в соответствии с описанным выше алгоритмом предварительного этапа 300. Depending on whether the preliminary step 100 or the preliminary step 300 was implemented, in step 420 the data is pre-processed either in accordance with the algorithm of the preliminary step 100 described above or in accordance with the algorithm of the preliminary step 300 described above.
В любом из возможных вариантов реализации способа в результате шага 420 получают и сохраняют численные вектора, каждый из которых соответствует одному из полученных на шаге 410 изображений хромосом плода.In any of the possible embodiments of the method, as a result of step 420, numerical vectors are obtained and stored, each of which corresponds to one of the images of the fetal chromosomes obtained in step 410.
На этом шаг 420 завершается и способ переходит к шагу 430, на котором подают на вход обученной на предварительном этапе модели машинного обучения численные вектора, полученные на шаге 420. At this point, step 420 is completed and the method proceeds to step 430, where the numerical vectors obtained in step 420 are fed to the input of the machine learning model trained in the preliminary stage.
В результате шага 440 получают вердикт обученной модели машинного обучения о вероятном наличии или отсутствии аномалий развития плода, на основе исследованных изображений хромосом плода. Вердикт может представлять собой, например, число, принимающее значения от 0 до 1, причём чем ближе это значение к 1, тем выше вероятность наличия хромосомной аномалии у плода, изображения хромосом которого получили на шаге 410.Step 440 results in a verdict from the trained machine learning model on the probable presence or absence of fetal developmental abnormalities based on the examined images of fetal chromosomes. The verdict may be, for example, a number between 0 and 1, with the closer this value to 1, the higher the probability of the presence of a chromosomal abnormality in the fetus whose chromosome images were obtained in step 410.
Полученный вердикт сохраняют любым общеизвестным образом.The resulting verdict is saved in any generally known manner.
На этом шаг 440 завершается и способ 400 переходит к шагу 450, на котором полученный вердикт обученной модели машинного обучения о вероятности наличия хромосомной аномалии у плода передают уполномоченному медицинскому персоналу. Передача вердикта может выполняться любым общеизвестным способом. Например, вердик может быть передан посредством вывода сообщения в пользовательском интерфейсе системы, реализующей данный способ, посредством отправки сообщения по электронной почте, посредством отправки SMS либо MMS, посредством отправки push-уведомления, либо посредством API, реализующего обмен информацией между системой, реализующей данный способ, и другими информационными системами.At this point, step 440 is completed and the method 400 proceeds to step 450, where the obtained verdict of the trained machine learning model on the probability of the presence of a chromosomal abnormality in the fetus is transmitted to the authorized medical personnel. The transmission of the verdict can be performed by any generally known method. For example, the verdict can be transmitted by displaying a message in the user interface of the system implementing this method, by sending a message by e-mail, by sending an SMS or MMS, by sending a push notification, or by means of an API implementing the exchange of information between the system implementing this method and other information systems.
На этом шаг 450 и способ 400 завершаются.This completes step 450 and method 400.
Таким образом способ выявление вероятности наличия хромосомной аномалии у плода включает два этапа: предварительный и рабочий, причём предварительный этап может выполняться в любом из альтернативных вариантов 100 и 300, описанных выше со ссылками на Фиг. 1, Фиг. 3. Вне зависимости от того, какой из альтернативных вариантов 100 и 300 выбран, на предварительном этапе происходит непосредственное обучение модели машинного обучения на численных векторах, которые получены из предварительно размеченной выборки изображений хромосом плода, из которых изображений различными способами выделяют и обрабатывают те данные, которые позволят обученной модели оценить наличие или отсутствие аномалий у плода. На рабочем этапе 400 используют эту обученную модель машинного обучения для непосредственного выявления и предоставления сведений, содержащих информацию о вероятности наличия аномалий плода.Thus, the method for identifying the probability of the presence of a chromosomal abnormality in a fetus includes two stages: preliminary and operational, wherein the preliminary stage can be performed in any of the alternative variants 100 and 300 described above with reference to Fig. 1, Fig. 3. Regardless of which of the alternative variants 100 and 300 is selected, at the preliminary stage, the machine learning model is directly trained on numerical vectors obtained from a pre-labeled sample of fetal chromosome images, from which images, in various ways, the data that will allow the trained model to assess the presence or absence of abnormalities in the fetus are extracted and processed. At the operational stage 400, this trained machine learning model is used for directly identifying and providing information containing information on the probability of the presence of fetal abnormalities.
На Фиг. 5 представлен пример общей схемы вычислительного устройства (500), обеспечивающего обработку данных, необходимую для реализации заявленного решения. Fig. 5 shows an example of a general diagram of a computing device (500) that provides data processing necessary for implementing the claimed solution.
В данном контексте под устройствами, подобными тому, что показано на общей схеме (500), понимаются любые вычислительные устройства, построенные на базе программно-аппаратных средств, например, такие как персональные компьютеры, серверы, смартфоны, ноутбуки, планшеты и т.д.In this context, devices similar to those shown in the general diagram (500) are understood to mean any computing devices built on the basis of software and hardware, such as personal computers, servers, smartphones, laptops, tablets, etc.
В качестве устройства обработки данных может выступать процессор, микропроцессор, ЭВМ (электронно-вычислительная машина), ПЛК (программируемый логический контроллер) или интегральная схема, сконфигурированные для исполнения определенных команд (инструкций, программ) по обработке данных. Процессор может быть многоядерным, для параллельной обработки данных.A data processing device may be a processor, microprocessor, computer (electronic computer), PLC (programmable logic controller) or integrated circuit, configured to execute specific commands (instructions, programs) for data processing. The processor may be multi-core, for parallel data processing.
В роли устройства памяти могут выступать, но, не ограничиваясь, жесткие диски (HDD), флеш-память, ПЗУ (постоянное запоминающее устройство), твердотельные накопители (SSD) и т.д.Memory devices may include, but are not limited to, hard drives (HDD), flash memory, ROM (read-only memory), solid-state drives (SSD), etc.
Следует отметить, что в указанное устройство могут входить и любые другие известные в данном уровне техники устройства, например, такие как датчики, устройства ввода/вывода данных, устройства отображения (дисплеи) и т.п. Устройство ввода/вывода данных может представлять собой, но не ограничиваясь, например, манипулятор мышь, клавиатуру, тачпад, стилус, джойстик, трекпад и т.п.It should be noted that the said device may also include any other devices known in the art, such as sensors, data input/output devices, display devices (displays), etc. The data input/output device may be, but is not limited to, a mouse, keyboard, touchpad, stylus, joystick, trackpad, etc.
В общем случае устройство (500) содержит такие компоненты как один или более процессоров (501), по меньшей мере одно оперативное запоминающее устройство или память (502), средство хранения данных (503), интерфейсы ввода/вывода (504), средство В/В (505), средства сетевого взаимодействия или, что тоже самое, передачи данных (506).In general, the device (500) comprises such components as one or more processors (501), at least one random access memory or memory (502), data storage means (503), input/output interfaces (504), I/O means (505), network interaction means or, which is the same, data transmission means (506).
Процессор (501) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (500) или функциональности одного или более его компонентов. Процессор (501) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (502).The processor (501) of the device performs the basic computing operations necessary for the functioning of the device (500) or the functionality of one or more of its components. The processor (501) executes the necessary machine-readable instructions contained in the RAM (502).
Память (502), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемую функциональность.Memory (502) is typically in the form of RAM and contains the necessary software logic to provide the required functionality.
Средство хранения данных (503) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п.The data storage device (503) can be implemented in the form of HDD, SSD disks, RAID array, network storage, flash memory, optical storage devices (CD, DVD, MD, Blue-Ray disks), etc.
Интерфейсы (504) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п. Выбор интерфейсов (504) зависит от конкретного исполнения устройства (500), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.Interfaces (504) are standard means for connecting and working with the server part, for example, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire, etc. The choice of interfaces (504) depends on the specific design of the device (500), which can be a personal computer, mainframe, server cluster, thin client, smartphone, laptop, etc.
В качестве средств В/В данных (505) могут использоваться клавиатура, джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.The following may be used as I/O data means (505): keyboard, joystick, display (touch display), projector, touchpad, mouse, trackball, light pen, speakers, microphone, etc.
Средства сетевого взаимодействия (506) выбираются из устройств, обеспечивающих прием и передачу данных по сети, например, Ethernet-карта, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (506) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.Network interaction means (506) are selected from devices that ensure the reception and transmission of data over a network, for example, an Ethernet card, a WLAN/Wi-Fi module, a Bluetooth module, a BLE module, an NFC module, an IrDa module, an RFID module, a GSM modem, etc. With the help of the means (506), the organization of data exchange over a wired or wireless data transmission channel is ensured, for example, WAN, PAN, LAN, Intranet, Internet, WLAN, WMAN or GSM.
Компоненты устройства (500) сопряжены посредством общей шины передачи данных (510).The components of the device (500) are connected via a common data transmission bus (510).
Системы и способы, проиллюстрированные в данном документе, могут описываться с точки зрения компонентов функциональных блоков. Следует принимать во внимание, что такие функциональные блоки могут быть реализованы посредством любого числа аппаратных и/или программных компонентов, сконфигурированных с возможностью выполнять указанные функции. Например, система может использовать различные компоненты интегральной схемы, например, запоминающие элементы, элементы обработки, логические элементы, таблицы поиска и т.п., которые могут выполнять множество функций под управлением одного или более микропроцессоров либо других устройств управления. Аналогично, программные элементы системы могут реализовываться с помощью любого языка программирования или подготовки сценариев, такого как C, C++, C#, Java, JavaScript, VBScript, Macromedia Cold Fusion, COBOL, Microsoft Active Server Pages, язык ассемблера, Perl, PHP, AWK, Python, Visual Basic, хранимых процедур SQL, PL/SQL, любых сценариев оболочки UNIX и расширяемого языка разметки (XML), при этом различные алгоритм реализуются с любой комбинацией структур данных, объектов, процессов, процедур или других программных элементов.The systems and methods illustrated in this document may be described in terms of functional block components. It should be appreciated that such functional blocks may be implemented by any number of hardware and/or software components configured to perform the specified functions. For example, the system may use various integrated circuit components, such as memory elements, processing elements, logic elements, lookup tables, etc., that may perform a variety of functions under the control of one or more microprocessors or other control devices. Similarly, the software elements of the system may be implemented using any programming or scripting language, such as C, C++, C#, Java, JavaScript, VBScript, Macromedia Cold Fusion, COBOL, Microsoft Active Server Pages, assembly language, Perl, PHP, AWK, Python, Visual Basic, SQL stored procedures, PL/SQL, any UNIX shell scripts, and Extensible Markup Language (XML), with the various algorithms being implemented with any combination of data structures, objects, processes, procedures, or other software elements.
Дополнительно следует отметить, что система, реализующая описанный способ, может использовать любое количество известных технологий для передачи данных, передачи служебных сигналов, обработки данных, управления сетью и т.п. It should also be noted that the system implementing the described method can use any number of known technologies for data transmission, transmission of service signals, data processing, network management, etc.
В заключение следует отметить, что приведенные в описании сведения являются только примерами, которые не ограничивают объем настоящего изобретения, описанного формулой. Специалисту в данной области становится понятным, что могут существовать и другие варианты осуществления настоящего изобретения, согласующегося с сущностью и объемом настоящего изобретения.In conclusion, it should be noted that the information provided in the description is only examples that do not limit the scope of the present invention described by the claims. A person skilled in the art will understand that there may be other embodiments of the present invention consistent with the essence and scope of the present invention.
В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.The present application materials present a preferred disclosure of the implementation of the claimed technical solution, which should not be used as limiting other, particular embodiments of its implementation that do not go beyond the scope of the requested scope of legal protection and are obvious to specialists in the relevant field of technology.
Claims (82)
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2846177C1 true RU2846177C1 (en) | 2025-09-01 |
Family
ID=
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110265087A (en) * | 2018-10-05 | 2019-09-20 | 中国医药大学附设医院 | Chromosome abnormality detection model, its detection system and chromosome abnormality detection method |
| RU2734484C1 (en) * | 2020-02-28 | 2020-10-16 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный университет имени М.В. Ломоносова" (МГУ) | Method for non-invasive prenatal diagnostics of trisomy and a set for it |
| WO2021056046A1 (en) * | 2019-09-25 | 2021-04-01 | Presagen Pty Ltd | Method and system for performing non-invasive genetic testing using an artificial intelligence (ai) model |
| US11984227B2 (en) * | 2020-07-28 | 2024-05-14 | Xifin, Inc. | Automatically determining a medical recommendation for a patient based on multiple medical images from multiple different medical imaging modalities |
| US12020492B2 (en) * | 2019-11-29 | 2024-06-25 | Sysmex Corporation | Cell analysis method, cell analysis device, and cell analysis system |
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110265087A (en) * | 2018-10-05 | 2019-09-20 | 中国医药大学附设医院 | Chromosome abnormality detection model, its detection system and chromosome abnormality detection method |
| WO2021056046A1 (en) * | 2019-09-25 | 2021-04-01 | Presagen Pty Ltd | Method and system for performing non-invasive genetic testing using an artificial intelligence (ai) model |
| US12020492B2 (en) * | 2019-11-29 | 2024-06-25 | Sysmex Corporation | Cell analysis method, cell analysis device, and cell analysis system |
| RU2734484C1 (en) * | 2020-02-28 | 2020-10-16 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный университет имени М.В. Ломоносова" (МГУ) | Method for non-invasive prenatal diagnostics of trisomy and a set for it |
| US11984227B2 (en) * | 2020-07-28 | 2024-05-14 | Xifin, Inc. | Automatically determining a medical recommendation for a patient based on multiple medical images from multiple different medical imaging modalities |
Non-Patent Citations (1)
| Title |
|---|
| МЕДНИКОВ Д.А. и др. Интеллектуальные системы поддержки принятия врачебных решений в кардиологической практике. - 2021. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7515144B2 (en) | System and method for processing images of slides for digital pathology and automatically prioritizing processed images of slides - Patents.com | |
| US20200349466A1 (en) | Providing performance views associated with performance of a machine learning system | |
| CN113892148A (en) | Explainable AI (xAI) platform for computational pathology | |
| EP4025119B1 (en) | System and method for prediction of disease progression of pulmonary fibrosis using medical images | |
| US20230068571A1 (en) | System and method of managing workflow of examination of pathology slides | |
| CN112367905A (en) | Methods for diagnosing, prognosing, determining prognosis, monitoring or staging disease based on vascularization patterns | |
| US20220005582A1 (en) | System and method for personalization and optimization of digital pathology analysis | |
| WO2024116137A1 (en) | Method and system for training a machine learning system for image processing | |
| König et al. | Quality assessment of colour fundus and fluorescein angiography images using deep learning | |
| CN119272221A (en) | Multi-source medical data fusion method, system, medium and equipment | |
| CN119645416A (en) | A software code optimization method, system, device and medium based on big data | |
| RU2846177C1 (en) | Method and system for determining probability of presence of chromosomal abnormality in foetus | |
| El-Sherbiny et al. | Visual analytics for the integrated exploration and sensemaking of cancer cohort radiogenomics and clinical information | |
| Schilling et al. | AI 2 Seg: A Method and Tool for AI-based Annotation Inspection of Biomedical Instance Segmentation Datasets | |
| CN109978877B (en) | Method and device for classifying by using screening model and storage medium | |
| CN115333973A (en) | Equipment abnormality detection method and device, computer equipment and storage medium | |
| Sundari et al. | Transfer learning-enhanced CNN model for integrative ultrasound and biomarker-based diagnosis of polycystic ovarian disease | |
| Dhivya et al. | Empowered brain tumor detection using deep learning methodology | |
| US20250252760A1 (en) | Method and apparatus for analyzing pathological slide images | |
| KR102891440B1 (en) | Systems and methods for processing images of slides to automatically prioritize the processed images of slides for digital pathology | |
| KR102671745B1 (en) | A method and an apparatus for evaluating the quality of pathological slide images | |
| KR102811873B1 (en) | Method, apparatus, and program for cell classification and detection in ai-based pathology images | |
| US20250062025A1 (en) | Hybrid machine learning models for improved diagnostic analysis | |
| EP4597508A1 (en) | Health equity assessment system for clinical data products | |
| KR102385294B1 (en) | Methods, systems and computer readable media for automatically selecting sample tasks and obtaining correct answers for worker competency tests without expert response through crowdsourcing |