RU2845119C2 - System and method for determining pulmonary pathologies from x-ray images - Google Patents
System and method for determining pulmonary pathologies from x-ray imagesInfo
- Publication number
- RU2845119C2 RU2845119C2 RU2023136361A RU2023136361A RU2845119C2 RU 2845119 C2 RU2845119 C2 RU 2845119C2 RU 2023136361 A RU2023136361 A RU 2023136361A RU 2023136361 A RU2023136361 A RU 2023136361A RU 2845119 C2 RU2845119 C2 RU 2845119C2
- Authority
- RU
- Russia
- Prior art keywords
- class
- mask
- pathology
- pixel
- segmentation
- Prior art date
Links
Abstract
Description
Область техники, к которой относится изобретениеField of technology to which the invention relates
Настоящее изобретение относится к области обработки изображений, и, более конкретно, к поддержке принятия врачебных решений на основе анализа медицинских изображений.The present invention relates to the field of image processing, and more particularly to supporting medical decision making based on the analysis of medical images.
Уровень техникиState of the art
Рентгенологические исследования органов грудной клетки занимают 24% или более 76 млн исследований в год в структуре всех лучевых исследований в Российской Федерации. В настоящее время основным методом активного выявления скрыто протекающих патологических процессов в легких являются флюорографические исследования.X-ray examinations of the chest organs account for 24% or more than 76 million examinations per year in the structure of all radiation examinations in the Russian Federation. Currently, the main method of active detection of latent pathological processes in the lungs are fluorographic examinations.
Широко тестируются алгоритмы и программное обеспечение, позволяющие проводить автоматический анализ рентгенологических данных. Применение таких алгоритмов предполагает более эффективное обнаружение патологических изменений. Algorithms and software that enable automated analysis of radiological data are being widely tested. The use of such algorithms suggests more efficient detection of pathological changes.
Использование искусственного интеллекта (ИИ) в различных областях медицины значительно выросло за последние годы. Это произошло главным образом благодаря прогрессу высокопроизводительных вычислений и развитию глубокого обучения (DL), подмножества алгоритмов искусственного интеллекта, которые используют нейронные сети для обучения решению конкретных задач из баз данных, помеченных экспертами.The use of artificial intelligence (AI) in various fields of medicine has grown significantly in recent years, largely due to advances in high-performance computing and the development of deep learning (DL), a subset of AI algorithms that use neural networks to learn how to solve specific problems from databases labeled by experts.
Ранние методы диагностики заболеваний легких с применением ИИ использовали следующие методы: сочетание нейронной сети-классификатора с сетью-сегментатором патологии, сочетание нейронной сети-сегментатора патологий с мультиклассовым детектором, мультиклассовая сегментация с отсечением по порогу, мультиклассовая сегментация с двумя порогами. Все эти методы имеют ограниченную точность, увеличенные требования к количеству обучающих данных, повышенную сложность обработки и ограниченную скорость работы. Кроме того, в известном уровне техники не предложены эффективные решения для преодоления проблемы малого размера классов и классового дисбаланса. Early methods of pulmonary disease diagnosis using AI used the following methods: combining a neural network classifier with a pathology segmentation network, combining a neural network pathology segmentation network with a multi-class detector, multi-class segmentation with thresholding, and multi-class segmentation with two thresholds. All these methods have limited accuracy, increased requirements for the amount of training data, increased processing complexity, and limited operating speed. In addition, the prior art does not provide effective solutions to overcome the problem of small class sizes and class imbalance.
Сущность изобретенияThe essence of the invention
С целью устранения по меньшей мере некоторых из вышеупомянутых недостатков предшествующего уровня техники, настоящее изобретение направлено на повышение эффективности систем и способов диагностики патологий легких посредством искусственного интеллекта. В современном мире, где технологии играют ключевую роль в улучшении качества медицинского обслуживания, представленное изобретение позволяет улучшить параметры точности диагностики заболеваний легких, скорости обработки изображений системами автоматической диагностики легких и снизить требования к количеству обучающих данных для ИИ систем.In order to eliminate at least some of the above-mentioned disadvantages of the prior art, the present invention is aimed at improving the efficiency of systems and methods for diagnosing lung pathologies using artificial intelligence. In the modern world, where technology plays a key role in improving the quality of medical care, the presented invention allows improving the accuracy parameters of diagnosing lung diseases, the speed of image processing by automatic lung diagnostic systems and reducing the requirements for the amount of training data for AI systems.
Согласно первому аспекту настоящего изобретения, предложена система определения патологий легких по рентгеновским изображениям, содержащая:According to a first aspect of the present invention, a system for determining lung pathologies from X-ray images is proposed, comprising:
блок получения изображений, выполненный с возможностью получать двумерное рентгеновское изображение области легких;an imaging unit configured to obtain a two-dimensional X-ray image of a region of the lungs;
блок диагностики патологий, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, с помощью нейронной сети на основе сегментации выявлять на полученном изображении участки патологий легких;a pathology diagnostic unit, configured to detect areas of lung pathologies on the obtained image using at least one processor and memory using a neural network based on segmentation;
блок сегментации анатомических структур, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, определять с помощью нейронной сети на основе сегментации область сердца, область правого легкого и область левого легкого по их внешним контурам, а также область от диафрагмы и ниже нее;a segmentation unit for anatomical structures, configured to determine, using at least one processor and memory, using a neural network based on segmentation, the region of the heart, the region of the right lung and the region of the left lung along their outer contours, as well as the region from the diaphragm and below it;
блок локализации патологий, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, определять локализацию выявленных участков патологии путем сопоставления выходных данных от блока диагностики патологий и выходных данных от блока сегментации анатомических структур, удалять предполагаемые участки патологий, выходящие за пределы области, которой они соответствуют; иa pathology localization unit configured to, using at least one processor and memory, determine the localization of the identified pathology areas by comparing the output data from the pathology diagnostic unit and the output data from the anatomical structure segmentation unit, and remove the suspected pathology areas that extend beyond the area to which they correspond; and
блок передачи отчета, выполненный с возможностью формировать отчет, содержащий сведения о наличии или отсутствии патологий легких на полученном изображении на основе выходных данных по меньшей от одного из блока диагностики патологий, блока сегментации анатомических структур и блока локализации патологий,a report transmission unit configured to generate a report containing information on the presence or absence of lung pathologies in the received image based on output data from at least one of the pathology diagnostic unit, the anatomical structure segmentation unit, and the pathology localization unit,
причем блок диагностики патологий дополнительно выполнен с возможностью выполнять постобработку масок сегментации, выводимых содержащейся в нем нейронной сетью, постобработка заключается в предварительной бинаризации маски каждого класса, выделении контуров, представлении каждого контура как отдельного объекта детекции, вычисления средней вероятности пикселей изначальной маски внутри каждого контура с последующем сравнением этой вероятности с порогом детекции, вычисленным на основании AUROC кривой по всей обучающей выборке.wherein the pathology diagnostics unit is additionally configured with the ability to perform post-processing of segmentation masks output by the neural network contained therein, the post-processing consists of preliminary binarization of the mask of each class, selection of contours, representation of each contour as a separate detection object, calculation of the average probability of pixels of the initial mask within each contour with subsequent comparison of this probability with the detection threshold calculated on the basis of the AUROC curve for the entire training sample.
В одном из вариантов осуществления блок передачи отчета дополнительно выполнен с возможностью формировать копию входного изображения с нанесенными на него контурами, ограничивающими область патологии, а также указывать текстовую информацию о локализации патологии и числовые значения площади поражения легких.In one embodiment, the report transmission unit is additionally configured to form a copy of the input image with contours applied to it, limiting the area of pathology, and also to indicate text information about the localization of the pathology and numerical values of the area of lung damage.
В одном из вариантов осуществления блок локализации патологий дополнительно выполнен с возможностью делать вывод о наличии или отсутствии диссеминированного поражения в зависимости от локализации патологии в одном или двух легких, количества очагов поражения и площади поражения каждого легкого.In one embodiment, the pathology localization unit is additionally configured to make a conclusion about the presence or absence of disseminated damage depending on the localization of the pathology in one or two lungs, the number of lesions, and the area of damage to each lung.
В одном из вариантов осуществления блок локализации патологий дополнительно выполнен с возможностью вычислять поперечный размер легких и сердца, вычислять на их основе кардиоторакальный индекс (КТИ) и обнулять определенную блоком диагностики патологий вероятность наличия кардиомегалии, если вычисленный КТИ меньше критического порога.In one embodiment, the pathology localization unit is additionally configured to calculate the transverse size of the lungs and heart, calculate the cardiothoracic index (CTI) on their basis, and reset the probability of the presence of cardiomegaly determined by the pathology diagnostic unit if the calculated CTI is less than the critical threshold.
В одном из вариантов осуществления каждая нейронная сеть предварительно обучена определять маску для каждого соответствующего ей класса, которая содержит вероятности принадлежности каждого пикселя к данному классу, причем при обучении используется фокусная функция потерь и веса пикселей, которые представляют собой веса для положительных пикселей истинной маски класса и отрицательных пикселей истинной маски класса, основанные на частоте пикселей, принадлежащих конкретному классу во всей выборке, причем фокусная функция потерь вычисляется для каждого пикселя маски после определения маски класса, и если соответствующий пиксель истинной маски класса является положительным, ошибка, полученная на этом пикселе маски класса, умножается на вес пикселя положительного примера данного класса, а если соответствующий пиксель истинной маски класса является отрицательным, ошибка, полученная на этом пикселе маски класса, умножается на вес пикселя отрицательного примера данного класса.In one embodiment, each neural network is pre-trained to determine a mask for each class corresponding to it, which contains the probabilities of each pixel belonging to this class, wherein during training a focal loss function and pixel weights are used, which represent weights for positive pixels of the true class mask and negative pixels of the true class mask, based on the frequency of pixels belonging to a specific class in the entire sample, wherein the focal loss function is calculated for each pixel of the mask after determining the class mask, and if the corresponding pixel of the true class mask is positive, the error obtained on this pixel of the class mask is multiplied by the weight of the pixel of a positive example of this class, and if the corresponding pixel of the true class mask is negative, the error obtained on this pixel of the class mask is multiplied by the weight of the pixel of a negative example of this class.
В одном из вариантов осуществления после каждой эпохи обучения вычисляется отношение между метриками средней точности и средней полноты, и если оно выходит за пределы от 0,9 до 1,1, то веса пикселей для фокусной функции потерь корректируются следующим образом: вес пикселя для положительного пикселя умножается на результат деления метрики среднего F1 на среднюю полноту, для отрицательного пикселя – на результат деления метрики среднего F1 на среднюю точность.In one embodiment, after each training epoch, the ratio between the average precision and average recall metrics is calculated, and if it is outside the range from 0.9 to 1.1, then the pixel weights for the focal loss function are adjusted as follows: the pixel weight for a positive pixel is multiplied by the result of dividing the average F1 metric by the average recall, for a negative pixel - by the result of dividing the average F1 metric by the average precision.
В одном из вариантов осуществления каждая нейронная сеть предварительно обучена определять маску для каждого соответствующего ей класса, которая содержит вероятности принадлежности каждого пикселя к данному классу, причем при обучении используется функция потерь на основе коэффициента Жаккара и веса классов положительной и отрицательной метки класса, которые определяются на основе обратной частоты положительных и отрицательных меток класса для всех изображений в выборке по каждому классу, причем если для заданного изображения в истинной маске заданного класса присутствуют положительные элементы, то всему экземпляру присваивается положительная метка класса, если отсутствуют - отрицательная метка класса, причем функция потерь на основе коэффициента Жаккара вычисляется для каждой маски класса после определения маски класса для каждого класса, и если соответствующая изображению истинная метка класса является положительной, то ошибка соответствующего класса умножается на вес класса положительного экземпляра класса, а если отрицательной – на вес класса отрицательного экземпляра класса, соответственно.In one embodiment, each neural network is pre-trained to determine a mask for each class corresponding to it, which contains the probabilities of each pixel belonging to this class, wherein during training a loss function is used based on the Jaccard coefficient and the class weights of the positive and negative class labels, which are determined based on the inverse frequency of positive and negative class labels for all images in the sample for each class, wherein if for a given image in the true mask of a given class there are positive elements, then the entire instance is assigned a positive class label, if absent - a negative class label, wherein the loss function based on the Jaccard coefficient is calculated for each class mask after determining the class mask for each class, and if the true class label corresponding to the image is positive, then the error of the corresponding class is multiplied by the class weight of the positive instance of the class, and if negative - by the class weight of the negative instance of the class, respectively.
Согласно второму аспекту настоящего изобретения, предложен способ определения патологий легких по рентгеновским изображениям, содержащий этапы, на которых:According to a second aspect of the present invention, a method for determining lung pathologies from X-ray images is provided, comprising the steps of:
с использованием блока получения изображений получают двумерное рентгеновское изображение, содержащее область легких;Using an imaging unit, a two-dimensional X-ray image is obtained containing an area of the lungs;
с использованием блока диагностики патологий, содержащего нейронную сеть для сегментации, определяют на полученном изображении участки патологий легких, при этом выполняют постобработку масок сегментации, выводимых нейронной сетью, постобработка заключается в предварительной бинаризации маски каждого класса, выделении контуров, представлении каждого контура как отдельного объекта детекции, вычисления средней вероятности пикселей изначальной маски внутри каждого контура с последующем сравнением этой вероятности с порогом детекции, вычисленным на основании AUROC кривой по всей обучающей выборке;using a pathology diagnostics unit containing a neural network for segmentation, areas of lung pathologies are determined on the obtained image, while post-processing of the segmentation masks output by the neural network is performed, post-processing consists of preliminary binarization of the mask of each class, selection of contours, presentation of each contour as a separate detection object, calculation of the average probability of pixels of the original mask within each contour with subsequent comparison of this probability with the detection threshold calculated on the basis of the AUROC curve for the entire training sample;
с использованием блока сегментации анатомических структур, содержащего нейронную сеть для сегментации, определяют на полученном изображении область сердца, область правого легкого и область левого легкого по их внешним контурам, а также область от диафрагмы и ниже нее;using a block for segmentation of anatomical structures containing a neural network for segmentation, the region of the heart, the region of the right lung and the region of the left lung are determined on the resulting image along their outer contours, as well as the region from the diaphragm and below it;
с использованием блока локализации патологий, определяют локализацию выявленных участков патологии на основе сопоставления выходных данных от блока диагностики патологий и выходных данных от блока сегментации анатомических структур и удаляют предполагаемые участки патологий, выходящие за пределы области, которой они соответствуют; иusing the pathology localization unit, determine the localization of the identified pathology areas based on a comparison of the output data from the pathology diagnostics unit and the output data from the anatomical structure segmentation unit and remove the suspected pathology areas that extend beyond the area to which they correspond; and
с использованием блока передачи отчета формируют и передают отчет, содержащий сведения о наличии или отсутствии патологий легких на полученном изображении на основе выходных данных по меньшей от одного из блока диагностики патологий, блока сегментации анатомических структур и блока локализации патологий, на устройство, запрашивавшее диагностику.using a report transmission unit, a report is generated and transmitted containing information about the presence or absence of lung pathologies in the obtained image based on output data from at least one of the pathology diagnostic unit, the anatomical structure segmentation unit and the pathology localization unit, to the device that requested the diagnostics.
Технический результатTechnical result
Настоящее изобретение позволяет повысить эффективность систем и способов диагностики патологий легких с использованием двумерных рентгеновских изображений. При этом обеспечивается:The present invention makes it possible to increase the efficiency of systems and methods for diagnosing lung pathologies using two-dimensional X-ray images. This ensures:
- повышение точности диагностики;- increasing the accuracy of diagnostics;
- повышение скорости обработки двумерных изображений;- increasing the speed of processing two-dimensional images;
- упрощение интерпретации и описания изображений;- simplification of interpretation and description of images;
- возможность выполнения диагностики заболеваний легких, в режиме скрининга;- the ability to perform diagnostics of lung diseases in screening mode;
- освобождение медицинского персонала от рутинных процессов анализа снимков пациентов;- freeing medical personnel from routine processes of analyzing patient images;
- уменьшение влияния человеческого фактора (внимательность, утомляемость, ответственность);- reducing the influence of the human factor (attentiveness, fatigue, responsibility);
- увеличение соотношения между количеством снимков, использованных для обучения, и полученными метриками классификации и детекции.- increasing the ratio between the number of images used for training and the obtained classification and detection metrics.
Эти и другие преимущества настоящего изобретения станут понятны при прочтении нижеследующего подробного описания со ссылкой на сопроводительные чертежи.These and other advantages of the present invention will become apparent from reading the following detailed description with reference to the accompanying drawings.
Краткое описание чертежейBrief description of the drawings
Фиг. 1 показывает блок-схему системы диагностики патологий легких согласно настоящему изобретению.Fig. 1 shows a block diagram of a system for diagnosing lung pathologies according to the present invention.
Следует понимать, что фигуры могут быть представлены схематично и не в масштабе и предназначены, главным образом, для улучшения понимания настоящего изобретения.It should be understood that the figures may be diagrammatic and not to scale and are intended primarily to facilitate an understanding of the present invention.
Подробное описаниеDetailed description
Заболевания легких на практике обычно диагностируются врачами путем ручного анализа изображений. Настоящее изобретение предоставляет способ и систему, которые автоматизируют процесс диагностики, определяя наличие признаков патологий из списка, их размер и локализацию, размер сердца, кардиоторокальный индекс.In practice, lung diseases are usually diagnosed by doctors by manual analysis of images. The present invention provides a method and a system that automate the diagnostic process, determining the presence of signs of pathologies from the list, their size and location, heart size, cardiothoracic index.
Авторами настоящего изобретения была собрана анонимная база данных пациентов с признаками патологий легких и без них. Каждый случай пациента состоит из снимка легких в прямой проекции. На каждом рентгеновском изображении квалифицированный рентгенолог вручную именованным контуром обводил область каждого легкого, область от куполов диафрагмы и ниже, область сердца и каждый из признаков патологий при наличии. Как будет показано далее, такая база данных будет использоваться для обучения моделей машинного обучения.The present authors collected an anonymous database of patients with and without signs of lung pathologies. Each patient case consists of a lung image in a direct projection. On each X-ray image, a qualified radiologist manually outlined the area of each lung, the area from the domes of the diaphragm and below, the heart area, and each of the signs of pathologies, if present, with a named contour. As will be shown below, such a database will be used to train machine learning models.
Из уровня техники известны системы, в которых для обнаружения патологий легких использовались сети типа детектор и классификатор, с последующей сегментацией на основе отдельной сети-сегментатора в мультиклассовом варианте или ансамбля сегментаторов в моноклассовом варианте или на основе карт внимания классификатора. Также известны примеры сетей, сочетающих сегментацию целевой области легких, с последующей передачей целевой области в классификатор с исключением областей, не относящихся к легким. Также из уровня техники известны системы, в которых осуществлялась сегментация патологии как единого класса с последующей классификацией выделенных областей. Также из уровня техники известны системы, в которых детекция и классификация производилась сетью-сегментатором по порогу сегментации или двум порогам, из которых первый служил для определения наличия или отсутствия патологии, а второй для определения оптимальной области сегментации.The prior art discloses systems in which networks of the detector and classifier type were used to detect lung pathologies, with subsequent segmentation based on a separate segmenter network in a multi-class version or an ensemble of segmenters in a mono-class version or based on classifier attention maps. Examples of networks combining segmentation of the target lung region are also known, with subsequent transfer of the target region to the classifier with the exclusion of regions that are not related to the lungs. The prior art discloses systems in which pathology was segmented as a single class with subsequent classification of the selected regions. The prior art discloses systems in which detection and classification were performed by a segmenter network based on a segmentation threshold or two thresholds, the first of which served to determine the presence or absence of pathology, and the second to determine the optimal segmentation region.
Из представленных подходов системы автоматической диагностики патологий легких на основе классификаторов, классификаторов с предварительной сегментацией и выделением целевой области, сетей-детекторов требуют значительного количества изображений для обучения. Системы автоматической диагностики патологий легких на основе сетей сегментации склонны к ложноположительным срабатываниям за счет активации сети на отдельных небольших участках и требуют дополнительной фильтрации по размеру обнаруженных потенциальных участков патологии. В свою очередь, в процессе обучения сети-сегментаторы, обученные ранее, сталкиваются с проблемой как дисбаланса классов, так и дисбаланса представленности класса на изображении, что приводит к ухудшению результатов при обучении с использованием функции ошибок (функции потерь) на основе кросэнтропии, особенно для таких патологических признаков, как кальцинаты, очаговые тени, очаговый фиброз, переломы ребер. Of the presented approaches, the automatic lung pathology diagnostics systems based on classifiers, classifiers with preliminary segmentation and target area allocation, and detector networks require a significant number of images for training. Automatic lung pathology diagnostics systems based on segmentation networks are prone to false positives due to network activation in individual small areas and require additional filtering by the size of the detected potential pathology areas. In turn, during the training process, previously trained segmentation networks face the problem of both class imbalance and class representation imbalance in the image, which leads to deterioration of the results when training using the error function (loss function) based on crossentropy, especially for such pathological signs as calcifications, focal shadows, focal fibrosis, rib fractures.
Настоящее изобретение эффективно преодолевает это препятствие за счет использования детекции на основе сегментации с описанным в настоящем изобретении алгоритмом обучения и постобработки, исключения ложноположительных результатов на основании анализа пересечения масок нормальной анатомии и патологии, а также увеличения точности, в том числе за счет оценки кардиоторакального индекса.The present invention effectively overcomes this obstacle by using segmentation-based detection with the training and post-processing algorithm described in the present invention, eliminating false positive results based on an analysis of the intersection of masks of normal anatomy and pathology, and increasing accuracy, including through the assessment of the cardiothoracic index.
Общее описание системыGeneral description of the system
Как изображено на блок-схеме на Фиг. 1, система 100 диагностики патологий легких согласно настоящему изобретению содержит блок 110 получения изображений, блок 120 сегментации анатомических структур, блок 130 диагностики патологий, блок 140 локализации патологий, блок 150 передачи отчета.As shown in the block diagram in Fig. 1, the system 100 for diagnosing lung pathologies according to the present invention comprises an image acquisition unit 110, an anatomical structure segmentation unit 120, a pathology diagnosis unit 130, a pathology localization unit 140, and a report transmission unit 150.
Блок получения изображений в одном варианте осуществления может представлять собой сетевую плату или иное средство приема данных. В другом варианте осуществления блок получения изображений может представлять собой непосредственно рентгеновский аппарат. In one embodiment, the image acquisition unit may be a network card or other data receiving means. In another embodiment, the image acquisition unit may be the X-ray apparatus itself.
Блок диагностики патологий, блок локализации патологий и блок сегментации анатомических структур реализуются на базе устройства обработки, содержащего вычислительный модуль (например, центральный процессор), модуль памяти (например, оперативную память и постоянную память), а также при необходимости дополнительный вычислительный модуль (например, графический процессор или нейронный процессор). Таким образом, блок диагностики патологий, блок локализации патологий и блок сегментации анатомических структур могут быть реализованы на базе компьютера или сервера.The pathology diagnostics unit, the pathology localization unit, and the anatomical structure segmentation unit are implemented on the basis of a processing device containing a computing module (e.g., a central processor), a memory module (e.g., RAM and ROM), and, if necessary, an additional computing module (e.g., a graphic processor or a neural processor). Thus, the pathology diagnostics unit, the pathology localization unit, and the anatomical structure segmentation unit can be implemented on the basis of a computer or a server.
Блок передачи отчета может представлять собой сетевую плату, аппаратный интерфейс передачи данных/видеосигнала или иное средство обмена данными.The report transmission unit may be a network card, a hardware data/video signal transmission interface, or other data exchange means.
Способ диагностики патологий легких выполняется системой диагностики патологий и заключается в следующем.The method of diagnosing lung pathologies is performed by the pathology diagnostic system and is as follows.
Сначала с помощью блока получения изображений получают двумерное изображение легких.First, a two-dimensional image of the lungs is obtained using an imaging unit.
Как указывалось выше, в одном варианте осуществления, если блок получения изображений является рентген-аппаратом, он может получать изображение самостоятельно (или под управлением оператора). В другом варианте осуществления блок получения изображений, будучи частью сервиса диагностики патологий, может получать извне (например, от медицинской организации, от врача, от региональной системы хранения медицинских данных и т.д.) запрос на диагностику или входные данные, содержащие одно или множество (например, пакет) изображений, и извлекать требуемое изображение из полученных входных данных или запроса.As indicated above, in one embodiment, if the image acquisition unit is an X-ray machine, it can acquire an image independently (or under the control of an operator). In another embodiment, the image acquisition unit, being part of a pathology diagnostic service, can receive from outside (e.g., from a medical organization, from a doctor, from a regional medical data storage system, etc.) a diagnostic request or input data containing one or a plurality (e.g., a batch) of images, and extract the desired image from the received input data or request.
При необходимости полученное изображение подвергается предварительной обработке в блоке предобработки (не показан на Фиг.1), чтобы оно было пригодно для обработки дальнейшими блоками. Например, если исходное изображение имеет в каком-либо направлении недостаточное или избыточное разрешение, то может выполняться преобразование или реконструкция изображения до требуемого разрешения. Также могут корректироваться яркость, контрастность и иные параметры изображения.If necessary, the resulting image is pre-processed in a pre-processing block (not shown in Fig. 1) so that it is suitable for processing by further blocks. For example, if the original image has insufficient or excessive resolution in any direction, then the image can be transformed or reconstructed to the required resolution. Brightness, contrast, and other image parameters can also be adjusted.
Затем изображение подается на блок сегментации анатомических структур и блок диагностики патологий. The image is then fed to the anatomical structure segmentation unit and the pathology diagnostic unit.
В блоке сегментации анатомических структур с использованием предварительно обученной нейронной сети определяется вероятность наличия класса и бинарные маски сегментации по каждому из следующих классов: «Правое легкое», «Левое легкое», «Купола диафрагмы и нижележащая область», «Сердце» (как показано выше, в обучающем датасете имеется разметка по каждому такому классу). Выходом блока сегментации анатомических структур является бинарная маска правого легкого, левого легкого, сердца, куполов диафрагмы. In the anatomical structure segmentation block, the probability of class presence and binary segmentation masks for each of the following classes are determined using a pre-trained neural network: "Right lung", "Left lung", "Domes of the diaphragm and underlying region", "Heart" (as shown above, the training dataset contains markings for each such class). The output of the anatomical structure segmentation block is a binary mask of the right lung, left lung, heart, and domes of the diaphragm.
В блоке диагностики патологий с использованием предварительно обученной нейронной сети для каждого из классов патологии легких генерируются бинарные маски патологий и вероятности наличия классов патологии. Под классами патологии подразумеваются следующие классы: очаговая тень, инфильтрация, плевральный выпот, ателектаз, пневмоторакс, кальцинаты, фиброз, перелом ребра, консолидированный перелом ребра, отек легких и расширение сердца (как показано выше, в обучающем датасете имеется именованная разметка областей с патологией на тех изображениях, где патологии имеются). Выходом блока диагностики патологий являются бинарные маски патологий и набор значений от 0 до 1 для каждой патологии, интерпретируемый как вероятность ее наличия.In the pathology diagnostics block, binary pathology masks and probabilities of pathology class presence are generated for each lung pathology class using a pre-trained neural network. The pathology classes are the following classes: focal shadow, infiltration, pleural effusion, atelectasis, pneumothorax, calcifications, fibrosis, rib fracture, consolidated rib fracture, pulmonary edema, and cardiac dilation (as shown above, the training dataset contains named marking of areas with pathology in those images where pathologies are present). The output of the pathology diagnostics block is binary pathology masks and a set of values from 0 to 1 for each pathology, interpreted as the probability of its presence.
Выходные данные от блока сегментации анатомических структур и блока диагностики патологий поступают в блок локализации патологий. В блоке локализации патологий области изображения, помеченные как содержащие патологию, проверяются на пересечение с областями изображения, выделенными как соответствующие правому легкому, левому легкому или сердцу, для исключения ложноположительных результатов. Маски патологий вне области легких обнуляются, маски патологий сердца вне маски сердца обнуляются. После этого вычисляется поперечный размер легких (грудной клетки) и сердца (например, по числу пикселей, составляющих соответствующую поперечную линию) и подчитывается кардиоторакальный индекс (КТИ), который представляет собой отношение поперечника тени сердца, измеряемого в наиболее отдаленных точках правого и левого контуров сердца к внутреннему поперечнику грудной клетки, измеряемому над куполами диафрагмы при прямой рентгенографии.The output data from the anatomical structure segmentation unit and the pathology diagnostics unit are sent to the pathology localization unit. In the pathology localization unit, image areas marked as containing pathology are checked for intersection with image areas selected as corresponding to the right lung, left lung, or heart to exclude false positive results. Pathology masks outside the lung area are reset to zero, and heart pathology masks outside the heart mask are reset to zero. After that, the transverse size of the lungs (chest) and heart is calculated (e.g., by the number of pixels that make up the corresponding transverse line) and the cardiothoracic index (CTI) is calculated, which is the ratio of the heart shadow diameter measured at the most distant points of the right and left heart contours to the internal chest diameter measured above the domes of the diaphragm during direct radiography.
В одной из реализаций для устранения ложноотрицательных результатов в классе «Кардиомегалия» вероятность наличия класса обнуляется, если подчитанный КТИ меньше критического порога 0,6.In one implementation, to eliminate false negative results in the class "Cardiomegaly", the probability of the class presence is reset to zero if the calculated CTI is less than the critical threshold of 0.6.
В одной из реализаций производится подсчет площади патологии «Инфильтрация» и «Очаговая тень» по сравнению с площадью легких. Если инфильтрация или очаговые тени занимают более критического порога площади в каждом из легких, делается вывод о наличии диссеминации.In one implementation, the area of the pathology "Infiltration" and "Focal shadow" is calculated in comparison with the area of the lungs. If the infiltration or focal shadows occupy more than a critical threshold of area in each of the lungs, a conclusion is made about the presence of dissemination.
В одной из реализаций производится подсчет изолированных контуров класса «Очаговая тень». Если число теней превосходит порог, то делается вывод о наличии диссеминированного поражения легких.In one implementation, isolated contours of the "Focal shadow" class are counted. If the number of shadows exceeds the threshold, a conclusion is made about the presence of disseminated lung damage.
Фактически, и в блоке сегментации анатомических структур, и в блоке диагностики патологий сначала выполняется сегментация, а затем на ее основе выполняется формирование бинарной маски и вычисление вероятностей. Различие состоит в том, что в блоке сегментации анатомических структур сегментация предназначена для классификации анатомических структур, а в блоке диагностики патологий сегментация предназначена для детекции патологий. Затем данные с этих блоков объединяются в блоке локализации патологий, чтобы повысить точность диагностики и отсечь ложные срабатывания, которые могли бы возникнуть, если бы использовался только один из указанных двух подходов с использованием сегментации, а не предложенное сочетание. Это выгодно отличается от известных решений из уровня техники, в которых либо вообще не используется сегментация, либо сегментация используется только для выявления анатомических структур.In fact, both the anatomical structure segmentation block and the pathology diagnostics block first perform segmentation, and then, based on this segmentation, form a binary mask and calculate probabilities. The difference is that in the anatomical structure segmentation block, segmentation is intended to classify anatomical structures, while in the pathology diagnostics block, segmentation is intended to detect pathologies. The data from these blocks are then combined in the pathology localization block to improve the diagnostic accuracy and eliminate false positives that could occur if only one of the two approaches using segmentation were used, rather than the proposed combination. This compares favorably with known solutions from the state of the art, which either do not use segmentation at all or use segmentation only to detect anatomical structures.
Далее, вывод от блока локализации патологий передается в блок передачи отчета. В одном варианте осуществления отчет о состоянии легких может формироваться для каждого изображения. В другом варианте осуществления запрос на диагностику или настройки системы диагностики могут предусматривать необходимость формирования отчета только для случаев, в которых выявлена патология. Например, если в полученном пакете из 10 изображений система выявила один случай патологии, она может формировать отчет для соответствующего изображения (или пациента), содержащий вычисленные клинические показатели. Отчет также может содержать сформированную блоком передачи отчета копию входного изображения с нанесенными на него контурами патологии. Отчет также может содержать информацию в текстовом виде о локализации каждого признака в одном из двух легких, КТИ, площадь поражения каждого легкого.Next, the output from the pathology localization unit is transmitted to the report transmission unit. In one embodiment, a report on the state of the lungs can be generated for each image. In another embodiment, a diagnostic request or diagnostic system settings can provide for the need to generate a report only for cases in which pathology is detected. For example, if the system has detected one case of pathology in the received batch of 10 images, it can generate a report for the corresponding image (or patient) containing the calculated clinical indicators. The report can also contain a copy of the input image generated by the report transmission unit with pathology contours applied to it. The report can also contain information in text form on the localization of each sign in one of the two lungs, the CTI, and the area of damage to each lung.
Далее отчет о состоянии здоровья легких выводится на экран монитора, подключенного к серверу, или же передается с помощью блока передачи отчета на устройство, запрашивавшее диагностику – например, на расположенное удаленно автоматизированное рабочее место (АРМ) врача.The report on the health status of the lungs is then displayed on the monitor screen connected to the server, or transmitted via a report transmission unit to the device that requested the diagnostics – for example, to a remotely located automated workstation (AWS) of the doctor.
С помощью изображения с нанесенными на него контурами и других данных, содержащихся в отчете, врач принимает решение о состоянии здоровья пациента.Using the image with the contours applied to it and other data contained in the report, the doctor makes a decision about the patient's health condition.
Детекция и классификация на основе масок сегментации Detection and classification based on segmentation masks
Далее процесс, выполняющийся в блоках сегментации анатомических структур и диагностики патологий, будет описан подробно.Below, the process performed in the blocks of segmentation of anatomical structures and diagnostics of pathologies will be described in detail.
Для каждой маски каждого класса выходом нейронной сети служит маска класса (соответственно, класса анатомической структуры или класса патологии) с вероятностями принадлежности пикселя к классу в диапазоне 0-1. Для каждой маски класса определяются участки изображения – кандидаты на принадлежность к классу. Под определением кандидатов подразумевается простая сегментация по порогу, вычисленному на основании максимизации попиксельного F1-score по всему обучающему датасету, далее называемому порогом сегментации. В другой реализации сегментация выполняется по порогу, определяемому в рамках одного изображения методом ADAPTIVE_THRESH_GAUSSIAN (адаптивный порог, равный взвешенной на основе гауссова окна сумме значений окрестностей). Результатом сегментации служит бинарная маска класса, в последующем называемая маской объектов. Далее (например, с использованием библиотеки opencv) производится поиск контуров для сегментов, содержащихся в маске объектов. Далее, для каждого контура на маске объектов из контура производится генерация маски области интереса, под этим подразумевается, что все элементы маски, лежащие внутри данного контура, считаются равными единице, а за пределами этого контура - равными нулю. Маска области интереса поэлементно умножается на изначальную маску класса. Далее, производится подсчет всех не нулевых пикселей маски области интереса (N) и суммы вероятностей по всем пикселям маски (M). Вероятность принадлежности рассматриваемого участка (области интереса) к классу определяется как P=M/N. P сравнивается с порогом детекции. Под порогом детекции подразумевается порог, рассчитанный на основании максимизации average F1 для маски объектов. Если P больше порога детекции, участок считается принадлежащим к искомому классу. Если P меньше порога детекции, то участок-кандидат считается участком с ложноположительным срабатыванием, и маска объектов в области соответствующего участка обнуляется. Для каждого изолированного участка маски объектов сохраняется полученная средняя вероятность по участку. Максимальная вероятность по всем изолированным участкам считается вероятностью наличия класса в целом.For each mask of each class, the output of the neural network is a class mask (respectively, the class of anatomical structure or the class of pathology) with probabilities of pixel belonging to the class in the range 0-1. For each class mask, image areas are determined - candidates for belonging to the class. Determination of candidates means simple segmentation by a threshold calculated on the basis of maximization of the pixel-by-pixel F1-score over the entire training dataset, hereinafter referred to as the segmentation threshold. In another implementation, segmentation is performed by a threshold determined within a single image using the ADAPTIVE_THRESH_GAUSSIAN method (an adaptive threshold equal to the sum of the neighborhood values weighted based on a Gaussian window). The result of segmentation is a binary class mask, hereinafter referred to as an object mask. Next (for example, using the opencv library), a search for contours for segments contained in the object mask is performed. Next, for each contour on the object mask, a region of interest mask is generated from the contour, which means that all mask elements lying inside this contour are considered equal to one, and outside this contour - equal to zero. The region of interest mask is multiplied element by element by the original class mask. Next, all non-zero pixels of the region of interest mask (N) and the sum of the probabilities for all pixels of the mask (M) are counted. The probability of belonging of the considered area (region of interest) to the class is defined as P = M / N. P is compared with the detection threshold. The detection threshold is understood to be the threshold calculated on the basis of maximization of average F1 for the object mask. If P is greater than the detection threshold, the area is considered to belong to the desired class. If P is less than the detection threshold, the candidate area is considered to be an area with a false positive response, and the object mask in the area of the corresponding area is reset to zero. For each isolated area of the object mask, the obtained average probability for the area is saved. The maximum probability over all isolated areas is considered the probability of the presence of the class as a whole.
Еще в одном варианте реализации в блоке диагностики патологий постобработка выходных данных содержащейся в нем нейронной сети может выполняться путем предварительной бинаризации маски каждого класса, выделения контуров, представления каждого контура как отдельного объекта детекции, вычисления средней вероятности пикселей изначальной маски внутри каждого контура с последующем сравнением этой вероятности с порогом детекции, вычисленным на основании AUROC кривой по всей обучающей выборке.In another embodiment of the pathology diagnostics block, post-processing of the output data of the neural network contained therein can be performed by preliminary binarization of the mask of each class, extraction of contours, representation of each contour as a separate detection object, calculation of the average probability of the pixels of the initial mask within each contour, followed by comparison of this probability with the detection threshold calculated on the basis of the AUROC curve for the entire training sample.
Указанные подходы позволяют повысить точность диагностики за счет повышения точности работы блоков, входящих в предложенную систему.The indicated approaches allow to increase the accuracy of diagnostics by increasing the accuracy of the operation of the blocks included in the proposed system.
Нейронная сеть, производящая сегментацию, может быть основана на разных подходящих архитектурах, известных специалисту. В качестве неограничивающих примеров нейронная сеть может быть основана на архитектуре UNet или FPN.The neural network performing the segmentation may be based on various suitable architectures known to the person skilled in the art. As non-limiting examples, the neural network may be based on the UNet or FPN architecture.
UNet как источник базовой сегментации UNet as a source of basic segmentation
Архитектура UNet была разработана для сегментации изображений и в настоящее время широко используется в медицинской визуализации благодаря своей универсальности и высокоточным результатам сегментации. Она состоит из пути энкодера с понижающей дискретизацией, который извлекает признаки изображения в разных масштабах и различной сложности, и пути декодера с повышающей дискретизацией, который генерирует результаты сегментации с использованием извлеченных признаков. Основная концепция UNet состоит в том, чтобы использовать замыкающие соединения (skip connections), которые проходят от энкодера к декодеру и идут от ранних уровней пути энкодера, где все еще сохраняются мелкие детали изображения, к поздним уровням пути декодера, которые содержат информацию от грубых признаков, необходимую для распознавания и сегментации объектов. Путь энкодера состоит из четырех блоков, каждый из которых состоит из двух сверточных слоев 3 × 3 × 3, за которым следует слой активации ReLU и слой объединения по максимальному значению (max-pooling) 2 × 2 × 2. Путь декодера состоит из четырех блоков, каждый из которых состоит из слоя повышающей дискретизации, слоя свертки транспонирования 2 × 2 × 2 и двух слоев свертки 3 × 3 × 3, за каждым из которых следует слой ReLU.The UNet architecture was developed for image segmentation and is currently widely used in medical imaging due to its versatility and high-precision segmentation results. It consists of a downsampling encoder path that extracts image features at different scales and complexities, and an upsampling decoder path that generates segmentation results using the extracted features. The basic concept of UNet is to use skip connections that run from the encoder to the decoder, going from the early layers of the encoder path, where fine image details are still preserved, to the later layers of the decoder path, which contain the coarse feature information needed for object recognition and segmentation. The encoder path consists of four blocks, each consisting of two 3×3×3 convolutional layers followed by a ReLU activation layer and a 2×2×2 max-pooling layer. The decoder path consists of four blocks, each consisting of an upsampling layer, a 2×2×2 transpose convolution layer, and two 3×3×3 convolution layers, each followed by a ReLU layer.
UNet может быть обучена с использованием оптимизатора Adam со скоростью обучения 0,0002 и снижением веса 0,0001.UNet can be trained using the Adam optimizer with a learning rate of 0.0002 and a weight decay of 0.0001.
FPN как источник базовой сегментацииFPN as a source of basic segmentation
Архитектура FPN с RPN основана на принципе эффективного извлечения многомасштабных признаков, что позволяет сочетать семантически устойчивые признаки с низким разрешением и семантически слабые признаки с высоким разрешением. Такой подход является эффективным для задачи обнаружения объектов. Компонент FPN извлекает признаки из входного изображения, и во время этого процесса, он имеет определенное сходство с UNet. Часть декодера создает карты объектов с более высоким разрешением путем повышения дискретизации результатов предыдущих слоев, и каждый блок пути декодера генерирует отдельный вывод для обучения сети. Замыкающие соединения состоят из слоев свертки 1 × 1, применяемых к блокам энкодера, которые затем добавляются к соответствующим блокам декодера. В результате FPN стремится генерировать признаки переменного разрешения, которые смогут описать целевой объект. В конкретном примере FPN может обучаться с использованием оптимизатора Adam со скоростью обучения 0,0002 и снижением веса 0,0001.The FPN architecture with RPN is based on the principle of efficient multi-scale feature extraction, which allows combining semantically robust features with low resolution and semantically weak features with high resolution. This approach is effective for the task of object detection. The FPN component extracts features from the input image, and during this process, it has some similarities with UNet. The decoder part creates higher-resolution feature maps by upsampling the results of previous layers, and each block in the decoder path generates a separate output for training the network. Trailing connections consist of 1×1 convolution layers applied to encoder blocks, which are then added to the corresponding decoder blocks. As a result, FPN aims to generate variable-resolution features that can describe the target object. In a specific example, FPN can be trained using the Adam optimizer with a learning rate of 0.0002 and a weight decay of 0.0001.
Обучение нейронных сетейTraining neural networks
В обучении нейронной сети в качестве функции потерь предлагается использовать среднее значение фокусной функции потерь (focal loss) – это вариация кросэнтропии, предназначенная для решения проблемы дисбаланса классов, и функции потерь на основе коэффициента Жаккара (Jaccard loss), особенностью которой является независимость значения ошибки от размера объектов на изображении, причем для каждой ошибки использовались собственные веса каждого класса.In neural network training, it is proposed to use the mean value of the focal loss function as a loss function - this is a variation of crossentropy designed to solve the problem of class imbalance, and the loss function based on the Jaccard coefficient (Jaccard loss), the peculiarity of which is the independence of the error value from the size of objects in the image, and for each error, the proper weights of each class were used.
Метрики, используемые в процессе обученияMetrics used in the learning process
В процессе обучения предлагается использовать следующие метрики: IOU (пересечение относительно объединения), average recall (средняя полнота), precision (точность), F1 и попиксельные recall, precision, F1. Расчет показателей предлагается производить исходя из следующих правил. Для каждого класса нейронной сети выход маски сегментации больше 0,5 оценивается как 1, меньше 0,5 оценивается как 0. Для полученной бинарной маски сегментации и для истинной маски сегментации производится поиск контуров (например, с помощью библиотеки cvcontours). Каждый найденный контур расценивается как отдельный объект, аналогичный bb в задаче детекции. После этого производится расчет соответствующих метрик исходя из критического значения IOU = 0,5.The following metrics are proposed to be used in the training process: IOU (intersection relative to union), average recall, precision, F1, and per-pixel recall, precision, F1. The following rules are proposed to be used to calculate the metrics. For each neural network class, the output of the segmentation mask greater than 0.5 is estimated as 1, less than 0.5 is estimated as 0. The search for contours is performed for the resulting binary segmentation mask and for the true segmentation mask (for example, using the cvcontours library). Each contour found is estimated as a separate object, similar to bb in the detection task. After that, the corresponding metrics are calculated based on the critical value of IOU = 0.5.
Pixel weight в сочетании Focal loss для увеличения точности сегментацииPixel weight combined with Focal loss to increase segmentation accuracy
В одном из вариантов осуществления веса focal loss могут быть направлены на устранение систематического искажения, вызываемого различным числом пикселей, принадлежащих в среднем по выборке каждому классу и фону.In one embodiment, the focal loss weights may be designed to correct for systematic bias caused by the different number of pixels that belong, on average across the sample, to each class and background.
Для этого для focal loss могут быть использованы веса для положительных элементов истинной маски класса и отрицательных элементов маски класса, основанные на частоте пикселей, принадлежащих конкретному классу во всей выборке (далее pixel-weight, веса пикселей). После получения маски сегментации вычисляется focal loss для каждого элемента маски. В случае, если соответствующий элемент истинной маски сегментации является положительным, ошибка, полученная на этом элементе маски сегментации, умножается на pixel-weight положительного примера данного класса. В случае, если элемент маски сегментации является отрицательным, ошибка, полученная на этом элементе маски сегментации, умножается на pixel-weight отрицательного примера данного класса. После умножения на веса производится усреднение ошибки по всем элементам взвешенной ошибки. Таким образом, увеличивается точность сегментации.For this purpose, the focal loss can use weights for positive elements of the true class mask and negative elements of the class mask based on the frequency of pixels belonging to a specific class in the entire sample (hereinafter pixel-weight, pixel weights). After obtaining the segmentation mask, the focal loss is calculated for each mask element. If the corresponding element of the true segmentation mask is positive, the error obtained on this segmentation mask element is multiplied by the pixel-weight of the positive example of this class. If the segmentation mask element is negative, the error obtained on this segmentation mask element is multiplied by the pixel-weight of the negative example of this class. After multiplying by the weights, the error is averaged over all elements of the weighted error. Thus, the segmentation accuracy increases.
Class-weight в сочетании с Jaccard loss для увеличения точности сегментацииClass-weight combined with Jaccard loss to improve segmentation accuracy
В одном из вариантов осуществления веса Jaccard loss могут быть направлены на устранение систематического дисбаланса, вызванного тем, что не на всех изображениях присутствуют классы патологий, в отличии от классов нормальной анатомии.In one embodiment, the Jaccard loss weights may be designed to correct for the systematic imbalance caused by the fact that not all images contain pathological classes, as opposed to normal anatomy classes.
Для этого для каждой ошибки в Jaccard loss предлагается использовать собственные веса каждого класса. Классы патологии в настоящем изобретении не противопоставляются друг другу. Классы нормальной анатомии в настоящем изобретении не противопоставляются друг другу.For this purpose, for each error in Jaccard loss, it is proposed to use the proper weights of each class. The pathology classes in the present invention are not opposed to each other. The normal anatomy classes in the present invention are not opposed to each other.
Если для некоторого изображения в истинной маске некоторого класса присутствуют положительные элементы, то всему экземпляру присваивается положительная метка класса, если отсутствуют - отрицательная метка класса. На основе частоты положительных и отрицательных меток класса для всех изображений в выборке по каждому классу, на основании обратной частоты меток класса определяются веса классов (class-weight) положительной и отрицательной метки класса. После получения масок сегментации для каждого класса для каждой маски вычисляется Jaccard loss. Если соответствующая изображению истинная метка класса является положительной, то ошибка соответствующего класса умножается на class-weight для положительного экземпляра класса, если отрицательной – на class-weight для отрицательного экземпляра класса, соответственно. Итоговая ошибка усредняется. Таким образом, увеличивается точность сегментации.If for some image in the true mask of some class there are positive elements, then the whole instance is assigned a positive class label, if absent - a negative class label. Based on the frequency of positive and negative class labels for all images in the sample for each class, based on the inverse frequency of class labels, class weights (class-weight) of the positive and negative class labels are determined. After obtaining the segmentation masks for each class, Jaccard loss is calculated for each mask. If the true class label corresponding to the image is positive, then the error of the corresponding class is multiplied by the class-weight for the positive instance of the class, if negative - by the class-weight for the negative instance of the class, respectively. The resulting error is averaged. Thus, the accuracy of segmentation increases.
Динамическая гиперплоскость оптимизации параметров сетиDynamic hyperplane of network parameter optimization
Выше в варианте реализации с pixel-weight для focal loss стартовое значение весов основывалось на частоте пикселей во всей выборке. Использование этого подхода даже для небольшой представленности класса на изображении обеспечивает высокое значение попиксельной полноты (recall) и средней полноты (average recall). Недостатком такого выбора весов является то, что в некоторых случаях нейронная сеть может быстро сходиться к состоянию выделения большого количества ложноположительных участков изображения. Для решения этой проблемы предлагается каждую эпоху видоизменять pixel-weight для достижения баланса между средней полнотой (average recall) и средней точностью (average precision) по следующему принципу: pixel-weight для положительного пикселя умножается на результат деления (average F1)/(average recall), для отрицательного пикселя – на результат деления (average F1)/(average precision), если отношение между average precision и average recall выходит за пределы от 0,9 до 1,1. Указанные соотношения можно представить в следующем виде:In the above implementation with pixel-weight for focal loss, the starting value of the weights was based on the pixel frequency in the entire sample. Using this approach even for a small representation of a class in an image provides a high value of per-pixel recall and average recall. The disadvantage of this choice of weights is that in some cases the neural network can quickly converge to the state of highlighting a large number of false positive areas of the image. To solve this problem, it is proposed to modify the pixel-weight every epoch to achieve a balance between the average recall and average precision according to the following principle: the pixel-weight for a positive pixel is multiplied by the result of dividing (average F1)/(average recall), for a negative pixel - by the result of dividing (average F1)/(average precision), if the ratio between average precision and average recall is outside the range from 0.9 to 1.1. These ratios can be represented as follows:
Positive_PWPositive_PW nn +1 +1 = Positive_PW= Positive_PW nn * (average_F1/average_recall) * (average_F1/average_recall)
Negative_PWNegative_PW n+1 n+1 = Negative_PW= Negative_PW nn * (average_F1/average_precision) * (average_F1/average_precision)
где Positive_PW – это pixel-weight для положительного пикселя, Negative_PW – это pixel-weight для отрицательного пикселя, n – номер эпохи.where Positive_PW is the pixel-weight for a positive pixel, Negative_PW is the pixel-weight for a negative pixel, n is the epoch number.
Тем самым, обеспечивается повышение точности работы нейронной сети за счет устранения ложноположительных результатов при сохранении высоких метрик, обеспечиваемых подходом pixel-weight для focal loss. Соответственно, повышается и точность диагностики (определения, обнаружения) патологий на изображениях.This ensures an increase in the accuracy of the neural network by eliminating false positive results while maintaining high metrics provided by the pixel-weight approach for focal loss. Accordingly, the accuracy of diagnostics (definition, detection) of pathologies in images also increases.
Пример осуществленияExample of implementation
Предложенная система была проверена на базе данных, содержащей 6139 рентгеновских изображений легких. Из этого набора 75% снимков использовались для обучения, а 25% для тестирования. The proposed system was tested on a database containing 6139 lung X-ray images. Of this set, 75% of the images were used for training and 25% for testing.
Возраст пациентов не учитывался. Наиболее частым диагнозами была кардиомегалия, пневмония, гидроторакс, соответствующие наличию признаков из списка: кардиомегалия, плевральный выпот, инфильтрация. The age of patients was not taken into account. The most common diagnoses were cardiomegaly, pneumonia, hydrothorax, corresponding to the presence of signs from the list: cardiomegaly, pleural effusion, infiltration.
Параметры отдельных компонентов системы определялись следующим образом. The parameters of individual components of the system were determined as follows.
Сеть обучалась в режиме multilabel – segmentation, к выходу сети применялась активация sigmoid c использованием функции ошибки (потерь) Jaccard loss и focal loss с последующим вычислением их среднего, с предварительным применением pixel-weight и class-weight, с коррекцией pixel-weight каждую эпоху для оптимизации меток детекции.The network was trained in the multilabel-segmentation mode, sigmoid activation was applied to the network output using the error (loss) function Jaccard loss and focal loss with subsequent calculation of their average, with preliminary application of pixel-weight and class-weight, with correction of pixel-weight each epoch to optimize detection labels.
Скорость обучения для моделей была выбрана равной 0,00001. Фреймворк был обучен на сервере, оснащенном графическим процессором (GPU) Tesla V100-SXM2-80 ГБ, 80-ядерным центральным процессором (CPU) Intel(R) Xeon(R) E5-2698 v4 @ 2,20 ГГц, оперативной памятью (RAM) 503 ГБ.The learning rate for the models was chosen to be 0.00001. The framework was trained on a server equipped with a Tesla V100-SXM2-80GB graphics processing unit (GPU), an 80-core Intel(R) Xeon(R) E5-2698 v4 central processing unit (CPU) @ 2.20 GHz, and 503GB of RAM.
Эффективность системы оценивалась путем оценки точности показателя IOU для масок сегментации и вычисленным на основе сегментации меткам классов, по методике, описанной ранее, с использованием таких метрик классификации, как recall, precision, F1-score. Полученные результаты были сопоставлены с другими системами и с человеческими оценками и было выявлено, что предложенная система может успешно определять патологии легких, демонстрируя почти по всем показателям повышенную точность и скорость диагностики. При наличии механизма внешней коррекции удается дополнительно повысить точность диагностики, при этом помощь внешнего специалиста требуется только в случаях, когда существует вероятность неверной автоматической постановки диагноза.The efficiency of the system was assessed by assessing the accuracy of the IOU indicator for segmentation masks and class labels calculated based on segmentation, according to the method described earlier, using such classification metrics as recall, precision, F1-score. The results were compared with other systems and with human assessments, and it was found that the proposed system can successfully identify lung pathologies, demonstrating increased accuracy and speed of diagnosis for almost all indicators. With the presence of an external correction mechanism, it is possible to further increase the accuracy of diagnosis, while the help of an external specialist is required only in cases where there is a possibility of an incorrect automatic diagnosis.
ПрименениеApplication
Системы и способы согласно настоящему изобретению можно использовать для обработки диагностических медицинских изображений, содержащих область легких, с целью выявления в них признаков туберкулеза, новообразований, ателектаза, пневмоторакса, перелома ребер, отека легких, остаточных изменений после туберкулеза и иных заболеваний.The systems and methods according to the present invention can be used to process diagnostic medical images containing the lung area in order to detect signs of tuberculosis, neoplasms, atelectasis, pneumothorax, rib fractures, pulmonary edema, residual changes after tuberculosis and other diseases.
Дополнительные особенности реализацииAdditional implementation features
Несмотря на то, что в данном документе может быть указано, что данные передаются/отправляются или принимаются/получаются человеком (например, медицинским специалистом, врачом, экспертом), специалист в данной области техники должен понимать, что такое указание используется исключительно в целях упрощения описания, тогда как на самом деле подразумевается, что данные передаются/отправляются или принимаются/получаются соответствующим устройством, которым пользуется и/или управляет этот человек.Although this document may indicate that data is transmitted/sent or received/received by a person (e.g., a medical professional, a doctor, an expert), one skilled in the art should understand that such indication is used solely for the purpose of simplifying the description, whereas in fact it is meant that the data is transmitted/sent or received/received by the corresponding device used and/or controlled by such person.
Один или более описанных в настоящем документе блоков или устройств передачи (передатчиков) и один или более блоков или устройств приема (приемников) физически могут быть реализованы в одном и том же блоке или устройстве приемопередачи или в разных блоках или устройствах.One or more of the transmission units or devices (transmitters) and one or more reception units or devices (receivers) described herein may be physically implemented in the same transmission/reception unit or device or in different units or devices.
Устройством или блоком передачи в данном документе для упрощения описания может называться устройство или блок, имеющий функции не только передачи, но и приема данных, информации и/или сигналов. Аналогичным образом, устройство или блок приема может также заключать в себе функции передачи данных, информации и/или сигналов.In this document, a device or unit for transmitting may be referred to as a device or unit having functions of not only transmitting but also receiving data, information and/or signals for ease of description. Similarly, a device or unit for receiving may also include functions of transmitting data, information and/or signals.
Различные иллюстративные блоки и модули, описанные в связи с раскрытием сущности в данном документе, могут реализовываться или выполняться с помощью процессора общего назначения, процессора цифровых сигналов (DSP), специализированной интегральной схемы (ASIC), программируемой пользователем вентильной матрицы (FPGA) или другого программируемого логического устройства (PLD), дискретного логического элемента или транзисторной логики, дискретных аппаратных компонентов либо любой комбинации вышеозначенного, предназначенной для того, чтобы выполнять описанные в данном документе функции. Процессор общего назначения может представлять собой микропроцессор, но в альтернативном варианте, процессор может представлять собой любой традиционный процессор, контроллер, микроконтроллер или конечный автомат. Процессор также может реализовываться как комбинация вычислительных устройств (к примеру, комбинация DSP и микропроцессора, несколько микропроцессоров, один или более микропроцессоров вместе с DSP-ядром либо любая другая подобная конфигурация).The various illustrative blocks and modules described in connection with the disclosure herein may be implemented or executed by a general-purpose processor, a digital signal processor (DSP), an application-specific integrated circuit (ASIC), a field-programmable gate array (FPGA) or other programmable logic device (PLD), discrete logic element or transistor logic, discrete hardware components, or any combination of the foregoing designed to perform the functions described herein. A general-purpose processor may be a microprocessor, but in the alternative, the processor may be any conventional processor, controller, microcontroller, or state machine. A processor may also be implemented as a combination of computing devices (e.g., a combination of a DSP and a microprocessor, multiple microprocessors, one or more microprocessors in conjunction with a DSP core, or any other such configuration).
Некоторые блоки по отдельности или вместе могут представлять собой, например, компьютер, и включать в себя процессор, который сконфигурирован для вызова и выполнения компьютерных программ из памяти для выполнения этапов способа или функций блоков в соответствии с вариантами осуществления настоящего изобретения. Согласно вариантам осуществления, устройство может дополнительно включать в себя память. Процессор может вызывать и выполнять компьютерные программы из памяти для выполнения способа. Память может быть отдельным устройством, независимым от процессора, или может быть интегрирована в процессор. Память может хранить код, инструкции, команды и/или данные для исполнения на наборе из одного или более процессоров описанного устройства. Коды, инструкции, команды могут предписывать процессору выполнять этапы способа или функции устройства.Some units individually or together may represent, for example, a computer, and include a processor that is configured to call and execute computer programs from the memory to perform the steps of the method or the functions of the units according to the embodiments of the present invention. According to the embodiments, the device may further include a memory. The processor may call and execute computer programs from the memory to perform the method. The memory may be a separate device independent of the processor, or may be integrated into the processor. The memory may store code, instructions, commands and/or data for execution on a set of one or more processors of the described device. The codes, instructions, commands may cause the processor to perform the steps of the method or the functions of the device.
Функции, описанные в данном документе, могут реализовываться в аппаратном обеспечении, программном обеспечении, выполняемом посредством одного или более процессоров, микропрограммном обеспечении или в любой комбинации вышеозначенного. Аппаратные и программные средства, реализующие функции, также могут физически находиться в различных позициях, в том числе согласно такому распределению, что части функций реализуются в различных физических местоположениях, то есть может выполняться распределенная обработка или распределенные вычисления.The functions described in this document may be implemented in hardware, software executed by one or more processors, firmware, or any combination thereof. The hardware and software implementing the functions may also be physically located in different locations, including in a distribution such that parts of the functions are implemented in different physical locations, i.e., distributed processing or distributed computing may be performed.
При необходимости (например, в случае если велик объем данных и/или вычислений, которые необходимо выполнить в отношении этих данных), может производиться многопоточная обработка данных, которая в простом представлении может выражаться в том, что все множество подлежащих обработке данных разделяется на набор подмножеств, и каждое ядро процессора выполняет обработку в отношении назначенного для него подмножества данных.If necessary (for example, if the volume of data and/or calculations that need to be performed on this data is large), multi-threaded data processing can be performed, which in a simple representation can be expressed in the fact that the entire set of data to be processed is divided into a set of subsets, and each processor core performs processing on the subset of data assigned to it.
Вышеупомянутая память может быть энергозависимой или энергонезависимой памятью или может включать в себя как энергозависимую, так и энергонезависимую память. Специалисту в области техники должно быть также понятно, что, когда речь идет о памяти и о хранении данных, программ, кодов, инструкций, команд и т.п., подразумевается наличие машиночитаемого (или компьютерно-читаемого, процессорно-читаемого) запоминающего носителя. Машиночитаемые носители данных включают в себя как некратковременные компьютерные носители хранения данных, так и среду связи, включающую в себя любую передающую среду, которая упрощает перемещение компьютерной программы или ее части из одного места в другое. Некратковременный машиночитаемый запоминающий носитель может представлять собой любой доступный носитель, который может использоваться для того, чтобы переносить или сохранять требуемое средство программного кода в форме инструкций или структур данных, и к которому можно осуществлять доступ посредством компьютера, процессора или иного устройства обработки общего назначения или специального назначения.The above-mentioned memory may be volatile or nonvolatile memory or may include both volatile and nonvolatile memory. It should also be clear to a person skilled in the art that when talking about memory and storing data, programs, codes, instructions, commands, etc., it is implied that there is a machine-readable (or computer-readable, processor-readable) storage medium. Machine-readable storage media include both non-transitory computer storage media and communication media, including any transmission medium that facilitates the movement of a computer program or a portion thereof from one place to another. A non-transitory machine-readable storage medium may be any available medium that can be used to carry or store the desired program code means in the form of instructions or data structures and that can be accessed by a computer, processor or other general-purpose or special-purpose processing device.
В качестве примера, а не ограничения, машиночитаемые носители могут содержать постоянное запоминающее устройство (ROM), программируемое постоянное запоминающее устройство (PROM), стираемое программируемое постоянное запоминающее устройство (EPROM), электронно-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, оперативную память (RAM), статическую память с произвольным доступом (SRAM), динамическую память с произвольным доступом (DRAM), синхронную динамическую память с произвольным доступом (SDRAM), синхронную динамическую память с произвольной выборкой с двойной скоростью передачи данных (DDR SDRAM), синхронную динамическую память с произвольной выборкой с повышенной скоростью (ESDRAM), DRAM с синхронной линией связи (SLDRAM) и оперативную память с шиной прямого доступа (DR RAM), регистр, кэш-память, полупроводниковые запоминающие устройства, магнитные носители, такие как внутренние жесткие диски и съемные диски, магнитооптические носители и оптические носители, такие как диски CD-ROM и цифровые универсальные диски (DVD), а также любые другие известные в уровне техники носители данных.By way of example, and not limitation, computer-readable media may comprise read-only memory (ROM), programmable read-only memory (PROM), erasable programmable read-only memory (EPROM), electronically erasable programmable read-only memory (EEPROM), flash memory, random access memory (RAM), static random access memory (SRAM), dynamic random access memory (DRAM), synchronous dynamic random access memory (SDRAM), double data rate synchronous dynamic random access memory (DDR SDRAM), increased speed synchronous dynamic random access memory (ESDRAM), synchronous line DRAM (SLDRAM), and direct access bus random access memory (DR RAM), register, cache memory, semiconductor memories, magnetic media such as internal hard disks and removable disks, magneto-optical media, and optical media such as CD-ROMs and digital versatile discs (DVD), as well as any other data carriers known in the prior art.
Информация и сигналы, описанные в данном документе, могут представляться с помощью любой из множества различных технологий. Например, данные, инструкции, команды, информация, сигналы, биты, символы и элементарные сигналы, которые могут приводиться в качестве примера в вышеприведенном описании, могут представляться посредством напряжений, токов, электромагнитных волн, магнитных полей или частиц, оптических полей или частиц либо любой комбинации вышеозначенного, если это применимо к настоящему изобретению.The information and signals described herein may be represented by any of a variety of different technologies. For example, data, instructions, commands, information, signals, bits, symbols, and signal elements, which may be exemplified in the above description, may be represented by voltages, currents, electromagnetic waves, magnetic fields or particles, optical fields or particles, or any combination thereof, as applicable to the present invention.
По меньшей мере один из этапов в способе или блоков в устройстве может использовать модель искусственного интеллекта (AI) для выполнения соответствующих операций. Функция, связанная с AI, может выполняться через процессор и энергонезависимую и/или энергозависимую память.At least one of the steps in the method or units in the device may use an artificial intelligence (AI) model to perform the corresponding operations. The function associated with AI may be performed via a processor and non-volatile and/or volatile memory.
Процессор может включать в себя один или более процессоров. В то же время, один или более процессоров могут быть процессором общего назначения, например центральным процессором (CPU), прикладным процессором (AP) и т.п., блоком обработки только графики, таким как графический процессор (GPU), визуальный процессор (VPU), и/или специализированным процессором AI, таким как нейронный процессор (NPU).The processor may include one or more processors. At the same time, the one or more processors may be a general-purpose processor, such as a central processing unit (CPU), an application processor (AP), etc., a graphics-only processing unit, such as a graphics processing unit (GPU), a visual processing unit (VPU), and/or a specialized AI processor, such as a neural processing unit (NPU).
Один или более процессоров управляют обработкой входных данных в соответствии с предварительно определенным правилом работы или моделью искусственного интеллекта (AI), хранящейся в энергонезависимой памяти и/или энергозависимой памяти. Предварительно определенное правило работы или модель искусственного интеллекта могут быть получены путем обучения. При этом процессор может выполнять операцию предварительной обработки данных для преобразования в форму, подходящую для использования в качестве входных данных для модели искусственного интеллекта.One or more processors control the processing of input data in accordance with a predetermined operating rule or an artificial intelligence (AI) model stored in non-volatile memory and/or volatile memory. The predetermined operating rule or an AI model may be obtained by training. In this case, the processor may perform a pre-processing operation of the data to transform it into a form suitable for use as input data for the AI model.
«Получены путем обучения» означает, что посредством применения алгоритма обучения к обучаемой модели искусственного интеллекта с использованием множества обучающих данных создается предварительно определенное правило работы или модель AI с желаемой характеристикой. Обучение может выполняться на самом устройстве, в котором выполняется AI согласно варианту осуществления, и/или может быть реализовано через отдельный сервер/систему."Obtained by training" means that by applying a training algorithm to a trainable artificial intelligence model using a plurality of training data, a predetermined operating rule or AI model with a desired characteristic is created. The training may be performed on the device itself, in which the AI is executed according to the embodiment, and/or may be implemented through a separate server/system.
Модель искусственного интеллекта может включать в себя множество слоев нейронной сети. Каждый из множества слоев нейронной сети включает в себя множество весовых значений (коэффициентов) и выполняет рабочую операцию для данного слоя путем вычисления с применением множества весовых значений данного слоя в отношении входных данных или результата вычисления предыдущего слоя.An artificial intelligence model may include multiple neural network layers. Each of the multiple neural network layers includes multiple weight values (coefficients) and performs a work operation for that layer by calculating using the multiple weight values of that layer with respect to the input data or the calculation result of the previous layer.
Примеры нейронных сетей включают, помимо прочего, сверточную нейронную сеть (CNN), глубокую нейронную сеть (DNN), рекуррентную нейронную сеть (RNN), ограниченную машину Больцмана (RBM), глубокую сеть доверия (DBN), двунаправленную рекуррентную глубокую нейронную сеть (BRDNN), генеративно-состязательные сети (GAN) и глубокие Q-сети.Examples of neural networks include, but are not limited to, convolutional neural network (CNN), deep neural network (DNN), recurrent neural network (RNN), restricted Boltzmann machine (RBM), deep belief network (DBN), bidirectional recurrent deep neural network (BRDNN), generative adversarial networks (GANs), and deep Q-networks.
Алгоритм обучения — это метод обучения предварительно определенного целевого устройства (например, нейронной сети на базе GPU или NPU) с использованием множества обучающих данных, чтобы вызывать, разрешать или управлять целевым устройством для выполнения определения или прогнозирования. Примеры алгоритмов обучения включают, но не ограничиваются ими, обучение с учителем, обучение без учителя, обучение с частичным привлечением учителя или обучение с подкреплением.A learning algorithm is a method for training a predefined target device (e.g., a GPU-based neural network or NPU) using a set of training data to cause, enable, or control the target device to make a determination or prediction. Examples of learning algorithms include, but are not limited to, supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning.
Следует понимать, что хотя в настоящем документе для описания различных блоков, модулей, сетей, элементов, компонентов, областей, слоев и/или секций, могут использоваться такие термины, как "первый", "второй", "третий" и т.п., эти блоки, модули, сети, элементы, компоненты, области, слои и/или секции не должны ограничиваться этими терминами. Эти термины используются только для того, чтобы отличить один блок, модуль, сеть, элемент, компонент, область, слой или секцию от другого блока, модуля, сети, элемента, компонента, области, слоя или секции. Так, первый блок, модуль, сеть, элемент, компонент, область, слой или секция может быть назван вторым блоком, модулем, сетью, элементом, компонентом, областью, слоем или секцией без выхода за рамки объема настоящего изобретения. В настоящем описании термин "и/или" включает любые и все комбинации из одной или более из соответствующих перечисленных позиций. Элементы, упомянутые в единственном числе, не исключают множественности элементов, если отдельно не указано иное.It should be understood that although terms such as "first", "second", "third", etc. may be used herein to describe various blocks, modules, networks, elements, components, regions, layers and/or sections, these blocks, modules, networks, elements, components, regions, layers and/or sections should not be limited by these terms. These terms are used only to distinguish one block, module, network, element, component, region, layer or section from another block, module, network, element, component, region, layer or section. Thus, a first block, module, network, element, component, region, layer or section may be referred to as a second block, module, network, element, component, region, layer or section without departing from the scope of the present invention. As used herein, the term "and/or" includes any and all combinations of one or more of the corresponding listed items. Elements mentioned in the singular do not exclude a plurality of elements unless otherwise specifically indicated.
Функциональность элемента, указанного в описании или формуле изобретения как единый элемент, может быть реализована на практике посредством нескольких компонентов устройства, и наоборот, функциональность элементов, указанных в описании или формуле изобретения как несколько отдельных элементов, может быть реализована на практике посредством единого компонента.The functionality of an element indicated in the description or claims as a single element may be implemented in practice by means of several components of the device, and vice versa, the functionality of elements indicated in the description or claims as several separate elements may be implemented in practice by means of a single component.
В одном из вариантов осуществления некоторые или все элементы/блоки/модули предложенного устройства находятся в общем корпусе, могут быть размещены на одной раме/конструкции/печатной плате/кристалле и связаны друг с другом конструктивно посредством монтажных (сборочных) операций и функционально посредством линий связи. Упомянутые линии или каналы связи, если не указано иное, являются типовыми, известными специалистам линиями связи, материальная реализация которых не требует творческих усилий. Линией связи может быть провод, набор проводов, шина, дорожка, беспроводная линия связи (индуктивная, радиочастотная, инфракрасная, ультразвуковая и т.д.). Протоколы связи по линиям связи известны специалистам и не раскрываются отдельно.In one embodiment, some or all elements/blocks/modules of the proposed device are in a common housing, can be placed on a single frame/structure/printed circuit board/crystal and are structurally connected to each other by means of assembly operations and functionally by means of communication lines. The said communication lines or channels, unless otherwise specified, are typical communication lines known to specialists, the material implementation of which does not require creative efforts. A communication line can be a wire, a set of wires, a bus, a track, a wireless communication line (inductive, radio frequency, infrared, ultrasonic, etc.). Communication protocols over communication lines are known to specialists and are not disclosed separately.
Под функциональной связью элементов следует понимать связь, обеспечивающую корректное взаимодействие этих элементов друг с другом и реализацию той или иной функциональности элементов. Частными примерами функциональной связи может быть связь с возможностью обмена информацией, связь с возможностью передачи электрического тока, связь с возможностью передачи механического движения, связь с возможностью передачи света, звука, электромагнитных или механических колебаний и т.д. Конкретный вид функциональной связи определяется характером взаимодействия упомянутых элементов, и, если не указано иное, обеспечивается широко известными средствами, используя широко известные в технике принципы.The functional connection of elements should be understood as a connection that ensures the correct interaction of these elements with each other and the implementation of one or another functionality of the elements. Particular examples of a functional connection may be a connection with the ability to exchange information, a connection with the ability to transmit electric current, a connection with the ability to transmit mechanical movement, a connection with the ability to transmit light, sound, electromagnetic or mechanical vibrations, etc. The specific type of functional connection is determined by the nature of the interaction of the mentioned elements, and, unless otherwise specified, is ensured by widely known means, using widely known principles in technology.
Несмотря на то, что примерные варианты осуществления были подробно описаны и показаны на сопроводительных чертежах, следует понимать, что такие варианты осуществления являются лишь иллюстративными и не предназначены ограничивать настоящее изобретение, и что данное изобретение не должно ограничиваться конкретными показанными и описанными компоновками и конструкциями, поскольку специалисту в данной области техники на основе информации, изложенной в описании, и знаний уровня техники могут быть очевидны различные другие модификации и варианты осуществления изобретения, не выходящие за пределы сущности и объема данного изобретения.Although exemplary embodiments have been described in detail and shown in the accompanying drawings, it should be understood that such embodiments are illustrative only and are not intended to limit the present invention, and that the present invention should not be limited to the specific arrangements and structures shown and described, since various other modifications and embodiments of the invention may be apparent to one skilled in the art from the information set forth in the description and knowledge of the prior art without departing from the spirit and scope of the present invention.
Claims (8)
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2023136361A RU2023136361A (en) | 2025-06-30 |
| RU2845119C2 true RU2845119C2 (en) | 2025-08-13 |
Family
ID=
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10755413B1 (en) * | 2020-02-24 | 2020-08-25 | Qure.Ai Technologies Private Limited | Method and system for medical imaging evaluation |
| WO2022178329A1 (en) * | 2021-02-22 | 2022-08-25 | The Johns Hopkins University | Methods and related aspects for classifying lesions in medical images |
| CN116883660A (en) * | 2023-07-12 | 2023-10-13 | 太原理工大学 | Honeycomb lung segmentation method based on class imbalance and multi-stage downsampling feature fusion |
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10755413B1 (en) * | 2020-02-24 | 2020-08-25 | Qure.Ai Technologies Private Limited | Method and system for medical imaging evaluation |
| WO2022178329A1 (en) * | 2021-02-22 | 2022-08-25 | The Johns Hopkins University | Methods and related aspects for classifying lesions in medical images |
| CN116883660A (en) * | 2023-07-12 | 2023-10-13 | 太原理工大学 | Honeycomb lung segmentation method based on class imbalance and multi-stage downsampling feature fusion |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10691980B1 (en) | Multi-task learning for chest X-ray abnormality classification | |
| US20230281809A1 (en) | Connected machine-learning models with joint training for lesion detection | |
| CN111325739B (en) | Method and device for detecting lung focus and training method of image detection model | |
| US10499857B1 (en) | Medical protocol change in real-time imaging | |
| Murakami et al. | Automatic identification of bone erosions in rheumatoid arthritis from hand radiographs based on deep convolutional neural network | |
| CN110599448A (en) | Migratory learning lung lesion tissue detection system based on MaskScoring R-CNN network | |
| Sreelakshmy et al. | [Retracted] An automated deep learning model for the cerebellum segmentation from fetal brain images | |
| US11471096B2 (en) | Automatic computerized joint segmentation and inflammation quantification in MRI | |
| Aslan | A robust semantic lung segmentation study for CNN-based COVID-19 diagnosis | |
| Chudzik et al. | Exudates segmentation using fully convolutional neural network and auxiliary codebook | |
| Bhuiyan et al. | Online learning for X-ray, CT or MRI | |
| Banerjee et al. | A CADe system for gliomas in brain MRI using convolutional neural networks | |
| Gordaliza et al. | Translational lung imaging analysis through disentangled representations | |
| CN113379770B (en) | Construction method of nasopharyngeal carcinoma MR image segmentation network, image segmentation method and device | |
| RU2845119C2 (en) | System and method for determining pulmonary pathologies from x-ray images | |
| RU2840009C1 (en) | System and method for detecting pulmonary pathologies from x-ray images | |
| RU2840011C1 (en) | System and method for diagnosing pulmonary pathologies from x-ray images | |
| CN113298807A (en) | Computed tomography image processing method and device | |
| Delmoral et al. | Segmentation of pathological liver tissue with dilated fully convolutional networks: A preliminary study | |
| CN112862787B (en) | CTA image data processing method, device and storage medium | |
| CN112862785B (en) | CTA image data identification method, device and storage medium | |
| CN112862786B (en) | CTA image data processing method, device and storage medium | |
| RU2825958C1 (en) | System and method for diagnosing pathologies of paranasal sinuses by x-ray images | |
| Bellary et al. | The MRI knee pain classification using CNN algorithm and segmentation using clustering algorithm | |
| RU2828554C1 (en) | System and method for diagnosing sinusitis by x-ray images |