[go: up one dir, main page]

RU2828554C1 - System and method for diagnosing sinusitis by x-ray images - Google Patents

System and method for diagnosing sinusitis by x-ray images Download PDF

Info

Publication number
RU2828554C1
RU2828554C1 RU2023135721A RU2023135721A RU2828554C1 RU 2828554 C1 RU2828554 C1 RU 2828554C1 RU 2023135721 A RU2023135721 A RU 2023135721A RU 2023135721 A RU2023135721 A RU 2023135721A RU 2828554 C1 RU2828554 C1 RU 2828554C1
Authority
RU
Russia
Prior art keywords
class
unit
pathology
mask
segmentation
Prior art date
Application number
RU2023135721A
Other languages
Russian (ru)
Inventor
Александр Вадимович Скворцов
Шамиль Ринатович Хастиев
Андрей Андреевич Новиков
Айнур Фанович Каримов
Original Assignee
Автономная некоммерческая организация высшего образования "Университет Иннополис"
Filing date
Publication date
Application filed by Автономная некоммерческая организация высшего образования "Университет Иннополис" filed Critical Автономная некоммерческая организация высшего образования "Университет Иннополис"
Application granted granted Critical
Publication of RU2828554C1 publication Critical patent/RU2828554C1/en

Links

Abstract

FIELD: image processing.
SUBSTANCE: group of inventions relates to image processing and more specifically to support of medical decision making based on analysis of medical images. Disclosed is a system for determining pathologies of paranasal sinuses by X-ray images for implementing the method, which comprises a unit for obtaining X-ray images of the paranasal sinuses; pathology diagnostic unit, which, using a segmentation-based neural network, detects on the obtained image areas of reduced pneumatisation and areas with fluid in the paranasal sinuses; an anatomical structure segmentation unit, which determines on the obtained image areas with high pneumatisation and external contours of each paranasal sinus using a neural network based on segmentation; pathology localization unit, which determines, by combining the output data from the pathology diagnostic unit and the output data from the anatomical structures segmentation unit, the pathologies belonging to a particular sinus; and a unit for transmitting a report to a device requesting diagnostics, wherein when training neural networks, a focal loss function and pixel weight are used, which are weights for positive pixels of the true class mask and negative pixels of the true class mask, based on the frequency of pixels belonging to a specific class in the entire sample.
EFFECT: group of inventions provides higher diagnostic accuracy and higher automation of processing.
6 cl, 2 dwg

Description

Область техники, к которой относится изобретениеField of technology to which the invention relates

Настоящее изобретение относится к области обработки изображений, и, более конкретно, к поддержке принятия врачебных решений на основе анализа медицинских изображений.The present invention relates to the field of image processing, and more particularly to supporting medical decision making based on the analysis of medical images.

Уровень техникиState of the art

Синусит — это воспаление оболочек, выстилающих околоносовые пазухи. Синуситы являются одними из наиболее распространенных заболеваний в клинической практике, ежегодно поражая более 15% населения. Их диагностика обычно основывается на сочетании клинических и рентгенологических исследований. Хотя компьютерная томография (КТ) является предпочтительным методом визуализации при синусите, поскольку она обеспечивает максимальную общую анатомическую детализацию околоносовых пазух, использование рентгенографических изображений, таких как снимки Уотерса и Колдуэлла, является традиционным методом оценки придаточных пазух носа и по-прежнему широко используется в качестве метода визуализации при подозрении на синусит из-за доступности, простоты и сравнительно низкой стоимости исследования, а также низкой дозы радиации. Рентгенологические исследования направлены на качественную оценку состояния слизистой придаточных пазух носа и оценку количества жидкости в придаточной пазухе носа, что позволяет в сочетании с клиническими признаками поставить диагноз острого или хронического синусита. Sinusitis is an inflammation of the membranes lining the paranasal sinuses. Sinusitis is one of the most common diseases in clinical practice, affecting more than 15% of the population annually. Its diagnosis is usually based on a combination of clinical and radiographic examinations. Although computed tomography (CT) is the preferred imaging modality for sinusitis because it provides the greatest gross anatomical detail of the paranasal sinuses, the use of radiographic images such as Waters and Caldwell images has been the traditional method of evaluating the paranasal sinuses and remains widely used as an imaging modality when sinusitis is suspected due to the availability, simplicity, and relatively low cost of the examination, as well as the low radiation dose. Radiographic examinations are aimed at qualitatively assessing the condition of the paranasal sinus mucosa and assessing the amount of fluid in the paranasal sinus, which, in combination with clinical features, allows for a diagnosis of acute or chronic sinusitis.

В последние годы с широким развитием информационных технологий в медицине активно внедряются цифровые методы обработки данных, в том числе технологии искусственного интеллекта (ИИ) для поддержки принятия врачебных решений. Например, в известных способах современной ИИ-диагностики нейронная сеть, которая была предварительно обучена на размеченном наборе изображений, получает оцифрованное рентгеновское изображение исследуемой области, анализирует его и осуществляет предсказание того, имеется ли у данного пациента патология, помогая тем самым врачу принять оптимальное взвешенное решение.In recent years, with the widespread development of information technology in medicine, digital data processing methods have been actively introduced, including artificial intelligence (AI) technologies to support medical decision-making. For example, in the known methods of modern AI diagnostics, a neural network that has been pre-trained on a labeled set of images receives a digitized X-ray image of the area being examined, analyzes it and predicts whether the patient has a pathology, thereby helping the doctor make an optimal, balanced decision.

Известные способы диагностики синуситов с применением ИИ основываются на сочетании нейронной сети - детектора с нейронной сетью - классификатором для двумерных изображений. Это ограничивает точность используемых систем и требует большого количества данных для их обучения.Known methods for diagnosing sinusitis using AI are based on a combination of a neural network detector with a neural network classifier for two-dimensional images. This limits the accuracy of the systems used and requires a large amount of data for their training.

Также известны примеры сетей, сочетающих сегментацию целевой области придаточных пазух носа как единого класса с последующей передачей целевой области и её классификацией на наличие патологии и регрессией, выявляющей уровень снижения пневматизации пазух. Подобные способы автоматической диагностики патологий придаточных пазух носа требуют значительного количества изображений для обучения нейронной сети классификатора и регрессора для достижения целевых метрик точности определения патологии и оценки количественных характеристик патологии.There are also examples of networks that combine segmentation of the target region of the paranasal sinuses as a single class with subsequent transfer of the target region and its classification for the presence of pathology and regression that identifies the level of reduction in pneumatization of the sinuses. Such methods of automatic diagnosis of paranasal sinus pathologies require a significant number of images to train the neural network of the classifier and regressor to achieve target metrics of pathology detection accuracy and assessment of quantitative characteristics of the pathology.

Сущность изобретенияThe essence of the invention

С целью устранения по меньшей мере некоторых из вышеупомянутых недостатков предшествующего уровня техники, настоящее изобретение направлено на повышение эффективности систем и способов диагностики синуситов посредством искусственного интеллекта.In order to eliminate at least some of the above-mentioned disadvantages of the prior art, the present invention is directed to improving the efficiency of systems and methods for diagnosing sinusitis using artificial intelligence.

В частности, настоящее изобретение эффективно преодолевает недостатки известных решений за счет использования классификации на базе сегментации и детекции на базе сегментации для таких патологических признаков, как снижение пневматизации придаточных пазух носа, в сочетании с сегментацией нормальных анатомических структур и анализом количественных характеристик каждой пазухи на основе масок сегментации, а также за счет исключения ложно-положительных результатов на основании анализа пересечения масок нормальной анатомии и патологии и исключения ложноотрицательных результатов за счёт использования вычисленных количественных характеристик снижения пневматизации придаточных пазух носа. In particular, the present invention effectively overcomes the shortcomings of known solutions by using segmentation-based classification and segmentation-based detection for such pathological features as decreased pneumatization of the paranasal sinuses, in combination with segmentation of normal anatomical structures and analysis of quantitative characteristics of each sinus based on segmentation masks, as well as by eliminating false-positive results based on an analysis of the intersection of masks of normal anatomy and pathology and eliminating false-negative results by using the calculated quantitative characteristics of decreased pneumatization of the paranasal sinuses.

Согласно первому аспекту настоящего изобретения, предложена система диагностики синуситов по рентгеновским изображениям, содержащая:According to a first aspect of the present invention, a system for diagnosing sinusitis using X-ray images is provided, comprising:

блок получения изображений, выполненный с возможностью получать двумерное рентгеновское изображение области придаточных пазух носа;an imaging unit configured to obtain a two-dimensional X-ray image of the paranasal sinus region;

блок диагностики патологий, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, с помощью нейронной сети на основе сегментации выявлять на полученном изображении участки снижения пневматизации и участки с жидкостью в придаточных пазухах носа;a pathology diagnostic unit, configured to detect, using at least one processor and memory, using a neural network based on segmentation, areas of reduced pneumatization and areas with fluid in the paranasal sinuses on the obtained image;

блок сегментации анатомических структур, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, определять на полученном изображении области с высокой пневматизацией и внешние контуры каждой придаточной пазухи носа с помощью нейронной сети на основе сегментации;a segmentation unit for anatomical structures, configured to, using at least one processor and memory, determine on the obtained image areas with high pneumatization and the external contours of each paranasal sinus using a neural network based on segmentation;

блок локализации патологий, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, определять путем объединения выходных данных от блока диагностики патологий и выходных данных от блока сегментации анатомических структур принадлежность патологий конкретной придаточной пазухе носа; иa pathology localization unit configured to, using at least one processor and memory, determine by combining output data from the pathology diagnostic unit and output data from the anatomical structure segmentation unit, the belonging of pathologies to a specific paranasal sinus; and

блок передачи отчета, выполненный с возможностью формировать отчет, содержащий сведения о наличии или отсутствии патологий придаточных пазух носа на полученном изображении на основе выходных данных по меньшей от одного из блока диагностики патологий, блока сегментации анатомических структур и блока локализации патологий,a report transmission unit configured to generate a report containing information on the presence or absence of paranasal sinus pathologies in the received image based on output data from at least one of the pathology diagnostic unit, the anatomical structure segmentation unit, and the pathology localization unit,

причем каждая нейронная сеть предварительно обучена определять маску для каждого соответствующего ей класса, которая содержит вероятности принадлежности каждого пикселя к данному классу, причем при обучении используется функция потерь на основе коэффициента Жаккара и веса классов положительной и отрицательной метки класса, которые определяются на основе обратной частоты положительных и отрицательных меток класса для всех изображений в выборке по каждому классу, причем если для заданного изображения в истинной маске заданного класса присутствуют положительные элементы, то всему экземпляру присваивается положительная метка класса, если отсутствуют - отрицательная метка класса, причем функция потерь на основе коэффициента Жаккара вычисляется для каждой маски класса после определения маски класса для каждого класса, и если соответствующая изображению истинная метка класса является положительной, то ошибка соответствующего класса умножается на вес класса положительного экземпляра класса, а если отрицательной – на вес класса отрицательного экземпляра класса, соответственно.wherein each neural network is pre-trained to determine a mask for each class corresponding to it, which contains the probabilities of belonging of each pixel to this class, wherein during training a loss function is used based on the Jaccard coefficient and the class weights of the positive and negative class labels, which are determined based on the inverse frequency of positive and negative class labels for all images in the sample for each class, wherein if for a given image in the true mask of a given class there are positive elements, then the entire instance is assigned a positive class label, if absent - a negative class label, wherein the loss function based on the Jaccard coefficient is calculated for each class mask after determining the class mask for each class, and if the true class label corresponding to the image is positive, then the error of the corresponding class is multiplied by the class weight of the positive instance of the class, and if negative - by the class weight of the negative instance of the class, respectively.

В одном из вариантов осуществления блок передачи отчета дополнительно выполнен с возможностью передавать копию входного изображения с нанесенными на него контурами, ограничивающими область патологии, текстовую информацию о локализации патологии и числовые значения, определяющие степень снижения пневматизации придаточных пазух носа.In one embodiment, the report transmission unit is additionally configured to transmit a copy of the input image with contours applied to it, limiting the area of the pathology, text information about the localization of the pathology and numerical values determining the degree of reduction in pneumatization of the paranasal sinuses.

В одном из вариантов осуществления блок локализации патологий дополнительно выполнен с возможностью проверять участки изображения, помеченные блоком диагностики патологий как содержащие патологию, на пересечение с областями изображения, выделенными блоком сегментации анатомических структур как соответствующие той или иной придаточной пазухе, и выполнять на основе этого локализацию патологий.In one embodiment, the pathology localization unit is additionally configured to check image areas marked by the pathology diagnostics unit as containing pathology for intersection with image areas identified by the anatomical structure segmentation unit as corresponding to a particular paranasal sinus, and to localize pathologies based on this.

В одном из вариантов осуществления блок локализации патологий дополнительно выполнен с возможностью, для пазухи, в которой уровень снижения пневматизации, измеренный на основании анализа нормальных анатомических структур, выявленных блоком сегментации анатомических структур, превышает критический порог, указывать снижение пневматизации.In one embodiment, the pathology localization unit is additionally configured to indicate a decrease in pneumatization for a sinus in which the level of pneumatization reduction, measured based on the analysis of normal anatomical structures identified by the anatomical structure segmentation unit, exceeds a critical threshold.

В одном из вариантов осуществления каждая нейронная сеть предварительно обучена определять маску для каждого соответствующего ей класса, которая содержит вероятности принадлежности каждого пикселя к данному классу, причем при обучении используется фокусная функция потерь и веса пикселей, которые представляют собой веса для положительных пикселей истинной маски класса и отрицательных пикселей истинной маски класса, основанные на частоте пикселей, принадлежащих конкретному классу во всей выборке, причем фокусная функция потерь вычисляется для каждого пикселя маски после определения маски класса, и если соответствующий пиксель истинной маски класса является положительным, ошибка, полученная на этом пикселе маски класса, умножается на вес пикселя положительного примера данного класса, а если соответствующий пиксель истинной маски класса является отрицательным, ошибка, полученная на этом пикселе маски класса, умножается на вес пикселя отрицательного примера данного класса.In one embodiment, each neural network is pre-trained to determine a mask for each class corresponding to it, which contains the probabilities of each pixel belonging to this class, wherein during training a focal loss function and pixel weights are used, which represent weights for positive pixels of the true class mask and negative pixels of the true class mask, based on the frequency of pixels belonging to a specific class in the entire sample, wherein the focal loss function is calculated for each pixel of the mask after determining the class mask, and if the corresponding pixel of the true class mask is positive, the error obtained on this pixel of the class mask is multiplied by the weight of the pixel of a positive example of this class, and if the corresponding pixel of the true class mask is negative, the error obtained on this pixel of the class mask is multiplied by the weight of the pixel of a negative example of this class.

Согласно второму аспекту настоящего изобретения, предложен способ диагностики синуситов по рентгеновским изображениям, содержащий этапы, на которых:According to a second aspect of the present invention, a method for diagnosing sinusitis using X-ray images is provided, comprising the steps of:

с использованием блока получения изображений получают двумерное рентгеновское изображение, содержащее область придаточных пазух носа;Using an imaging unit, a two-dimensional X-ray image is obtained containing the paranasal sinus area;

с использованием блока диагностики патологий, содержащего нейронную сеть для сегментации, определяют на полученном изображении участки снижения пневматизации и участки с жидкостью в придаточных пазухах носа;using a pathology diagnostic block containing a neural network for segmentation, areas of reduced pneumatization and areas with fluid in the paranasal sinuses are determined on the resulting image;

с использованием блока сегментации анатомических структур, содержащего нейронную сеть для сегментации, определяют на полученном изображении области с высокой пневматизацией и внешние контуры каждой придаточной пазухи носа;using a block for segmentation of anatomical structures containing a neural network for segmentation, areas with high pneumatization and the external contours of each paranasal sinus are determined on the resulting image;

с использованием блока локализации патологий, на основе выходных данных от блока диагностики патологий и выходных данных от блока сегментации анатомических структур, путем определения пересечения между областями, на которых присутствует снижение пневматизации и которые соответствуют конкретной придаточной пазухе носа, определяют локализацию патологии; иusing the pathology localization unit, based on the output data from the pathology diagnostics unit and the output data from the anatomical structure segmentation unit, by determining the intersection between areas where there is a decrease in pneumatization and which correspond to a specific paranasal sinus, the localization of the pathology is determined; and

с использованием блока передачи отчета формируют и передают отчет, содержащий сведения о наличии или отсутствии патологий придаточных пазух носа на полученном изображении на основе выходных данных по меньшей от одного из блока диагностики патологий, блока сегментации анатомических структур и блока локализации патологий, на устройство, запрашивавшее диагностику,using a report transmission unit, a report is generated and transmitted containing information about the presence or absence of paranasal sinus pathologies in the received image based on output data from at least one of the pathology diagnostic unit, the anatomical structure segmentation unit, and the pathology localization unit, to the device that requested the diagnostics,

причем каждую нейронную сеть предварительно обучают определять маску для каждого соответствующего ей класса, которая содержит вероятности принадлежности каждого пикселя к данному классу, причем при обучении используют функцию потерь на основе коэффициента Жаккара и веса классов положительной и отрицательной метки класса, которые определяют на основе обратной частоты положительных и отрицательных меток класса для всех изображений в выборке по каждому классу, причем если для заданного изображения в истинной маске заданного класса присутствуют положительные элементы, то всему экземпляру присваивают положительную метку класса, если отсутствуют - отрицательную метку класса, причем функцию потерь на основе коэффициента Жаккара вычисляют для каждой маски класса после определения маски класса для каждого класса, и если соответствующая изображению истинная метка класса является положительной, то ошибку соответствующего класса умножают на вес класса положительного экземпляра класса, а если отрицательной – на вес класса отрицательного экземпляра класса, соответственно.wherein each neural network is pre-trained to determine a mask for each class corresponding to it, which contains the probabilities of each pixel belonging to this class, wherein during training a loss function is used based on the Jaccard coefficient and the class weights of the positive and negative class labels, which are determined based on the inverse frequency of positive and negative class labels for all images in the sample for each class, wherein if for a given image in the true mask of a given class there are positive elements, then the entire instance is assigned a positive class label, if absent - a negative class label, wherein the loss function based on the Jaccard coefficient is calculated for each class mask after determining the class mask for each class, and if the true class label corresponding to the image is positive, then the error of the corresponding class is multiplied by the class weight of the positive instance of the class, and if negative - by the class weight of the negative instance of the class, respectively.

Технический результатTechnical result

Настоящее изобретение позволяет повысить эффективность систем и способов диагностики синуситов в придаточных пазухах носа с использованием двумерных рентгеновских изображений. При этом обеспечивается:The present invention makes it possible to increase the efficiency of systems and methods for diagnosing sinusitis in the paranasal sinuses using two-dimensional X-ray images. This ensures:

- повышение точности диагностики;- increasing the accuracy of diagnostics;

- повышение скорости обработки двумерных изображений;- increasing the speed of processing two-dimensional images;

- упрощение интерпретации и описания изображений;- simplification of interpretation and description of images;

- возможность выполнения ранней диагностики заболеваний придаточных пазух, в режиме скрининга;- the possibility of performing early diagnostics of paranasal sinus diseases in screening mode;

- освобождение медицинского персонала от рутинных процессов анализа снимков пациентов, не имеющих симптомов и ранее выявленных патологий в области придаточных пазух носа;- freeing medical personnel from routine processes of analyzing images of patients who have no symptoms and previously identified pathologies in the paranasal sinuses;

- уменьшение влияния человеческого фактора (внимательность, утомляемость, ответственность).- reducing the influence of the human factor (attentiveness, fatigue, responsibility).

- увеличение соотношения между количеством снимков, использованных для обучения, и полученными метриками классификации и детекции.- increasing the ratio between the number of images used for training and the obtained classification and detection metrics.

Эти и другие преимущества настоящего изобретения станут понятны при прочтении нижеследующего подробного описания со ссылкой на сопроводительные чертежи.These and other advantages of the present invention will become apparent from reading the following detailed description with reference to the accompanying drawings.

Краткое описание чертежейBrief description of the drawings

Фиг. 1 показывает пример рентгеновских изображений придаточных пазух носа в прямой проекции с нанесенной разметкой.Fig. 1 shows an example of X-ray images of the paranasal sinuses in a direct projection with markings applied.

Фиг. 2 показывает блок-схему системы диагностики синуситов согласно настоящему изобретению.Fig. 2 shows a block diagram of a sinusitis diagnostic system according to the present invention.

Следует понимать, что фигуры могут быть представлены схематично и не в масштабе и предназначены, главным образом, для улучшения понимания настоящего изобретения.It should be understood that the figures may be diagrammatic and not to scale and are intended primarily to facilitate an understanding of the present invention.

Подробное описаниеDetailed description

Заболевания придаточных пазух носа на практике обычно диагностируются врачами путем ручного анализа изображений. Настоящее изобретение предоставляет способ и систему, которые автоматизируют процесс диагностики, предоставляя врачу такие полезные данные, как наличие утолщения стенок придаточных пазух носа, наличие уровня жидкости, степень снижения пневматизации и локализацию патологии.Diseases of the paranasal sinuses are usually diagnosed by physicians in practice by manual analysis of images. The present invention provides a method and system that automate the diagnostic process, providing the physician with useful data such as the presence of thickening of the walls of the paranasal sinuses, the presence of fluid levels, the degree of reduction of pneumatization, and the localization of pathology.

Авторами настоящего изобретения была собрана анонимная база данных пациентов с синуситами и без них. Каждый случай пациента состоит из снимка в прямой проекции придаточных пазух носа. На каждом рентгеновском изображении опытный рентгенолог вручную выделил контуром внешний контур каждой пазухи, каждую пазуху, в которой определялось снижение пневматизации, а также жидкость, обнаруженную в пазухе. Пример рентгеновских изображений придаточных пазух носа в прямой проекции с нанесенной разметкой показан на Фиг. 1. Как будет показано далее, такая база данных будет использоваться для обучения моделей машинного обучения.The present inventors collected an anonymous database of patients with and without sinusitis. Each patient case consists of a AP image of the paranasal sinuses. On each X-ray image, an experienced radiologist manually outlined the outer contour of each sinus, each sinus in which decreased pneumatization was detected, and the fluid detected in the sinus. An example of AP X-ray images of the paranasal sinuses with the applied markings is shown in Fig. 1. As will be shown below, such a database will be used to train machine learning models.

Общее описание системыGeneral description of the system

Как изображено на блок-схеме на Фиг.2, система 100 диагностики синуситов согласно настоящему изобретению содержит блок 110 получения изображений, блок 120 сегментации анатомических структур, блок 130 диагностики патологий, блок 140 локализации патологий, блок 150 передачи отчета.As shown in the block diagram in Fig. 2, the sinusitis diagnostic system 100 according to the present invention comprises an image acquisition unit 110, an anatomical structure segmentation unit 120, a pathology diagnostic unit 130, a pathology localization unit 140, and a report transmission unit 150.

Блок получения изображений в одном варианте осуществления может представлять собой сетевую плату или иное средство приема данных. В другом варианте осуществления блок получения изображений может представлять собой непосредственно рентгеновский аппарат. In one embodiment, the image acquisition unit may be a network card or other data receiving means. In another embodiment, the image acquisition unit may be the X-ray apparatus itself.

Блок диагностики патологий, блок локализации патологий и блок сегментации анатомических структур реализуются на базе устройства обработки, содержащего вычислительный модуль (например, центральный процессор), модуль памяти (например, оперативную память и постоянную память), а также при необходимости дополнительный вычислительный модуль (например, графический процессор или нейронный процессор). Таким образом, блок диагностики патологий, блок локализации патологий и блок сегментации анатомических структур могут быть реализованы на базе компьютера или сервера.The pathology diagnostics unit, the pathology localization unit, and the anatomical structure segmentation unit are implemented on the basis of a processing device containing a computing module (e.g., a central processor), a memory module (e.g., RAM and ROM), and, if necessary, an additional computing module (e.g., a graphic processor or a neural processor). Thus, the pathology diagnostics unit, the pathology localization unit, and the anatomical structure segmentation unit can be implemented on the basis of a computer or a server.

Блок передачи отчета может представлять собой сетевую плату, аппаратный интерфейс передачи данных/видеосигнала или иное средство обмена данными.The report transmission unit may be a network card, a hardware data/video signal transmission interface, or other data exchange means.

Способ диагностики синуситов выполняется системой диагностики синуситов и заключается в следующем.The method of diagnosing sinusitis is performed by the sinusitis diagnostic system and is as follows.

Сначала с помощью блока получения изображений получают двумерное изображение придаточных пазух носа. First, a two-dimensional image of the paranasal sinuses is obtained using an imaging unit.

Как указывалось выше, в одном варианте осуществления, если блок получения изображений является рентген-аппаратом, он может получать изображение самостоятельно (или под управлением оператора). В другом варианте осуществления блок получения изображений, будучи частью сервиса диагностики патологий, может получать извне (например, от медицинской организации, от врача, от региональной системы хранения медицинских данных и т.д.) запрос на диагностику или входные данные, содержащие одно или множество (например, пакет) изображений, и извлекать требуемое изображение из полученных входных данных или запроса.As indicated above, in one embodiment, if the image acquisition unit is an X-ray machine, it can acquire an image independently (or under the control of an operator). In another embodiment, the image acquisition unit, being part of a pathology diagnostic service, can receive from outside (e.g., from a medical organization, from a doctor, from a regional medical data storage system, etc.) a diagnostic request or input data containing one or a plurality (e.g., a batch) of images, and extract the desired image from the received input data or request.

При необходимости полученное изображение подвергается предварительной обработке в блоке предобработки (не показан на Фиг.2), чтобы оно было пригодно для обработки дальнейшими блоками. Например, если исходное изображение имеет в каком-либо направлении недостаточное или избыточное разрешение, то может выполняться преобразование или реконструкция изображения до требуемого разрешения. Также могут корректироваться яркость, контрастность и иные параметры изображения.If necessary, the resulting image is pre-processed in a pre-processing block (not shown in Fig. 2) so that it is suitable for processing by further blocks. For example, if the original image has insufficient or excessive resolution in any direction, then the image can be transformed or reconstructed to the required resolution. Brightness, contrast, and other image parameters can also be adjusted.

Затем изображение подается на блок сегментации анатомических структур и блок диагностики патологий. The image is then fed to the anatomical structure segmentation unit and the pathology diagnostic unit.

В блоке сегментации анатомических структур с использованием предварительно обученной нейронной сети определяется вероятность наличия класса и бинарные маски сегментации по каждому из следующих классов: “внешний контур - правая гайморова пазуха”, “внешний контур - левая гайморова пазуха”, “внешний контур - правая лобная пазуха”, ”внешний контур - левая лобная пазуха”, “область высокой пневматизации - правая гайморова пазуха”, “область высокой пневматизации - левая гайморова пазуха”, “область высокой пневматизации - правая лобная пазуха”, “область высокой пневматизации - левая лобная пазуха”. После этого, для каждой придаточной пазухи подсчитывается степень снижения пневматизации по следующей формуле:In the anatomical structures segmentation block, the probability of class presence and binary segmentation masks are determined for each of the following classes using a pre-trained neural network: “outer contour - right maxillary sinus”, “outer contour - left maxillary sinus”, “outer contour - right frontal sinus”, “outer contour - left frontal sinus”, “area of high pneumatization - right maxillary sinus”, “area of high pneumatization - left maxillary sinus”, “area of high pneumatization - right frontal sinus”, “area of high pneumatization - left frontal sinus”. After that, the degree of pneumatization reduction is calculated for each paranasal sinus using the following formula:

X% = (Sпазухи – Sвнутренней пустоты) / Sпазухи ,X% = (S sinus – S internal void ) / S sinus ,

где под S подразумевается число пикселей, относящихся к соответствующим классам. Выходом блока сегментации анатомических структур является бинарная маска сегментации и набор значений от 0 до 1, соответствующих степени снижения пневматизации каждой из придаточных пазух носа.where S is the number of pixels belonging to the corresponding classes. The output of the anatomical structure segmentation block is a binary segmentation mask and a set of values from 0 to 1 corresponding to the degree of reduction in pneumatization of each paranasal sinus.

В блоке диагностики патологий с использованием предварительно обученной нейронной сети для каждого из классов патологии генерируются бинарные маски патологий и вероятности наличия классов патологии. Под классами патологии подразумеваются следующие классы: “снижение пневматизации придаточной пазухи носа”, “горизонтальный уровень жидкости в пазухе”. В случае класса “снижение пневматизации придаточной пазухи носа” при разметке данных вся пазуха со сниженной пневматизацией сопоставляется искомому классу. В случае класса “горизонтальный уровень жидкости в пазухе” искомому классу при разметке сопоставляется область, предполагаемо занятая жидкостью по мнению врача. Выходом блока диагностики патологий являются бинарные маски патологий и набор значений от 0 до 1 для каждой патологии, интерпретируемый как вероятность её наличия.In the pathology diagnostics block, binary pathology masks and probabilities of pathology class presence are generated for each pathology class using a pre-trained neural network. The pathology classes are the following classes: “reduced pneumatization of the paranasal sinus”, “horizontal fluid level in the sinus”. In the case of the “reduced pneumatization of the paranasal sinus” class, the entire sinus with reduced pneumatization is matched with the desired class during data labeling. In the case of the “horizontal fluid level in the sinus” class, the area presumably occupied by fluid in the doctor’s opinion is matched with the desired class during labeling. The output of the pathology diagnostics block is binary pathology masks and a set of values from 0 to 1 for each pathology, interpreted as the probability of its presence.

Выходные данные от блоков сегментации анатомических структур и блока диагностики патологий поступают в блок локализации патологий. В блоке локализации патологий области изображения, помеченные как содержащие патологию, проверяются на пересечение с областями изображения, выделенными как соответствующие той или иной гайморовой или лобной пазухе, за счёт чего производится локализация патологии и уменьшение или даже устранение ложноположительных результатов.The output data from the anatomical structure segmentation and pathology diagnostics units are sent to the pathology localization unit. In the pathology localization unit, image areas marked as containing pathology are checked for intersection with image areas marked as corresponding to a particular maxillary or frontal sinus, thereby localizing the pathology and reducing or even eliminating false positive results.

В одной из реализаций для пазухи, в которой уровень снижения пневматизации, измеренный на основании анализа масок нормальных анатомических структур, превышает критический порог, проставляется маска “снижение пневматизации”. Это обеспечивает уменьшение или даже устранение ложноотрицательных результатов.In one implementation, for a sinus in which the level of pneumatization reduction measured by the analysis of masks of normal anatomical structures exceeds a critical threshold, a “pneumatization reduction” mask is assigned. This ensures a reduction or even elimination of false negative results.

Фактически, и в блоке сегментации анатомических структур, и в блоке диагностики патологий сначала выполняется сегментация, а затем на ее основе выполняется формирование бинарной маски и вычисление вероятностей. Различие состоит в том, что в блоке сегментации анатомических структур сегментация предназначена для классификации нормальных анатомических структур и анатомических структур с патологией, а в блоке диагностики патологий сегментация предназначена для детекции патологий в целом. То есть оба эти блока выполняют поиск патологий, но подходят к этому с разных точек зрения. Затем данные с этих блоков объединяются в блоке локализации патологий, чтобы повысить точность диагностики и отсечь ложные срабатывания, которые могли бы возникнуть, если бы использовался только один из указанных двух подходов с использованием сегментации, а не предложенное сочетание. Это выгодно отличается от известных решений из уровня техники, в которых либо вообще не используется сегментация, либо сегментация используется только для выявления анатомических структур.In fact, both the anatomical structure segmentation block and the pathology diagnostics block first perform segmentation, and then, based on this segmentation, form a binary mask and calculate probabilities. The difference is that in the anatomical structure segmentation block, segmentation is intended to classify normal anatomical structures and anatomical structures with pathology, while in the pathology diagnostics block, segmentation is intended to detect pathologies in general. That is, both of these blocks search for pathologies, but they approach this from different points of view. Then, the data from these blocks is combined in the pathology localization block to improve the accuracy of diagnostics and cut off false positives that could occur if only one of the two approaches using segmentation were used, rather than the proposed combination. This compares favorably with known solutions from the state of the art, which either do not use segmentation at all, or use segmentation only to detect anatomical structures.

Далее, вывод от блока локализации патологий передаётся в блок передачи отчета. В одном варианте осуществления отчет о состоянии придаточных пазух носа может формироваться для каждого изображения. В другом варианте осуществления запрос на диагностику или настройки системы диагностики могут предусматривать необходимость формирования отчета только для случаев, в которых выявлена патология. Например, если в полученном пакете из 10 изображений система выявила один случай патологии, она может формировать отчет для соответствующего изображения (или пациента), содержащий вычисленные клинические показатели. Отчет также может содержать сформированную блоком передачи отчёта копию входного изображения с нанесенными на него контурами патологии.Next, the output from the pathology localization unit is transmitted to the report transmission unit. In one embodiment, a report on the state of the paranasal sinuses can be generated for each image. In another embodiment, a diagnostic request or diagnostic system settings can provide for the need to generate a report only for cases in which pathology is detected. For example, if the system has detected one case of pathology in a received batch of 10 images, it can generate a report for the corresponding image (or patient) containing the calculated clinical indicators. The report can also contain a copy of the input image generated by the report transmission unit with pathology contours applied to it.

Далее отчет о состоянии здоровья придаточных пазух носа выводится на экран монитора, подключенного к серверу, или же передается с помощью блока передачи отчета на устройство, запрашивавшее диагностику – например, на расположенное удаленно автоматизированное рабочее место (АРМ) врача.Next, the report on the health status of the paranasal sinuses is displayed on the monitor screen connected to the server, or transmitted using the report transmission unit to the device that requested the diagnostics - for example, to a remotely located automated workstation (AWS) of the doctor.

С помощью изображения с нанесенными на него контурами и других данных, содержащихся в отчете (степень снижения пневматизации каждой пазухи, указание на наличие/отсутствие патологии - синусита), врач принимает решение о состоянии здоровья пациента.Using the image with the contours applied to it and other data contained in the report (the degree of reduction in pneumatization of each sinus, an indication of the presence/absence of pathology - sinusitis), the doctor makes a decision on the patient's health condition.

Детекция и классификация на основе масок сегментации Detection and classification based on segmentation masks

Далее процесс, выполняющийся в блоках сегментации анатомических структур и диагностики патологий, будет описан подробно.Below, the process performed in the blocks of segmentation of anatomical structures and diagnostics of pathologies will be described in detail.

Для каждой маски каждого класса выходом нейронной сети служит маска класса (соответственно, класса анатомической структуры или класса патологии) с вероятностями принадлежности пикселя к классу в диапазоне 0-1. Для каждой маски класса определяются участки изображения – кандидаты на принадлежность к классу. Под определением кандидатов подразумевается простая сегментация по порогу, вычисленному на основании максимизации попиксельного F1-score, далее называемому порогом сегментации. Результатом сегментации служит бинарная маска класса, в последующем называемая маской объектов. Далее, с использованием библиотеки opencv производится поиск контуров для сегментов, содержащихся в маске объектов. Далее, для каждого контура на маске объектов из контура производится генерация маски области интереса - под этим подразумевается, что все элементы маски, лежащие внутри данного контура, считаются равными единице, а за пределами этого контура - равными нулю. Маска области интереса поэлементно умножается на изначальную маску класса. Далее, производится подсчёт всех ненулевых пикселей маски области интереса (N) и суммы вероятностей по всем пикселям маски (M). Вероятность принадлежности рассматриваемого участка (области интереса) к классу определяется как P=M/N. P сравнивается с порогом детекции. Под порогом детекции подразумевается порог, рассчитанный на основании максимизации average F1 для маски объектов. Если P больше порога детекции, участок считается принадлежащим к искомому классу. Если P меньше порога детекции, то участок-кандидат считается участком с ложноположительным срабатыванием, и маска объектов в области соответствующего участка обнуляется. Для каждого изолированного участка маски объектов сохраняется полученная средняя вероятность по участку. Максимальная вероятность по всем изолированным участкам считается вероятностью наличия класса в целом.For each mask of each class, the output of the neural network is a class mask (respectively, the class of the anatomical structure or the class of pathology) with probabilities of pixel belonging to the class in the range of 0-1. For each class mask, image areas are determined - candidates for belonging to the class. Determination of candidates means simple segmentation by a threshold calculated on the basis of maximization of the pixel-by-pixel F1-score, hereinafter referred to as the segmentation threshold. The result of segmentation is a binary class mask, hereinafter referred to as an object mask. Next, using the opencv library, a search for contours for segments contained in the object mask is performed. Next, for each contour on the object mask from the contour, a mask of the area of interest is generated - this means that all elements of the mask lying inside this contour are considered equal to one, and outside this contour - equal to zero. The mask of the area of interest is multiplied element by element by the original class mask. Next, all non-zero pixels of the region of interest mask (N) and the sum of probabilities for all pixels of the mask (M) are counted. The probability of belonging of the considered area (region of interest) to the class is defined as P=M/N. P is compared with the detection threshold. The detection threshold is the threshold calculated based on maximization of average F1 for the object mask. If P is greater than the detection threshold, the area is considered to belong to the desired class. If P is less than the detection threshold, the candidate area is considered to be an area with a false positive response, and the object mask in the area of the corresponding area is reset to zero. For each isolated area of the object mask, the obtained average probability for the area is saved. The maximum probability for all isolated areas is considered to be the probability of the presence of the class as a whole.

Нейронная сеть, производящая сегментацию, может быть основана на разных подходящих архитектурах, известных специалисту. В качестве неограничивающих примеров нейронная сеть может быть основана на архитектуре UNet или FPN.The neural network performing the segmentation may be based on various suitable architectures known to the person skilled in the art. As non-limiting examples, the neural network may be based on the UNet or FPN architecture.

UNet как источник базовой сегментации UNet as a source of basic segmentation

Архитектура UNet была разработана для сегментации изображений и в настоящее время широко используется в медицинской визуализации благодаря своей универсальности и высокоточным результатам сегментации. Она состоит из пути кодера с понижающей дискретизацией, который извлекает признаки изображения в разных масштабах и различной сложности, и пути декодера с повышающей дискретизацией, который генерирует результаты сегментации с использованием извлеченных признаков. Основная концепция UNet состоит в том, чтобы использовать замыкающие соединения (skip connections), которые проходят от кодера к декодеру и идут от ранних уровней пути кодера, где все еще сохраняются мелкие детали изображения, к поздним уровням пути декодера, которые содержат информацию от грубых признаков, необходимую для распознавания и сегментации объектов. Путь энкодера состоит из четырех блоков, каждый из которых состоит из двух сверточных слоев 3 × 3 × 3, за которым следует слой активации ReLU и слой объединения по максимальному значению (max-pooling) 2 × 2 × 2. Путь декодера состоит из четырех блоков, каждый из которых состоит из слоя повышающей дискретизации, слоя свертки транспонирования 2 × 2 × 2 и двух слоев свертки 3 × 3 × 3, за каждым из которых следует слой ReLU.The UNet architecture was developed for image segmentation and is currently widely used in medical imaging due to its versatility and high-accuracy segmentation results. It consists of a downsampling encoder path that extracts image features at different scales and complexities, and an upsampling decoder path that generates segmentation results using the extracted features. The basic concept of UNet is to use skip connections that run from the encoder to the decoder, going from the early layers of the encoder path, where fine image details are still preserved, to the later layers of the decoder path, which contain the coarse feature information needed for object recognition and segmentation. The encoder path consists of four blocks, each consisting of two 3×3×3 convolutional layers followed by a ReLU activation layer and a 2×2×2 max-pooling layer. The decoder path consists of four blocks, each consisting of an upsampling layer, a 2×2×2 transpose convolution layer, and two 3×3×3 convolution layers, each followed by a ReLU layer.

UNet может быть обучена с использованием оптимизатора Adam со скоростью обучения 0,0002 и снижением веса 0,0001.UNet can be trained using the Adam optimizer with a learning rate of 0.0002 and a weight decay of 0.0001.

FPN как источник базовой сегментацииFPN as a source of basic segmentation

Архитектура FPN с RPN основана на принципе эффективного извлечения многомасштабных признаков, что позволяет сочетать семантически устойчивые признаки с низким разрешением и семантически слабые признаки с высоким разрешением. Такой подход является эффективным для задачи обнаружения объектов. Компонент FPN извлекает признаки из входного изображения, и во время этого процесса, он имеет определенное сходство с UNet. Часть декодера создает карты объектов с более высоким разрешением путем повышения дискретизации результатов предыдущих слоев, и каждый блок пути декодера генерирует отдельный вывод для обучения сети. Замыкающие соединения состоят из слоев свертки 1 × 1, применяемых к блокам кодера, которые затем добавляются к соответствующим блокам декодера. В результате FPN стремится генерировать признаки переменного разрешения, которые смогут описать целевой объект. В конкретном примере FPN может обучаться с использованием оптимизатора Adam со скоростью обучения 0,0002 и снижением веса 0,0001.The FPN architecture with RPN is based on the principle of efficient multi-scale feature extraction, which allows combining semantically robust features with low resolution and semantically weak features with high resolution. This approach is effective for the task of object detection. The FPN component extracts features from the input image, and during this process, it has some similarities with UNet. The decoder part creates higher-resolution feature maps by upsampling the results of previous layers, and each block in the decoder path generates a separate output for training the network. Trailing connections consist of 1×1 convolution layers applied to encoder blocks, which are then added to the corresponding decoder blocks. As a result, FPN aims to generate variable-resolution features that can describe the target object. In a specific example, FPN can be trained using the Adam optimizer with a learning rate of 0.0002 and a weight decay of 0.0001.

Обучение нейронных сетейTraining neural networks

В обучении нейронной сети в качестве функции потерь предлагается использовать среднее значение фокусной функции потерь (focal loss) – это вариация кросэнтропии, предназначенная для решения проблемы дисбаланса классов, и функции потерь на основе коэффициента Жаккара (Jaccard loss), особенностью которой является независимость значения ошибки от размера объектов на изображении. In neural network training, it is proposed to use the mean value of the focal loss function as a loss function - this is a variation of crossentropy designed to solve the problem of class imbalance, and the loss function based on the Jaccard coefficient (Jaccard loss), the feature of which is the independence of the error value from the size of objects in the image.

Pixel-weight в сочетании с focal loss для увеличения точности сегментацииPixel-weight combined with focal loss to improve segmentation accuracy

В одном из вариантов осуществления веса focal loss могут быть направлены на устранение систематического искажения, вызываемого различным числом пикселей, принадлежащих в среднем по выборке каждому классу и фону.In one embodiment, the focal loss weights may be designed to correct for systematic bias caused by the different number of pixels that belong, on average across the sample, to each class and background.

Для этого для focal loss могут быть использованы веса для положительных элементов истинной маски класса и отрицательных элементов маски класса, основанные на частоте пикселей, принадлежащих конкретному классу во всей выборке (далее pixel-weight, веса пикселей). После получения маски сегментации вычисляется focal loss для каждого элемента маски. В случае, если соответствующий элемент истинной маски сегментации является положительным, ошибка, полученная на этом элементе маски сегментации, умножается на pixel-weight положительного примера данного класса. В случае, если элемент маски сегментации является отрицательным, ошибка, полученная на этом элементе маски сегментации, умножается на pixel-weight отрицательного примера данного класса. После умножения на веса производится усреднение ошибки по всем элементам взвешенной ошибки. Таким образом, увеличивается точность сегментации.For this purpose, the focal loss can use weights for positive elements of the true class mask and negative elements of the class mask based on the frequency of pixels belonging to a specific class in the entire sample (hereinafter pixel-weight, pixel weights). After obtaining the segmentation mask, the focal loss is calculated for each mask element. If the corresponding element of the true segmentation mask is positive, the error obtained on this segmentation mask element is multiplied by the pixel-weight of the positive example of this class. If the segmentation mask element is negative, the error obtained on this segmentation mask element is multiplied by the pixel-weight of the negative example of this class. After multiplying by the weights, the error is averaged over all elements of the weighted error. Thus, the segmentation accuracy increases.

Class-weight в сочетании с Jaccard loss для увеличения точности сегментацииClass-weight combined with Jaccard loss to improve segmentation accuracy

В одном из вариантов осуществления веса Jaccard loss могут быть направлены на устранение систематического дисбаланса, вызванного тем, что не на всех изображениях присутствуют классы патологий, в отличии от классов нормальной анатомии.In one embodiment, the Jaccard loss weights may be designed to correct for the systematic imbalance caused by the fact that not all images contain pathological classes, as opposed to normal anatomy classes.

Для этого для каждой ошибки в Jaccard loss предлагается использовать собственные веса каждого класса. Классы патологии в настоящем изобретении не противопоставляются друг другу. Классы нормальной анатомии в настоящем изобретении не противопоставляются друг другуFor this purpose, for each error in Jaccard loss, it is proposed to use the proper weights of each class. The pathology classes in the present invention are not opposed to each other. The normal anatomy classes in the present invention are not opposed to each other.

Если для некоторого изображения в истинной маске некоторого класса присутствуют положительные элементы, то всему экземпляру присваивается положительная метка класса, если отсутствуют - отрицательная метка класса. На основе частоты положительных и отрицательных меток класса для всех изображений в выборке по каждому классу, на основании обратной частоты меток класса определяются веса классов (class-weight) положительной и отрицательной метки класса. После получения масок сегментации для каждого класса для каждой маски вычисляется Jaccard loss. Если соответствующая изображению истинная метка класса является положительной, то ошибка соответствующего класса умножается на class-weight для положительного экземпляра класса, если отрицательной – на class-weight для отрицательного экземпляра класса, соответственно. Итоговая ошибка усредняется. Таким образом, увеличивается точность сегментации.If for some image in the true mask of some class there are positive elements, then the whole instance is assigned a positive class label, if absent - a negative class label. Based on the frequency of positive and negative class labels for all images in the sample for each class, based on the inverse frequency of class labels, class weights (class-weight) of the positive and negative class labels are determined. After obtaining the segmentation masks for each class, Jaccard loss is calculated for each mask. If the true class label corresponding to the image is positive, then the error of the corresponding class is multiplied by the class-weight for the positive instance of the class, if negative - by the class-weight for the negative instance of the class, respectively. The resulting error is averaged. Thus, the accuracy of segmentation increases.

Пример осуществленияExample of implementation

Предложенная система была проверена на базе данных, содержащей 1123 рентгеновских изображений придаточных пазух носа (в частности 523 без патологии и 600 с патологией) Из этого набора 75% снимков использовались для обучения, а 25% для тестирования. The proposed system was tested on a database containing 1123 paranasal sinus X-ray images (specifically 523 without pathology and 600 with pathology). From this set, 75% of the images were used for training and 25% for testing.

Возраст пациентов не учитывался. Наиболее частым диагнозом был хронический верхнечелюстной синусит. Второй по распространённости патологией был острый верхнечелюстной синусит.The age of the patients was not taken into account. The most common diagnosis was chronic maxillary sinusitis. The second most common pathology was acute maxillary sinusitis.

Параметры отдельных компонентов системы определялись следующим образом. The parameters of individual components of the system were determined as follows.

Сеть обучалась в режиме multilabel – segmentation, к выходу сети применялась активация sigmoid c использованием функции ошибки Jaccard loss и focal loss с последующим вычислением их среднего.The network was trained in the multilabel-segmentation mode, sigmoid activation was applied to the network output using the Jaccard loss and focal loss error functions, followed by calculating their average.

Скорость обучения для моделей была выбрана равной 0,00001. Фреймворк был обучен на сервере, оснащенном графическим процессором (GPU) Tesla V100-SXM2-80 ГБ, 80-ядерным центральным процессором (CPU) Intel(R) Xeon(R) E5-2698 v4 @ 2,20 ГГц, оперативной памятью (RAM) 503 ГБ.The learning rate for the models was chosen to be 0.00001. The framework was trained on a server equipped with a Tesla V100-SXM2-80GB graphics processing unit (GPU), an 80-core Intel(R) Xeon(R) E5-2698 v4 central processing unit (CPU) @ 2.20 GHz, and 503GB of RAM.

Эффективность системы оценивалась путем оценки точности показателя IOU для масок сегментации и вычисленным на основе сегментации меткам классов, по методике, описанной ранее, с использованием таких метрик классификации, как recall, precision, F1-score. Полученные результаты были сопоставлены с другими системами и с человеческими оценками и было выявлено, что предложенная система может успешно количественно определять патологии придаточных пазух носа, демонстрируя почти по всем показателям повышенную точность и скорость диагностики. При наличии механизма внешней коррекции удается дополнительно повысить точность диагностики, при этом помощь внешнего специалиста требуется только в случаях, когда существует вероятность неверной автоматической постановки диагноза.The effectiveness of the system was assessed by assessing the accuracy of the IOU indicator for segmentation masks and class labels calculated based on segmentation, according to the method described earlier, using such classification metrics as recall, precision, F1-score. The results were compared with other systems and with human assessments, and it was found that the proposed system can successfully quantitatively determine paranasal sinus pathologies, demonstrating increased accuracy and speed of diagnosis for almost all indicators. With the presence of an external correction mechanism, it is possible to further improve the accuracy of diagnosis, while the help of an external specialist is required only in cases where there is a possibility of an incorrect automatic diagnosis.

ПрименениеApplication

Системы и способы согласно настоящему изобретению, можно использовать для обработки диагностических медицинских изображений, содержащих область придаточных пазух носа, с целью выявления в них признаков синуситов.The systems and methods according to the present invention can be used to process diagnostic medical images containing the paranasal sinus region in order to detect signs of sinusitis therein.

Дополнительные особенности реализацииAdditional implementation features

Несмотря на то, что в данном документе может быть указано, что данные передаются/отправляются или принимаются/получаются человеком (например, медицинским специалистом, врачом, экспертом), специалист в данной области техники должен понимать, что такое указание используется исключительно в целях упрощения описания, тогда как на самом деле подразумевается, что данные передаются/отправляются или принимаются/получаются соответствующим устройством, которым пользуется и/или управляет этот человек.Although this document may indicate that data is transmitted/sent or received/received by a person (e.g., a medical professional, a doctor, an expert), one skilled in the art should understand that such indication is used solely for the purpose of simplifying the description, whereas in fact it is meant that the data is transmitted/sent or received/received by the corresponding device used and/or controlled by such person.

Один или более описанных в настоящем документе блоков или устройств передачи (передатчиков) и один или более блоков или устройств приема (приемников) физически могут быть реализованы в одном и том же блоке или устройстве приемопередачи или в разных блоках или устройствах.One or more of the transmission units or devices (transmitters) and one or more reception units or devices (receivers) described herein may be physically implemented in the same transmission/reception unit or device or in different units or devices.

Устройством или блоком передачи в данном документе для упрощения описания может называться устройство или блок, имеющий функции не только передачи, но и приема данных, информации и/или сигналов. Аналогичным образом, устройство или блок приема может также заключать в себе функции передачи данных, информации и/или сигналов.In this document, a device or unit for transmitting may be referred to as a device or unit having functions of not only transmitting but also receiving data, information and/or signals for ease of description. Similarly, a device or unit for receiving may also include functions of transmitting data, information and/or signals.

Различные иллюстративные блоки и модули, описанные в связи с раскрытием сущности в данном документе, могут реализовываться или выполняться с помощью процессора общего назначения, процессора цифровых сигналов (DSP), специализированной интегральной схемы (ASIC), программируемой пользователем вентильной матрицы (FPGA) или другого программируемого логического устройства (PLD), дискретного логического элемента или транзисторной логики, дискретных аппаратных компонентов либо любой комбинации вышеозначенного, предназначенной для того, чтобы выполнять описанные в данном документе функции. Процессор общего назначения может представлять собой микропроцессор, но в альтернативном варианте, процессор может представлять собой любой традиционный процессор, контроллер, микроконтроллер или конечный автомат. Процессор также может реализовываться как комбинация вычислительных устройств (к примеру, комбинация DSP и микропроцессора, несколько микропроцессоров, один или более микропроцессоров вместе с DSP-ядром либо любая другая подобная конфигурация).The various illustrative blocks and modules described in connection with the disclosure herein may be implemented or executed by a general-purpose processor, a digital signal processor (DSP), an application-specific integrated circuit (ASIC), a field-programmable gate array (FPGA) or other programmable logic device (PLD), discrete logic element or transistor logic, discrete hardware components, or any combination of the foregoing designed to perform the functions described herein. A general-purpose processor may be a microprocessor, but in the alternative, the processor may be any conventional processor, controller, microcontroller, or state machine. A processor may also be implemented as a combination of computing devices (e.g., a combination of a DSP and a microprocessor, multiple microprocessors, one or more microprocessors in conjunction with a DSP core, or any other such configuration).

Некоторые блоки по отдельности или вместе могут представлять собой, например, компьютер, и включать в себя процессор, который сконфигурирован для вызова и выполнения компьютерных программ из памяти для выполнения этапов способа или функций блоков в соответствии с вариантами осуществления настоящего изобретения. Согласно вариантам осуществления, устройство может дополнительно включать в себя память. Процессор может вызывать и выполнять компьютерные программы из памяти для выполнения способа. Память может быть отдельным устройством, независимым от процессора, или может быть интегрирована в процессор. Память может хранить код, инструкции, команды и/или данные для исполнения на наборе из одного или более процессоров описанного устройства. Коды, инструкции, команды могут предписывать процессору выполнять этапы способа или функции устройства.Some units individually or together may represent, for example, a computer, and include a processor that is configured to call and execute computer programs from the memory to perform the steps of the method or the functions of the units according to the embodiments of the present invention. According to the embodiments, the device may further include a memory. The processor may call and execute computer programs from the memory to perform the method. The memory may be a separate device independent of the processor, or may be integrated into the processor. The memory may store code, instructions, commands and/or data for execution on a set of one or more processors of the described device. The codes, instructions, commands may cause the processor to perform the steps of the method or the functions of the device.

Функции, описанные в данном документе, могут реализовываться в аппаратном обеспечении, программном обеспечении, выполняемом посредством одного или более процессоров, микропрограммном обеспечении или в любой комбинации вышеозначенного. Аппаратные и программные средства, реализующие функции, также могут физически находиться в различных позициях, в том числе согласно такому распределению, что части функций реализуются в различных физических местоположениях, то есть может выполняться распределенная обработка или распределенные вычисления.The functions described in this document may be implemented in hardware, software executed by one or more processors, firmware, or any combination thereof. The hardware and software implementing the functions may also be physically located in different locations, including in a distribution such that parts of the functions are implemented in different physical locations, i.e., distributed processing or distributed computing may be performed.

При необходимости (например, в случае если велик объем данных и/или вычислений, которые необходимо выполнить в отношении этих данных), может производиться многопоточная обработка данных, которая в простом представлении может выражаться в том, что все множество подлежащих обработке данных разделяется на набор подмножеств, и каждое ядро процессора выполняет обработку в отношении назначенного для него подмножества данных.If necessary (for example, if the volume of data and/or calculations that need to be performed on this data is large), multi-threaded data processing can be performed, which in a simple representation can be expressed in the fact that the entire set of data to be processed is divided into a set of subsets, and each processor core performs processing on the subset of data assigned to it.

Вышеупомянутая память может быть энергозависимой или энергонезависимой памятью или может включать в себя как энергозависимую, так и энергонезависимую память. Специалисту в области техники должно быть также понятно, что, когда речь идет о памяти и о хранении данных, программ, кодов, инструкций, команд и т.п., подразумевается наличие машиночитаемого (или компьютерно-читаемого, процессорно-читаемого) запоминающего носителя. Машиночитаемые носители данных включают в себя как некратковременные компьютерные носители хранения данных, так и среду связи, включающую в себя любую передающую среду, которая упрощает перемещение компьютерной программы или ее части из одного места в другое. Некратковременный машиночитаемый запоминающий носитель может представлять собой любой доступный носитель, который может использоваться для того, чтобы переносить или сохранять требуемое средство программного кода в форме инструкций или структур данных, и к которому можно осуществлять доступ посредством компьютера, процессора или иного устройства обработки общего назначения или специального назначения.The above-mentioned memory may be volatile or nonvolatile memory or may include both volatile and nonvolatile memory. It should also be clear to a person skilled in the art that when talking about memory and storing data, programs, codes, instructions, commands, etc., it is implied that there is a machine-readable (or computer-readable, processor-readable) storage medium. Machine-readable storage media include both non-transitory computer storage media and communication media, including any transmission medium that facilitates the movement of a computer program or a portion thereof from one place to another. A non-transitory machine-readable storage medium may be any available medium that can be used to carry or store the desired program code means in the form of instructions or data structures and that can be accessed by a computer, processor or other general-purpose or special-purpose processing device.

В качестве примера, а не ограничения, машиночитаемые носители могут содержать постоянное запоминающее устройство (ROM), программируемое постоянное запоминающее устройство (PROM), стираемое программируемое постоянное запоминающее устройство (EPROM), электронно-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, оперативную память (RAM), статическую память с произвольным доступом (SRAM), динамическую память с произвольным доступом (DRAM), синхронную динамическую память с произвольным доступом (SDRAM), синхронную динамическую память с произвольной выборкой с двойной скоростью передачи данных (DDR SDRAM), синхронную динамическую память с произвольной выборкой с повышенной скоростью (ESDRAM), DRAM с синхронной линией связи (SLDRAM) и оперативную память с шиной прямого доступа (DR RAM), регистр, кэш-память, полупроводниковые запоминающие устройства, магнитные носители, такие как внутренние жесткие диски и съемные диски, магнитооптические носители и оптические носители, такие как диски CD-ROM и цифровые универсальные диски (DVD), а также любые другие известные в уровне техники носители данных.By way of example, and not limitation, computer-readable media may comprise read-only memory (ROM), programmable read-only memory (PROM), erasable programmable read-only memory (EPROM), electronically erasable programmable read-only memory (EEPROM), flash memory, random access memory (RAM), static random access memory (SRAM), dynamic random access memory (DRAM), synchronous dynamic random access memory (SDRAM), double data rate synchronous dynamic random access memory (DDR SDRAM), increased speed synchronous dynamic random access memory (ESDRAM), synchronous line DRAM (SLDRAM), and direct access bus random access memory (DR RAM), register, cache memory, semiconductor memories, magnetic media such as internal hard disks and removable disks, magneto-optical media, and optical media such as CD-ROMs and digital versatile discs (DVD), as well as any other data carriers known in the prior art.

Информация и сигналы, описанные в данном документе, могут представляться с помощью любой из множества различных технологий. Например, данные, инструкции, команды, информация, сигналы, биты, символы и элементарные сигналы, которые могут приводиться в качестве примера в вышеприведенном описании, могут представляться посредством напряжений, токов, электромагнитных волн, магнитных полей или частиц, оптических полей или частиц либо любой комбинации вышеозначенного, если это применимо к настоящему изобретению.The information and signals described herein may be represented by any of a variety of different technologies. For example, data, instructions, commands, information, signals, bits, symbols, and signal elements, which may be exemplified in the above description, may be represented by voltages, currents, electromagnetic waves, magnetic fields or particles, optical fields or particles, or any combination thereof, as applicable to the present invention.

По меньшей мере один из этапов в способе или блоков в устройстве может использовать модель искусственного интеллекта (AI) для выполнения соответствующих операций. Функция, связанная с AI, может выполняться через процессор и энергонезависимую и/или энергозависимую память.At least one of the steps in the method or units in the device may use an artificial intelligence (AI) model to perform the corresponding operations. The function associated with AI may be performed via a processor and non-volatile and/or volatile memory.

Процессор может включать в себя один или более процессоров. В то же время, один или более процессоров могут быть процессором общего назначения, например центральным процессором (CPU), прикладным процессором (AP) и т.п., блоком обработки только графики, таким как графический процессор (GPU), визуальный процессор (VPU), и/или специализированным процессором AI, таким как нейронный процессор (NPU).The processor may include one or more processors. At the same time, the one or more processors may be a general-purpose processor, such as a central processing unit (CPU), an application processor (AP), etc., a graphics-only processing unit, such as a graphics processing unit (GPU), a visual processing unit (VPU), and/or a specialized AI processor, such as a neural processing unit (NPU).

Один или более процессоров управляют обработкой входных данных в соответствии с предварительно определенным правилом работы или моделью искусственного интеллекта (AI), хранящейся в энергонезависимой памяти и/или энергозависимой памяти. Предварительно определенное правило работы или модель искусственного интеллекта могут быть получены путем обучения. При этом процессор может выполнять операцию предварительной обработки данных для преобразования в форму, подходящую для использования в качестве входных данных для модели искусственного интеллекта.One or more processors control the processing of input data in accordance with a predetermined operating rule or an artificial intelligence (AI) model stored in non-volatile memory and/or volatile memory. The predetermined operating rule or an AI model may be obtained by training. In this case, the processor may perform a pre-processing operation of the data to transform it into a form suitable for use as input data for the AI model.

«Получены путем обучения» означает, что посредством применения алгоритма обучения к обучаемой модели искусственного интеллекта с использованием множества обучающих данных создается предварительно определенное правило работы или модель AI с желаемой характеристикой. Обучение может выполняться на самом устройстве, в котором выполняется AI согласно варианту осуществления, и/или может быть реализовано через отдельный сервер/систему."Obtained by training" means that by applying a training algorithm to a trainable artificial intelligence model using a plurality of training data, a predetermined operating rule or AI model with a desired characteristic is created. The training may be performed on the device itself, in which the AI is executed according to the embodiment, and/or may be implemented through a separate server/system.

Модель искусственного интеллекта может включать в себя множество слоев нейронной сети. Каждый из множества слоев нейронной сети включает в себя множество весовых значений (коэффициентов) и выполняет рабочую операцию для данного слоя путем вычисления с применением множества весовых значений данного слоя в отношении входных данных или результата вычисления предыдущего слоя.An artificial intelligence model may include multiple neural network layers. Each of the multiple neural network layers includes multiple weight values (coefficients) and performs a work operation for that layer by calculating using the multiple weight values of that layer with respect to the input data or the calculation result of the previous layer.

Примеры нейронных сетей включают, помимо прочего, сверточную нейронную сеть (CNN), глубокую нейронную сеть (DNN), рекуррентную нейронную сеть (RNN), ограниченную машину Больцмана (RBM), глубокую сеть доверия (DBN), двунаправленную рекуррентную глубокую нейронную сеть (BRDNN), генеративно-состязательные сети (GAN) и глубокие Q-сети.Examples of neural networks include, but are not limited to, convolutional neural network (CNN), deep neural network (DNN), recurrent neural network (RNN), restricted Boltzmann machine (RBM), deep belief network (DBN), bidirectional recurrent deep neural network (BRDNN), generative adversarial networks (GANs), and deep Q-networks.

Алгоритм обучения - это метод обучения предварительно определенного целевого устройства (например, нейронной сети на базе GPU или NPU) с использованием множества обучающих данных, чтобы вызывать, разрешать или управлять целевым устройством для выполнения определения или прогнозирования. Примеры алгоритмов обучения включают, но не ограничиваются ими, обучение с учителем, обучение без учителя, обучение с частичным привлечением учителя или обучение с подкреплением.A learning algorithm is a method for training a predetermined target device (e.g., a GPU-based neural network or NPU) using a set of training data to cause, enable, or control the target device to make a determination or prediction. Examples of learning algorithms include, but are not limited to, supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning.

Следует понимать, что хотя в настоящем документе для описания различных блоков, модулей, сетей, элементов, компонентов, областей, слоев и/или секций, могут использоваться такие термины, как "первый", "второй", "третий" и т.п., эти блоки, модули, сети, элементы, компоненты, области, слои и/или секции не должны ограничиваться этими терминами. Эти термины используются только для того, чтобы отличить один блок, модуль, сеть, элемент, компонент, область, слой или секцию от другого блока, модуля, сети, элемента, компонента, области, слоя или секции. Так, первый блок, модуль, сеть, элемент, компонент, область, слой или секция может быть назван вторым блоком, модулем, сетью, элементом, компонентом, областью, слоем или секцией без выхода за рамки объема настоящего изобретения. В настоящем описании термин "и/или" включает любые и все комбинации из одной или более из соответствующих перечисленных позиций. Элементы, упомянутые в единственном числе, не исключают множественности элементов, если отдельно не указано иное.It should be understood that although terms such as "first", "second", "third", etc. may be used herein to describe various blocks, modules, networks, elements, components, regions, layers and/or sections, these blocks, modules, networks, elements, components, regions, layers and/or sections should not be limited by these terms. These terms are used only to distinguish one block, module, network, element, component, region, layer or section from another block, module, network, element, component, region, layer or section. Thus, a first block, module, network, element, component, region, layer or section may be referred to as a second block, module, network, element, component, region, layer or section without departing from the scope of the present invention. As used herein, the term "and/or" includes any and all combinations of one or more of the corresponding listed items. Elements mentioned in the singular do not exclude a plurality of elements unless otherwise specifically indicated.

Функциональность элемента, указанного в описании или формуле изобретения как единый элемент, может быть реализована на практике посредством нескольких компонентов устройства, и наоборот, функциональность элементов, указанных в описании или формуле изобретения как несколько отдельных элементов, может быть реализована на практике посредством единого компонента.The functionality of an element indicated in the description or claims as a single element may be implemented in practice by means of several components of the device, and vice versa, the functionality of elements indicated in the description or claims as several separate elements may be implemented in practice by means of a single component.

В одном из вариантов осуществления некоторые или все элементы/блоки/модули предложенного устройства находятся в общем корпусе, могут быть размещены на одной раме/конструкции/печатной плате/кристалле и связаны друг с другом конструктивно посредством монтажных (сборочных) операций и функционально посредством линий связи. Упомянутые линии или каналы связи, если не указано иное, являются типовыми, известными специалистам линиями связи, материальная реализация которых не требует творческих усилий. Линией связи может быть провод, набор проводов, шина, дорожка, беспроводная линия связи (индуктивная, радиочастотная, инфракрасная, ультразвуковая и т.д.). Протоколы связи по линиям связи известны специалистам и не раскрываются отдельно.In one embodiment, some or all elements/blocks/modules of the proposed device are in a common housing, can be placed on a single frame/structure/printed circuit board/crystal and are structurally connected to each other by means of assembly operations and functionally by means of communication lines. The said communication lines or channels, unless otherwise specified, are typical communication lines known to specialists, the material implementation of which does not require creative efforts. A communication line can be a wire, a set of wires, a bus, a track, a wireless communication line (inductive, radio frequency, infrared, ultrasonic, etc.). Communication protocols over communication lines are known to specialists and are not disclosed separately.

Под функциональной связью элементов следует понимать связь, обеспечивающую корректное взаимодействие этих элементов друг с другом и реализацию той или иной функциональности элементов. Частными примерами функциональной связи может быть связь с возможностью обмена информацией, связь с возможностью передачи электрического тока, связь с возможностью передачи механического движения, связь с возможностью передачи света, звука, электромагнитных или механических колебаний и т.д. Конкретный вид функциональной связи определяется характером взаимодействия упомянутых элементов, и, если не указано иное, обеспечивается широко известными средствами, используя широко известные в технике принципы.The functional connection of elements should be understood as a connection that ensures the correct interaction of these elements with each other and the implementation of one or another functionality of the elements. Particular examples of a functional connection may be a connection with the ability to exchange information, a connection with the ability to transmit electric current, a connection with the ability to transmit mechanical movement, a connection with the ability to transmit light, sound, electromagnetic or mechanical vibrations, etc. The specific type of functional connection is determined by the nature of the interaction of the mentioned elements, and, unless otherwise specified, is ensured by widely known means, using widely known principles in technology.

Несмотря на то, что примерные варианты осуществления были подробно описаны и показаны на сопроводительных чертежах, следует понимать, что такие варианты осуществления являются лишь иллюстративными и не предназначены ограничивать настоящее изобретение, и что данное изобретение не должно ограничиваться конкретными показанными и описанными компоновками и конструкциями, поскольку специалисту в данной области техники на основе информации, изложенной в описании, и знаний уровня техники могут быть очевидны различные другие модификации и варианты осуществления изобретения, не выходящие за пределы сущности и объема данного изобретения.Although exemplary embodiments have been described in detail and shown in the accompanying drawings, it should be understood that such embodiments are illustrative only and are not intended to limit the present invention, and that the present invention should not be limited to the specific arrangements and structures shown and described, since various other modifications and embodiments of the invention may be apparent to one skilled in the art from the information set forth in the description and knowledge of the prior art without departing from the spirit and scope of the present invention.

Claims (18)

1. Система диагностики синуситов по рентгеновским изображениям, содержащая:1. A system for diagnosing sinusitis using X-ray images, containing: блок получения изображений, выполненный с возможностью получать двумерное рентгеновское изображение области придаточных пазух носа;an imaging unit configured to obtain a two-dimensional X-ray image of the paranasal sinus region; блок диагностики патологий, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, с помощью нейронной сети на основе сегментации выявлять на полученном изображении участки снижения пневматизации и участки с жидкостью в придаточных пазухах носа;a pathology diagnostic unit, configured to detect, using at least one processor and memory, using a neural network based on segmentation, areas of reduced pneumatization and areas with fluid in the paranasal sinuses on the obtained image; блок сегментации анатомических структур, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, определять на полученном изображении области с высокой пневматизацией и внешние контуры каждой придаточной пазухи носа с помощью нейронной сети на основе сегментации;a segmentation unit for anatomical structures, configured to, using at least one processor and memory, determine on the obtained image areas with high pneumatization and the external contours of each paranasal sinus using a neural network based on segmentation; блок локализации патологий, выполненный с возможностью, с использованием по меньшей мере одного процессора и памяти, определять путем объединения выходных данных от блока диагностики патологий и выходных данных от блока сегментации анатомических структур принадлежность патологий конкретной придаточной пазухе носа; иa pathology localization unit configured to, using at least one processor and memory, determine by combining output data from the pathology diagnostic unit and output data from the anatomical structure segmentation unit, the belonging of pathologies to a specific paranasal sinus; and блок передачи отчета, выполненный с возможностью формировать отчет, содержащий сведения о наличии или отсутствии патологий придаточных пазух носа на полученном изображении на основе выходных данных по меньшей от одного из блока диагностики патологий, блока сегментации анатомических структур и блока локализации патологий,a report transmission unit configured to generate a report containing information on the presence or absence of paranasal sinus pathologies in the received image based on output data from at least one of the pathology diagnostic unit, the anatomical structure segmentation unit, and the pathology localization unit, причем каждая нейронная сеть предварительно обучена определять маску для каждого соответствующего ей класса, которая содержит вероятности принадлежности каждого пикселя к данному классу, причем при обучении используется функция потерь на основе коэффициента Жаккара и веса классов положительной и отрицательной метки класса, которые определяются на основе обратной частоты положительных и отрицательных меток класса для всех изображений в выборке по каждому классу, причем если для заданного изображения в истинной маске заданного класса присутствуют положительные элементы, то всему экземпляру присваивается положительная метка класса, если отсутствуют - отрицательная метка класса, причем функция потерь на основе коэффициента Жаккара вычисляется для каждой маски класса после определения маски класса для каждого класса, и если соответствующая изображению истинная метка класса является положительной, то ошибка соответствующего класса умножается на вес класса положительного экземпляра класса, а если отрицательной - на вес класса отрицательного экземпляра класса, соответственно.wherein each neural network is pre-trained to determine a mask for each class corresponding to it, which contains the probabilities of belonging of each pixel to this class, wherein during training a loss function is used based on the Jaccard coefficient and the class weights of the positive and negative class labels, which are determined based on the inverse frequency of positive and negative class labels for all images in the sample for each class, wherein if for a given image in the true mask of a given class there are positive elements, then the entire instance is assigned a positive class label, if absent - a negative class label, wherein the loss function based on the Jaccard coefficient is calculated for each class mask after determining the class mask for each class, and if the true class label corresponding to the image is positive, then the error of the corresponding class is multiplied by the class weight of the positive instance of the class, and if negative - by the class weight of the negative instance of the class, respectively. 2. Система по п. 1, в которой блок передачи отчета дополнительно выполнен с возможностью передавать копию входного изображения с нанесенными на него контурами, ограничивающими область патологии, текстовую информацию о локализации патологии и числовые значения, определяющие степень снижения пневматизации придаточных пазух носа.2. The system according to claim 1, in which the report transmission unit is additionally configured to transmit a copy of the input image with contours applied to it, limiting the area of pathology, text information about the localization of the pathology and numerical values determining the degree of reduction in pneumatization of the paranasal sinuses. 3. Система по п. 1, в которой блок локализации патологий дополнительно выполнен с возможностью проверять участки изображения, помеченные блоком диагностики патологий как содержащие патологию, на пересечение с областями изображения, выделенными блоком сегментации анатомических структур как соответствующие той или иной придаточной пазухе, и выполнять на основе этого локализацию патологий.3. The system according to claim 1, in which the pathology localization unit is additionally configured with the ability to check image areas marked by the pathology diagnostic unit as containing pathology for intersection with image areas selected by the anatomical structure segmentation unit as corresponding to a particular paranasal sinus, and to localize pathologies on this basis. 4. Система по п. 1, в которой блок локализации патологий дополнительно выполнен с возможностью, для пазухи, в которой уровень снижения пневматизации, измеренный на основании анализа нормальных анатомических структур, выявленных блоком сегментации анатомических структур, превышает критический порог, указывать снижение пневматизации.4. The system according to claim 1, in which the pathology localization unit is additionally configured to indicate a decrease in pneumatization for a sinus in which the level of pneumatization reduction, measured based on the analysis of normal anatomical structures identified by the anatomical structure segmentation unit, exceeds a critical threshold. 5. Система по п. 1, в которой каждая нейронная сеть предварительно обучена определять маску для каждого соответствующего ей класса, которая содержит вероятности принадлежности каждого пикселя к данному классу, причем при обучении используется фокусная функция потерь и веса пикселей, которые представляют собой веса для пикселей положительного примера истинной маски класса и пикселей отрицательного примера истинной маски класса, основанные на частоте пикселей, принадлежащих конкретному классу во всей выборке, причем фокусная функция потерь вычисляется для каждого пикселя маски после определения маски класса, и если соответствующий пиксель истинной маски класса относится к положительному примеру, ошибка, полученная на этом пикселе маски класса, умножается на вес пикселя положительного примера данного класса, а если соответствующий пиксель истинной маски класса относится к отрицательному примеру, ошибка, полученная на этом пикселе маски класса, умножается на вес пикселя отрицательного примера данного класса.5. The system according to claim 1, in which each neural network is pre-trained to determine a mask for each class corresponding to it, which contains the probabilities of each pixel belonging to the given class, wherein during training a focal loss function and pixel weights are used, which represent weights for the pixels of a positive example of the true class mask and the pixels of a negative example of the true class mask, based on the frequency of pixels belonging to a specific class in the entire sample, wherein the focal loss function is calculated for each pixel of the mask after determining the class mask, and if the corresponding pixel of the true class mask belongs to a positive example, the error obtained on this pixel of the class mask is multiplied by the weight of the pixel of the positive example of the given class, and if the corresponding pixel of the true class mask belongs to a negative example, the error obtained on this pixel of the class mask is multiplied by the weight of the pixel of the negative example of the given class. 6. Способ диагностики синуситов по рентгеновским изображениям, содержащий этапы, на которых:6. A method for diagnosing sinusitis using X-ray images, comprising the following steps: с использованием блока получения изображений получают двумерное рентгеновское изображение, содержащее область придаточных пазух носа;Using an imaging unit, a two-dimensional X-ray image is obtained containing the paranasal sinus area; с использованием блока диагностики патологий, содержащего нейронную сеть для сегментации, определяют на полученном изображении участки снижения пневматизации и участки с жидкостью в придаточных пазухах носа;using a pathology diagnostic block containing a neural network for segmentation, areas of reduced pneumatization and areas with fluid in the paranasal sinuses are determined on the resulting image; с использованием блока сегментации анатомических структур, содержащего нейронную сеть для сегментации, определяют на полученном изображении области с высокой пневматизацией и внешние контуры каждой придаточной пазухи носа;using a block for segmentation of anatomical structures containing a neural network for segmentation, areas with high pneumatization and the external contours of each paranasal sinus are determined on the resulting image; с использованием блока локализации патологий, на основе выходных данных от блока диагностики патологий и выходных данных от блока сегментации анатомических структур, путем определения пересечения между областями, на которых присутствует снижение пневматизации и которые соответствуют конкретной придаточной пазухе носа, определяют локализацию патологии; иusing the pathology localization unit, based on the output data from the pathology diagnostics unit and the output data from the anatomical structure segmentation unit, by determining the intersection between areas where there is a decrease in pneumatization and which correspond to a specific paranasal sinus, the localization of the pathology is determined; and с использованием блока передачи отчета формируют и передают отчет, содержаний сведения о наличии или отсутствии патологий придаточных пазух носа на полученном изображении на основе выходных данных по меньшей от одного из блока диагностики патологий, блока сегментации анатомических структур и блока локализации патологий, на устройство, запрашивавшее диагностику,using the report transmission unit, a report is generated and transmitted, containing information about the presence or absence of paranasal sinus pathologies in the received image based on output data from at least one of the pathology diagnostic unit, the anatomical structure segmentation unit and the pathology localization unit, to the device that requested the diagnostics, причем каждую нейронную сеть предварительно обучают определять маску для каждого соответствующего ей класса, которая содержит вероятности принадлежности каждого пикселя к данному классу, причем при обучении используют функцию потерь на основе коэффициента Жаккара и веса классов положительной и отрицательной метки класса, которые определяют на основе обратной частоты положительных и отрицательных меток класса для всех изображений в выборке по каждому классу, причем если для заданного изображения в истинной маске заданного класса присутствуют положительные элементы, то всему экземпляру присваивают положительную метку класса, если отсутствуют - отрицательную метку класса, причем функцию потерь на основе коэффициента Жаккара вычисляют для каждой маски класса после определения маски класса для каждого класса, и если соответствующая изображению истинная метка класса является положительной, то ошибку соответствующего класса умножают на вес класса положительного экземпляра класса, а если отрицательной - на вес класса отрицательного экземпляра класса, соответственно.wherein each neural network is pre-trained to determine a mask for each class corresponding to it, which contains the probabilities of each pixel belonging to this class, wherein during training a loss function is used based on the Jaccard coefficient and the class weights of the positive and negative class labels, which are determined based on the inverse frequency of positive and negative class labels for all images in the sample for each class, wherein if for a given image in the true mask of a given class there are positive elements, then the entire instance is assigned a positive class label, if absent - a negative class label, wherein the loss function based on the Jaccard coefficient is calculated for each class mask after determining the class mask for each class, and if the true class label corresponding to the image is positive, then the error of the corresponding class is multiplied by the class weight of the positive instance of the class, and if negative - by the class weight of the negative instance of the class, respectively.
RU2023135721A 2023-12-28 System and method for diagnosing sinusitis by x-ray images RU2828554C1 (en)

Publications (1)

Publication Number Publication Date
RU2828554C1 true RU2828554C1 (en) 2024-10-14

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10755413B1 (en) * 2020-02-24 2020-08-25 Qure.Ai Technologies Private Limited Method and system for medical imaging evaluation
RU2734575C1 (en) * 2020-04-17 2020-10-20 Общество с ограниченной ответственностью "АЙРИМ" (ООО "АЙРИМ") Method and system for identifying new growths on x-ray images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10755413B1 (en) * 2020-02-24 2020-08-25 Qure.Ai Technologies Private Limited Method and system for medical imaging evaluation
RU2734575C1 (en) * 2020-04-17 2020-10-20 Общество с ограниченной ответственностью "АЙРИМ" (ООО "АЙРИМ") Method and system for identifying new growths on x-ray images

Similar Documents

Publication Publication Date Title
EP4036931B1 (en) Training method for specializing artificial intelligence model in institution for deployment, and apparatus for training artificial intelligence model
US10952613B2 (en) Stroke diagnosis and prognosis prediction method and system
US10499857B1 (en) Medical protocol change in real-time imaging
Ahmed et al. Ensemble of ROI-based convolutional neural network classifiers for staging the Alzheimer disease spectrum from magnetic resonance imaging
US11630995B2 (en) Characterization of amount of training for an input to a machine-learned network
US11471096B2 (en) Automatic computerized joint segmentation and inflammation quantification in MRI
Yeo et al. Evaluation of techniques to improve a deep learning algorithm for the automatic detection of intracranial haemorrhage on CT head imaging
CN116034398A (en) Attentional multi-arm machine learning model for lesion segmentation
CN111784652B (en) MRI (magnetic resonance imaging) segmentation method based on reinforcement learning multi-scale neural network
KR20190068254A (en) Method, Device and Program for Estimating Time of Lesion Occurrence
Park et al. Multi-pose-based convolutional neural network model for diagnosis of patients with central lumbar spinal stenosis
US20230368423A1 (en) Precise slice-level localization of intracranial hemorrhage on head cts with networks trained on scan-level labels
Priya et al. An intellectual caries segmentation and classification using modified optimization-assisted transformer denseUnet++ and ViT-based multiscale residual denseNet with GRU
WO2023200990A1 (en) Automated methods for determining fibroglandular density on mammograms
RU2828554C1 (en) System and method for diagnosing sinusitis by x-ray images
RU2825519C1 (en) System and method for determining pathologies of paranasal sinuses by x-ray images
RU2825958C1 (en) System and method for diagnosing pathologies of paranasal sinuses by x-ray images
CN115187566A (en) Intracranial aneurysm detection method and device based on MRA image
CN117218135B (en) Method and related equipment for segmenting plateau pulmonary edema chest film focus based on transducer
Nagaraj et al. Optimized tsa resnet architecture with tsh—discriminatory features for kidney stone classification from qus images
RU2840009C1 (en) System and method for detecting pulmonary pathologies from x-ray images
RU2840011C1 (en) System and method for diagnosing pulmonary pathologies from x-ray images
Nurfadhillah et al. Effectiveness of Automatic Detection of Osteoarthritis using Convolutional Neural Network (CNN) Method with DenseNet201 on Digital Images of Knee Joint Radiography
RU2845119C2 (en) System and method for determining pulmonary pathologies from x-ray images
KR20230128210A (en) Device and method of medical image regression for the diagnosis of dementia