RU2846351C1 - System for converting a structured data array containing information objects of a digitized document - Google Patents
System for converting a structured data array containing information objects of a digitized documentInfo
- Publication number
- RU2846351C1 RU2846351C1 RU2024118105A RU2024118105A RU2846351C1 RU 2846351 C1 RU2846351 C1 RU 2846351C1 RU 2024118105 A RU2024118105 A RU 2024118105A RU 2024118105 A RU2024118105 A RU 2024118105A RU 2846351 C1 RU2846351 C1 RU 2846351C1
- Authority
- RU
- Russia
- Prior art keywords
- data structure
- linguistic
- elements
- data
- constructions
- Prior art date
Links
Abstract
Description
[1] ОБЛАСТЬ ТЕХНИКИ[1] FIELD OF TECHNOLOGY
[2] Группа изобретений относится к решениям в области обработки массивов данных, в частности, к решениям в области обработки структурированных массивов данных, содержащих текст на естественном языке, в частности, лингвистические предложения, и может быть использована для предварительного преобразования структурированного массива данных для обеспечения его последующей обработки. [2] The group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of processing structured data arrays containing text in natural language, in particular, linguistic sentences, and can be used for preliminary transformation of a structured data array to ensure its subsequent processing.
[3] УРОВЕНЬ ТЕХНИКИ[3] LEVEL OF TECHNOLOGY
[4] Из патента РФ 2544739 (Рогачев Игорь Петрович), опубл. 20.03.2015 (Д1) известен способ преобразования структурированного массива данных. В известном из Д1 способе преобразования структурированного массива данных, содержащего текст на естественном языке, формируют (101) первую структуру данных структурированного массива данных из итоговой структуры данных структурированного массива данных. Формируют (102) базу данных логических связей логических разделов элементов первой структуры данных. Формируют (103) вторую структуру данных структурированного массива данных. Формируют (104) базу данных семантических частей логических разделов элементов второй структуры данных. Формируют (105) грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных путем лингвистических преобразований над упомянутыми семантическими частями. Формируют (106) итоговую структуру данных структурированного массива данных.[4] A method for transforming a structured data array is known from Russian patent 2544739 (Igor Petrovich Rogachev), published 20.03.2015 (D1). In the method for transforming a structured data array containing text in a natural language known from D1, a first data structure of the structured data array is formed (101) from the final data structure of the structured data array. A database of logical connections of logical sections of elements of the first data structure is formed (102). A second data structure of the structured data array is formed (103). A database of semantic parts of logical sections of elements of the second data structure is formed (104). Grammatically and orthographically correct semantic parts of logical sections of elements of the second data structure are formed (105) by means of linguistic transformations over the said semantic parts. The final data structure of the structured data array is formed (106).
[5] В известном из Д1 способе обеспечивается преобразование структурированного массива данных для получения логических конструкций с грамматически и орфографически верными семантическими частями, что может быть полезно для повышения точности поиска информации в неспециализированных массивах данных, таких как, например, художественная литература или публицистика. Вместе с тем, преобразования, известные из Д1, не обеспечивают формирование ни базовых конструкций предметной области, ни тем более целевых конструкций предметной области, которые обеспечивают надежную идентификацию предметных ролей, что требуется для проведения высокоточных поисков в специализированных предметных областях, таких как, например. юриспруденция. Более того, известный из Д1 способ пригоден лишь для работы с текстами на естественном языке, то есть требует предварительную выборку текстов из документа.[5] The method known from D1 provides for the transformation of a structured data array to obtain logical constructions with grammatically and orthographically correct semantic parts, which can be useful for increasing the accuracy of information retrieval in non-specialized data arrays, such as, for example, fiction or journalism. At the same time, the transformations known from D1 do not provide for the formation of either the basic constructions of the subject area, or even less the target constructions of the subject area, which provide reliable identification of subject roles, which is required for conducting high-precision searches in specialized subject areas, such as, for example, jurisprudence. Moreover, the method known from D1 is suitable only for working with texts in natural language, that is, it requires preliminary selection of texts from the document.
[6] Известное из Д1 решение может быть принято в качестве ближайшего аналога.[6] The solution known from D1 can be accepted as the closest analogue.
[7] РАСКРЫТИЕ ИЗОБРЕТЕНИЯ[7] DISCLOSURE OF INVENTION
[8] Технической проблемой, решаемой заявленным изобретением, является создание изобретений, не обладающих недостатками ближайшего аналога и таким образом обладающих повышенной эффективностью обработки оцифрованных документов для последующей индексации его элементов, их обработки и проведения поисков с их использованием. Другой технической проблемой, решаемой заявленным изобретением, является расширение арсенала технических средств - способов преобразования структурированных массивов данных, содержащих информационные объекты оцифрованных документов. [8] The technical problem solved by the claimed invention is the creation of inventions that do not have the disadvantages of the closest analogue and thus have increased efficiency in processing digitized documents for subsequent indexing of its elements, their processing and conducting searches using them. Another technical problem solved by the claimed invention is the expansion of the arsenal of technical means - methods for converting structured data arrays containing information objects of digitized documents.
[9] Техническим результатом, достигаемым при реализации заявленного изобретения, помимо реализации им своего назначения, является устранение недостатков ближайшего аналога и таким образом повышение эффективности обработки оцифрованных документов для последующей индексации его элементов, их обработки и проведения поисков с их использованием. [9] The technical result achieved by implementing the claimed invention, in addition to fulfilling its purpose, is the elimination of the shortcomings of the closest analogue and thus increasing the efficiency of processing digitized documents for subsequent indexing of its elements, their processing and conducting searches using them.
[10] Технический результат достигается за счет того, что обеспечивается система преобразования структурированного массива данных, содержащего, по меньшей мере, информационные объекты оцифрованного документа, являющиеся отдельными блоками информационного контента оцифрованного документа, представляющие собой текстовые информационные объекты, и/или представляющие собой визуальные информационные объекты, и/или представляющие собой текстово-визуальные информационные объекты; система, по меньшей мере, содержит: серверное компьютерное устройство преобразования структурированного массива данных; серверное компьютерное устройство, по меньшей мере, содержит: процессор; память, содержащую код программы, который при выполнении процессором побуждает компьютерное устройство выполнять действия способа преобразования структурированного массива данных, содержащего, по меньшей мере, информационные объекты оцифрованного документа, являющиеся отдельными блоками информационного контента оцифрованного документа, представляющие собой текстовые информационные объекты, и/или представляющие собой визуальные информационные объекты, и/или представляющие собой текстово-визуальные информационные объекты; способ характеризуется: выполнением этапа 1001 формирования первой структуры данных, на котором формируют первую структуру данных, содержащую элементы первой структуры данных, представляющие собой смысловые части информационных объектов оцифрованного документа, а также идентификационные данные таких смысловых частей, представляющие собой значения таких смысловых частей и порядковые номера таких смысловых частей в оцифрованном документе; выполнением этапа 1002 формирования базы данных системных признаков смысловых частей, на котором выявляют системные признаки содержащихся в первой структуре данных смысловых частей, представляющие собой форматные системные характеристики таких смысловых частей и функциональные системные характеристики таких смысловых частей, а также значения соответствующих упомянутых системных характеристик, для выявления смысловых частей со структурными системными признаками, и/или для выявления смысловых частей с логическими системными признаками, и/или для выявления смысловых частей с информационными системными признаками, и/или для выявления смысловых частей с реквизитными системными признаками; и формируют из таких выявленных системных признаков базу данных системных признаков смысловых частей; выполнением этапа 1003 формирования второй структуры данных, характеризующегося: выполнением этапа 10031 идентификации и формирования элементов второй структуры данных, на котором идентифицируют и формируют элементы второй структуры данных, представляющие собой интегрированные смысловые части информационных объектов оцифрованного документа, и представляющие собой сгруппированные содержащиеся в первой структуре данных смысловые части с совпадающими системными признаками или сгруппированные содержащиеся в первой структуре данных смысловые части с уникальными системными признаками, а также идентификационные данные интегрированных смысловых частей, представляющие собой неповторяющиеся разновидности упомянутых смысловых частей с совпадающими системными признаками или упомянутых смысловых частей с уникальными системными признаками, значения упомянутых смысловых частей с совпадающими системными признаками или упомянутых смысловых частей с уникальными системными признаками, и порядковые номера в оцифрованном документе упомянутых смысловых частей с совпадающими системными признаками или упомянутых смысловых частей с уникальными системными признаками, причем такие упомянутые смысловые части с совпадающими системными признаками или такие упомянутые смысловые части с уникальными системными признаками составляют упомянутые интегрированные смысловые части; выполнением этапа 10032 формирования второй структуры данных, на котором формируют вторую структуру данных из идентифицированных и сформированных элементов второй структуры данных и их идентификационных данных; и способ характеризуется: выполнением этапа 1004 формирования третьей структуры данных, на котором формируют третью структуру данных, содержащую в качестве элементов третьей структуры данных лингвистические конструкции, представляющие собой содержащиеся во второй структуре данных интегрированные смысловые части информационных объектов оцифрованного документа, причем такие интегрированные смысловые части имеют системные признаки текстовых логических смысловых частей, а также содержащую идентификационные данные лингвистических конструкций, представляющие собой значения лингвистических конструкций и порядковые номера лингвистических конструкций в оцифрованном документе, причем лингвистическими конструкциями в оцифрованном документе являются одни из следующих лингвистических конструкций или комбинация из следующих лингвистических конструкций: обычные лингвистические конструкции третьей структуры данных, являющиеся лингвистическими предложениями, особые лингвистические конструкции третьей структуры данных, являющиеся списками или рубриками перечисления, реконструируемые лингвистические конструкции третьей структуры данных, являющиеся таблицами, содержащими, по меньшей мере, две строки и два столбца, причем, по меньшей мере, одна строка содержит заголовки столбцов и/или, соответственно, по меньшей мере, один столбец содержит заголовки строк; выполнением этапа 1005 формирования четвертой структуры данных, на котором формируют четвертую структуру данных, содержащую в качестве элементов четвертой структуры данных лингвистические предложения четвертой структуры данных, сформированные из элементов третьей структуры данных и представляющие собой либо лингвистические предложения, являющиеся обычными лингвистическими конструкциями третьей структуры данных, либо лингвистические предложения, полученные посредством преобразования особых лингвистических конструкций третьей структуры данных, либо лингвистические предложения, полученные посредством воссоздания из реконструируемых лингвистических конструкций третьей структуры данных; причем четвертая структура данных включает также идентификационные данные лингвистических предложений четвертой структуры данных, представляющие собой значения лингвистических предложений четвертой структуры данных и порядковые номера лингвистических предложений четвертой структуры данных в четвертой структуре данных; выполнением этапа 1006 формирования пятой структуры данных, на котором формируют пятую структуру данных, содержащую в качестве элементов пятой структуры данных текстовые элементы лингвистических предложений четвертой структуры данных, а также идентификационные данные текстовых элементов лингвистических предложений четвертой структуры данных, представляющие собой значения соответствующих текстовых элементов соответствующих лингвистических предложений четвертой структуры данных и порядковые номера соответствующих текстовых элементов в соответствующих лингвистических предложениях четвертой структуры данных; выполнением этапа 1007 формирования базы данных лингво-логическо-предметных признаков, на котором выявляют лингвистические, логические и предметные признаки текстовых элементов лингвистических предложений четвертой структуры данных и формируют из выявленных признаков базу данных лингво-логическо-предметных признаков; выполнением этапа 1008 формирования шестой структуры данных, на котором формируют шестую структуру данных, содержащую элементы шестой структуры данных, представляющие собой компоненты простого суждения, которые представляют собой компоненты соответствующих простых суждений, причем простые суждения являются простыми суждениями соответствующих лингвистических предложений четвертой структуры данных, а также содержащую идентификационные данные упомянутых компонентов простого суждения, представляющие собой для каждого соответствующего компонента простого суждения из шестой структуры данных вид такого соответствующего компонента простого суждения, значение такого соответствующего компонента простого суждения и порядковый номер такого соответствующего компонента простого суждения в соответствующем лингвистическом предложении; выполнением этапа 1009 формирования седьмой структуры данных, на котором формируют седьмую структуру данных, содержащую элементы седьмой структуры данных, представляющие собой простые суждения соответствующих лингвистических предложений четвертой структуры данных, а также содержащую идентификационные данные таких простых суждений, представляющие собой значения соответствующих простых суждений и порядковые номера соответствующих простых суждений в соответствующих лингвистических предложениях четвертой структуры данных; выполнением этапа 1010 формирования восьмой структуры данных, на котором формируют восьмую структуру данных, содержащую элементы восьмой структуры данных, представляющие собой итоговые суждения соответствующих лингвистических предложений четвертой структуры данных, сформированные из упомянутых простых суждений соответствующих лингвистических предложений четвертой структуры данных, а также содержащую идентификационные данные итоговых суждений, представляющие собой значения итоговых суждений и порядковые номера итоговых суждений в восьмой структуре данных; выполнением этапа 1011 формирования девятой структуры данных, на котором формируют девятую структуру данных, содержащую элементы девятой структуры данных, представляющие собой базовые конструкции предметной области, сформированные из данных, включающих данные упомянутой сформированной по результатам выполнения этапа 1008 шестой структуры данных, причем формирование базовых конструкций предметной области осуществляют на основании данных о формализованной модели базовой конструкции предметной области и данных о формализованной модели логической конструкции суждения, а также содержащую идентификационные данные базовых конструкций предметной области, представляющие собой значения базовых конструкций предметной области и порядковые номера базовых конструкций предметной области в девятой структуре данных; выполнением этапа 1012 формирования итоговой структуры данных, на котором формируют итоговую структуру данных, содержащую элементы итоговой структуры данных, представляющие собой целевые конструкции предметной области, сформированные из базовых конструкций предметной области, содержащихся в девятой структуре данных, причем формирование целевых конструкций предметной области осуществляют на основании данных о формализованной модели целевой конструкции предметной области, а также содержащую идентификационные данные целевых конструкций предметной области, представляющие собой значения целевых конструкций предметной области и порядковые номера целевых конструкций предметной области в итоговой структуре данных; и система содержит: пользовательское устройство, представляющее собой тонкий клиент, содержащее, по меньшей мере: устройство ввода-вывода; процессор; память; причем пользовательское устройство связано с серверным устройством и выполнено с возможностью передавать на серверное устройство команды выполнения упомянутого способа преобразования структурированного массива данных и получать от серверного устройства результат выполнения упомянутого способа преобразования структурированного массива данных.[10] The technical result is achieved due to the fact that a system is provided for converting a structured data array containing at least information objects of a digitized document, which are separate blocks of the information content of the digitized document, which are textual information objects, and/or which are visual information objects, and/or which are textual and visual information objects; the system at least comprises: a server computer device for converting a structured data array; the server computer device at least comprises: a processor; memory containing program code which, when executed by the processor, causes the computer device to perform actions of the method for converting a structured data array containing at least information objects of a digitized document, which are separate blocks of the information content of the digitized document, which are textual information objects, and/or which are visual information objects, and/or which are textual and visual information objects; the method is characterized by: performing a step 1001 of forming a first data structure, at which a first data structure is formed, containing elements of the first data structure, representing the semantic parts of the information objects of the digitized document, as well as identification data of such semantic parts, representing the values of such semantic parts and the ordinal numbers of such semantic parts in the digitized document; performing a step 1002 of forming a database of system features of the semantic parts, at which system features of the semantic parts contained in the first data structure are identified, representing the format system characteristics of such semantic parts and the functional system characteristics of such semantic parts, as well as the values of the corresponding mentioned system characteristics, for identifying the semantic parts with structural system features, and/or for identifying the semantic parts with logical system features, and/or for identifying the semantic parts with information system features, and/or for identifying the semantic parts with requisite system features; and forming a database of system features of the semantic parts from such identified system features; performing a step 1003 of forming a second data structure, characterized by: performing a step 10031 of identifying and forming elements of the second data structure, in which elements of the second data structure are identified and formed, representing integrated semantic parts of information objects of the digitized document, and representing grouped semantic parts contained in the first data structure with matching system features or grouped semantic parts contained in the first data structure with unique system features, as well as identification data of the integrated semantic parts, representing non-repeating varieties of said semantic parts with matching system features or said semantic parts with unique system features, the values of said semantic parts with matching system features or said semantic parts with unique system features, and serial numbers in the digitized document of said semantic parts with matching system features or said semantic parts with unique system features, wherein such said semantic parts with coinciding system features or such said semantic parts with unique system features constitute said integrated semantic parts; by performing step 10032 of forming the second data structure, at which the second data structure is formed from the identified and formed elements of the second data structure and their identification data; and the method is characterized by: performing a step 1004 of forming a third data structure, in which a third data structure is formed, containing as elements of the third data structure linguistic constructions, which are integrated semantic parts of the information objects of the digitized document contained in the second data structure, wherein such integrated semantic parts have systemic features of text logical semantic parts, and also containing identification data of linguistic constructions, which are values of linguistic constructions and ordinal numbers of linguistic constructions in the digitized document, wherein the linguistic constructions in the digitized document are one of the following linguistic constructions or a combination of the following linguistic constructions: ordinary linguistic constructions of the third data structure, which are linguistic sentences, special linguistic constructions of the third data structure, which are lists or enumeration headings, reconstructed linguistic constructions of the third data structure, which are tables containing at least two rows and two columns, wherein at least one row contains column headers and/or, respectively, at least one column contains row headers; performing step 1005 of forming a fourth data structure, in which a fourth data structure is formed, containing as elements of the fourth data structure linguistic sentences of a fourth data structure, formed from elements of the third data structure and representing either linguistic sentences that are ordinary linguistic constructions of the third data structure, or linguistic sentences obtained by transforming special linguistic constructions of the third data structure, or linguistic sentences obtained by recreating from reconstructed linguistic constructions of the third data structure; wherein the fourth data structure also includes identification data of the linguistic sentences of the fourth data structure, representing values of the linguistic sentences of the fourth data structure and ordinal numbers of the linguistic sentences of the fourth data structure in the fourth data structure; performing step 1006 of forming a fifth data structure, in which a fifth data structure is formed, containing as elements of the fifth data structure text elements of linguistic sentences of the fourth data structure, as well as identification data of text elements of linguistic sentences of the fourth data structure, representing the values of the corresponding text elements of the corresponding linguistic sentences of the fourth data structure and the ordinal numbers of the corresponding text elements in the corresponding linguistic sentences of the fourth data structure; performing step 1007 of forming a database of linguo-logical-subject features, in which linguistic, logical and subject features of text elements of linguistic sentences of the fourth data structure are identified and a database of linguo-logical-subject features is formed from the identified features; performing step 1008 of forming a sixth data structure, in which a sixth data structure is formed, containing elements of the sixth data structure, representing components of a simple judgment, which represent components of corresponding simple judgments, wherein the simple judgments are simple judgments of corresponding linguistic sentences of the fourth data structure, and also containing identification data of said components of a simple judgment, representing for each corresponding component of a simple judgment from the sixth data structure the type of such corresponding component of a simple judgment, the value of such corresponding component of a simple judgment and the ordinal number of such corresponding component of a simple judgment in the corresponding linguistic sentence; performing step 1009 of forming a seventh data structure, in which a seventh data structure is formed, containing elements of the seventh data structure, representing simple judgments of the corresponding linguistic sentences of the fourth data structure, and also containing identification data of such simple judgments, representing values of the corresponding simple judgments and ordinal numbers of the corresponding simple judgments in the corresponding linguistic sentences of the fourth data structure; performing step 1010 of forming an eighth data structure, in which an eighth data structure is formed, containing elements of the eighth data structure, representing final judgments of the corresponding linguistic sentences of the fourth data structure, formed from the mentioned simple judgments of the corresponding linguistic sentences of the fourth data structure, and also containing identification data of the final judgments, representing values of the final judgments and ordinal numbers of the final judgments in the eighth data structure; performing step 1011 of forming a ninth data structure, in which a ninth data structure is formed, containing elements of the ninth data structure, representing basic constructs of the subject area, formed from data, including data of the said sixth data structure formed as a result of performing step 1008, wherein the formation of basic constructs of the subject area is carried out on the basis of data on the formalized model of the basic construct of the subject area and data on the formalized model of the logical construct of the judgment, and also containing identification data of the basic constructs of the subject area, representing the values of the basic constructs of the subject area and the ordinal numbers of the basic constructs of the subject area in the ninth data structure; performing step 1012 of forming the final data structure, in which the final data structure is formed, containing elements of the final data structure, representing the target constructions of the subject area, formed from the basic constructions of the subject area, contained in the ninth data structure, wherein the formation of the target constructions of the subject area is carried out on the basis of data on the formalized model of the target construction of the subject area, and also containing identification data of the target constructions of the subject area, representing the values of the target constructions of the subject area and the ordinal numbers of the target constructions of the subject area in the final data structure; and the system comprises: a user device, which is a thin client, containing, at least: an input-output device; a processor; memory; wherein the user device is connected to the server device and is configured to transmit commands for executing the said method of converting a structured array of data to the server device and to receive from the server device the result of executing the said method of converting a structured array of data.
[11] КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ[11] BRIEF DESCRIPTION OF DRAWINGS
[12] Иллюстративные варианты осуществления настоящего изобретения описываются далее подробно со ссылкой на прилагаемые чертежи, которые включены в данный документ посредством ссылки, и на которых:[12] Illustrative embodiments of the present invention are described below in detail with reference to the accompanying drawings, which are incorporated herein by reference, and in which:
[13] На фиг. 1, в качестве примера, но не ограничения, изображена общая схема выполнения этапов способа 1000.[13] Fig. 1, by way of example and not limitation, shows a general flow chart of the steps of method 1000.
[14] На фиг. 2, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1001.[14] Fig. 2, by way of example and not limitation, shows a general flow chart of the steps of step 1001.
[15] На фиг. 3, в качестве примера, но не ограничения, изображена общая структура исходной структуры данных.[15] Fig. 3 shows, by way of example and not limitation, the general structure of the original data structure.
[16] На фиг. 4, в качестве примера, но не ограничения, изображена общая структура сформированной первой структуры данных.[16] Fig. 4 shows, by way of example and not limitation, the general structure of the generated first data structure.
[17] На фиг. 5, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1002.[17] Fig. 5, by way of example and not limitation, shows a general flow chart of the steps of step 1002.
[18] На фиг. 6, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных системных признаков.[18] Fig. 6 shows, by way of example and not limitation, the general structure of the generated database of system features.
[19] На фиг. 7, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1003.[19] Fig. 7, by way of example and not limitation, shows a general flow chart of the steps of step 1003.
[20] На фиг. 8, в качестве примера, но не ограничения, изображена общая структура сформированной второй структуры данных.[20] Fig. 8 shows, by way of example and not limitation, the general structure of the generated second data structure.
[21] На фиг. 9, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1004.[21] Fig. 9, by way of example and not limitation, shows a general flow chart of the steps of step 1004.
[22] На фиг. 10, в качестве примера, но не ограничения, изображена общая структура сформированной третьей структуры данных.[22] Fig. 10 shows, by way of example and not limitation, the general structure of the generated third data structure.
[23] На фиг. 11, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1005.[23] Fig. 11, by way of example and not limitation, shows a general flow chart of the steps of step 1005.
[24] На фиг. 12, в качестве примера, но не ограничения, изображена общая структура сформированной четвертой структуры данных.[24] Fig. 12 shows, by way of example and not limitation, the general structure of the generated fourth data structure.
[25] На фиг. 13, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1006.[25] Fig. 13, by way of example and not limitation, shows a general flow chart of the steps of step 1006.
[26] На фиг. 14, в качестве примера, но не ограничения, изображена общая структура сформированной пятой структуры данных.[26] Fig. 14 shows, by way of example and not limitation, the general structure of the generated fifth data structure.
[27] На фиг. 15, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1007.[27] Fig. 15, by way of example and not limitation, shows a general flow chart of the steps of step 1007.
[28] На фиг. 16, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных лингво-логическо-предметных признаков.[28] Fig. 16, as an example but not a limitation, shows the general structure of the generated database of linguistic-logical-subject features.
[29] На фиг. 17, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1008.[29] Fig. 17, by way of example and not limitation, shows a general flow chart of the steps of step 1008.
[30] На фиг. 18, в качестве примера, но не ограничения, изображена общая структура сформированной шестой структуры данных.[30] Fig. 18 shows, by way of example and not limitation, the general structure of the generated sixth data structure.
[31] На фиг. 19, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1009.[31] Fig. 19, by way of example and not limitation, shows a general flow chart of the steps of step 1009.
[32] На фиг. 20, в качестве примера, но не ограничения, изображена общая структура сформированной седьмой структуры данных.[32] Fig. 20 shows, by way of example and not limitation, the general structure of the generated seventh data structure.
[33] На фиг. 21, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1010.[33] Fig. 21, by way of example and not limitation, shows a general flow chart of the steps of step 1010.
[34] На фиг. 22, в качестве примера, но не ограничения, изображена общая структура сформированной восьмой структуры данных.[34] Fig. 22 shows, by way of example and not limitation, the general structure of the generated eighth data structure.
[35] На фиг. 23, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1011.[35] Fig. 23, by way of example and not limitation, shows a general diagram of the execution of the steps of step 1011.
[36] На фиг. 24, в качестве примера, но не ограничения, изображена общая структура сформированной девятой структуры данных.[36] Fig. 24 shows, by way of example and not limitation, the general structure of the generated ninth data structure.
[37] На фиг. 25, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1012.[37] Fig. 25, by way of example and not limitation, shows a general flow chart of the steps of step 1012.
[38] На фиг. 26, в качестве примера, но не ограничения, изображена общая структура сформированной итоговой структуры данных.[38] Fig. 26 shows, by way of example and not limitation, the general structure of the generated final data structure.
[39] На фиг. 27, в качестве примера, но не ограничения, проиллюстрирована примерная схема системы 2000.[39] Fig. 27 illustrates, by way of example and not limitation, an exemplary diagram of a system 2000.
[40] ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ[40] IMPLEMENTATION OF THE INVENTION
[41] Описанные в данном разделе возможные осуществления вариантов настоящего изобретения представлены на неограничивающих объем правовой охраны примерах, применительно к конкретным вариантам осуществления настоящего изобретения, которые во всех их аспектах предполагаются иллюстративными и не накладывающими ограничения. Альтернативные варианты реализации настоящего изобретения, не выходящие за пределы объема его правовой охраны, являются очевидными специалистам в данной области, имеющим обычную квалификацию, на которых это изобретение рассчитано.[41] The possible embodiments of the variants of the present invention described in this section are presented in non-limiting examples applicable to specific embodiments of the present invention, which in all their aspects are intended to be illustrative and non-limiting. Alternative embodiments of the present invention, which do not go beyond the scope of its legal protection, are obvious to specialists in the field, having the usual qualifications, for whom this invention is intended.
На фиг. 1, в качестве примера, но не ограничения, изображена общая схема выполнения этапов способа 1000, представляющего собой исполняемый процессором или процессорами компьютерного устройства способ преобразования структурированного массива данных, содержащего, по меньшей мере, информационные объекты оцифрованного документа, являющиеся отдельными блоками информационного контента оцифрованного документа, представляющие собой текстовые информационные объекты, и/или представляющие собой визуальные информационные объекты, и/или представляющие собой текстово-визуальные информационные объекты; способ характеризуется: выполнением этапа 1001 формирования первой структуры данных, на котором формируют первую структуру данных, содержащую элементы первой структуры данных, представляющие собой смысловые части информационных объектов оцифрованного документа, а также идентификационные данные таких смысловых частей, представляющие собой значения таких смысловых частей и порядковые номера таких смысловых частей в оцифрованном документе; выполнением этапа 1002 формирования базы данных системных признаков смысловых частей, на котором выявляют системные признаки содержащихся в первой структуре данных смысловых частей, представляющие собой форматные системные характеристики таких смысловых частей и функциональные системные характеристики таких смысловых частей, а также значения соответствующих упомянутых системных характеристик, для выявления смысловых частей со структурными системными признаками, и/или для выявления смысловых частей с логическими системными признаками, и/или для выявления смысловых частей с информационными системными признаками, и/или для выявления смысловых частей с реквизитными системными признаками; и формируют из таких выявленных системных признаков базу данных системных признаков смысловых частей; выполнением этапа 1003 формирования второй структуры данных, на котором формируют вторую структуру данных, содержащую элементы второй структуры данных, представляющие собой интегрированные смысловые части информационных объектов оцифрованного документа, представляющие собой сгруппированные содержащиеся в первой структуре данных смысловые части с совпадающими системными признаками или сгруппированные содержащиеся в первой структуре данных смысловые части с уникальными системными признаками, а также содержащую идентификационные данные интегрированных смысловых частей, представляющие собой неповторяющиеся разновидности упомянутых смысловых частей с совпадающими системными признаками или упомянутых смысловых частей с уникальными системными признаками, значения упомянутых смысловых частей с совпадающими системными признаками или упомянутых смысловых частей с уникальными системными признаками, и порядковые номера в оцифрованном документе упомянутых смысловых частей с совпадающими системными признаками или упомянутых смысловых частей с уникальными системными признаками, причем такие упомянутые смысловые части с совпадающими системными признаками или такие упомянутые смысловые части с уникальными системными признаками составляют упомянутые интегрированные смысловые части; выполнением этапа 1004 формирования третьей структуры данных, на котором формируют третью структуру данных, содержащую в качестве элементов третьей структуры данных лингвистические конструкции, представляющие собой содержащиеся во второй структуре данных интегрированные смысловые части информационных объектов оцифрованного документа, причем такие интегрированные смысловые части имеют системные признаки текстовых логических смысловых частей, а также содержащую идентификационные данные лингвистических конструкций, представляющие собой значения лингвистических конструкций и порядковые номера лингвистических конструкций в оцифрованном документе, причем лингвистическими конструкциями в оцифрованном документе являются одни из следующих лингвистических конструкций или комбинация из следующих лингвистических конструкций: обычные лингвистические конструкции третьей структуры данных, являющиеся лингвистическими предложениями, особые лингвистические конструкции третьей структуры данных, являющиеся списками или рубриками перечисления, реконструируемые лингвистические конструкции третьей структуры данных, являющиеся таблицами, содержащими, по меньшей мере, две строки и два столбца, причем, по меньшей мере, одна строка содержит заголовки столбцов и/или, соответственно, по меньшей мере, один столбец содержит заголовки строк; выполнением этапа 1005 формирования четвертой структуры данных, на котором формируют четвертую структуру данных, содержащую в качестве элементов четвертой структуры данных лингвистические предложения четвертой структуры данных, сформированные из элементов третьей структуры данных и представляющие собой либо лингвистические предложения, являющиеся обычными лингвистическими конструкциями третьей структуры данных, либо лингвистические предложения, полученные посредством преобразования особых лингвистических конструкций третьей структуры данных, либо лингвистические предложения, полученные посредством воссоздания из реконструируемых лингвистических конструкций третьей структуры данных; причем четвертая структура данных включает также идентификационные данные лингвистических предложений четвертой структуры данных, представляющие собой значения лингвистических предложений четвертой структуры данных и порядковые номера лингвистических предложений четвертой структуры данных в четвертой структуре данных; выполнением этапа 1006 формирования пятой структуры данных, на котором формируют пятую структуру данных, содержащую в качестве элементов пятой структуры данных текстовые элементы лингвистических предложений четвертой структуры данных, а также идентификационные данные текстовых элементов лингвистических предложений четвертой структуры данных, представляющие собой значения соответствующих текстовых элементов соответствующих лингвистических предложений четвертой структуры данных и порядковые номера соответствующих текстовых элементов в соответствующих лингвистических предложениях четвертой структуры данных; выполнением этапа 1007 формирования базы данных лингво-логическо-предметных признаков, на котором выявляют лингвистические, логические и предметные признаки текстовых элементов лингвистических предложений четвертой структуры данных и формируют из выявленных признаков базу данных лингво-логическо-предметных признаков; выполнением этапа 1008 формирования шестой структуры данных, на котором формируют шестую структуру данных, содержащую элементы шестой структуры данных, представляющие собой компоненты простого суждения, которые представляют собой компоненты соответствующих простых суждений, причем простые суждения являются простыми суждениями соответствующих лингвистических предложений четвертой структуры данных, а также содержащую идентификационные данные упомянутых компонентов простого суждения, представляющие собой для каждого соответствующего компонента простого суждения из шестой структуры данных вид такого соответствующего компонента простого суждения, значение такого соответствующего компонента простого суждения и порядковый номер такого соответствующего компонента простого суждения в соответствующем лингвистическом предложении; выполнением этапа 1009 формирования седьмой структуры данных, на котором формируют седьмую структуру данных, содержащую элементы седьмой структуры данных, представляющие собой простые суждения соответствующих лингвистических предложений четвертой структуры данных, а также содержащую идентификационные данные таких простых суждений, представляющие собой значения соответствующих простых суждений и порядковые номера соответствующих простых суждений в соответствующих лингвистических предложениях четвертой структуры данных; выполнением этапа 1010 формирования восьмой структуры данных, на котором формируют восьмую структуру данных, содержащую элементы восьмой структуры данных, представляющие собой итоговые суждения соответствующих лингвистических предложений четвертой структуры данных, сформированные из упомянутых простых суждений соответствующих лингвистических предложений четвертой структуры данных, а также содержащую идентификационные данные итоговых суждений, представляющие собой значения итоговых суждений и порядковые номера итоговых суждений в восьмой структуре данных; выполнением этапа 1011 формирования девятой структуры данных, на котором формируют девятую структуру данных, содержащую элементы девятой структуры данных, представляющие собой базовые конструкции предметной области, сформированные из данных, включающих данные упомянутой сформированной по результатам выполнения этапа 1008 шестой структуры данных, причем формирование базовых конструкций предметной области осуществляют на основании данных о формализованной модели базовой конструкции предметной области и данных о формализованной модели логической конструкции суждения, а также содержащую идентификационные данные базовых конструкций предметной области, представляющие собой значения базовых конструкций предметной области и порядковые номера базовых конструкций предметной области в девятой структуре данных; выполнением этапа 1012 формирования итоговой структуры данных, на котором формируют итоговую структуру данных, содержащую элементы итоговой структуры данных, представляющие собой целевые конструкции предметной области, сформированные из базовых конструкций предметной области, содержащихся в девятой структуре данных, причем формирование целевых конструкций предметной области осуществляют на основании данных о формализованной модели целевой конструкции предметной области, а также содержащую идентификационные данные целевых конструкций предметной области, представляющие собой значения целевых конструкций предметной области и порядковые номера целевых конструкций предметной области в итоговой структуре данных.In Fig. 1, by way of example, but not limitation, a general flow chart of performing the steps of a method 1000 is shown, which is a method executed by a processor or processors of a computer device for converting a structured data array containing at least information objects of a digitized document, which are separate blocks of the information content of the digitized document, which are textual information objects, and/or which are visual information objects, and/or which are textual and visual information objects; the method is characterized by: performing a step 1001 of forming a first data structure, at which a first data structure is formed, containing elements of the first data structure, which are semantic parts of the information objects of the digitized document, as well as identification data of such semantic parts, which are the values of such semantic parts and the ordinal numbers of such semantic parts in the digitized document; performing step 1002 of forming a database of system features of semantic parts, in which system features of the semantic parts contained in the first data structure are identified, representing format system characteristics of such semantic parts and functional system characteristics of such semantic parts, as well as the values of the corresponding mentioned system characteristics, in order to identify semantic parts with structural system features, and/or to identify semantic parts with logical system features, and/or to identify semantic parts with information system features, and/or to identify semantic parts with requisite system features; and a database of system features of semantic parts is formed from such identified system features; performing step 1003 of forming a second data structure, in which a second data structure is formed, containing elements of the second data structure, which are integrated semantic parts of the information objects of the digitized document, which are grouped semantic parts with matching system features contained in the first data structure or grouped semantic parts with unique system features contained in the first data structure, and also containing identification data of the integrated semantic parts, which are non-repeating varieties of said semantic parts with matching system features or said semantic parts with unique system features, the values of said semantic parts with matching system features or said semantic parts with unique system features, and serial numbers in the digitized document of said semantic parts with matching system features or said semantic parts with unique system features, wherein such said semantic parts with matching system features or such said semantic parts with the mentioned integrated semantic parts constitute unique systemic features; performing step 1004 of forming a third data structure, in which a third data structure is formed, containing as elements of the third data structure linguistic constructions, which are integrated semantic parts of the information objects of the digitized document contained in the second data structure, wherein such integrated semantic parts have systemic features of text logical semantic parts, and also containing identification data of linguistic constructions, which are values of linguistic constructions and ordinal numbers of linguistic constructions in the digitized document, wherein the linguistic constructions in the digitized document are one of the following linguistic constructions or a combination of the following linguistic constructions: ordinary linguistic constructions of the third data structure, which are linguistic sentences, special linguistic constructions of the third data structure, which are lists or enumeration headings, reconstructed linguistic constructions of the third data structure, which are tables containing at least two rows and two columns, wherein at least one row contains headings columns and/or, respectively, at least one column contains row headers; performing step 1005 of forming a fourth data structure, in which a fourth data structure is formed, containing as elements of the fourth data structure linguistic sentences of the fourth data structure, formed from elements of the third data structure and representing either linguistic sentences that are ordinary linguistic constructions of the third data structure, or linguistic sentences obtained by transforming special linguistic constructions of the third data structure, or linguistic sentences obtained by recreating from reconstructed linguistic constructions of the third data structure; wherein the fourth data structure also includes identification data of the linguistic sentences of the fourth data structure, representing values of the linguistic sentences of the fourth data structure and ordinal numbers of the linguistic sentences of the fourth data structure in the fourth data structure; performing step 1006 of forming a fifth data structure, in which a fifth data structure is formed, containing as elements of the fifth data structure text elements of linguistic sentences of the fourth data structure, as well as identification data of text elements of linguistic sentences of the fourth data structure, representing the values of the corresponding text elements of the corresponding linguistic sentences of the fourth data structure and the ordinal numbers of the corresponding text elements in the corresponding linguistic sentences of the fourth data structure; performing step 1007 of forming a database of linguo-logical-subject features, in which linguistic, logical and subject features of text elements of linguistic sentences of the fourth data structure are identified and a database of linguo-logical-subject features is formed from the identified features; performing step 1008 of forming a sixth data structure, in which a sixth data structure is formed, containing elements of the sixth data structure, representing components of a simple judgment, which represent components of corresponding simple judgments, wherein the simple judgments are simple judgments of corresponding linguistic sentences of the fourth data structure, and also containing identification data of said components of a simple judgment, representing for each corresponding component of a simple judgment from the sixth data structure the type of such corresponding component of a simple judgment, the value of such corresponding component of a simple judgment and the ordinal number of such corresponding component of a simple judgment in the corresponding linguistic sentence; performing step 1009 of forming a seventh data structure, in which a seventh data structure is formed, containing elements of the seventh data structure, representing simple judgments of the corresponding linguistic sentences of the fourth data structure, and also containing identification data of such simple judgments, representing values of the corresponding simple judgments and ordinal numbers of the corresponding simple judgments in the corresponding linguistic sentences of the fourth data structure; performing step 1010 of forming an eighth data structure, in which an eighth data structure is formed, containing elements of the eighth data structure, representing final judgments of the corresponding linguistic sentences of the fourth data structure, formed from the mentioned simple judgments of the corresponding linguistic sentences of the fourth data structure, and also containing identification data of the final judgments, representing values of the final judgments and ordinal numbers of the final judgments in the eighth data structure; performing step 1011 of forming a ninth data structure, in which a ninth data structure is formed, containing elements of the ninth data structure, representing basic constructs of the subject area, formed from data, including data of the said sixth data structure formed as a result of performing step 1008, wherein the formation of basic constructs of the subject area is carried out on the basis of data on the formalized model of the basic construct of the subject area and data on the formalized model of the logical construct of the judgment, and also containing identification data of the basic constructs of the subject area, representing the values of the basic constructs of the subject area and the ordinal numbers of the basic constructs of the subject area in the ninth data structure; performing step 1012 of forming the final data structure, in which the final data structure is formed, containing elements of the final data structure, representing the target constructions of the subject area, formed from the basic constructions of the subject area, contained in the ninth data structure, wherein the formation of the target constructions of the subject area is carried out on the basis of data on the formalized model of the target construction of the subject area, and also containing identification data of the target constructions of the subject area, representing the values of the target constructions of the subject area and the ordinal numbers of the target constructions of the subject area in the final data structure.
[42] На фиг. 2, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1001 формирования первой структуры данных 2. Этап 1001 характеризуется: выполнением этапа 10011 идентификации исходной структуры данных 1, на котором идентифицируют элементы 11 исходной структуры данных 1, представляющие собой информационные объекты 11 оцифрованного документа 1; выполнением этапа 10012 идентификации элементов 21 первой структуры данных 2, на котором идентифицируют элементы 21 первой структуры данных 2, представляющие собой смысловые части 21 информационных объектов 11 оцифрованного документа 1, а также идентификационные данные элементов 21 первой структуры данных 2, представляющие собой для каждой упомянутой смысловой части 21 значения 211 упомянутых смысловых частей 21 и порядковые номера 212 упомянутых смысловых частей 21 в оцифрованном документе 1, и формируют первую структуру данных 2.[42] Fig. 2 shows, by way of example and not limitation, a general diagram of the execution of the steps of step 1001 of forming the first data structure 2. Step 1001 is characterized by: executing step 10011 of identifying the initial data structure 1, in which the elements 11 of the initial data structure 1 are identified, which represent the information objects 11 of the digitized document 1; executing step 10012 of identifying the elements 21 of the first data structure 2, in which the elements 21 of the first data structure 2 are identified, which represent the semantic parts 21 of the information objects 11 of the digitized document 1, as well as the identification data of the elements 21 of the first data structure 2, which represent for each said semantic part 21 the values 211 of said semantic parts 21 and the serial numbers 212 of said semantic parts 21 in the digitized document 1, and the first data structure 2 is formed.
[43] На фиг. 3, в качестве примера, но не ограничения, изображена общая структура исходной структуры данных 1 (исходного структурированного массива данных 1; оцифрованного документа 1), из которой формируются элементы первой структуры данных СМД. Предпочтительно, не ограничиваясь, источником данных для формирования исходного структурированного массива данных 1 (исходного СМД 1) является, в качестве примера, но не ограничения, оцифрованный документ (электронный документ), то есть документ, преобразованный из традиционной, присущей для него формы, в цифровую форму в виде электронного файла данных, пригодного для записи на электронные носители. Предпочтительно, не ограничиваясь, оцифрованный (электронный) документ - это системно организованное соединение отдельных блоков информационного контента (информационных объектов). При этом предпочтительно, не ограничиваясь, каждый отдельный информационный объект обладает смысловой и логической завершенностью. Упомянутые блоки информационного контента предназначены для различных целей, например, не ограничиваясь, для предоставления информации посредством восприятия текстовых образов, и/или для предоставления информации посредством восприятия визуальных образов, и/или для предоставления информации посредством восприятия текстово-визуальных образов.[43] Fig. 3, by way of example and not limitation, shows the general structure of the initial data structure 1 (initial structured data array 1; digitized document 1), from which the elements of the first data structure SMD are formed. Preferably, without being limited, the source of data for forming the initial structured data array 1 (initial SMD 1) is, by way of example and not limitation, a digitized document (electronic document), i.e. a document transformed from its traditional, inherent form, into digital form in the form of an electronic data file suitable for recording on electronic media. Preferably, without being limited, the digitized (electronic) document is a systemically organized combination of individual blocks of information content (information objects). In this case, preferably, without being limited, each individual information object has semantic and logical completeness. The said blocks of information content are intended for various purposes, such as, but not limited to, providing information through the perception of text images, and/or providing information through the perception of visual images, and/or providing information through the perception of text-visual images.
[44] Предпочтительно, не ограничиваясь, исходная структура данных, характеризующая исходный СМД 1, содержит элементы 11, представляющие собой, по меньшей мере, информационные объекты 11 исходного структурированного массива данных 1 (оцифрованного документа 1). Предпочтительно, не ограничиваясь, информационные объекты 11 состоят из компонентов информационных объектов и могут содержать любое число упомянутых компонентов, в качестве примера, но не ограничения, отдельных строчных объектов, и/или списочных объектов, и/или табличных текстовых объектов, и/или визуальных объектов. При этом, например, не ограничиваясь, упомянутые компоненты предварительно формируют в информационных объектах 11 различными техническими методами и средствами, в качестве примера, но не ограничения, с помощью инструментов лингвистики (например, не ограничиваясь, несколько предложений объединяют в абзац с использованием известных из уровня техники или любых иных пригодных технических средств, которые далее подробно не описываются), либо, не ограничиваясь, с помощью известных из уровня техники или любых иных пригодных технических средств различных текстовых редакторов электронных документов, которые далее подробно не описываются (например, не ограничиваясь, отделяют одну информацию в документе от другой с помощью средств форматирования «табуляция» или «перевод строки», и тому подобные действия), при этом, не ограничиваясь, такое формирование упомянутых компонентов в информационных объектах 11 осуществляют, в том числе, не ограничиваясь, с использованием известных из уровня техники средств автоматизации, а также, не ограничиваясь, с использованием технологий машинного обучения, нейросетевых технологий. Предпочтительно, не ограничиваясь, компоненты информационных объектов выполняют роль технического инструмента для предоставления информации определенного типа. В качестве примера, но не ограничения, компоненты информационных объектов могут различаться по типу предоставляемой информации. Для предоставления информации посредством восприятия текстовых образов, например, не ограничиваясь, используют компоненты информационных объектов текстового типа, таких как, например, не ограничиваясь, таких как строчные объекты, и/или списочные объекты, и/или табличные текстовые объекты, и тому подобные текстовые объекты. Для предоставления информации посредством восприятия визуальных образов используют, например, не ограничиваясь, компоненты информационных объектов визуального типа, например, не ограничиваясь, таких как логотип, картинка, рисунок, рукописный текст, фото и тому подобные визуальные объекты. Например, не ограничиваясь, для предоставления информации посредством восприятия текстово-визуальных образов используют компоненты информационных объектов текстово-визуального типа, например, не ограничиваясь, состоящих из сочетаний упомянутых компонентов информационных объектов текстового и визуального типов. Предпочтительно, не ограничиваясь, в исходной структуре данных 1 элементы 11, в качестве примера, но не ограничения, могут именоваться как «ИО1», «ИО2», «ИО3», «ИОn», где n≥1 - порядковый номер элемента 11 в оцифрованном документе. Предпочтительно, не ограничиваясь, все перечисленные выше информационные объекты 11 оцифрованного документа 1 в исходной структуре данных представляют собой отдельные информационные объекты 11, заранее подготовленные и помещенные в исходную структуру данных 1 в виде структурированного массива отдельных информационных объектов 11 оцифрованного документа 1. При этом, не ограничиваясь, такие подготовительные действия могут осуществляться любым известным из уровня техники способом и, соответственно, далее не описываются. Предпочтительно, не ограничиваясь, идентификацию элементов 11 исходной структуры данных в ходе этапа 10011 производят путем выявления признаков информационного объекта оцифрованного документа. Таким признаком может являться, в качестве примера, но не ограничения, признак группирования последовательных компонентов информационных объектов в оцифрованном документе 1, которым может являться, не ограничиваясь, управляющий символ (тег, управляющая команда) «разделитель строк» («перевод строки», «разрыв строки»), и/или «табуляция». Как правило, с помощью таких управляющих символов все последовательные информационные объекты 11 обособляются с двух сторон. При этом, например, не ограничиваясь, у первого информационного объекта 11 в оцифрованном документе 1 нет такого признака до первого компонента информационного объекта, а у последнего информационного объекта 11 в оцифрованном документе 1 нет такого признака после последнего компонента информационного объекта. Идентифицированные указанными способами элементы 11 формируют элементы 11 исходной структуры данных СМД 1. Предпочтительно, не ограничиваясь, такие подготовительные действия могут осуществляться любым известным из уровня техники способом и, соответственно, далее не описываются. При этом, предпочтительно, не ограничиваясь, таким образом исходный структурированный массив данных 1 представляет собой массив информационных объектов оцифрованного (электронного) документа, состоящий из элементов 11 оцифрованного документа 1, идентифицированных на этапе 1011.[44] Preferably, without being limited, the original data structure characterizing the original SMD 1 contains elements 11 representing at least information objects 11 of the original structured data array 1 (digitized document 1). Preferably, without being limited, the information objects 11 consist of components of information objects and may contain any number of the mentioned components, by way of example, but not limitation, individual line objects, and/or list objects, and/or tabular text objects, and/or visual objects. In this case, for example, without being limited to, the said components are preliminarily formed in the information objects 11 by various technical methods and means, as an example, but not limitation, using linguistic tools (for example, without being limited to, several sentences are combined into a paragraph using known from the prior art or any other suitable technical means that are not described in detail below), or, without being limited to, using known from the prior art or any other suitable technical means of various text editors of electronic documents that are not described in detail below (for example, without being limited to, separating one piece of information in a document from another using the formatting tools "tabulation" or "line feed", and similar actions), in this case, without being limited to, such formation of the said components in the information objects 11 is carried out, including, without being limited to, using automation tools known from the prior art, as well as, without being limited to, using machine learning technologies, neural network technologies. Preferably, without being limited to, the components of the information objects act as a technical tool for providing information of a certain type. By way of example, but not limitation, the components of information objects may differ in the type of information provided. For example, but not limited to, the components of text-type information objects are used to provide information by perceiving text images, such as, for example, but not limited to, line objects, and/or list objects, and/or tabular text objects, and similar text objects. For example, but not limited to, the components of visual-type information objects are used to provide information by perceiving visual images, such as, for example, but not limited to, a logo, picture, drawing, handwritten text, photo, and similar visual objects. For example, but not limited to, the components of text-visual-type information objects are used to provide information by perceiving text-visual images, such as, for example, but not limited to, consisting of combinations of the aforementioned components of text and visual-type information objects. Preferably, without being limited, in the original data structure 1, the elements 11, by way of example but not limitation, may be named as "IO1", "IO2", "IO3", "IOn", where n≥1 is the serial number of the element 11 in the digitized document. Preferably, without being limited, all of the above-listed information objects 11 of the digitized document 1 in the original data structure represent individual information objects 11, prepared in advance and placed in the original data structure 1 in the form of a structured array of individual information objects 11 of the digitized document 1. In this case, without being limited, such preparatory actions may be carried out by any method known from the prior art and, accordingly, are not described further. Preferably, without being limited, the identification of the elements 11 of the original data structure during step 10011 is performed by identifying the features of the information object of the digitized document. Such a feature may be, by way of example, but not limitation, a feature of grouping successive components of information objects in the digitalized document 1, which may be, without limitation, a control character (tag, control command) "line separator" ("line feed", "line break"), and/or "tab". As a rule, with the help of such control characters, all successive information objects 11 are separated from both sides. In this case, for example, without limitation, the first information object 11 in the digitalized document 1 does not have such a feature before the first component of the information object, and the last information object 11 in the digitalized document 1 does not have such a feature after the last component of the information object. The elements 11 identified by the specified methods form the elements 11 of the original data structure of the SMD 1. Preferably, without limitation, such preparatory actions can be carried out by any method known from the prior art and, accordingly, are not described further. In this case, preferably, without being limited in this way, the initial structured data array 1 represents an array of information objects of a digitized (electronic) document, consisting of elements 11 of the digitized document 1, identified at step 1011.
[45] На фиг. 4, в качестве примера, но не ограничения, изображена общая структура сформированной первой структуры данных 2 СМД. Предпочтительно, не ограничиваясь, первая структура данных содержит элементы 21 первой структуры данных, представляющие собой смысловые части (СЧ) 21 информационных объектов 11 оцифрованного документа 1 и идентификационные данные таких смысловых частей, представляющие собой значения 211 смысловых частей 21 и порядковые номера 212 смысловых частей 21 в оцифрованном документе 1. Каждая смысловая часть 21 информационного объекта 11 оцифрованного документа 1 представляет собой, в качестве примера, но не ограничения, отдельный информационный объект 11 или часть информационного объекта 11 с признаком однородности компонентов информационного объекта (КИО). В качестве примера, но не ограничения, признаком такой однородности КИО может быть принадлежность КИО отдельного информационного объекта 11 только к одному роду данных, например, не ограничиваясь, к строчным текстовым данным, или к списочным текстовым данным, или к табличным текстовым данным, или к визуальным данным. Значением 211 смысловой части 21 являются, в качестве примера, но не ограничения, набор букв, и/или набор слов, и/или набор цифр, и/или набор чисел, и/или набор знаков препинания, и/или набор иных знаков и символов, и/или таблица, а также, например, не ограничиваясь, логотип, и/или картинка, и/или рисунок, и/или рукописный текст, и/или фото и тому подобное, из которых состоит смысловая часть 21. Порядковым номером 212 смысловой части 21, в качестве примера, но не ограничения, является порядковый номер смысловой части 21 информационного объекта 11 в оцифрованном документе 1. В первой структуре данных элементы 21, в качестве примера, но не ограничения, могут именоваться как «СЧ1», «СЧ2», «СЧ3», «СЧn», где n≥1 - порядковый номер элемента в оцифрованном документе. Предпочтительно, не ограничиваясь, идентификацию элементов 21 первой структуры данных в ходе этапа 10012 производят путем анализа компонентов информационных объектов (КИО) для каждого информационного объекта 11 оцифрованного документа 1. Предпочтительно, не ограничиваясь, суть анализа состоит в том, чтобы проверить наличие в каждом отдельном информационном объекте 11 признаков однородности компонентов информационных объектов (КИО). В случае, если все КИО отдельного информационного объекта 11 принадлежат к одному роду данных, то из такого информационного объекта 11 формируют одну смысловую часть 21. В случае, если КИО отдельного информационного объекта 11 принадлежат к разным родам данных, то такие информационные объекты 11 разделяют на фрагменты. При этом, не ограничиваясь, из каждого фрагмента разделенного информационного объекта 11 формируют свою разделенную смысловую часть 21, кроме случая, когда в последовательных текстовых КИО любого рода имеется визуальный КИО. В этом случае такие визуальные КИО формируют вложенную визуальную смысловую часть 21, а фрагменты из текстовых КИО, разделенных визуальным КИО, объединяются вместе и формируют свою сборную смысловую часть 21. При этом, не ограничиваясь, в такой сборной смысловой части 21 вместо удаленной из нее вложенной визуальной смысловой части 21 формируют замещающий текст (например, не ограничиваясь, если вложенной визуальной смысловой частью 21 была картинка, то в качестве замещающего текста используют слово «КАРТИНКА»), поместив его в сборную смысловую часть 21 в том месте, откуда была исключена упомянутая вложенная визуальная смысловая часть 21, восстановив таким образом целостность последовательности текстового КИО отдельного информационного объекта 11, из которого сформирована сборная смысловая часть 21. Предпочтительно, не ограничиваясь, идентификацию значения 211 смысловой части 21 в ходе этапа 10012 производят путем регистрации содержания компонентов информационных объектов (набора букв, и/или набора слов, и/или набора цифр, и/или набора чисел, и/или набора знаков препинания, и/или иных знаков и символов, и/или таблицы, и/или логотипа, и/или картинки, и/или рисунка, и/или рукописного текста, и/или фото и тому подобного), из которых состоит смысловая часть 21. Предпочтительно, не ограничиваясь, идентификацию порядкового номера 212 смысловой части 21 первой структуры данных в ходе этапа 10012 производят путем расчета местоположения компонентов информационного объекта, из которых состоит смысловая часть 21, в оцифрованном документе 1. При этом, не ограничиваясь, поскольку количество элементов 21 может существенно превышать число элементов 11, то использование порядковых номеров элементов 11 подразумевает, например, не ограничиваясь, следующий порядок расчета, состоящий из двух этапов. На первом этапе для каждого элемента 21 получают предварительный номер вида «Х.1», в котором индекс «Х» указывает на номер элемента 11, из которого сформирован элемент 21. Если элемент 21 является разделенной смысловой частью 21, сборной смысловой частью 21 или вложенной визуальной смысловой частью 21, то для таких элементов 21 получают предварительный номер вида «Х.Y», в котором индекс «Х» указывает на номер элемента 11, из которого сформирован элемент 21, а индекс «Y» - на порядковый номер части разделенной, сборной или вложенной визуальной смысловой части 21 в последовательности компонентов информационного объекта, установленной на основании расчета положения первого КИО разделенной, сборной или вложенной визуальной смысловой части 21 в элементе 11. На втором этапе, полученная таким образом вложенная нумерация (например, не ограничиваясь: 1.1, 2.1, 2.2, 3.1, 4.1, 4.2, 4.3, 5.1) позволяет сформировать порядковые номера элементов 21 в оцифрованном документе 1, начиная с номера «1» у элемента с вложенным номером «1.1». Далее, не ограничиваясь, следующий порядковый номер получает элемент 21 либо с вложенным номером «1.2», либо, если такого нет - с вложенным номером «2.1». И так далее, до преобразования всех вложенных номеров в порядковые номера элемента 21 в оцифрованном документе 1. Предпочтительно, не ограничиваясь, такой анализ для идентификации и формирования элементов 21 может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[45] In Fig. 4, by way of example, but not limitation, the general structure of the generated first data structure 2 of the SMD is shown. Preferably, without limitation, the first data structure contains elements 21 of the first data structure, which are meaningful parts (SP) 21 of the information objects 11 of the digitized document 1 and identification data of such meaningful parts, which are values 211 of the meaningful parts 21 and serial numbers 212 of the meaningful parts 21 in the digitized document 1. Each meaningful part 21 of the information object 11 of the digitized document 1 is, by way of example, but not limitation, a separate information object 11 or a part of the information object 11 with a feature of homogeneity of the components of the information object (CHI). As an example, but not limitation, a sign of such homogeneity of the KIO may be that the KIO of a separate information object 11 belongs to only one type of data, for example, without limitation, to string text data, or to list text data, or to tabular text data, or to visual data. The value 211 of the semantic part 21 is, by way of example, but not limitation, a set of letters and/or a set of words and/or a set of digits and/or a set of numbers and/or a set of punctuation marks and/or a set of other signs and symbols and/or a table, as well as, for example, without limitation, a logo and/or a picture and/or a drawing and/or a handwritten text and/or a photo and the like, of which the semantic part 21 consists. The ordinal number 212 of the semantic part 21 is, by way of example, but not limitation, the ordinal number of the semantic part 21 of the information object 11 in the digitized document 1. In the first data structure, the elements 21 can be, by way of example, but not limitation, referred to as "SC1", "SC2", "SC3", "SCn", where n≥1 is the ordinal number of the element in the digitized document. Preferably, without being limited to, the identification of elements 21 of the first data structure during step 10012 is performed by analyzing the components of information objects (CIO) for each information object 11 of the digitized document 1. Preferably, without being limited to, the essence of the analysis is to check the presence of features of homogeneity of components of information objects (CIO) in each individual information object 11. In the event that all CIOs of an individual information object 11 belong to the same type of data, then one semantic part 21 is formed from such information object 11. In the event that the CIOs of an individual information object 11 belong to different types of data, then such information objects 11 are divided into fragments. In this case, without being limited to, its own divided semantic part 21 is formed from each fragment of the divided information object 11, except for the case when in successive text CIOs of any type there is a visual CIO. In this case, such visual IOCs form an embedded visual semantic part 21, and fragments from text IOCs separated by a visual IOC are combined together and form their own composite semantic part 21. In this case, without limitation, in such composite semantic part 21, instead of the embedded visual semantic part 21 removed from it, a replacement text is formed (for example, without limitation, if the embedded visual semantic part 21 was a picture, then the word "PICTURE" is used as a replacement text), placing it in the composite semantic part 21 in the place from which the said embedded visual semantic part 21 was excluded, thus restoring the integrity of the sequence of the text IOC of a separate information object 11, from which the composite semantic part 21 is formed. Preferably, without limitation, the identification of the meaning 211 of the semantic part 21 during step 10012 is performed by registering the content of the components of the information objects (a set of letters and/or a set of words and/or a set of digits and/or a set of numbers and/or a set of punctuation marks and/or other signs and symbols and/or a table and/or a logo and/or a picture and/or a drawing and/or handwritten text and/or a photo and the like) that make up the semantic part 21. Preferably, without limitation, the identification of the ordinal number 212 of the semantic part 21 of the first data structure during step 10012 is performed by calculating the location of the components of the information object that make up the semantic part 21 in the digitized document 1. In this case, without limitation, since the number of elements 21 may significantly exceed the number of elements 11, the use of the ordinal numbers of elements 11 implies, for example, without limitation, the following calculation procedure consisting of two stages. At the first stage, for each element 21, a preliminary number of the type "X.1" is obtained, in which the index "X" indicates the number of element 11 from which element 21 is formed. If element 21 is a divided semantic part 21, a combined semantic part 21 or a nested visual semantic part 21, then for such elements 21 a preliminary number of the type "X.Y" is obtained, in which the index "X" indicates the number of element 11 from which element 21 is formed, and the index "Y" indicates the ordinal number of the part of the divided, combined or nested visual semantic part 21 in the sequence of components of the information object established on the basis of the calculation of the position of the first CIO of the divided, combined or nested visual semantic part 21 in element 11. At the second stage, the nested numbering obtained in this way (for example, but not limited to: 1.1, 2.1, 2.2, 3.1, 4.1, 4.2, 4.3, 5.1) allows to form ordinal numbers of elements 21 in the digitalized document 1, starting with the number "1" for the element with the embedded number "1.1". Then, without limitation, the next ordinal number is received by element 21 either with the embedded number "1.2", or, if there is none, with the embedded number "2.1". And so on, until all embedded numbers are converted into ordinal numbers of element 21 in the digitalized document 1. Preferably, without limitation, such analysis for identifying and forming elements 21 can be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, without limitation, such analysis can be performed traditionally by a linguist, or with the help of a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are enough examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by applying neural network (AI systems) training technology.
[46] На фиг. 5, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1002 формирования базы данных системных признаков 20 смысловых частей 21, на котором, предпочтительно, не ограничиваясь, выявляют системные признаки содержащихся в первой структуре данных 2 смысловых частей 21, представляющие собой форматные системные характеристики 213 таких смысловых частей 21 и функциональные системные характеристики 213 таких смысловых частей 21, а также значения 2131 соответствующих упомянутых системных характеристик 213, для выявления смысловых частей 21 со структурными системными признаками, и/или для выявления смысловых частей 21 с логическими системными признаками, и/или для выявления смысловых частей 21 с информационными системными признаками, и/или для выявления смысловых частей с реквизитными системными признаками; и формируют из таких выявленных системных признаков базу данных системных признаков 20 смысловых частей 21. Предпочтительно, не ограничиваясь, этап 1002 характеризуется: выполнением этапа 10021 формирования системных признаков смысловых частей 21, на котором для системного анализа для каждой смысловой части 21 информационных объектов 11 оцифрованного документа 1 предоставляют идентификационные данные упомянутой смысловой части 21 и получают системные характеристики 213 для всех упомянутых смысловых частей 21, а также значения 2131 упомянутых системных характеристик; выполнением этапа 10022 формирования базы данных системных признаков 20 смысловых частей 21, на котором формируют базу данных системных признаков смысловых частей 21 информационных объектов 11 оцифрованного документа 1, причем системным признаком упомянутой смысловой части 21 являются все упомянутые полученные для упомянутой смысловой части 21 системные характеристики 213, обладающие значениями 2131 системных характеристик 213.[46] Fig. 5, by way of example and not limitation, shows a general diagram of the execution of the steps of step 1002 of forming a database of system features 20 of semantic parts 21, in which, preferably, without limitation, the system features of the semantic parts 21 contained in the first data structure 2 are identified, which represent the format system characteristics 213 of such semantic parts 21 and the functional system characteristics 213 of such semantic parts 21, as well as the values 2131 of the corresponding mentioned system characteristics 213, for identifying the semantic parts 21 with structural system features, and/or for identifying the semantic parts 21 with logical system features, and/or for identifying the semantic parts 21 with information system features, and/or for identifying the semantic parts with requisite system features; and from such identified system features a database of system features 20 of semantic parts 21 is formed. Preferably, without limitation, step 1002 is characterized by: performing step 10021 of forming system features of semantic parts 21, at which, for system analysis, for each semantic part 21 of information objects 11 of the digitized document 1, identification data of said semantic part 21 are provided and system characteristics 213 are obtained for all said semantic parts 21, as well as values 2131 of said system characteristics; performing stage 10022 of forming a database of system features 20 of semantic parts 21, at which a database of system features of semantic parts 21 of information objects 11 of the digitized document 1 is formed, wherein the system feature of said semantic part 21 is all said system characteristics 213 obtained for said semantic part 21, having values 2131 of system characteristics 213.
[47] На фиг. 6, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных системных признаков 20 (БДСП 20), являющейся БДСП 20 смысловых частей 21 информационных объектов 11 оцифрованного (электронного) документа 1. Предпочтительно, не ограничиваясь, системные характеристики 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1 содержат форматные характеристики и функциональные характеристики. При этом, предпочтительно, не ограничиваясь, совокупность значений 2131 всех системных характеристик 213 каждой смысловой части 21 информационных объектов 11 в оцифрованном документе 1 является отличительным системным признаком каждой смысловой части 21 информационных объектов 11 в оцифрованном документе 1. Форматные характеристики, предпочтительно, не ограничиваясь, указывают на форматные признаки смысловых частей 21 информационных объектов 11 оцифрованного документа 1, которые могут быть классифицированы, в качестве примера, но не ограничения, по уровню вложенности, например, как «род-вид-подвид». При этом, не ограничиваясь, форматный род упомянутых смысловых частей 21 предпочтительно имеет следующие значения: текстовый информационный объект документа, визуальный информационный объект документа; не ограничиваясь, форматный вид упомянутых смысловых частей 21 предпочтительно имеет следующие значения: строчный (машиночитаемый текст (слова, числа)), списочный (машиночитаемый текст (слова, числа)), табличный (машиночитаемый текст (слова, числа)), изобразительный (фото, рисунок, логотип, картинка), рукописный (не машиночитаемый текст (слова, числа)); не ограничиваясь, форматный подвид упомянутых смысловых частей 21 предпочтительно имеет следующие значения: обычная лингвистическая конструкция (лингвистическое предложение), особая лингвистическая конструкция (лингвистическая конструкция, сочетающая в себе элементы языковой конструкции, а также способ организации данных и (или) визуальные информационные объекты), реконструируемая лингвистическая конструкция (способ организации данных, который имеет логическую основу, на базе которой возможно воссоздать лингвистическую конструкцию, эквивалентную информации в системе организованных данных), нелингвистическая конструкция. Функциональные характеристики, предпочтительно, не ограничиваясь, указывают на множество функциональных признаков смысловых частей 21 информационных объектов 11 оцифрованного документа 1, среди которых можно выделить, в качестве примера, но не ограничения, следующие: признаки структурной иерархии документа (структурные системные признаки); признаки основной смысловой информации (логические системные признаки); признаки сопутствующей или технической информации (информационные системные признаки); признаки метаданных документа (реквизитные системные признаки). Не ограничиваясь, функциональные характеристики указывают на функциональную роль упомянутых смысловых частей 21, представляющих собой, в качестве примера, но не ограничения, следующие функциональные роли смысловых частей 21: структурная, то есть смысловая часть 21 со структурными системными признаками; логическая, то есть смысловая часть 21 с логическими системными признаками; информационная, то есть смысловая часть 21 с информационными системными признаками; реквизитная, то есть смысловая часть 21 с признаками метаданных документа (с реквизитными системными признаками).[47] Fig. 6, as an example, but not limitation, shows the general structure of the generated database of system features 20 (DBSF 20), which is the DBSF 20 of the semantic parts 21 of the information objects 11 of the digitized (electronic) document 1. Preferably, without limitation, the system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1 contain format characteristics and functional characteristics. In this case, preferably, without being limited to, the set of values 2131 of all system characteristics 213 of each semantic part 21 of information objects 11 in the digitized document 1 is a distinctive system feature of each semantic part 21 of information objects 11 in the digitized document 1. The format characteristics, preferably, without being limited to, indicate format features of the semantic parts 21 of information objects 11 of the digitized document 1, which can be classified, as an example, but not limitation, by nesting level, for example, as "genus-type-subtype". In this case, without being limited to, the format genus of the said semantic parts 21 preferably has the following meanings: textual information object of the document, visual information object of the document; without being limited, the format type of the said semantic parts 21 preferably has the following meanings: line (machine-readable text (words, numbers)), list (machine-readable text (words, numbers)), tabular (machine-readable text (words, numbers)), pictorial (photo, drawing, logo, picture), handwritten (non-machine-readable text (words, numbers)); without being limited, the format subtype of the said semantic parts 21 preferably has the following meanings: ordinary linguistic construction (linguistic sentence), special linguistic construction (linguistic construction that combines elements of linguistic construction, as well as a method of organizing data and (or) visual information objects), reconstructable linguistic construction (a method of organizing data that has a logical basis on the basis of which it is possible to recreate a linguistic construction equivalent to information in a system of organized data), non-linguistic construction. The functional characteristics, preferably but not limited to, indicate a plurality of functional attributes of the semantic parts 21 of the information objects 11 of the digitized document 1, among which the following can be distinguished, by way of example but not limitation: attributes of the structural hierarchy of the document (structural system attributes); attributes of the main semantic information (logical system attributes); attributes of accompanying or technical information (information system attributes); attributes of the document metadata (requisite system attributes). The functional characteristics, without limitation, indicate the functional role of the said semantic parts 21, which represent, by way of example but not limitation, the following functional roles of the semantic parts 21: structural, i.e. the semantic part 21 with structural system attributes; logical, i.e. the semantic part 21 with logical system attributes; informational, i.e. the semantic part 21 with information system attributes; requisite, i.e. the semantic part 21 with attributes of the document metadata (with requisite system attributes).
[48] Формирование системных характеристик 213 и их значений 2131 для смысловых частей 21 информационных объектов 11 оцифрованного документа 1, предпочтительно, не ограничиваясь, производят на этапе 10021 путем комплексного структурно-лингвистического анализа каждой смысловой части 21 информационных объектов 11 оцифрованного документа 1, представляющего, в качестве примера, но не ограничения, анализ компонентов информационных объектов (КИО) информационного объекта 11, из которого сформирована смысловая часть 21, с точки зрения упомянутых системных признаков. По результатам системного анализа упомянутых КИО смысловой части 21, предпочтительно, не ограничиваясь, производится формирование системных характеристик 213 и их внесение на этапе 10022 в БДСП 20 в виде перечня системных характеристик 213 со значениями этих характеристик 2131. Например, но не ограничиваясь, для смысловой части 21 со значением 211 «Глава 1. Общие положения» системными признаками могут быть следующие системные характеристики 213 со значениями системных характеристик 2131: форматный род «текстовый КИО»; форматный вид «строчный машиночитаемый текст»; форматный подвид «обычная лингвистическая конструкция»; функциональные признаки «признаки структурной иерархии документа»; функциональная роль «структурная». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ). Предпочтительно, не ограничиваясь, на основании выявленных системных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1 и их значений 2131 в итоге формируют базу данных системных признаков 20 (БДСП 20), являющуюся БДСП 20 смысловых частей 21 информационных объектов 11 оцифрованного документа 1. При этом системные характеристики 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1 и их значения 2131 формируют системные признаки упомянутых смысловых частей 21[48] The formation of system characteristics 213 and their values 2131 for the semantic parts 21 of the information objects 11 of the digitized document 1, preferably, without limitation, is carried out at step 10021 by means of a comprehensive structural-linguistic analysis of each semantic part 21 of the information objects 11 of the digitized document 1, representing, as an example, but not limitation, an analysis of the components of information objects (CIO) of the information object 11, from which the semantic part 21 is formed, from the point of view of the mentioned system features. Based on the results of the system analysis of the said KIO of the semantic part 21, preferably, but not limited to, the system characteristics 213 are formed and entered at stage 10022 into the DBSP 20 in the form of a list of system characteristics 213 with the values of these characteristics 2131. For example, but not limited to, for the semantic part 21 with the value 211 "Chapter 1. General Provisions", the system features may be the following system characteristics 213 with the values of the system characteristics 2131: format type "text KIO"; format type "linear machine-readable text"; format subtype "ordinary linguistic construction"; functional features "features of the structural hierarchy of the document"; functional role "structural". Such an analysis may be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, but not limited to, such analysis can be performed traditionally by a linguist, or by using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are enough examples, it is possible to perform such analysis using a statistical processor (neural network, AI systems) by using neural network (AI systems) training technology. Preferably, without limitation, based on the identified system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1 and their values 2131, a database of system features 20 (DSF 20) is ultimately formed, which is a DSF 20 of the semantic parts 21 of the information objects 11 of the digitized document 1. In this case, the system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1 and their values 2131 form the system features of the said semantic parts 21
[49] На фиг. 7, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1003 формирования второй структуры данных 3 СМД. Предпочтительно, не ограничиваясь, этап 103 характеризуется: выполнением этапа 10031 идентификации и формирования элементов 31 второй структуры данных 3, на котором идентифицируют и формируют элементы 31 второй структуры данных 3, представляющие собой интегрированные смысловые части 31 информационных объектов 11 оцифрованного документа 1, и представляющие собой сгруппированные содержащиеся в первой структуре данных 2 смысловые части 21 с совпадающими системными признаками или сгруппированные содержащиеся в первой структуре данных 2 смысловые части 21 с уникальными системными признаками, а также идентификационные данные интегрированных смысловых частей 31, представляющие собой неповторяющиеся разновидности упомянутых смысловых частей 21 с совпадающими системными признаками или упомянутых смысловых частей 21 с уникальными системными признаками, значения упомянутых смысловых частей 21 с совпадающими системными признаками или упомянутых смысловых частей 21 с уникальными системными признаками, и порядковые номера в оцифрованном документе 1 упомянутых смысловых частей 21 с совпадающими системными признаками или упомянутых смысловых частей 21 с уникальными системными признаками, причем такие упомянутые смысловые части 21 с совпадающими системными признаками или такие упомянутые смысловые части 21 с уникальными системными признаками составляют упомянутые интегрированные смысловые части 31; выполнением этапа 10032 формирования второй структуры данных 3, на котором формируют вторую структуру данных 3 из идентифицированных и сформированных элементов 31 второй структуры данных 3 и их идентификационных данных.[49] Fig. 7, as an example but not limitation, shows a general diagram of the execution of the steps of step 1003 of forming the second data structure 3 of the SMD. Preferably, without limitation, step 103 is characterized by: performing step 10031 of identifying and generating elements 31 of the second data structure 3, in which elements 31 of the second data structure 3 are identified and generated, representing integrated semantic parts 31 of the information objects 11 of the digitized document 1, and representing grouped semantic parts 21 contained in the first data structure 2 with matching system features or grouped semantic parts 21 contained in the first data structure 2 with unique system features, as well as identification data of the integrated semantic parts 31, representing unique varieties of said semantic parts 21 with matching system features or said semantic parts 21 with unique system features, the values of said semantic parts 21 with matching system features or said semantic parts 21 with unique system features, and serial numbers in in the digitalized document 1 of said semantic parts 21 with matching system features or said semantic parts 21 with unique system features, wherein such said semantic parts 21 with matching system features or such said semantic parts 21 with unique system features constitute said integrated semantic parts 31; by performing step 10032 of forming the second data structure 3, at which the second data structure 3 is formed from the identified and generated elements 31 of the second data structure 3 and their identification data.
[50] На фиг. 8, в качестве примера, но не ограничения, изображена общая структура сформированной второй структуры данных 3 СМД. Предпочтительно, не ограничиваясь, вторая структура данных 3 содержит элементы второй структуры данных 31, представляющие собой интегрированные смысловые части 31 оцифрованного (электронного) документа 1 и идентификационные данные интегрированных смысловых частей 31 оцифрованного (электронного) документа 1. Элементами 31 второй структуры данных 3 СМД являются интегрированные смысловые части 31 информационных объектов 11 оцифрованного документа 1 и идентификационные данные таких интегрированных смысловых частей 31, представляющие собой значения 311 интегрированных смысловых частей, порядковые номера 312 интегрированных смысловых частей и неповторяющиеся разновидности 313 интегрированных смысловых частей в оцифрованном документе 1. Интегрированными смысловыми частями 31 информационных объектов 11 оцифрованного документа 1, предпочтительно, не ограничиваясь, являются сгруппированные содержащиеся в первой структуре данных 2 смысловые части 21 с совпадающими системными признаками или смысловые части 21 с уникальными системными признаками. При этом, под системными признаками смысловых частей 21 понимаются системные характеристики 213 и их значения 2131, под уникальными системными признаками понимают такие системные признаки, которые встречаются в оцифрованном документе 1 только у одной смысловой части 21, под совпадающими системными признаками понимают такие системные признаки, которые встречаются в оцифрованном документе 1 как минимум у двух смысловых частей 21. В качестве примера, но не ограничения, системные признаки у элемента 31 могут быть такие: «Текстовый КИО. Табличный машиночитаемый текст. Реконструируемая лингвистическая конструкция. Признаки основной смысловой информации. Логическая функциональная роль». Предпочтительно, не ограничиваясь, значениями 311 интегрированных смысловых частей 31 являются, значения 211 смысловых частей 21 с совпадающими или с уникальными системными признаками, причем такие смысловые части 21 с совпадающими или с уникальными системными признаками составляют упомянутые интегрированные смысловые части 31. Предпочтительно, не ограничиваясь, порядковым номером 312 интегрированной смысловой части 31 являются, порядковые номера 212 смысловых частей 21 с совпадающими или с уникальными системными признаками, причем такие смысловые части 21 с совпадающими или с уникальными системными признаками составляют упомянутые интегрированные смысловые части 31. Во второй структуре данных 3 элементы 31 именуются без уникальных наименований и, в качестве примера, но не ограничения, могут именоваться как «ИСЧ1», «ИСЧ2», «ИСЧ3», ИСЧn», где n≥1- порядковый индекс элемента 31 в оцифрованном документе 1, начиная с «1» для каждого элемента 31 в оцифрованном документе 1. Предпочтительно, не ограничиваясь, неповторяющимися разновидностями 313 интегрированных смысловых частей 31 в оцифрованном документе 1 являются неповторяющиеся разновидности смысловых частей 21, из которых сформированы элементы 31. При этом под неповторяющимися разновидностями смысловых частей 21 понимают все уникальные системные признаки смысловых частей 21, содержащиеся в оцифрованном документе 1. В качестве примера, но не ограничения, неповторяющейся разновидностью 313 интегрированных смысловых частей 31 являются уникальные (если в элементе 31 содержится только один элемент 21) или совпадающие (если в элементе 31 содержится два и более элементов 21) системные признаки элементов 21, из которых сформированы элементы 31, а именно: «Текстовый КИО. Табличный машиночитаемый текст. Реконструируемая лингвистическая конструкция. Признаки основной смысловой информации. Логическая функциональная роль». Предпочтительно, не ограничиваясь, идентификацию элементов 31 второй структуры данных 3 СМД в рамках этапа 1031 производят путем сравнительного анализа значений 2131 системных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1. При этом, в ходе идентификации элемента 31 одновременно идентифицируют порядковый номер 312 элемента 31 и неповторяющуюся разновидность 313 элемента 31. В качестве примера, но не ограничения порядок идентификации элементов 31, а также порядкового номера 312 элемента 31 и неповторяющуюся разновидность 313 элемента 31 может быть следующим. На первом этапе из списка элементов 21 первой структуры данных 2 выявляют все уникальные элементы 21, то есть такие элементы 21, которые имеют уникальные (неповторяющиеся) значения системных характеристик 2131. На втором этапе все выявленные уникальные элементы 21 признаются элементами 31 и нумеруются порядковыми номерами, начиная с «1», причем номер «1» получает такой элемент 21, который имеет минимальный порядковый номер 212, номер «2» получает такой элемент 21, который имеет порядковый номер 212 больше, чем у элемента 21, признанного элементом 31 с порядковым номером «1», но одновременно меньшим, чем у остальных уникальных элементов 21. И так далее, до тех пор, пока все уникальные элементы 21 не получат свой порядковый номер как признанные элементы 31. На третьем этапе среди элементов 21 первой структуры данных, которые еще не признаны элементами 31, производят поиск таких элементов 21, которые по своим системным признакам идентичны элементам 21, уже идентифицированным в качестве элементов 31 на втором этапе. Выявленные таким образом элементы 21 присоединяют к соответствующим элементам 31 (группе элементов 21 с системными признаками, идентичными системным признакам выявленного элемента 21), идентифицируя таким образом все элементы 21 первой структуры данных с тем или иным элементом 31, сформированным на втором этапе.[50] Fig. 8 shows, by way of example but not limitation, the general structure of the generated second data structure 3 of the SMD. Preferably, but not limited to, the second data structure 3 contains elements of the second data structure 31, which are integrated semantic parts 31 of the digitized (electronic) document 1 and identification data of the integrated semantic parts 31 of the digitized (electronic) document 1. Elements 31 of the second data structure 3 SMD are integrated semantic parts 31 of information objects 11 of the digitized document 1 and identification data of such integrated semantic parts 31, which are values 311 of the integrated semantic parts, serial numbers 312 of the integrated semantic parts and unique varieties 313 of the integrated semantic parts in the digitized document 1. The integrated semantic parts 31 of the information objects 11 of the digitized document 1, preferably, but not limited to, are grouped semantic parts 21 contained in the first data structure 2 with coinciding system features or semantic parts 21 with unique system features. In this case, the system features of semantic parts 21 are understood to be system characteristics 213 and their values 2131, unique system features are understood to be such system features that are found in the digitized document 1 only in one semantic part 21, and coinciding system features are understood to be such system features that are found in the digitized document 1 in at least two semantic parts 21. As an example, but not limitation, the system features of element 31 may be as follows: "Text KIO. Tabular machine-readable text. Reconstructed linguistic construction. Features of the main semantic information. Logical functional role." Preferably, without being limited to, the values 311 of the integrated semantic parts 31 are the values 211 of the semantic parts 21 with the same or with unique system features, wherein such semantic parts 21 with the same or with unique system features constitute the said integrated semantic parts 31. Preferably, without being limited to, the ordinal number 312 of the integrated semantic part 31 are the ordinal numbers 212 of the semantic parts 21 with the same or with unique system features, wherein such semantic parts 21 with the same or with unique system features constitute the said integrated semantic parts 31. In the second data structure 3, the elements 31 are named without unique names and, by way of example, but not limitation, can be named as "ISCh1", "ISCh2", "ISCh3", "ISChn", where n≥1 is the ordinal index of the element 31 in the digitized document 1, starting with "1" for each element 31 in the digitized document 1. Preferably, without being limited to, the unique varieties 313 of the integrated semantic parts 31 in the digitized document 1 are the unique varieties of the semantic parts 21 from which the elements 31 are formed. In this case, the unique varieties of the semantic parts 21 are understood to mean all unique system features of the semantic parts 21 contained in the digitized document 1. As an example, but not limitation, the unique variety 313 of the integrated semantic parts 31 are unique (if the element 31 contains only one element 21) or matching (if the element 31 contains two or more elements 21) system features of the elements 21 from which the elements 31 are formed, namely: "Text KIO. Tabular machine-readable text. Reconstructable linguistic construction. Features of the main semantic information. Logical functional role". Preferably, without limitation, the identification of elements 31 of the second data structure 3 of the SMD within the framework of step 1031 is carried out by means of a comparative analysis of the values 2131 of the system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1. In this case, during the identification of element 31, the serial number 312 of element 31 and the non-repeating variety 313 of element 31 are simultaneously identified. As an example, but not limitation, the order of identification of elements 31, as well as the serial number 312 of element 31 and the non-repeating variety 313 of element 31 may be as follows. At the first stage, all unique elements 21 are identified from the list of elements 21 of the first data structure 2, i.e., such elements 21 that have unique (non-repeating) values of system characteristics 2131. At the second stage, all identified unique elements 21 are recognized as elements 31 and numbered with ordinal numbers, starting with "1", where the number "1" is assigned to such element 21 that has the minimum ordinal number 212, the number "2" is assigned to such element 21 that has an ordinal number 212 greater than that of the element 21 recognized as element 31 with ordinal number "1", but at the same time less than that of the remaining unique elements 21. And so on, until all unique elements 21 receive their ordinal number as recognized elements 31. At the third stage, among the elements 21 of the first data structure that have not yet been recognized as elements 31, a search is performed for such elements 21 that are identical in their system characteristics to the elements 21 already identified as elements 31 in the second stage. The elements 21 identified in this way are attached to the corresponding elements 31 (a group of elements 21 with system features identical to the system features of the identified element 21), thus identifying all elements 21 of the first data structure with one or another element 31 formed in the second stage.
[51] Не ограничиваясь, идентификацию системных признаков элементов 21 при необходимости производят путем организации запроса в БДСП 20 и получения значений 2131 системных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1. При этом, не ограничиваясь, как было описано ранее, системными признаками элемента 21 являются как минимум форматные и функциональные характеристики смысловых частей 21 информационных объектов 11 оцифрованного документа 1. Не ограничиваясь, идентификацию значений 311 элементов 31 производят после идентификации всех элементов 31 второй структуры данных, то есть после признания всех элементов 21 первой структуры данных 2 тем или иным идентифицированным элементом 31 (элементом 31 с тем или иным порядковым номером и с уникальными или с совпадающими системными признаками элементов 21, из которых состоит идентифицированный элемент 31). При этом, значениями 311 интегрированной смысловой части 31 будут являться значения 211 всех элементов 21, из которых состоит идентифицированный элемент 31 второй структуры данных 3. В качестве примера, но не ограничения определение порядковых номеров 312 элементов 31 второй структуры данных может быть продемонстрировано следующим образом. На первом этапе для элемента 31, в составе которого содержится смысловая часть 21 с минимальным значением порядкового номера 212, будет установлен порядковый номер «1». На втором этапе в оставшихся непронумерованных элементах 31 находят такой элемент 31, в составе которого содержится смысловая часть 21 с порядковым номером 212 большим, чем у элемента 31 с порядковым номером «1», но меньшим, чем у других элементов 31, порядковый номер которых пока не идентифицирован. Такой элемент 31 получает порядковый номер «2». На третьем этапе анализ, описанный на втором этапе проводится заново для установления элемента 31 с порядковым номером «3» и так далее до тех пор, пока число оставшихся непронумерованных элементов 31 второй структуры данных документа не будет равно «1». Тогда последний непронумерованный элемент 31 получит порядковый номер, равный максимальному установленному порядковому номеру у пронумерованных элементов 31 плюс «1». Такой сравнительный анализ для идентификации и формирования элементов 31 может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[51] Without limitation, the identification of the system features of elements 21, if necessary, is carried out by organizing a request in the DBPS 20 and obtaining the values 2131 of the system characteristics 213 of the semantic parts 21 of information objects 11 of the digitized document 1. In this case, without limitation, as described earlier, the system features of element 21 are at least the format and functional characteristics of the semantic parts 21 of information objects 11 of the digitized document 1. Without limitation, the identification of the values 311 of elements 31 is carried out after identifying all elements 31 of the second data structure, that is, after recognizing all elements 21 of the first data structure 2 as one or another identified element 31 (element 31 with one or another serial number and with unique or with matching system features of elements 21, of which the identified element 31 consists). In this case, the values 311 of the integrated semantic part 31 will be the values 211 of all the elements 21 of which the identified element 31 of the second data structure 3 consists. As an example, but not a limitation, the determination of the ordinal numbers 312 of the elements 31 of the second data structure can be demonstrated as follows. At the first stage, the ordinal number "1" will be set for the element 31, which contains the semantic part 21 with the minimum value of the ordinal number 212. At the second stage, in the remaining unnumbered elements 31, such an element 31 is found, which contains the semantic part 21 with the ordinal number 212 greater than that of the element 31 with the ordinal number "1", but less than that of the other elements 31, the ordinal number of which has not yet been identified. Such an element 31 receives the ordinal number "2". At the third stage, the analysis described at the second stage is carried out again to establish the element 31 with the ordinal number "3" and so on until the number of the remaining unnumbered elements 31 of the second document data structure is equal to "1". Then the last unnumbered element 31 will receive a ordinal number equal to the maximum established ordinal number of the numbered elements 31 plus "1". Such a comparative analysis for identifying and forming the elements 31 can be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, without limitation, such an analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by applying the technology of training the neural network (AI systems).
[52] На фиг. 9, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1004 формирования третьей структуры данных 4 СМД. Этап 1004 характеризуется: выполнением этапа 10041 идентификации и формирования элементов 41 третьей структуры данных 4, на котором идентифицируют и формируют элементы 41 третьей структуры данных 4, представляющие собой лингвистические конструкции 41, представляющие собой содержащиеся во второй структуре данных 3 интегрированные смысловые части 31 информационных объектов 11 оцифрованного документа 1, причем такие интегрированные смысловые части 31 имеют системные признаки текстовых логических смысловых частей, а также содержащую идентификационные данные лингвистических конструкций 41, представляющие собой значения 411 лингвистических конструкций 41 и порядковые номера 412 лингвистических конструкций 41 в оцифрованном документе 1, причем лингвистическими конструкциями 41 в оцифрованном документе 1 являются одни из следующих лингвистических конструкций 41 или комбинация из следующих лингвистических конструкций 41: обычные лингвистические конструкции 41 третьей структуры данных 4, являющиеся лингвистическими предложениями, особые лингвистические конструкции 41 третьей структуры данных 4, являющиеся списками или рубриками перечисления, реконструируемые лингвистические конструкции 41 третьей структуры данных 4, являющиеся таблицами, содержащими, по меньшей мере, две строки и два столбца, причем, по меньшей мере, одна строка содержит заголовки столбцов и, соответственно, по меньшей мере, один столбец содержит заголовки строк; выполнением этапа 10042 формирования третьей структуры данных 4, на котором формируют третью структуру данных 4 из идентифицированных и сформированных на этапе 10041 элементов 41 третьей структуры данных 4 и их идентификационных данных.[52] Fig. 9, as an example but not limitation, shows a general diagram of the execution of the steps of step 1004 for forming the third data structure 4 of the SMD. Step 1004 is characterized by: performing step 10041 of identifying and generating elements 41 of the third data structure 4, at which elements 41 of the third data structure 4 are identified and generated, representing linguistic constructions 41, representing integrated semantic parts 31 of information objects 11 of the digitized document 1 contained in the second data structure 3, wherein such integrated semantic parts 31 have systemic features of text logical semantic parts, and also containing identification data of linguistic constructions 41, representing values 411 of linguistic constructions 41 and ordinal numbers 412 of linguistic constructions 41 in the digitized document 1, wherein the linguistic constructions 41 in the digitized document 1 are one of the following linguistic constructions 41 or a combination of the following linguistic constructions 41: ordinary linguistic constructions 41 of the third data structure 4, which are linguistic sentences, special linguistic constructions 41 of the third data structure 4, which are lists or enumeration headings, reconstructed linguistic constructions 41 of the third data structure 4, which are tables containing at least two rows and two columns, wherein at least one row contains column headings and, accordingly, at least one column contains row headings; performing step 10042 of forming the third data structure 4, at which the third data structure 4 is formed from the elements 41 of the third data structure 4 identified and formed at step 10041 and their identification data.
[53] На фиг. 10, в качестве примера, но не ограничения, изображена общая структура сформированной третьей структуры данных 4 СМД. Третья структура данных 4 содержит элементы 41 третьей структуры данных 4, представляющие собой лингвистические конструкции 41 и идентификационные данные лингвистических конструкций 41, представляющие собой значения 411 лингвистических конструкций 41, и порядковые номера 412 лингвистических конструкций 41 в оцифрованном документе 1. Предпочтительно, не ограничиваясь, элементами 41 третьей структуры данных 4 СМД являются лингвистические конструкции 41, причем под лингвистическими конструкциями 41 понимают интегрированные смысловые части 31 оцифрованного (электронного) документа 1, содержащиеся во второй структуре данных 3, с системными признаками текстовых логических смысловых частей (тексто-логические интегрированные смысловые части 31). Тексто-логические интегрированные смысловые части, в качестве примера, но не ограничения, могут обладать следующими системными признаками текстовых логических смысловых частей: значениями 2131 системных характеристик 213 смысловых частей 21, составляющих элемент 31: «Текстовый КИО. Списочный машиночитаемый текст. Особая лингвистическая конструкция. Признаки основной смысловой информации. Логическая функциональная роль». Предпочтительно, не ограничиваясь, значение 411 лингвистических конструкций 41 идентично значению тексто-логических интегрированных смысловых частей (интегрированных смысловых частей 31 информационных объектов 11 оцифрованного документа 1, содержащихся во второй структуре данных 3, и имеющих системные признаки текстовых логических смысловых частей). Предпочтительно, не ограничиваясь, порядковым номером 412 лингвистических конструкций 41 является порядковый номер тексто-логической интегрированной смысловой части в оцифрованном документе 1. [53] Fig. 10 shows, by way of example and not limitation, the general structure of the generated third data structure 4 of the SMD. The third data structure 4 contains elements 41 of the third data structure 4, which are linguistic constructions 41 and identification data of the linguistic constructions 41, which are values 411 of the linguistic constructions 41, and serial numbers 412 of the linguistic constructions 41 in the digitized document 1. Preferably, without limitation, the elements 41 of the third data structure 4 of the SMD are linguistic constructions 41, wherein the linguistic constructions 41 are understood to be integrated semantic parts 31 of the digitized (electronic) document 1, contained in the second data structure 3, with systemic features of textual logical semantic parts (textual-logical integrated semantic parts 31). The textual-logical integrated semantic parts, by way of example, but not limitation, may have the following systemic features of textual logical semantic parts: values 2131 of systemic characteristics 213 of semantic parts 21 constituting element 31: "Textual KIO. List machine-readable text. Special linguistic construction. Features of main semantic information. Logical functional role." Preferably, without limitation, the value 411 of linguistic constructions 41 is identical to the value of textual-logical integrated semantic parts (integrated semantic parts 31 of information objects 11 of digitalized document 1 contained in second data structure 3 and having systemic features of textual logical semantic parts). Preferably, without limitation, the ordinal number 412 of linguistic constructions 41 is the ordinal number of the textual-logical integrated semantic part in digitalized document 1.
[54] Предпочтительно, не ограничиваясь, идентификацию и формирование элемента 41 третьей структуры данных 4 СМД в рамках этапа 10041 производят путем сравнительного анализа значений 2131 системных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1, входящих в элементы 31 второй структуры данных 3. Объектом сравнения в значениях 2131 системных характеристиках 21 являются формат и функциональные роли смысловых частей 21. При этом, не ограничиваясь, все элементы 21, входящие в элемент 31 имеют одинаковые формат и функциональные роли. Поэтому, для проведения сравнительного анализа элемента 31 достаточно провести сравнительный анализ одного элемента 21, входящего в элемент 31. В случае, если значения системных характеристик в анализируемого элемента 21 будут содержать «Текстовой формат» и «Логическая функциональная роль», то анализируемый элемент 31, в состав которого входит анализируемый элемент 21, признается тексто-логической интегрированной смысловой частью и идентифицируется как элемент 41 (лингвистическая конструкция) и пополняет третью структуру 3 СМД. Предпочтительно, не ограничиваясь, идентификацию системных признаков элементов 21 при необходимости производят путем организации запроса в БДСП 10, формируемую в рамках этапа 1003, состоящего из идентификационных данных смысловых частей 21, и получения значений 2131 системных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1. При этом, как было описано ранее, системными признаками элемента 21 являются как минимум форматные и функциональные характеристики смысловых частей 21 информационных объектов 11 оцифрованного документа 1. Предпочтительно, не ограничиваясь, значение 411 каждого элемента 41 (лингвистической конструкции) является идентичным значению 311 интегрированной смысловой части 31, которая признана тексто-логической интегрированной смысловой частью и идентифицирована как элемент 41 (лингвистическая конструкция).[54] Preferably, without limitation, the identification and formation of element 41 of the third data structure 4 of the SMD within the framework of step 10041 is carried out by means of a comparative analysis of the values 2131 of the system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1 included in the elements 31 of the second data structure 3. The object of comparison in the values 2131 of the system characteristics 21 are the format and functional roles of the semantic parts 21. In this case, without limitation, all elements 21 included in element 31 have the same format and functional roles. Therefore, to conduct a comparative analysis of element 31, it is sufficient to conduct a comparative analysis of one element 21, included in element 31. If the values of the system characteristics in the analyzed element 21 contain “Text format” and “Logical functional role”, then the analyzed element 31, which includes the analyzed element 21, is recognized as a textual-logical integrated semantic part and is identified as element 41 (linguistic construction) and replenishes the third structure 3 of the SMD. Preferably, without being limited to, the identification of the system features of the elements 21, if necessary, is carried out by organizing a request in the DBPS 10, formed within the framework of stage 1003, consisting of the identification data of the semantic parts 21, and obtaining the values 2131 of the system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1. In this case, as was described earlier, the system features of the element 21 are at least the format and functional characteristics of the semantic parts 21 of the information objects 11 of the digitized document 1. Preferably, without being limited to, the value 411 of each element 41 (linguistic construction) is identical to the value 311 of the integrated semantic part 31, which is recognized as a textual-logical integrated semantic part and is identified as the element 41 (linguistic construction).
[55] В структуре данных элементы 41, в качестве примера, но не ограничения, могут именоваться как «ЛК1», «ЛК2», «ЛК3», «ЛКn», где n≥1- порядковый номер 412 элемента 41 в оцифрованном документе 1. В качестве примера, но не ограничения определение порядковых номеров 412 элементов 41 третей структуры данных 4 может быть продемонстрировано следующим образом. На первом этапе для элемента 41, сформированного из интегрированной смысловой части 31 с минимальным значением порядкового номера 312, будет установлен порядковый номер «1». На втором этапе в оставшихся непронумерованных элементах 41 находят такой элемент 41, сформированный из интегрированной смысловой части 31 с порядковым номером 312 большим, чем у элемента 41 с порядковым номером «1», но меньшим, чем у других элементов 41, порядковый номер которых пока не идентифицирован. Такой элемент 41 получает порядковый номер «2». На третьем этапе анализ, описанный на втором этапе, проводится заново для установления элемента 41 с порядковым номером «3» и так далее до тех пор, пока число оставшихся непронумерованных элементов 41 второй структуры данных документа не будет равно «1». Тогда последний непронумерованный элемент 41 получит порядковый номер, равный максимальному установленному порядковому номеру у пронумерованных элементов 41 плюс «1». Такой сравнительный анализ для идентификации и формирования элементов 41 может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ). Формирование третьей структуры данных 4 СМД в ходе этапа 10042 производят путем объединения в одной структуре данных элементов 41 третьей структуры данных 4, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.[55] In the data structure, the elements 41, by way of example but not limitation, may be referred to as "LC1", "LC2", "LC3", "LCn", where n≥1 is the serial number 412 of the element 41 in the digitized document 1. By way of example but not limitation, the determination of the serial numbers 412 of the elements 41 of the third data structure 4 may be demonstrated as follows. In the first step, the serial number "1" will be set for the element 41 formed from the integrated semantic part 31 with the minimum value of the serial number 312. In the second step, in the remaining unnumbered elements 41, such an element 41 formed from the integrated semantic part 31 with the serial number 312 greater than that of the element 41 with the serial number "1", but less than that of the other elements 41, the serial number of which has not yet been identified, is found. Such element 41 receives the ordinal number "2". In the third stage, the analysis described in the second stage is carried out again to establish the element 41 with the ordinal number "3", and so on until the number of the remaining unnumbered elements 41 of the second document data structure is equal to "1". Then the last unnumbered element 41 will receive the ordinal number equal to the maximum established ordinal number of the numbered elements 41 plus "1". Such a comparative analysis for identifying and forming the elements 41 can be carried out by any method known from the prior art and, accordingly, is not described in detail below. For example, without limitation, such an analysis can be carried out traditionally by a linguist, or with the help of a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using the coding of unchangeable rules (IT solution "by rules"). Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by using neural network (AI systems) training technology. The formation of the third data structure 4 of the SMD during step 10042 is performed by combining in one data structure the elements 41 of the third data structure 4, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in detail below.
[56] На фиг. 11, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1005 формирования четвертой структуры данных 5 СМД. Предпочтительно, не ограничиваясь, этап 1005 характеризуется: выполнением этапа 10051 идентификации и формирования первых элементов 51 четвертой структуры данных 5, на котором идентифицируют и формируют первые элементы 51 четвертой структуры данных 5, а также идентификационные данные первых элементов 51 четвертой структуры данных 5, представляющие собой для каждого первого элемента четвертой структуры данных 5 значение 511 первого элемента 51 четвертой структуры данных 5 и порядковые номера 512 первого элемента 51 четвертой структуры данных 5 в четвертой структуре данных 5; причем первыми элементами 51 четвертой структуры данных 5 являются лингвистические предложения, сформированные из элементов 41 третьей структуры данных 4, содержащих обычные лингвистические конструкции 41, посредством отождествления лингвистических предложений четвертой структуры данных 5 с обычными лингвистическими конструкциями 41 третьей структуры данных 4; выполнением этапа 10052 идентификации и формирования вторых элементов 52 четвертой структуры данных 5, на котором идентифицируют и формируют вторые элементы 52 четвертой структуры данных 5, а также идентификационные данные вторых элементов 52 четвертой структуры данных 5, представляющие собой для каждого второго элемента 52 четвертой структуры данных 5 значение 521 второго элемента 52 четвертой структуры данных 5 и порядковые номера 522 второго элемента 52 четвертой структуры данных 5 в четвертой структуре данных 5; причем вторым элементом 52 четвертой структуры данных 5 являются лингвистические предложения, сформированные из элементов 41 третьей структуры данных 4, содержащих особые лингвистические конструкции 41, посредством преобразования особых лингвистических конструкций 41 в лингвистические предложения четвертой структуры данных 5; причем особой лингвистической конструкцией 41 может являться список или рубрика перечисления; выполнением этапа 10053 идентификации и формирования третьих элементов 53 четвертой структуры данных 5, на котором идентифицируют и формируют третьи элементы 53 четвертой структуры данных 5, а также идентификационные данные третьих элементов 53 четвертой структуры данных 5, представляющие собой для каждого третьего элемента 53 четвертой структуры данных 5 значение 531 третьего элемента 53 четвертой структуры данных 5 и порядковые номера 532 третьего элемента 53 четвертой структуры данных 5 в четвертой структуре данных 5; причем третьим элементом 53 четвертой структуры данных 5 являются лингвистические предложения, сформированные из элементов 41 третьей структуры данных 4, содержащих реконструируемые лингвистические конструкции 41, посредством воссоздания из данных, содержащихся в реконструируемых лингвистических конструкциях 41 отдельных лингвистических предложений четвертой структуры данных 5; причем реконструируемыми лингвистическими конструкциями являются таблицы, обладающие признаками логической основы организации данных; выполнением этапа 10054 формирования четвертой структуры данных 5, на котором формируют четвертую структуру данных 5 из первых элементов 51 четвертой структуры данных 5, вторых элементов 52 четвертой структуры данных 5, третьих элементов 53 четвертой структуры данных 5 и их идентификационных данных.[56] Fig. 11, by way of example and not limitation, shows a general diagram of the execution of the steps of step 1005 of forming the fourth data structure 5 of the SMD. Preferably, without limitation, step 1005 is characterized by: executing a step 10051 of identifying and forming the first elements 51 of the fourth data structure 5, in which the first elements 51 of the fourth data structure 5 are identified and formed, as well as the identification data of the first elements 51 of the fourth data structure 5, representing for each first element of the fourth data structure 5 a value 511 of the first element 51 of the fourth data structure 5 and serial numbers 512 of the first element 51 of the fourth data structure 5 in the fourth data structure 5; wherein the first elements 51 of the fourth data structure 5 are linguistic sentences formed from the elements 41 of the third data structure 4, containing the usual linguistic constructions 41, by identifying the linguistic sentences of the fourth data structure 5 with the usual linguistic constructions 41 of the third data structure 4; performing the step 10052 of identifying and forming the second elements 52 of the fourth data structure 5, at which the second elements 52 of the fourth data structure 5 are identified and formed, as well as the identification data of the second elements 52 of the fourth data structure 5, representing for each second element 52 of the fourth data structure 5 the value 521 of the second element 52 of the fourth data structure 5 and the ordinal numbers 522 of the second element 52 of the fourth data structure 5 in the fourth data structure 5; wherein the second element 52 of the fourth data structure 5 are linguistic sentences formed from the elements 41 of the third data structure 4, containing special linguistic constructions 41, by transforming the special linguistic constructions 41 into linguistic sentences of the fourth data structure 5; wherein the special linguistic construction 41 can be a list or an enumeration heading; by performing a step 10053 of identifying and forming the third elements 53 of the fourth data structure 5, at which the third elements 53 of the fourth data structure 5 are identified and formed, as well as the identification data of the third elements 53 of the fourth data structure 5, representing for each third element 53 of the fourth data structure 5 the value 531 of the third element 53 of the fourth data structure 5 and the ordinal numbers 532 of the third element 53 of the fourth data structure 5 in the fourth data structure 5; wherein the third element 53 of the fourth data structure 5 are linguistic sentences formed from the elements 41 of the third data structure 4 containing reconstructed linguistic constructions 41 by means of recreating individual linguistic sentences of the fourth data structure 5 from the data contained in the reconstructed linguistic constructions 41; wherein the reconstructed linguistic constructions are tables possessing the features of a logical basis for organizing data; performing step 10054 of forming the fourth data structure 5, at which the fourth data structure 5 is formed from the first elements 51 of the fourth data structure 5, the second elements 52 of the fourth data structure 5, the third elements 53 of the fourth data structure 5 and their identification data.
[57] На фиг. 12, в качестве примера, но не ограничения, изображена общая структура сформированной четвертой структуры данных 5. Предпочтительно, не ограничиваясь, четвертая структура данных 5 (четвертая СД 5) содержит первый элемент 51 четвертой СД 5, второй элемент 52 четвертой СД 5 и третий элемент 53 четвертой СД 5, представляющие собой лингвистические предложения четвертой структуры данных 5 и идентификационные данные лингвистических предложений в четвертой структуре данных 5, представляющие собой: для первого элемента 51 четвертой СД 5 , в качестве примера, но не ограничения, значения 511 первого элемента 51 четвертой СД 5 и порядковые номера 512 первого элемента 51 четвертой СД 5 в четвертой СД 5; для второго элемента 52 четвертой СД 5, в качестве примера, но не ограничения, значения 521 второго элемента 52 четвертой СД 5 и порядковые номера 522 второго элемента 52 четвертой СД 5 в четвертой СД 5; для третьего элемента 53 четвертой СД 5, в качестве примера, но не ограничения, значения 531 третьего элемента 53 четвертой СД 5 и порядковые номера 532 третьего элемента 53 четвертой СД 5 в четвертой СД 5. Предпочтительно, не ограничиваясь, элементы 51, 52, 53 четвертой структуры данных 5 представляют собой лингвистические предложения, сформированные из различных лингвистических конструкций 41, содержащихся в третьей структуре данных 4. Предпочтительно, не ограничиваясь, лингвистические предложения четвертой СД 5, отождествляемые с обычной лингвистической конструкцией 41, представляют собой элементы 51 четвертой структуры данных 5. При этом, не ограничиваясь, обычной лингвистической конструкцией 41 считается синтаксически связанная группа слов, то есть лингвистическое предложение. Предпочтительно, не ограничиваясь, лингвистические предложения, сформированные посредством преобразования особых лингвистических конструкций 41 в лингвистические предложения, представляют собой элементы 52 четвертой структуры данных 5. При этом, не ограничиваясь, особой лингвистической конструкцией 41 считается лингвистическая конструкция 41, в которой сочетаются признаки обычной лингвистической конструкции 41 (синтаксически связанной группы слов, лингвистического предложения) и системы организации данных (список, таблица из одной строки или столбца), представляющие на практике, в виде примера, но не ограничения, рубрику перечислений. Предпочтительно, не ограничиваясь, лингвистические предложения, полученные посредством воссоздания из содержащихся в реконструируемых лингвистических конструкциях 41 данных отдельных лингвистических предложений, представляют собой элементы 53 четвертой структуры данных 5. Причем, не ограничиваясь, реконструируемыми лингвистическими конструкциями 41 являются таблицы, обладающие признаками логической основы организации данных. Не ограничиваясь, к таким признакам для таблиц относят, как правило, наличие в таблице как минимум двух строк и двух столбцов. При этом, как минимум, одна строка и/или один столбец должны содержать не данные, а наименование данных в строках и/или в столбцах (заголовки строк и/или, соответственно, заголовки столбцов). Подобные таблицы обладают признаками организации данных, которые можно описать следующими логическими формулами: «ЕСЛИ <…> , ТО <…>», или «(ЕСЛИ <…> И, ЕСЛИ <…>), ТО <…>». В качестве примера, но не ограничения, для формирования элемента 51 значения системных характеристик 2131 у элементов 21, составляющих элемент 41, могут быть такие: «Текстовый КИО. Строчный машиночитаемый текст. Обычная лингвистическая конструкция. Признаки основной смысловой информации. Логическая функциональная роль». В качестве примера, но не ограничения, для формирования элемента 52 значения системных характеристик 2131 у элементов 21, составляющих элемент 41, могут быть такие: «Текстовый КИО. Списочный машиночитаемый текст. Особая лингвистическая конструкция. Признаки основной смысловой информации. Логическая функциональная роль». В качестве примера, но не ограничения, для формирования элемента 53 значения системных характеристик 2131 у элементов 21, составляющих элемент 41, могут быть такие: «Текстовый КИО. Табличный машиночитаемый текст. Реконструируемая лингвистическая конструкция. Признаки основной смысловой информации. Логическая функциональная роль».[57] Fig. 12 shows, by way of example and not limitation, the general structure of the generated fourth data structure 5. Preferably, without limitation, the fourth data structure 5 (fourth SD 5) comprises a first element 51 of the fourth SD 5, a second element 52 of the fourth SD 5 and a third element 53 of the fourth SD 5, representing linguistic sentences of the fourth data structure 5 and identification data of the linguistic sentences in the fourth data structure 5, representing: for the first element 51 of the fourth SD 5, by way of example and not limitation, values 511 of the first element 51 of the fourth SD 5 and serial numbers 512 of the first element 51 of the fourth SD 5 in the fourth SD 5; for the second element 52 of the fourth SD 5, as an example, but not limitation, the values 521 of the second element 52 of the fourth SD 5 and the serial numbers 522 of the second element 52 of the fourth SD 5 in the fourth SD 5; for the third element 53 of the fourth SD 5, by way of example but not limitation, the values 531 of the third element 53 of the fourth SD 5 and the ordinal numbers 532 of the third element 53 of the fourth SD 5 in the fourth SD 5. Preferably, without being limited, the elements 51, 52, 53 of the fourth data structure 5 are linguistic sentences formed from various linguistic constructions 41 contained in the third data structure 4. Preferably, without being limited, the linguistic sentences of the fourth SD 5, identified with the usual linguistic construction 41, are the elements 51 of the fourth data structure 5. In this case, without being limited, the usual linguistic construction 41 is considered to be a syntactically related group of words, that is, a linguistic sentence. Preferably, but not limited to, the linguistic sentences formed by transforming the special linguistic constructions 41 into linguistic sentences are elements 52 of the fourth data structure 5. In this case, but not limited to, the special linguistic construction 41 is considered to be a linguistic construction 41 that combines the features of an ordinary linguistic construction 41 (a syntactically related group of words, a linguistic sentence) and a data organization system (a list, a table of one row or column), which in practice represents, by way of example, but not limitation, a heading of enumerations. Preferably, but not limited to, the linguistic sentences obtained by recreating individual linguistic sentences from the data contained in the reconstructed linguistic constructions 41 are elements 53 of the fourth data structure 5. In this case, but not limited to, the reconstructed linguistic constructions 41 are tables that have the features of a logical basis for organizing data. Without being limited to, such features for tables usually include the presence of at least two rows and two columns in the table. At the same time, at least one row and/or one column must contain not data, but the name of the data in the rows and/or columns (row headings and/or column headings, respectively). Such tables have data organization features that can be described by the following logical formulas: "IF <…>, THEN <…>", or "(IF <…> AND, IF <…>), THEN <…>". As an example, but not limitation, for the formation of element 51, the values of system characteristics 2131 for elements 21, which make up element 41, may be as follows: "Text KIO. Linear machine-readable text. Usual linguistic construction. Features of the main semantic information. Logical functional role." By way of example, but not limitation, for the formation of element 52, the values of system characteristics 2131 for elements 21 that make up element 41 may be as follows: "Textual KIO. List machine-readable text. Special linguistic construction. Attributes of the main semantic information. Logical functional role." By way of example, but not limitation, for the formation of element 53, the values of system characteristics 2131 for elements 21 that make up element 41 may be as follows: "Textual KIO. Tabular machine-readable text. Reconstructable linguistic construction. Attributes of the main semantic information. Logical functional role."
[58] В четвертой структуре данных 5 элементы 51, в качестве примера, но не ограничения, могут именоваться как «ЛПх1», «ЛПх2», «ЛПх3», «ЛПхn», где х - порядковый номер смысловой части 41 в третьей структуре данных 4, в которой содержится обычная лингвистическая конструкция 41, отождествленная с лингвистическим предложением 51, а n≥1 - порядковый номер элемента 51 (лингвистического предложения, отождествленного с обычной лингвистической конструкцией 41) в такой смысловой части 41, начиная с «1». В четвертой структуре данных 5 элементы 52, в качестве примера, но не ограничения, могут именоваться как «ЛПх1», «ЛПх2», «ЛПх3», «ЛПхn», где х - порядковый номер смысловой части 41 в третьей структуре данных 4, в которой содержится особая лингвистическая конструкция 41, из которой сформировано лингвистическое предложение 52, а n≥1 - порядковый номер элемента 52 (лингвистического предложения 52, сформированного из особой лингвистической конструкции 41) в такой смысловой части 41, начиная с «1». В четвертой структуре данных 5 элементы 53, в качестве примера, но не ограничения, могут именоваться как «ЛПх1», «ЛПх2», «ЛПх3», «ЛПхn», где х - порядковый номер смысловой части 41 в третьей структуре данных 4, в которой содержится реконструируемая лингвистическая конструкция 41, из которой воссоздано лингвистическое предложение 53, а n≥1 - порядковый номер элемента 53 (лингвистического предложения 53, воссозданного из данных реконструируемой лингвистической конструкции 41) в такой смысловой части 41, начиная с «1». Предпочтительно, не ограничиваясь, поскольку нумерацию всех лингвистических предложений 51, 52, 53 четвертой структуры данных 5 производят одну по всем лингвистическим предложениям 51, 52, 53 четвертой структуры данных 5, вне зависимости от того первым, вторым или третьим элементом четвертой структуры данных 5 является отдельное лингвистическое предложение 51, 52, 53, то на основании установленных предварительных порядковых номеров форматов «хn» устанавливают порядковые номера всех лингвистических предложений 51, 52, 53 четвертой структуры данных 5 в четвертой структуре данных 5 в формате «ЛП1», «ЛП2», «ЛП3», «ЛПy», где y - порядковый номер элемента 51, 52, 53 четвертой структуры данных 5 в четвертой структуре данных 5. При этом, не ограничиваясь, наименьший номер получают такие лингвистические предложения 51, 52, 53 четвертой структуры данных 5, которые имеют наименьшие значения предварительного порядкового номера в формате «хn». При установлении порядкового номера индекс «х» считают основным номером, а индекс «n» - дополнительным. Наименьший порядковый номер элемента 51, 52, 53 четвертой структуры данных 5 получает такой элемент 51, 52, 53 четвертой структуры данных 5, у которого индекс «х» наименьший, а при равенстве данного индекса у нескольких элементов 51, 52, 53 четвертой структуры данных 5 наименьший порядковый номер получает элемент 51, 52, 53 четвертой структуры данных 5 с наименьшим значением индекса «n» в предварительном порядковом номере. Предпочтительно, не ограничиваясь, идентификацию и формирование элементов 51 четвертой структуры данных в рамках этапа 10051 производят путем выявления в значениях 511 элемента 51 четвертой структуры данных 5 признаков окончания лингвистического предложения и признаков начала лингвистического предложения. Такие признаки формируются и хранятся в специальной пользовательской базе данных (ПБД) и представляют собой список символов текста (текстовых элементов), наличие которых в обычных лингвистических конструкциях 41 третьей структуры данных 4 является признаком начала или окончания лингвистического предложения. В качестве примера, но не ограничения, символами (текстовыми элементами), являющимися признаками начала предложения могут быть: слово (число) с заглавной буквы; первое слово (число) в смысловой части и тому подобное. В качестве примера, но не ограничения, символами (текстовыми элементами), являющимися признаком окончания предложения могут быть: знаки препинания (точка, точка с запятой) с последующим за ним пробелом; последнее слово (число, знак препинания) в смысловой части и тому подобное.[58] In the fourth data structure 5, the elements 51, by way of example but not limitation, may be referred to as "LPx1", "LPx2", "LPx3", "LPxn", where x is the ordinal number of the semantic part 41 in the third data structure 4, which contains the ordinary linguistic construction 41 identified with the linguistic sentence 51, and n≥1 is the ordinal number of the element 51 (the linguistic sentence identified with the ordinary linguistic construction 41) in such semantic part 41, starting with "1". In the fourth data structure 5, the elements 52, by way of example but not limitation, may be referred to as "LPx1", "LPx2", "LPx3", "LPxn", where x is the ordinal number of the semantic part 41 in the third data structure 4, which contains the special linguistic construction 41 from which the linguistic sentence 52 is formed, and n≥1 is the ordinal number of the element 52 (the linguistic sentence 52 formed from the special linguistic construction 41) in such semantic part 41, starting with "1". In the fourth data structure 5, the elements 53, by way of example but not limitation, may be referred to as "LPx1", "LPx2", "LPx3", "LPxn", where x is the ordinal number of the semantic part 41 in the third data structure 4, which contains the reconstructed linguistic construction 41, from which the linguistic sentence 53 is recreated, and n≥1 is the ordinal number of the element 53 (the linguistic sentence 53, recreated from the data of the reconstructed linguistic construction 41) in such semantic part 41, starting with "1". Preferably, without being limited to, since the numbering of all linguistic sentences 51, 52, 53 of the fourth data structure 5 is carried out one by all linguistic sentences 51, 52, 53 of the fourth data structure 5, regardless of whether the first, second or third element of the fourth data structure 5 is a separate linguistic sentence 51, 52, 53, then, on the basis of the established preliminary ordinal numbers of the formats "xn", the ordinal numbers of all linguistic sentences 51, 52, 53 of the fourth data structure 5 in the fourth data structure 5 are established in the format "LP1", "LP2", "LP3", "LPy", where y is the ordinal number of the element 51, 52, 53 of the fourth data structure 5 in the fourth data structure 5. In this case, without being limited to, the smallest number is received by such linguistic sentences 51, 52, 53 of the fourth data structure 5, which have the smallest values of the preliminary ordinal number in the format "xn". When establishing the ordinal number, the index "x" is considered the main number, and the index "n" is additional. The smallest ordinal number of the element 51, 52, 53 of the fourth data structure 5 is received by such an element 51, 52, 53 of the fourth data structure 5, which has the smallest index "x", and if this index is equal for several elements 51, 52, 53 of the fourth data structure 5, the smallest ordinal number is received by the element 51, 52, 53 of the fourth data structure 5 with the smallest value of the index "n" in the preliminary ordinal number. Preferably, without limitation, the identification and formation of the elements 51 of the fourth data structure within the framework of step 10051 is carried out by identifying in the values 511 of the element 51 of the fourth data structure 5 the features of the end of a linguistic sentence and the features of the beginning of a linguistic sentence. Such features are formed and stored in a special user database (SUD) and represent a list of text symbols (text elements), the presence of which in conventional linguistic constructions 41 of the third data structure 4 is a feature of the beginning or end of a linguistic sentence. As an example, but not limitation, the symbols (text elements) that are features of the beginning of a sentence may be: a word (number) with a capital letter; the first word (number) in the semantic part, and the like. As an example, but not limitation, the symbols (text elements) that are a feature of the end of a sentence may be: punctuation marks (period, semicolon) followed by a space; the last word (number, punctuation mark) in the semantic part, and the like.
[59] Предпочтительно, не ограничиваясь, для идентификации элементов 51 выявляют такие элементы 41, которые по значениям 2131 системных характеристик 213 смысловых частей 21, входящих в элемент 41, соответствуют упомянутым требованиям к первому элементу 51 четвертой структуры данных 5. Далее в соответствующих упомянутым требованиям элементах 41 выявляются признаки окончания лингвистического предложения и признаки начала лингвистического предложения. По результатам выявления признаков окончания лингвистического предложения и признаков начала лингвистического предложения элемент 41 разделяется на элементы 51, представляющие собой лингвистические предложения 51, содержащиеся в элементе 41. Такой анализ элементов 41 для идентификации и формирования элементов 51 может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ). Предпочтительно, не ограничиваясь, при этом идентификацию системных характеристик смысловых частей, составляющих элементы 41 третьей структуры данных 4 СМД и их значений при необходимости производят путем организации запроса в Базу данных системных признаков 20 (БДСП 20), формируемую в рамках этапа 1003 состоящего из идентификационных данных смысловых частей, составляющих элемент 41, и получения значений 2131 системных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1, из которых состоит элемент 41. При этом, как было описано ранее, системными признаками элемента 51 являются как минимум упомянутые значения 2131 форматных и функциональных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1, из которых состоят элементы 41, которые соответствуют требованиям системных признаков элементов 51.[59] Preferably, without limitation, for identifying elements 51, such elements 41 are identified which, according to the values 2131 of the system characteristics 213 of the semantic parts 21 included in element 41, correspond to the said requirements for the first element 51 of the fourth data structure 5. Further, in the elements 41 corresponding to the said requirements, the features of the end of a linguistic sentence and the features of the beginning of a linguistic sentence are identified. Based on the results of identifying the features of the end of a linguistic sentence and the features of the beginning of a linguistic sentence, element 41 is divided into elements 51 representing linguistic sentences 51 contained in element 41. Such an analysis of elements 41 for identifying and forming elements 51 can be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, but not limited to, such analysis can be performed traditionally by a linguist, or by using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are enough examples, it is possible to perform such analysis using a statistical processor (neural network, AI systems) by using neural network (AI systems) training technology. Preferably, without limitation, the identification of the system characteristics of the semantic parts constituting the elements 41 of the third data structure 4 SMD and their values, if necessary, is carried out by organizing a request to the Database of System Features 20 (DSF 20), formed within the framework of stage 1003 consisting of the identification data of the semantic parts constituting the element 41, and obtaining the values 2131 of the system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1, of which the element 41 consists. In this case, as was described earlier, the system features of the element 51 are at least the mentioned values 2131 of the format and functional characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1, of which the elements 41 consist, which correspond to the requirements of the system features of the elements 51.
[60] Предпочтительно, не ограничиваясь, идентификацию и формирование элементов 52 четвертой структуры данных в рамках этапа 10052 производят путем выявления в значениях 521 элемента 52 четвертой структуры данных 5 признаков первой части сборного лингвистического предложения и признаков второй части сборного лингвистического предложения. Такие признаки формируются и хранятся в специальной пользовательской базе данных (ПБД) и представляют собой список символов текста (текстовых элементов), наличие которых в электронном текстовом массиве данных (массиве логических данных), состоящем из особых лингвистических конструкций, является признаком первой и второй части сборного лингвистического предложения. В качестве примера, но не ограничения, символами (текстовыми элементами), являющимися признаками начала первой части сборного предложения могут быть: слово (число) с заглавной буквы; первое слово (число) в смысловой части и тому подобное. В качестве примера, но не ограничения, символами (текстовыми элементами), являющимися признаками окончания первой части сборного предложения могут быть: знак препинания (двоеточие) с последующим за ним пробелом или символом «перевод строки». В качестве примера, но не ограничения, символами (текстовыми элементами), являющимися признаками начала второй части сборного предложения могут быть: слово (число) со строчной буквы; предшествующий символ - знак препинания (двоеточие или точка с запятой). В качестве примера, но не ограничения, символами (текстовыми элементами), являющимися признаками окончания второй части сборного предложения могут быть: знак препинания (точка с запятой или точка) с последующим за ним пробелом или символом «перевод строки». Практический пример формирования сборных лингвистических предложений из элементов 41, представляющих собой список или рубрику перечисления можно продемонстрировать на следующем примере. Если рубрика перечисления (элемент 41) имеет следующий текст: «Для осуществления приемки-передачи товара покупатель обязан предоставить: чек об уплате товара; доверенность от покупателя; документ, подтверждающий личность доверенного лица», то из него могут быть сформированы следующие элементы 52: «Для осуществления приемки-передачи товара покупатель обязан предоставить чек об уплате товара»; «Для осуществления приемки-передачи товара покупатель обязан предоставить доверенность от покупателя»; «Для осуществления приемки-передачи товара покупатель обязан предоставить документ, подтверждающий личность доверенного лица». Предпочтительно, не ограничиваясь, для идентификации элементов 52 выявляют такие элементы 41, которые по значениям 2131 системных характеристик 213 смысловых частей 21, входящих в элемент 41 соответствуют упомянутым требованиям ко второму элементу 52 четвертой структуры данных 5. Далее, в соответствующих упомянутым требованиям элементах 41 выявляются признаки начала первой части сборного лингвистического предложения и признаки окончания первой части сборного лингвистического предложения, а также признаки начала второй части сборного лингвистического предложения и признаки окончания второй части сборного лингвистического предложения. По результатам выявления всех упомянутых признаков для идентификации элементов 52 элемент 41 разделяется вначале на части элементов 52, из которых формируются элементы 52, представляющие собой сборные лингвистические предложения, содержащиеся в элементе 41. Такой анализ элементов 41 для идентификации и формирования элементов 52 может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ). Предпочтительно, не ограничиваясь, идентификацию системных характеристик 213 смысловых частей 21, составляющих элементы 41 третьей структуры данных 4 СМД и их значений при необходимости производят путем организации запроса в базу данных системных признаков 20 (БДСП 20), формируемую в рамках этапа 1003, состоящего из идентификационных данных смысловых частей 21, составляющих элемент 41, и получения значений 2131 системных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1, из которых состоит элемент 41. При этом, как было описано ранее, системными признаками элемента 52 являются как минимум упомянутые значения 2131 форматных и функциональных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1, из которых состоят элементы 41, которые соответствуют требованиям системных признаков элементов 52.[60] Preferably, without limitation, the identification and formation of elements 52 of the fourth data structure within the framework of step 10052 is carried out by identifying in the values 521 of element 52 of the fourth data structure 5 the features of the first part of the composite linguistic sentence and the features of the second part of the composite linguistic sentence. Such features are formed and stored in a special user database (SUD) and represent a list of text symbols (text elements), the presence of which in the electronic text data array (logical data array) consisting of special linguistic constructions is a feature of the first and second parts of the composite linguistic sentence. As an example, but not limitation, the symbols (text elements) that are features of the beginning of the first part of the composite sentence may be: a word (number) with a capital letter; the first word (number) in the semantic part, and the like. By way of example, but not limitation, the symbols (text elements) that are signs of the end of the first part of a compound sentence may be: a punctuation mark (colon) followed by a space or line feed. By way of example, but not limitation, the symbols (text elements) that are signs of the beginning of the second part of a compound sentence may be: a word (number) starting with a lowercase letter; the preceding symbol is a punctuation mark (colon or semicolon). By way of example, but not limitation, the symbols (text elements) that are signs of the end of the second part of a compound sentence may be: a punctuation mark (semicolon or period) followed by a space or line feed. A practical example of forming compound linguistic sentences from elements 41, which are a list or enumeration heading, can be demonstrated in the following example. If the enumeration heading (element 41) has the following text: "To carry out acceptance and transfer of the goods, the buyer must provide: a receipt for payment for the goods; a power of attorney from the buyer; document confirming the identity of the authorized person”, then the following elements 52 can be formed from it: “In order to carry out the acceptance and transfer of the goods, the buyer must provide a receipt for the payment for the goods”; “In order to carry out the acceptance and transfer of the goods, the buyer must provide a power of attorney from the buyer”; “In order to carry out the acceptance and transfer of the goods, the buyer must provide a document confirming the identity of the authorized person”. Preferably, without limitation, for identifying elements 52, such elements 41 are identified that, according to the values 2131 of the system characteristics 213 of the semantic parts 21 included in the element 41, correspond to the aforementioned requirements for the second element 52 of the fourth data structure 5. Further, in the elements 41 corresponding to the aforementioned requirements, the features of the beginning of the first part of the composite linguistic sentence and the features of the end of the first part of the composite linguistic sentence, as well as the features of the beginning of the second part of the composite linguistic sentence and the features of the end of the second part of the composite linguistic sentence are identified. Based on the results of identifying all the mentioned features for identifying elements 52, element 41 is first divided into parts of elements 52, from which elements 52 are formed, which are prefabricated linguistic sentences contained in element 41. Such analysis of elements 41 for identifying and forming elements 52 can be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, without limitation, such analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are a sufficient number of examples, it is possible to perform such analysis using a statistical processor (neural network, AI systems) by using neural network (AI systems) training technology. Preferably, without limitation, the identification of the system characteristics 213 of the semantic parts 21 constituting the elements 41 of the third data structure 4 of the SMD and their values, if necessary, is carried out by organizing a request to the database of system features 20 (DBSF 20), formed within the framework of step 1003, consisting of the identification data of the semantic parts 21 constituting the element 41, and obtaining the values 2131 of the system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1, of which the element 41 consists. In this case, as was described earlier, the system features of the element 52 are at least the mentioned values 2131 of the format and functional characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1, of which the elements 41 consist, which correspond to the requirements of the system features of the elements 52.
[61] Предпочтительно, не ограничиваясь, идентификацию и формирование элемента 53 четвертой структуры данных в рамках этапа 10053 производят путем выявления в значениях 531 элемента 53 четвертой структуры данных 5 СМД признаков первой части воссозданного лингвистического предложения и признаков второй части воссозданного лингвистического предложения. Такие признаки формируются и хранятся в специальной пользовательской базе данных (ПБД) и представляют собой список символов кода электронной страницы (текстово-табличных символов), наличие которых в электронном текстовом массиве данных (массиве логических данных), состоящем из реконструируемых лингвистических конструкций, является признаком первой и второй части реконструируемого лингвистического предложения. В качестве примера, но не ограничения, символами (текстово-табличными символами), являющимися признаками наименования таблицы могут быть: текстовая строка над таблицей; ячейка первой строки таблицы, содержащая текст, соответствует по ширине всем ячейкам во второй строке; и тому подобное В качестве примера, но не ограничения, символами (текстово-табличными символами), являющимися признаками наименований полей (столбцов) таблицы могут быть: символы, указывающие на число полей первой строки таблицы более одного; символы, указывающие на число полей второй строки таблицы более одного (при наличии первой строки наименования таблицы); символы, указывающие на наименование полей таблицы, расположенных на нескольких строках, и тому подобное. В качестве примера, но не ограничения, символами (текстово-табличными символами), являющимися признаками наименований строк таблицы могут быть: символы, указывающие на число строк таблицы; символы, указывающие на число строк таблицы, в которых содержится наименование полей таблицы; символы, указывающие на число строк таблицы, в которых содержится наименование строк таблицы, и тому подобное. В качестве примера, но не ограничения, символами (текстово-табличными символами), являющимися признаками значений таблицы могут быть: символы, указывающие на ячейки таблицы, не относящихся ни к наименованию таблицы, ни к наименованию полей (столбцов) или строк таблицы, и тому подобное.[61] Preferably, without limitation, the identification and formation of element 53 of the fourth data structure within the framework of step 10053 is carried out by identifying in the values 531 of element 53 of the fourth data structure 5 of the SMD the features of the first part of the reconstructed linguistic sentence and the features of the second part of the reconstructed linguistic sentence. Such features are formed and stored in a special user database (SUD) and represent a list of symbols of the electronic page code (text-table symbols), the presence of which in the electronic text data array (logical data array) consisting of the reconstructed linguistic constructions is a feature of the first and second parts of the reconstructed linguistic sentence. As an example, but not limitation, the symbols (text-table symbols) that are features of the table name may be: a text line above the table; a cell of the first row of the table containing the text corresponds in width to all cells in the second row; By way of example, but not limitation, the symbols (text-table symbols) that are attributes of table field (column) names may be: symbols indicating the number of fields in the first row of the table that is greater than one; symbols indicating the number of fields in the second row of the table that is greater than one (if the first row of the table name is present); symbols indicating the names of table fields located on several rows, and the like. By way of example, but not limitation, the symbols (text-table symbols) that are attributes of table row names may be: symbols indicating the number of table rows; symbols indicating the number of table rows that contain the names of table fields; symbols indicating the number of table rows that contain the names of table rows, and the like. By way of example, but not limitation, the symbols (text-table symbols) that are attributes of table values may be: symbols indicating table cells that are not related to either the table name or the names of table fields (columns) or rows, and the like.
[62] Практический пример формирования воссозданных лингвистических предложений из элементов 41, представляющих собой таблицу данных, можно продемонстрировать на следующем примере. Допустим, что таблица №1 (элемент 41, содержащий данные, имеющие следующие значения системных признаков смысловых частей - «Табличный машиночитаемый текст. Реконструируемая лингвистическая конструкция») имеет следующий вид (таблица №1):[62] A practical example of the formation of reconstructed linguistic sentences from elements 41, which represent a data table, can be demonstrated in the following example. Let us assume that table No. 1 (element 41, containing data with the following values of the system features of semantic parts - "Tabular machine-readable text. Reconstructed linguistic construction") has the following form (table No. 1):
[63] Таблица №1:[63] Table No. 1:
[64] Тогда, воссозданные лингвистические предложения 53 могут быть следующими: «Если метод обработки есть черновое обтачивание, то шероховатость должна быть от 160 до 80 мкм»; «Если метод обработки есть черновое обтачивание, то квалитет должен быть от 14 до 12»; «Если метод обработки есть черновое обтачивание, то припуск на сторону должен быть от 1,5 до 3,5 мкм»; «Если метод обработки есть чистовое обтачивание, то шероховатость должна быть от 160 до 80 мкм»; «Если метод обработки есть чистовое обтачивание, то квалитет должен быть от 14 до 12»; «Если метод обработки есть чистовое обтачивание, то припуск на сторону должен быть от 1,5 до 3,5 мкм»; «Если метод обработки есть тонкое обтачивание, то шероховатость должна быть от 160 до 80 мкм»; «Если метод обработки есть тонкое обтачивание, то квалитет должен быть от 14 до 12»; «Если метод обработки есть тонкое обтачивание, то припуск на сторону должен быть от 1,5 до 3,5 мкм». Предпочтительно, не ограничиваясь, для идентификации элементов 53 выявляют такие элементы 41, которые по значениям 2131 системных характеристик 213 смысловых частей 21, входящих в элемент 41 соответствуют упомянутым требованиям к третьему элементу 53 четвертой структуры данных 5. Далее в соответствующих упомянутым требованиям элементах 41 выявляются признаки наименования таблицы, признаки наименований полей (столбцов) таблицы, а также признаки наименований строк таблицы и признаки значений таблицы. По результатам выявления всех упомянутых признаков для идентификации элементов 53 элемент 41 разделяется вначале на части элементов 53, из которых формируются элементы 53, представляющие собой воссозданные лингвистические предложения 53, содержащиеся в элементе 41. Такой анализ элементов 41 для идентификации и формирования элементов 53 может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ). Предпочтительно, не ограничиваясь, идентификацию системных характеристик 213 смысловых частей 21, составляющих элементы 41 третьей структуры данных 4 СМД и их значений при необходимости производят путем организации запроса в базу данных системных признаков 20 (БДСП 20), формируемую в рамках этапа 1003, состоящего из идентификационных данных смысловых частей, составляющих элемент 41, и получения значений 2131 системных характеристик 213 смысловых частей 21 информационных объектов 11 оцифрованного документа 1, из которых состоит элемент 41 третьей СД СМД. При этом, как было описано ранее, системными признаками элемента 53 являются как минимум упомянутые значения 2131 форматных и функциональных характеристик 213 смысловых частей 21 информационного объекта 11 оцифрованного документа 1, из которых состоят элементы 41, которые соответствуют требованиям системных признаков элементов 53.[64] Then, the reconstructed linguistic sentences 53 can be as follows: "If the processing method is rough turning, then the roughness should be from 160 to 80 µm"; "If the processing method is rough turning, then the quality grade should be from 14 to 12"; "If the processing method is rough turning, then the allowance on the side should be from 1.5 to 3.5 µm"; "If the processing method is finish turning, then the roughness should be from 160 to 80 µm"; "If the processing method is finish turning, then the quality grade should be from 14 to 12"; "If the processing method is finish turning, then the allowance on the side should be from 1.5 to 3.5 µm"; "If the processing method is fine turning, then the roughness should be from 160 to 80 µm"; "If the processing method is fine turning, then the quality must be from 14 to 12"; "If the processing method is fine turning, then the allowance on the side must be from 1.5 to 3.5 μm". Preferably, without limitation, for identifying elements 53, such elements 41 are identified that, according to the values 2131 of the system characteristics 213 of the semantic parts 21 included in the element 41, correspond to the mentioned requirements for the third element 53 of the fourth data structure 5. Further, in the elements 41 corresponding to the mentioned requirements, the attributes of the table name, the attributes of the names of the fields (columns) of the table, as well as the attributes of the names of the rows of the table and the attributes of the values of the table are identified. Based on the results of identifying all the mentioned features for identifying elements 53, element 41 is first divided into parts of elements 53, from which elements 53 are formed, which are recreated linguistic sentences 53 contained in element 41. Such analysis of elements 41 for identifying and forming elements 53 can be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, without limitation, such analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are a sufficient number of examples, it is possible to perform such analysis using a statistical processor (neural network, AI systems) by using neural network (AI systems) training technology. Preferably, without limitation, the identification of the system characteristics 213 of the semantic parts 21 constituting the elements 41 of the third data structure 4 of the SMD and their values, if necessary, is carried out by organizing a request to the database of system features 20 (DBSF 20), formed within the framework of step 1003, consisting of the identification data of the semantic parts constituting the element 41, and obtaining the values 2131 of the system characteristics 213 of the semantic parts 21 of the information objects 11 of the digitized document 1, of which the element 41 of the third SD SMD consists. In this case, as was described earlier, the system features of the element 53 are at least the mentioned values 2131 of the format and functional characteristics 213 of the semantic parts 21 of the information object 11 of the digitized document 1, of which the elements 41 consist, which correspond to the requirements of the system features of the elements 53.
[65] Предпочтительно, не ограничиваясь, формирование четвертой структуры данных 5 в ходе этапа 10054 производят путем объединения в одной структуре данных элементов 51, 52, 53 четвертой структуры данных 5, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.[65] Preferably, without limitation, the formation of the fourth data structure 5 during step 10054 is carried out by combining in one data structure the elements 51, 52, 53 of the fourth data structure 5, as well as their identification data, according to principles and methods known from the prior art, which, accordingly, are not described in detail below.
[66] На фиг. 13, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1006 формирования пятой структуры данных 6. Предпочтительно, не ограничиваясь, этап 1006 характеризуется: выполнением этапа 1061 идентификации элементов 61 пятой структуры данных 6, на котором идентифицируют элементы 61 пятой структуры данных 6, а также идентификационные данные элементов 61 пятой структуры данных 6, представляющие собой значения 611 элементов 61 пятой структуры данных 6 и порядковые номера 612 элементов 61 пятой структуры данных 6 в соответствующем лингвистическом предложении 51, 52, 53 четвертой структуры данных 5, при этом такие лингвистические предложения 51, 52, 53 содержатся в лингвистических конструкциях 41 третьей структуры данных 4; причем элементами 61 пятой структуры данных 6 являются текстовые элементы 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5; выполнением этапа 10062 формирования пятой структуры данных 6, на котором формируют пятую структуру данных 6 из идентифицированных элементов 61 пятой структуры данных 6 и их идентификационных данных.[66] Fig. 13, by way of example and not limitation, shows a general diagram of the execution of the steps of step 1006 of forming the fifth data structure 6. Preferably, without limitation, step 1006 is characterized by: executing a step 1061 of identifying the elements 61 of the fifth data structure 6, in which the elements 61 of the fifth data structure 6 are identified, as well as the identification data of the elements 61 of the fifth data structure 6, representing the values 611 of the elements 61 of the fifth data structure 6 and the ordinal numbers 612 of the elements 61 of the fifth data structure 6 in the corresponding linguistic sentence 51, 52, 53 of the fourth data structure 5, wherein such linguistic sentences 51, 52, 53 are contained in the linguistic constructions 41 of the third data structure 4; wherein the elements 61 of the fifth data structure 6 are the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5; performing the stage 10062 of forming the fifth data structure 6, at which the fifth data structure 6 is formed from the identified elements 61 of the fifth data structure 6 and their identification data.
[67] На фиг. 14, в качестве примера, но не ограничения, изображена общая структура сформированной пятой структуры данных 6. Пятая структура данных 6 (пятая СД 6) содержит элементы 61 пятой СД 6, представляющие собой текстовые элементы 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5, содержащихся в лингвистических конструкциях 41 третьей структуры данных 4 СМД и идентификационные данные текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5, содержащихся в лингвистических конструкциях 41 третьей структуры данных 4 СМД, представляющие собой в качестве примера, но не ограничения: значения 611 текстовых элементов 61 в лингвистических предложениях 51, 52, 53 четвертой структуры данных 5; порядковые номера 612 текстовых элементов 61 в лингвистических предложениях 51, 52, 53 четвертой структуры данных 5. Предпочтительно, не ограничиваясь, текстовые элементы 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5 как элементы 61 пятой структуры данных 6 представляют собой различные обособленные объекты соответствующего лингвистического предложения 51, 52, 53, в качестве примера, но не ограничения: текстовые элементы первого вида (первичные текстовые элементы), представляющие собой в качестве примера, но не ограничения, слова, числа, цифры, индексы (конструкции из цифр и(или) букв и(или) знаков), знаки препинания и тому подобное, при этом, упомянутые объекты лингвистического предложения обособляются в предложении с помощью пробелов, за исключением знаков препинания, которые как минимум с одной стороны (до знака препинания) не имеют пробела; текстовые элементы второго вида (сложные текстовые элементы), представляющие собой в качестве примера, но не ограничения, словоформы или группы слов, являющиеся одним объектом в соответствии с правилами морфологии (сложная словоформа или морфоомоним). Например, слова «в», «соответствии» и «с» представляют собой несколько первичных ТЭ, хотя при этом они же (группа слов) являются одним сложным текстовым элементом «в соответствии с». На практике пользователь самостоятельно заранее устанавливает критерии для текстовых элементов, уточняя интересующий его вид текстовых элементов лингвистического предложения. Предпочтительно, не ограничиваясь, значением 611 текстового элемента 61 является набор всех символов (букв, цифр, символов, знаков препинания, пробелов), из которых состоит элемент 61 в лингвистическом предложении 51, 52, 53. Предпочтительно, не ограничиваясь, порядковым номером 612 текстового элемента 61 является порядковый номер 612 текстового элемента 61 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. В структуре данных элементы 61 в качестве примера, но не ограничения, могут именоваться как «ТЭ1.х», «ТЭ2.х», «ТЭ3.х» «ТЭn.х», где n≥1 - порядковый номер текстового элемента 61 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5, а х≥1 - соответствующий порядковый номер 512, 522, 532 лингвистического предложения 51, 52, 53 в четвертой структуре данных.[67] Fig. 14 shows, by way of example and not limitation, the general structure of the generated fifth data structure 6. The fifth data structure 6 (fifth SD 6) contains elements 61 of the fifth SD 6, which are text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5, contained in linguistic constructions 41 of the third data structure 4 SMD, and identification data of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5, contained in linguistic constructions 41 of the third data structure 4 SMD, which are, by way of example and not limitation: values 611 of text elements 61 in linguistic sentences 51, 52, 53 of the fourth data structure 5; ordinal numbers 612 of text elements 61 in linguistic sentences 51, 52, 53 of the fourth data structure 5. Preferably, without limitation, text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5 as elements 61 of the fifth data structure 6 represent various isolated objects of the corresponding linguistic sentence 51, 52, 53, by way of example but not limitation: text elements of the first type (primary text elements), which are, by way of example but not limitation, words, numbers, digits, indices (constructions of digits and/or letters and/or signs), punctuation marks and the like, wherein the said objects of the linguistic sentence are isolated in the sentence by means of spaces, with the exception of punctuation marks that do not have a space on at least one side (before the punctuation mark); text elements of the second type (complex text elements), which are, by way of example, but not limitation, word forms or groups of words that are one object according to the rules of morphology (complex word form or morphohomonym). For example, the words "in", "in accordance with" and "with" represent several primary TE, although at the same time they (the group of words) are one complex text element "in accordance with". In practice, the user independently sets the criteria for text elements in advance, specifying the type of text elements of the linguistic sentence that interests him. Preferably, but not limited to, the value 611 of the text element 61 is the set of all characters (letters, digits, symbols, punctuation marks, spaces) that make up the element 61 in the linguistic sentence 51, 52, 53. Preferably, but not limited to, the ordinal number 612 of the text element 61 is the ordinal number 612 of the text element 61 in the linguistic sentence 51, 52, 53 of the fourth data structure 5. In the data structure, the elements 61, by way of example but not limitation, may be named as "TE1.x", "TE2.x", "TE3.x" "TEn.x", where n≥1 is the ordinal number of the text element 61 in the linguistic sentence 51, 52, 53 of the fourth data structure 5, and x≥1 is the corresponding ordinal number 512, 522, 532 linguistic sentences 51, 52, 53 in the fourth data structure.
[68] Предпочтительно, не ограничиваясь, идентификацию и формирование текстовых элементов 61 пятой структуры данных 6 в ходе этапа 10061 производят путем анализа текста и выявления (выделения) отдельных текстовых элементов 61 согласно их виду и описанию, которое должно быть известно заранее. Например, но не ограничиваясь, такой анализ может производиться путем выделения в предложении слов, чисел или индексов, разделенных друг от друга пробелом, а также знаков препинания, которые присоединены к упомянутым словам, числам и индексам. При этом предпочтительно, чтобы последний знак препинания в предложении не учитывался и не рассматривался в качестве текстового элемента 61 лингвистического предложения 51 четвертой структуры данных 5. Предпочтительно, не ограничиваясь, при идентификации текстовых элементов 61, представляющих собой сложные текстовые элементы 61 в случае, если заранее был установлен такой вид текстовых элементов 61, производят запрос в отдельные базы данных (например, не ограничиваясь, в подключаемый электронный морфологический словарь) для подтверждения состава сложного текстового элемента 61 с целью его дальнейшей идентификации как текстового элемента 61 в лингвистическом предложении 51 четвертой структуры данных 5. Такой анализ лингвистических предложений 51 четвертой структуры данных 5 для идентификации и формирования текстовых элементов 61 может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ). Предпочтительно, не ограничиваясь, формирование пятой структуры данных в ходе этапа 10062 производят путем объединения в одной структуре данных элементов 61 пятой структуры данных 6, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.[68] Preferably, without limitation, the identification and formation of text elements 61 of the fifth data structure 6 during step 10061 is carried out by analyzing the text and identifying (highlighting) individual text elements 61 according to their type and description, which must be known in advance. For example, but without limitation, such an analysis can be carried out by highlighting words, numbers or indices in a sentence, separated from each other by a space, as well as punctuation marks that are attached to the said words, numbers and indices. In this case, it is preferable that the last punctuation mark in the sentence is not taken into account and is not considered as a text element 61 of the linguistic sentence 51 of the fourth data structure 5. Preferably, without limitation, when identifying text elements 61 that are complex text elements 61 in the event that such a type of text elements 61 has been previously established, a request is made to separate databases (for example, without limitation, to a pluggable electronic morphological dictionary) to confirm the composition of the complex text element 61 for the purpose of its subsequent identification as a text element 61 in the linguistic sentence 51 of the fourth data structure 5. Such an analysis of the linguistic sentences 51 of the fourth data structure 5 for identifying and forming text elements 61 can be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, without limitation, such a complex analysis can be performed traditionally by a linguist, or with the help of a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by using neural network training technology (AI systems). Preferably, without limitation, the formation of the fifth data structure during step 10062 is performed by combining in one data structure the elements 61 of the fifth data structure 6, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in detail below.
[69] На фиг. 15, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1007 формирования базы данных лингво-логическо-предметных признаков 30 (БДЛЛПП 30), представляющей собой базу данных лингвистических, логических и предметных признаков текстовых элементов 61 лингвистических предложений 51, 52, 53 содержащихся в лингвистических конструкциях 41 третьей структуры данных 4. Предпочтительно, не ограничиваясь, этап 1007 характеризуется: выполнением этапа 10071 формирования первой части лингво-логическо-предметных признаков текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5, на котором для лингвистического анализа текстовых элементов 61, содержащихся в пятой структуре данных 6 и классифицированных как слово, предоставляют идентификационные данные таких текстовых элементов 61 и получают лингвистические характеристики таких текстовых элементов 61, а также значения упомянутых лингвистических характеристик; выполнением этапа 10072 формирования второй части лингво-логическо-предметных признаков текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5, на котором для логического анализа текстовых элементов 61, содержащихся в пятой структуре данных 6 и классифицированных как слово, предоставляют идентификационные данные таких текстовых элементов 61, а также лингвистические характеристики таких текстовых элементов 61 вместе с упомянутыми значениями лингвистических характеристик, и получают логические характеристики таких текстовых элементов 61 каждого лингвистического предложения 51, 52, 53, а также значения упомянутых логических характеристик; выполнением этапа 10073 формирования третьей части лингво-логическо-предметных признаков текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5, на котором для предметного анализа текстовых элементов 61, содержащихся в пятой структуре данных 6 и классифицированных как слово, предоставляют идентификационные данные таких текстовых элементов 61, а также лингвистические характеристики таких текстовых элементов 61 вместе с упомянутыми значениями лингвистических характеристик и предоставляют логические характеристики таких текстовых элементов 61, а также значения упомянутых логических характеристик, и получают характеристики таких текстовых элементов 61 в предметной области, являющиеся предметными характеристиками, а также значения упомянутых предметных характеристик; выполнением этапа 10074 формирования базы данных лингво-логическо-предметных признаков 20, на котором формируют базу данных лингво-логическо-предметных признаков 30 текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, при этом лингво-логическо-предметными признаками текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 являются полученные для каждого текстового элемента 61 в ходе этапов 10071, 10072 и 10073 упомянутые лингвистические характеристики, упомянутые логические характеристики и упомянутые предметные характеристики, обладающие соответственно упомянутыми значениями лингвистических характеристик, упомянутыми значениями логических характеристик и упомянутыми значениями предметных характеристик.[69] In Fig. 15, as an example, but not limitation, a general diagram of the execution of the stages of stage 1007 of the formation of a database of linguo-logical-subject features 30 (BDLLPP 30), which is a database of linguistic, logical and subject features of text elements 61 of linguistic sentences 51, 52, 53 contained in linguistic constructions 41 of the third data structure 4. Preferably, without limitation, stage 1007 is characterized by: the execution of stage 10071 of the formation of the first part of the linguo-logical-subject features of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5, at which, for the linguistic analysis of text elements 61 contained in the fifth data structure 6 and classified as a word, identification data of such text elements 61 are provided and linguistic characteristics of such text elements 61 are obtained, as well as the values of the mentioned linguistic characteristics; by performing stage 10072 of forming the second part of the linguistic-logical-subject features of the text elements 61 of the linguistic sentences 51, 52, 53 of the fourth data structure 5, at which, for the logical analysis of the text elements 61 contained in the fifth data structure 6 and classified as a word, identification data of such text elements 61 are provided, as well as linguistic characteristics of such text elements 61 together with the mentioned values of the linguistic characteristics, and logical characteristics of such text elements 61 of each linguistic sentence 51, 52, 53 are obtained, as well as the values of the mentioned logical characteristics; by performing stage 10073 of forming the third part of the linguistic-logical-subject features of the text elements 61 of the linguistic sentences 51, 52, 53 of the fourth data structure 5, at which, for the subject analysis of the text elements 61 contained in the fifth data structure 6 and classified as a word, identification data of such text elements 61 are provided, as well as linguistic characteristics of such text elements 61 together with the mentioned values of linguistic characteristics, and logical characteristics of such text elements 61 are provided, as well as values of the mentioned logical characteristics, and characteristics of such text elements 61 in the subject area, which are subject characteristics, are obtained, as well as values of the mentioned subject characteristics; performing step 10074 of forming a database of linguistic-logical-subject features 20, at which a database of linguistic-logical-subject features 30 of text elements 61 of linguistic sentence 51, 52, 53 of the fourth data structure 5 is formed, wherein the linguistic-logical-subject features of text elements 61 of linguistic sentence 51, 52, 53 of the fourth data structure 5 are the said linguistic characteristics, said logical characteristics and said subject characteristics obtained for each text element 61 during steps 10071, 10072 and 10073, having respectively the said values of linguistic characteristics, the said values of logical characteristics and the said values of subject characteristics.
[70] На фиг. 16, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных лингво-логическо-предметных признаков 30 (БДЛЛПП 30), являющейся базой данных лингво-логическо-предметных признаков 30 текстовых элементов 61 лингвистического предложения 51 четвертой структуры данных 5. Предпочтительно, не ограничиваясь, практическим назначением БДЛЛПП 30 является формирование двух взаимосвязанных групп характеристик: лингво-логических и логически-предметных характеристик. Предпочтительно, не ограничиваясь, первая группа (лингво-логические характеристики) необходима для выделения из лингвистического предложения 51, 52, 53 логических конструкций (итоговых суждений, простых суждений, элементов простых суждений (понятий, признаков понятий, образов)) для преобразования лингвистического предложения в логические конструкции, представляющие собой в качестве примера, но не ограничения, простые суждения, итоговые суждения. Вторая группа (логически-предметные характеристики) необходима для формирования предметно-ориентированной структурированной информации путем корреляции логических объектов упомянутых логических конструкций с предметными объектами предметных конструкций - объектами и конструкциями, принятыми в конкретной предметной области и установленными в формализованной модели элементов конструкции предметной области. В качестве примера, но не ограничения, такой предметной областью может быть юридическая наука (право). В этом случае коррелируемой предметной конструкцией будет формализованная модель структурной части правовой нормы (гипотезы, диспозиции или санкции), а предметными объектами - элементы формализованной модели структурной части правовой нормы (элементы ФМСЧПН), которыми могут быть в качестве примера, но не ограничения, субъект правоотношений, объект правоотношений, содержание правоотношений, и тому подобное.[70] Fig. 16 shows, by way of example and not limitation, the general structure of the generated database of linguo-logical-subject features 30 (DLSF 30), which is a database of linguo-logical-subject features 30 of text elements 61 of linguistic sentence 51 of fourth data structure 5. Preferably, without being limited, the practical purpose of DLSF 30 is to generate two interconnected groups of characteristics: linguo-logical and logical-subject characteristics. Preferably, without being limited, the first group (linguo-logical characteristics) is necessary for extracting logical constructions (final judgments, simple judgments, elements of simple judgments (concepts, attributes of concepts, images)) from linguistic sentence 51, 52, 53 for transforming the linguistic sentence into logical constructions, which are, by way of example and not limitation, simple judgments, final judgments. The second group (logical-subject characteristics) is necessary for the formation of subject-oriented structured information by correlating the logical objects of the above-mentioned logical constructions with the subject objects of the subject constructions - objects and constructions adopted in a specific subject area and established in the formalized model of the elements of the subject area construction. As an example, but not limitation, such a subject area may be legal science (law). In this case, the correlated subject construction will be a formalized model of the structural part of the legal norm (hypotheses, dispositions or sanctions), and the subject objects will be the elements of the formalized model of the structural part of the legal norm (elements of the FSMSCHPN), which may be, as an example, but not limitation, the subject of legal relations, the object of legal relations, the content of legal relations, etc.
[71] Предпочтительно, не ограничиваясь, первая часть лингво-логическо-предметных признаков 613 текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 содержит лингвистические характеристики - морфологические, синтаксические и семантические характеристики. При этом, не ограничиваясь, совокупность значений всех лингвистических характеристик текстового элемента является для каждого текстового элемента 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 его отличительным (уникальным) лингвистическим признаком в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. Морфологические характеристики предпочтительно указывают на морфологические признаки текстовых элементов 61 лингвистического предложения 51 четвертой структуры данных, которые могут быть классифицированы, в качестве примера, но не ограничения, по уровню вложенности (род-вид-подвид). При этом морфологическими родами текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 предпочтительно являются слово, цифра, знаки препинания, иные знаки; морфологическими видами - часть речи (для слов), вид цифры (арабская, римская), вид знака препинания (точка, запятая и тому подобное), вид иного знака; морфологическими подвидами - род, число, падеж частей речи и тому подобное для слов, а также число, двоичный код, индекс и тому подобное для цифр. Синтаксические характеристики предпочтительно указывают на множество синтаксических признаков текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, среди которых можно выделить, в качестве примера, но не ограничения, следующие синтаксические признаки текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5: синтаксическая роль (сказуемое, подлежащее и тому подобное); синтаксический родитель (синтаксически главное слово); синтаксические потомки (синтаксически подчиненные слова); синтаксическая сочинительная связь (наличие иного текстового элемента, имеющего ту же синтаксическую роль и того же синтаксического родителя). Семантические характеристики предпочтительно указывают на семантические признаки текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, среди которых можно выделить, в качестве примера, но не ограничения, следующие семантические характеристики текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5: семантическая группа (группа слов, которые можно отнести к одному классу, роду, виду или подвиду предметов или действий окружающего мира при совпадении признаков упомянутых классов, родов, видов или подвидов), семантический статус (смысловое значение слова или группы слов в рамках словосочетания, которым называется некий мыслимый образ (предмет или действие) - например, но не ограничиваясь, мыслимый образ «отсутствие продавца в месте нахождения потребителя» состоит из двух элементов верхнего уровня (терминов): первого - «отсутствие продавца», и второго - «месте нахождения потребителя», у которых имеются следующие семантические статусы: у первого - главный (определяет смысл термина), у второго - дополнительный (уточняет определенный ранее смысл главного термина)).[71] Preferably, without being limited to, the first part of the linguo-logical-subject features 613 of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 contains linguistic characteristics - morphological, syntactic and semantic characteristics. In this case, without being limited to, the set of values of all linguistic characteristics of the text element is for each text element 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 its distinctive (unique) linguistic feature in the linguistic sentence 51, 52, 53 of the fourth data structure 5. The morphological characteristics preferably indicate the morphological features of the text elements 61 of the linguistic sentence 51 of the fourth data structure, which can be classified, as an example, but not limitation, by nesting level (genus-species-subspecies). In this case, the morphological genera of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 are preferably a word, a digit, punctuation marks, and other marks; the morphological types are a part of speech (for words), a type of digit (Arabic, Roman), a type of punctuation mark (period, comma, etc.), a type of other mark; the morphological subtypes are gender, number, case of parts of speech, etc. for words, as well as a number, binary code, index, etc. for digits. The syntactic characteristics preferably indicate a set of syntactic features of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, among which the following syntactic features of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 can be distinguished, by way of example, but not limitation: syntactic role (predicate, subject, etc.); syntactic parent (syntactically main word); syntactic descendants (syntactically subordinate words); syntactic coordinative relation (the presence of another text element that has the same syntactic role and the same syntactic parent). Semantic characteristics preferably indicate the semantic features of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, among which the following semantic characteristics of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 can be distinguished, by way of example, but not limitation: semantic group (a group of words that can be attributed to the same class, genus, species or subspecies of objects or actions of the surrounding world when the features of the mentioned classes, genera, species or subspecies coincide), semantic status (the semantic meaning of a word or group of words within a phrase that calls a certain imaginary image (object or action) - for example, but not limited to, the imaginary image "absence of a salesperson at the location of the consumer" consists of two top-level elements (terms): the first - "absence of a salesperson", and the second - "location of the consumer", which have the following semantic statuses: the first - the main (defines the meaning of the term), the second one has an additional meaning (clarifies the previously defined meaning of the main term)).
[72] Предпочтительно, не ограничиваясь, вторая часть лингво-логическо-предметных характеристик 614 текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 содержит логические характеристики. При этом совокупность значений всех логических характеристик текстового элемента является для каждого текстового элемента 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 его отличительным (уникальным) логическим признаком в лингвистическом предложении 51, 52, 53 четвертой структуры данных. Логические характеристики предпочтительно указывают на логические признаки текстовых элементов текстовых элементов лингвистического предложения 51, 52, 53 четвертой структуры данных 5, среди которых можно выделить, в качестве примера, но не ограничения, следующие логические характеристики текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5: логические роли каждого слова, являющегося текстовым элементом 61 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. Под логической ролью слова понимается логическая позиция слова в логических сущностях (логических объектах) предложения, среди которых можно выделить, в качестве примера, но не ограничения, следующие логические сущности (логические объекты): понятие, признак понятия, термин (часть образа), образ (элемент простого суждения), простое суждение, сложное суждение. Выявление логической роли слова в самых простых логических объектах (понятие и признак понятия) не зависит от вида логической конструкции суждения, и представляет собой метку (индекс), который указывает на то, чем является данное слово в указанных простых логических объектах. Например, слово «закон» всегда есть логический объект «понятие», а слово «федеральный» есть логический объект «признак понятия». Выявление логической роли слова в более сложных (составных) логических объектах (например, термин и образ) зависит от формализованной модели логической конструкции суждения (ФМЛКС), в привязке к элементам которой (к логическим объектам формализованной модели логической конструкции суждения) и будет установлена логическая роль слова.[72] Preferably, without limitation, the second part of the linguistic-logical-subject characteristics 614 of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 contains logical characteristics. In this case, the set of values of all logical characteristics of the text element is for each text element 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 its distinctive (unique) logical feature in the linguistic sentence 51, 52, 53 of the fourth data structure. The logical characteristics preferably indicate the logical attributes of the text elements of the text elements of the linguistic sentence 51, 52, 53 of the fourth data structure 5, among which the following logical characteristics of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 can be distinguished, by way of example but not limitation: the logical roles of each word, which is a text element 61 in the linguistic sentence 51, 52, 53 of the fourth data structure 5. The logical role of a word is understood to be the logical position of the word in the logical entities (logical objects) of the sentence, among which the following logical entities (logical objects) can be distinguished, by way of example but not limitation: concept, attribute of a concept, term (part of an image), image (element of a simple judgment), simple judgment, complex judgment. Identification of the logical role of a word in the simplest logical objects (concept and concept attribute) does not depend on the type of logical construction of judgment, and is a label (index) that indicates what the given word is in the specified simple logical objects. For example, the word "law" is always the logical object "concept", and the word "federal" is the logical object "concept attribute". Identification of the logical role of a word in more complex (composite) logical objects (for example, a term and an image) depends on the formalized model of the logical construction of judgment (FMLCS), in connection with the elements of which (to the logical objects of the formalized model of the logical construction of judgment) the logical role of the word will be established.
[73] Предпочтительно, не ограничиваясь, необходимым условием для формирования лингво-логических признаков является наличие в лингвистическом и логическом массивах данных коррелируемых объектов (объектов, допустимых для сравнения). Вопрос о допустимости сравнения текстового элемента 61 предложения 51, 52, 53 с логическими объектами можно решить на основании анализа сопоставимости логических объектов ФМЛКС с текстовыми элементами 61 предложения 51, 52, 53. Такой анализ показывает, что если текстовые элементы могут являться такими логическими объектами как «признак понятия» (например, слово «установленный»), то отдельные текстовые элементы предложения никак не соотносятся с логическими объектами, такими как «понятие», выраженными через группу первичных текстовых элементов 61 (например, «нарушение прав потребителей»). А поскольку, элементом (логическим объектом) ФМЛКС может быть не только понятие с признаком (например, «установленное нарушение прав потребителей» - группа из четырех первичных текстовых элементов), но и значительно большая конструкция из синтаксически связанных слов (например, логический объект «субъект» может иметь следующий лингвистический вид: «обязанности исполнять в пределах своих полномочий решения судьи о проведении оперативно-розыскных мероприятий»), то можно сделать вывод о недопустимости сравнения текстовых элементов предложения с логическими объектами. Предпочтительно, не ограничиваясь, лингвистическим объектом предложения, который может быть сопоставим с логическим объектом ФМЛКС, может быть синтаксическая единица (СЕ). Синтаксическая единица - это словоформа или словосочетание (синтаксически связанная группа слов). Гибкий формат синтаксической единицы позволяет ей соответствовать любым логическим объектам, составляющим ФМЛКС. Таким образом, выявляемые актуальные лингво-логические характеристики с практической точки зрения важны не столько для описания отдельных текстовых элементов 61, сколько для актуальных синтаксических единиц (актуальных СЕ), которые состоят из одного или нескольких текстовых элементов 61 предложения 51, 52, 53. Актуальные СЕ - это актуальный перечень синтаксических единиц, коррелируемых с актуальными логическими объектами актуальной ФМЛКС. Актуальные СЕ и актуальная ФМЛКС устанавливаются предварительно и записываются в первую пользовательскую базу данных (первую ПБД), являющуюся таким образом базой данных актуальных синтаксических единиц (актуальных СЕ), актуальных логических объектов (актуальных ЛогО) и актуальной ФМЛКС, включая таблицу корреляции актуальных СЕ и актуальных ЛогО.[73] Preferably, without limitation, a necessary condition for the formation of linguo-logical features is the presence of correlated objects (objects acceptable for comparison) in the linguistic and logical data arrays. The question of the admissibility of comparing the text element 61 of sentence 51, 52, 53 with logical objects can be resolved based on an analysis of the comparability of the logical objects of the FMLKS with the text elements 61 of sentence 51, 52, 53. Such an analysis shows that while text elements can be such logical objects as a “concept feature” (e.g., the word “established”), individual text elements of a sentence are in no way related to logical objects such as a “concept” expressed through a group of primary text elements 61 (e.g., “violation of consumer rights”). And since an element (logical object) of the FMLKS may be not only a concept with a feature (for example, "established violation of consumer rights" - a group of four primary text elements), but also a significantly larger construction of syntactically related words (for example, the logical object "subject" may have the following linguistic form: "obligations to execute, within the limits of their authority, decisions of a judge to conduct operational-search activities"), then we can conclude that it is inadmissible to compare text elements of a sentence with logical objects. Preferably, without being limited to, a linguistic object of a sentence that can be comparable with a logical object of the FMLKS may be a syntactic unit (SU). A syntactic unit is a word form or a phrase (a syntactically related group of words). The flexible format of a syntactic unit allows it to correspond to any logical objects that make up the FMLKS. Thus, the revealed actual linguistic and logical characteristics are important from a practical point of view not so much for the description of individual text elements 61, as for actual syntactic units (actual SU), which consist of one or several text elements 61 sentences 51, 52, 53. Actual SU is an actual list of syntactic units correlated with actual logical objects of the actual FMLKS. Actual SU and the actual FMLKS are installed in advance and recorded in the first user database (the first PDB), which is thus a database of actual syntactic units (actual SU), actual logical objects (actual LogO) and the actual FMLKS, including a table of correlation of actual SU and actual LogO.
[74] Предпочтительно, не ограничиваясь, третья часть лингво-логическо-предметных характеристик 615 текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 содержит предметные характеристики. При этом совокупность значений всех предметных характеристик текстового элемента является для каждого текстового элемента 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 его отличительным (уникальным) предметным признаком в лингвистическом предложении 51, 52, 53. Предметные характеристики предпочтительно указывают на предметные признаки текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, среди которых можно выделить, в качестве примера, но не ограничения, следующие предметные характеристики текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, в качестве примера, но не ограничения, в предметной области права: правовые роли каждого слова, являющегося текстовым элементом 61 (коррелированной с отдельной актуальной СЕ или частью актуальной СЕ), в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. Под правовой ролью слова понимается правовая позиция слова в правовых сущностях (правовых объектах) предложения, среди которых можно выделить, в качестве примера, но не ограничения, следующие правовые сущности (правовые объекты): правовое понятие, признак правового понятия, правовой термин, субъект правоотношений, объект правоотношений, элемент содержания правоотношений, гипотеза, диспозиция, санкция (структурная часть правовой нормы), правовая норма. Выявление правовой роли слова в самых простых правовых объектах (правовое понятие и признак правового понятия) не зависит от вида правовой конструкции, и представляет собой метку (индекс), который указывает на то, чем является данное слово в указанных простых правовых объектах. Например, слово «закон» всегда есть правовой объект «объект правоотношений», а слово «федеральный» есть признак правового объект «признак объекта правоотношений». Выявление правовой роли слова в более сложных (составных) правовых объектах (например, в гипотезе, диспозиции или санкции) зависит от формализованной модели структурной части правовой нормы, в привязке к элементам которой (к правовым объектам формализованной модели логической конструкции суждения) и будет установлена правовая роль слова.[74] Preferably, without limitation, the third part of the linguistic-logical-subject characteristics 615 of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 contains subject characteristics. In this case, the set of values of all subject characteristics of a text element is, for each text element 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, its distinctive (unique) subject feature in the linguistic sentence 51, 52, 53. The subject characteristics preferably indicate the subject features of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, among which the following subject characteristics of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 can be distinguished, as an example, but not a limitation, in the subject area of law: the legal roles of each word, which is a text element 61 (correlated with a separate relevant CE or part of a relevant CE), in the linguistic sentence 51, 52, 53 of the fourth data structure 5. The legal role of a word is understood to be the legal position of a word in legal entities (legal objects) of the sentence, among which the following legal entities (legal objects) can be distinguished, by way of example but not limitation: legal concept, attribute of a legal concept, legal term, subject of legal relations, object of legal relations, element of the content of legal relations, hypothesis, disposition, sanction (structural part of a legal norm), legal norm. Identification of the legal role of a word in the simplest legal objects (legal concept and attribute of a legal concept) does not depend on the type of legal construction, and is a label (index) that indicates what a given word is in the specified simple legal objects. For example, the word "law" is always a legal object "object of legal relations", and the word "federal" is an attribute of a legal object "attribute of an object of legal relations". The identification of the legal role of a word in more complex (composite) legal objects (for example, in a hypothesis, disposition or sanction) depends on the formalized model of the structural part of a legal norm, in connection with the elements of which (to the legal objects of the formalized model of the logical construction of a judgment) the legal role of a word will be established.
[75] Предпочтительно, не ограничиваясь, необходимым условием для формирования логико-предметных признаков является наличие в логическом и предметном массивах данных коррелируемых объектов (объектов, допустимых для сравнения). Если в качестве примера, но не ограничения, под предметной областью иметь в виду предметную область права, то тогда вопрос о допустимости сравнения сравниваемых объектов можно рассмотреть не умозрительно, а практически. Практический вопрос о возможности сравнения логических объектов предложения с правовыми объектами можно решить на основании результатов научных исследований в данной предметной области. Из открытых источников достоверно известно, что правоведы обоснованно полагают, что с точки зрения логики любая правовая норма представляет собой суждение. А юридическая и логическая конструкции правовой нормы получают свое отражение в специфической форме языковой конструкции, в которой лингвистика играет роль юридико-технического инструмента. В тексте нормативного акта любое суждение выражается в форме повествовательного предложения. При этом, не ограничиваясь, логическая структура суждения соответствует грамматической структуре сложноподчиненного предложения. По своему смыслу грамматическая структура предложения совпадает с юридической структурой нормы права. В настоящее время теория нормы права в полной мере позволяет считать любую правовую норму суждением и подтверждает факт наличия взаимосвязей и единства нормы права как единства юридической, логической и грамматической конструкций. Таким образом, взаимосвязи юридической и логической конструкций являются основанием для наличия взаимосвязей (корреляции) элементов юридической и логической конструкций. Иными словами, логические объекты логических конструкций и правовые объекты юридических конструкций являются объектами, допустимыми для сравнения. При этом результатом такого сравнения является корреляция (соотнесение) конкретных правовых объектов с конкретными логическими объектами. Такая корреляция становится практически возможной при наличии формализованных моделей (правовой и логической), содержащей коррелируемые объекты. Приоритетной формализованной моделью является правовая (предметная) формализованная модель (формализованной модели структурной части правовой нормы), поскольку количество и вид объектов (элементов) правовой (предметной) формализованной модели задает уровень детализации и глубину структурирования логической формализованной модели (формализованной модели логической конструкции суждения). Актуальная формализованная модель базовой конструкции предметной области (ФМБКПО) устанавливается предварительно и записывается во вторую пользовательскую базу данных (вторую ПБД), являющуюся таким образом базой данных актуальных базовых предметных объектов (актуальных БПО) и ФМБКПО, включая таблицу корреляции актуальных БПО и актуальных логических объектов (актуальных ЛогО).[75] Preferably, but not limited to, a necessary condition for the formation of logical-subject features is the presence of correlated objects (objects admissible for comparison) in the logical and subject arrays of data. If, as an example, but not a limitation, we mean the subject area of law by subject area, then the question of the admissibility of comparing the compared objects can be considered not speculatively, but practically. The practical question of the possibility of comparing logical objects of a sentence with legal objects can be resolved based on the results of scientific research in this subject area. It is reliably known from open sources that legal scholars reasonably believe that, from the point of view of logic, any legal norm is a judgment. And the legal and logical constructions of a legal norm are reflected in a specific form of a language construction, in which linguistics plays the role of a legal-technical tool. In the text of a normative act, any judgment is expressed in the form of a narrative sentence. In this case, without limitation, the logical structure of a judgment corresponds to the grammatical structure of a complex sentence. In its meaning, the grammatical structure of a sentence coincides with the legal structure of a legal norm. At present, the theory of a legal norm fully allows us to consider any legal norm as a judgment and confirms the fact of the existence of interrelations and unity of a legal norm as a unity of legal, logical and grammatical constructions. Thus, the interrelations of legal and logical constructions are the basis for the existence of interrelations (correlations) of elements of legal and logical constructions. In other words, logical objects of logical constructions and legal objects of legal constructions are objects admissible for comparison. In this case, the result of such a comparison is the correlation (correlation) of specific legal objects with specific logical objects. Such a correlation becomes practically possible in the presence of formalized models (legal and logical) containing correlated objects. The priority formalized model is the legal (subject) formalized model (formalized model of the structural part of the legal norm), since the number and type of objects (elements) of the legal (subject) formalized model determine the level of detail and depth of structuring of the logical formalized model (formalized model of the logical construction of judgment). The current formalized model of the basic construction of the subject area (FMBKPO) is installed in advance and recorded in the second user database (second PDB), which is thus a database of current basic subject objects (current BPO) and FMBKPO, including a correlation table of current BPO and current logical objects (current LogO).
[76] Предпочтительно, не ограничиваясь, формирование первой части лингво-логическо-предметных характеристик - лингвистических характеристик 613 и их значений 6131 - для текстовых элементов 61 каждого лингвистического предложения 51, 52, 53 четвертой структуры данных 5 предпочтительно производят на этапе 10071 путем первого комплексного анализа каждого текстового элемента 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, представляющего собой анализ упомянутых текстовых элементов 61, в качестве примера, но не ограничения например, анализ на основе местонахождения текстового элемента в структуре предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в предложении, а также информации из первой ПБД об актуальных СЕ. По результатам первого комплексного анализа предпочтительно производится формирование лингвистических характеристик 613 и их внесение на этапе 10074 в БДЛЛПП 30 в виде перечня лингвистических характеристик 613 со значениями этих характеристик 6131. Например, но не ограничиваясь, одной из лингвистических характеристик 613 может быть «синтаксическая роль» текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, со значением данной лингвистической характеристики, например «подлежащее», а также может быть «синтаксическая роль» актуальной СЕ, состоящей как из одного текстового элемента 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, так и из группы упомянутых текстовых элементов 61, со значением данной лингвистической характеристики, например, «обстоятельство места». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[76] Preferably, without limitation, the formation of the first part of the linguo-logical-subject characteristics - linguistic characteristics 613 and their values 6131 - for the text elements 61 of each linguistic sentence 51, 52, 53 of the fourth data structure 5 is preferably carried out at step 10071 by means of a first comprehensive analysis of each text element 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, which is an analysis of the mentioned text elements 61, for example, as an example, but not limitation, an analysis based on the location of the text element in the structure of the sentence, its meaning, type, classification of its conceivable image and analysis of its connections with other text elements in the sentence, as well as information from the first PBD on the current CE. Based on the results of the first comprehensive analysis, linguistic characteristics 613 are preferably formed and entered at step 10074 into the BDLLPP 30 in the form of a list of linguistic characteristics 613 with the values of these characteristics 6131. For example, but not limited to, one of the linguistic characteristics 613 may be the "syntactic role" of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, with the value of this linguistic characteristic, for example, "subject", and may also be the "syntactic role" of the current CE, consisting of both one text element 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, and of a group of the mentioned text elements 61, with the value of this linguistic characteristic, for example, "adverbial modifier of place". Such an analysis may be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, but not limited to, such a complex analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are enough examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by applying neural network (AI systems) training technology.
[77] Предпочтительно, не ограничиваясь, формирование второй части лингво-логическо-предметных характеристик - логических характеристик 614 и их значений 6141 - для текстовых элементов 61 каждого лингвистического предложения 51, 52, 53 четвертой структуры данных 5 предпочтительно производят на этапе 10072 путем второго комплексного анализа каждого текстового элемента 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, а также каждой актуальной СЕ, представляющего в качестве примера, но не ограничения анализ упомянутых текстовых элементов 61 (либо нескольких упомянутых текстовых элементов 61, составляющих актуальную СЕ) на основе местонахождения упомянутого текстового элемента 61 (группы упомянутых текстовых элементов 61) в структуре предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в предложении, а также анализа выявленных лингвистических характеристик 613 и их значений 6131, а также информации из первой ПБД об актуальных СЕ, коррелируемых с актуальными ЛогО, установленными в ФМЛКС. Не ограничиваясь, по результатам второго комплексного анализа предпочтительно производится формирование логических характеристик 614 текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 и их внесение на этапе 10074 в БДЛЛПП 30 в виде перечня логических характеристик 614 со значениями этих характеристик 6141. Например, но не ограничиваясь, одной из логических характеристик 614 упомянутого текстового элемента 61 может быть «логическая роль» упомянутого текстового элемента 61 со значением данной логической характеристики «признак понятия», либо одной из логических характеристик 614 группы упомянутых текстовых элементов 61 (актуальной СЕ) может быть «логическая роль» группы упомянутых текстовых элементов 61 (актуальной СЕ), со значением данной логической характеристики - «субъект суждения». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[77] Preferably, without being limited to, the formation of the second part of the linguistic-logical-subject characteristics - logical characteristics 614 and their values 6141 - for the text elements 61 of each linguistic sentence 51, 52, 53 of the fourth data structure 5 is preferably carried out at step 10072 by means of a second complex analysis of each text element 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, as well as each current CE, representing as an example, but not limitation, an analysis of the said text elements 61 (or several of the said text elements 61 that make up the current CE) based on the location of the said text element 61 (group of the said text elements 61) in the sentence structure, its meaning, type, classification of its conceivable image and analysis of its connections with other text elements in the sentence, as well as an analysis of the identified linguistic characteristics 613 and their values 6131, as well as information from the first PBD on current CE, correlated with current Logos established in the FMLKS. Without being limited, based on the results of the second complex analysis, logical characteristics 614 of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 are preferably formed and entered at step 10074 into the BDLLPP 30 in the form of a list of logical characteristics 614 with the values of these characteristics 6141. For example, but without being limited, one of the logical characteristics 614 of the said text element 61 may be the "logical role" of the said text element 61 with the value of this logical characteristic of "concept feature", or one of the logical characteristics 614 of the group of the said text elements 61 (actual CE) may be the "logical role" of the group of the said text elements 61 (actual CE), with the value of this logical characteristic of "subject of judgment". Such an analysis may be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, but not limited to, such a complex analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are enough examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by applying neural network (AI systems) training technology.
[78] Предпочтительно, не ограничиваясь, формирование третьей части лингво-логическо-предметных характеристик - предметных характеристик 615 и их значений 6151 - для текстовых элементов 61 каждого лингвистического предложения 51, 52, 53 четвертой структуры данных 5 предпочтительно производят на этапе 10073 путем третьего комплексного анализа каждого текстового элемента 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, а также каждого актуального ЛогО, анализ представляет собой, в качестве примера, но не ограничения, анализ упомянутых текстовых элементов 61 (либо нескольких упомянутых текстовых элементов 61), составляющих актуальный ЛогО на основе логических характеристик 614 и их значений 6141, его связей с другими логическими объектами в предложении, а также информации из первой ПБД об актуальных ЛогО, коррелируемых с предметными объектами, установленными в ФМБКПО, включая таблицу корреляции актуальных БПО и актуальных ЛогО. Предпочтительно, не ограничиваясь, по результатам третьего комплексного анализа предпочтительно производится формирование предметных характеристик 615 текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 и их внесение на этапе 10074 в БДЛЛПП 30 в виде перечня предметных характеристик 615 со значениями этих характеристик 6151. Например, но не ограничиваясь, одной из предметных характеристик 615 упомянутого текстового элемента 61 в предметной области права (юриспруденции) может быть «правовая роль» упомянутого текстового элемента 61 со значением данной предметной характеристики 6151 «субъект правоотношений». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[78] Preferably, without limitation, the formation of the third part of the linguistic-logical-subject characteristics - subject characteristics 615 and their values 6151 - for the text elements 61 of each linguistic sentence 51, 52, 53 of the fourth data structure 5 is preferably carried out at step 10073 by means of a third comprehensive analysis of each text element 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, as well as each current LogO, the analysis being, as an example, but not limitation, an analysis of the mentioned text elements 61 (or several mentioned text elements 61) that make up the current LogO based on the logical characteristics 614 and their values 6141, its connections with other logical objects in the sentence, as well as information from the first PBD on the current LogOs correlated with the subject objects established in the FMBKPO, including a correlation table of the current BPOs and the current LogOs. Preferably, without being limited to, based on the results of the third complex analysis, the subject characteristics 615 of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 are preferably formed and entered at step 10074 into the BDLLPP 30 in the form of a list of subject characteristics 615 with the values of these characteristics 6151. For example, but without being limited to, one of the subject characteristics 615 of the said text element 61 in the subject area of law (jurisprudence) may be the "legal role" of the said text element 61 with the value of this subject characteristic 6151 "subject of legal relations". Such an analysis may be performed by any method known from the prior art and, accordingly, is not described in detail below. For example, but not limited to, such a complex analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are enough examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by applying neural network (AI systems) training technology.
[79] Предпочтительно, не ограничиваясь, на основании выявленных первой части лингво-логическо-предметных характеристик 613 текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5 и их значений 6131, второй части лингво-логическо-предметных характеристик 614 текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5 и их значений 6141, а также третьей части лингво-логическо-предметных характеристик 614 текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5 и их значений 6141 в итоге формируют базу данных лингво-логическо-предметных признаков 20, являющуюся БДЛЛПП 30 текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5. При этом первая часть лингво-логическо-предметных характеристик 613 текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5 и их значения 6131 формируют уникальные лингвистические признаки текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5, вторая часть лингво-логическо-предметных характеристик 614 текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5 и их значения 6141 формируют уникальные логические признаки текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5, а третья часть лингво-логических характеристик 615 текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5 и их значения 6151 формируют уникальные предметные признаки текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5.[79] Preferably, without limitation, based on the identified first part of the linguo-logical-subject characteristics 613 of the text elements 61 of the linguistic sentences 51, 52, 53 of the fourth data structure 5 and their values 6131, the second part of the linguo-logical-subject characteristics 614 of the text elements 61 of the linguistic sentences 51, 52, 53 of the fourth data structure 5 and their values 6141, as well as the third part of the linguo-logical-subject characteristics 614 of the text elements 61 of the linguistic sentences 51, 52, 53 of the fourth data structure 5 and their values 6141, a database of linguo-logical-subject features 20 is ultimately formed, which is a DBLLPP 30 of the text elements 61 of the linguistic sentences 51, 52, 53 of the fourth data structure 5. When in this case, the first part of the linguo-logical-subject characteristics 613 of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5 and their values 6131 form unique linguistic features of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5, the second part of the linguo-logical-subject characteristics 614 of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5 and their values 6141 form unique logical features of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5, and the third part of the linguo-logical characteristics 615 of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5 and their values 6151 form unique subject features of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5.
[80] На фиг. 17, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1008 формирования шестой структуры данных 7. Предпочтительно, не ограничиваясь, этап 1008 характеризуется: выполнением этапа 1081, формирования элементов 71 шестой структуры данных 7, на котором на основании сведений, содержащихся в базе данных лингво-логическо-предметных признаков 20, пятой структуре данных 6, а также на основании данных из первой пользовательской базы данных, содержащей данные об актуальных синтаксических единицах и актуальных логических объектах, а также об актуальной формализованной модели логической конструкции суждения, идентифицируют и формируют элементы 71 шестой структуры данных 7, являющиеся компонентами простого суждения 71 соответствующих лингвистических предложений 51, 52, 53 четвертой структуры данных 5, а также идентификационные данные упомянутых компонентов простого суждения 71, представляющие собой для каждого упомянутого компонента простого суждения 71 вид 71.1, 71.х такого соответствующего компонента простого суждения 71, значение 711 такого соответствующего компонента простого суждения 71 и порядковый номер 712 такого соответствующего компонента простого суждения 71 в соответствующем лингвистическом предложении 51, 52, 53 четвертой структуры данных 5; выполнением этапа 10082 формирования шестой структуры данных 7, на котором формируют шестую структуру данных 7 из упомянутых компонентов простого суждения 71 и их идентификационных данных. Причем компонентами простых суждений 71 являются компоненты соответствующих простых суждений, причем простые суждения являются простыми суждениями соответствующих лингвистических предложений 51, 52, 53 четвертой структуры данных 5.[80] In Fig. 17, as an example, but not limitation, a general diagram of the execution of the stages of stage 1008 of the formation of the sixth data structure 7 is shown. Preferably, without limitation, stage 1008 is characterized by: the execution of stage 1081, the formation of elements 71 of the sixth data structure 7, in which, based on the information contained in the database of linguistic-logical-subject features 20, the fifth data structure 6, as well as based on data from the first user database containing data on current syntactic units and current logical objects, as well as on the current formalized model of the logical construction of the judgment, elements 71 of the sixth data structure 7 are identified and formed, which are components of the simple judgment 71 of the corresponding linguistic sentences 51, 52, 53 of the fourth data structure 5, as well as identification data of the said components of the simple judgment 71, representing for each said component of the simple judgment 71 the type 71.1, 71.x of such corresponding component of the simple judgment 71, the value 711 of such corresponding component of the simple judgment 71 and the ordinal number 712 of such corresponding component of the simple judgment 71 in the corresponding linguistic sentence 51, 52, 53 of the fourth data structure 5; by performing the step 10082 of forming the sixth data structure 7, at which the sixth data structure 7 is formed from the mentioned components of the simple judgment 71 and their identification data. Moreover, the components of the simple judgments 71 are the components of the corresponding simple judgments, and the simple judgments are the simple judgments of the corresponding linguistic sentences 51, 52, 53 of the fourth data structure 5.
[81] На фиг. 18, в качестве примера, но не ограничения, изображена общая структура сформированной шестой структуры данных 7. Предпочтительно, не ограничиваясь, шестая структура данных 7 (шестая СД 7) содержит элементы 71 шестой структуры данных, представляющие собой компоненты простого суждения 71 каждого простого суждения каждого лингвистического предложения 51, 52, 53 четвертой структуры данных 5 и идентификационные данные упомянутых компонентов простого суждения 71, представляющие собой, по меньшей мере, вид 71.1, 71.Х упомянутых компонентов простого суждения 71, значения 711 упомянутых компонентов простого суждения 71, порядковые номера 712 упомянутых компонентов простого суждения 71 соответствующего лингвистического предложения 51, 52, 53 четвертой структуры данных 5, составляющих такие компоненты простого суждения 71 лингвистического предложения 51, 52, 53 четвертой структуры данных 5. Предпочтительно, не ограничиваясь, компоненты простого суждения 71 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 представляют собой элементы простого суждения. Предпочтительно, согласно теории логики, простые суждения, представляют собой набор структурных элементов простого суждения, с помощью которых утверждается или опровергается нечто о предмете суждения. При этом, предпочтительно, основными структурными элементами простого суждения являются субъект и предикат. Предпочтительно, согласно теории логики, субъектом простого суждения признается понятие, выражающее предмет суждения, то есть это то, о чем говорится в данном простом суждении. Предпочтительно, предикатом простого суждения, согласно теории логики, признается то, что утверждается или отрицается о предмете суждения (о субъекте простого суждения). Например, не ограничиваясь, простое предложение «Уполномоченный продавец обязан передать покупателю товар после его оплаты» содержит структурный элемент простого суждения «субъект», имеющий значение «уполномоченный продавец», а также структурный элемент простого суждения «предикат», имеющий значение «обязан передать покупателю товар после его оплаты». При этом, предпочтительно, структурные элементы простых суждений состоят из понятий, которые могут иметь признаки понятий. Например, не ограничиваясь, элемент простого суждения «субъект», имеющий значение «уполномоченный продавец» состоит из понятия «продавец» и признака этого понятия «уполномоченный». Предпочтительно, не ограничиваясь, для практических целей, связанных с настоящим преобразованием структурированного массива данных, являющегося оцифрованным документом 1, выделение в лингвистических предложениях 51, 52, 53 простых суждений, у которых имеется всего два структурных элемента («субъект» и «предикат») не представляет интереса, поскольку основной задачей логической формализации лингвистических предложений 51, 52, 53 четвертой структуры данных 5 является формирование таких формализованных объектов - компонентов простого суждения 71 - которые сами по себе (исходя прежде всего из вида компонента простого суждения 71) поясняют логическую роль таких формализованных объектов (понятия, понятия с признаком, либо группа понятий и признаков понятий, представляющих собой логический образ элемента простого суждения) и их смысловую функцию в простом суждении, исходя из практических задач, которые необходимо решить путем формализации объектов с актуальными смысловыми функциями. Например, не ограничиваясь, в предметной области права необходимо формализовать правовые нормы, содержащиеся в предложениях нормативных актов. Для этого, предпочтительно, не ограничиваясь, специалисты предметной области права создают формализованную модель структурной части правовой нормы (ФМСЧПН), представляющую собой формализованную модель гипотезы, диспозиции или санкции правовой нормы. В такой ФМСЧПН содержатся элементы, которые обладают уникальными смысловыми функциями предметной области права, например, не ограничиваясь, следующие элементы ФМСЧПН: юридические правила и юридические факты (события и обстоятельства, влияющие на практические применение юридического правила). При этом, предпочтительно, юридическое правило состоит из субэлементов (вложенных элементов), представляющих собой субъект правоотношений, объект правоотношений и содержание правоотношений. Причем, предпочтительно, субэлемент содержание правоотношений состоит также из субэлементов (вложенных элементов), а именно - из способа регулирования, влияющих объектов и дефиниенса (определяющего выражения, раскрывающего смысл определяемого понятия или термина либо устанавливающего значение понятия или термина, что означает на практике иное наименование субъекта или объекта правоотношений, либо определение субъекта или объекта правоотношений). Таким образом, предпочтительно, исходя из практической задачи и сформированной для ее решения упомянутой формализованной модели, определяются количество и виды элементов упомянутой формализованной модели (элементов, не содержащих субэлементы и субэлементов). При этом, предпочтительно, каждый элемент такой формализованной модели обладает уникальными смысловыми функциями предметной области, представляя собой актуальные элементы такой формализованной модели. Предпочтительно, такая актуальная формализованная модель является ориентиром для формирования актуальной формализованной модели простого суждения (формализованной модели логической конструкции суждения), и в таком простом суждении структурный элемент «предикат» должен быть разделен на такое число субэлементов, которое, как минимум, равно количеству актуальных элементов формализованной модели предметной области минус один - поскольку среди актуальных элементов формализованной модели предметной области обязательно присутствует один актуальный элемент, который соответствует (коррелирует к) структурному элементу «субъект». При этом, предпочтительно, такая актуальная формализованная модель простого суждения (формализованная модель логической конструкции суждения) содержит актуальные элементы простого суждения с актуальными смысловыми функциями.[81] In Fig. 18, as an example, but not limitation, the general structure of the generated sixth data structure 7 is shown. Preferably, without limitation, the sixth data structure 7 (sixth SD 7) contains elements 71 of the sixth data structure, which are components of a simple judgment 71 of each simple judgment of each linguistic sentence 51, 52, 53 of the fourth data structure 5 and identification data of said components of a simple judgment 71, which are at least the type 71.1, 71.X of said components of a simple judgment 71, values 711 of said components of a simple judgment 71, ordinal numbers 712 of said components of a simple judgment 71 of the corresponding linguistic sentence 51, 52, 53 of the fourth data structure 5, constituting such components of a simple judgment 71 of the linguistic sentence 51, 52, 53 of the fourth data structures 5. Preferably, without being limited to, the components of the simple judgment 71 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 are elements of a simple judgment. Preferably, according to the theory of logic, simple judgments are a set of structural elements of a simple judgment, with the help of which something is asserted or refuted about the subject of the judgment. In this case, preferably, the main structural elements of a simple judgment are the subject and the predicate. Preferably, according to the theory of logic, the subject of a simple judgment is recognized as a concept expressing the subject of the judgment, i.e. this is what is discussed in this simple judgment. Preferably, the predicate of a simple judgment, according to the theory of logic, is recognized as what is asserted or denied about the subject of the judgment (about the subject of the simple judgment). For example, without limitation, the simple sentence "The authorized seller is obliged to transfer the goods to the buyer after payment" contains the structural element of the simple judgment "subject", which has the meaning "authorized seller", as well as the structural element of the simple judgment "predicate", which has the meaning "is obliged to transfer the goods to the buyer after payment". In this case, structural elements of simple judgments preferably consist of concepts that can have the attributes of concepts. For example, without limitation, the element of the simple judgment "subject", which has the meaning "authorized seller" consists of the concept "seller" and the attribute of this concept "authorized". Preferably, without limitation, for practical purposes related to the present transformation of a structured data array, which is a digitized document 1, the selection in linguistic sentences 51, 52, 53 of simple judgments that have only two structural elements ("subject" and "predicate") is of no interest, since the main task of the logical formalization of linguistic sentences 51, 52, 53 of the fourth data structure 5 is the formation of such formalized objects - components of a simple judgment 71 - which in themselves (based primarily on the type of the component of a simple judgment 71) explain the logical role of such formalized objects (concepts, concepts with a feature, or a group of concepts and features of concepts representing a logical image of an element of a simple judgment) and their semantic function in a simple judgment, based on the practical problems that must be solved by formalizing objects with relevant semantic functions. For example, but not limited to, in the subject area of law it is necessary to formalize legal norms contained in the proposals of normative acts. For this purpose, preferably, but not limited to, specialists in the subject area of law create a formalized model of the structural part of the legal norm (FMSCHPN), which is a formalized model of the hypothesis, disposition or sanction of the legal norm. Such FMSCHPN contains elements that have unique semantic functions of the subject area of law, for example, but not limited to, the following elements of FMSCHPN: legal rules and legal facts (events and circumstances influencing the practical application of a legal rule). In this case, preferably, a legal rule consists of subelements (nested elements), which represent the subject of legal relations, the object of legal relations and the content of legal relations. Moreover, preferably, the sub-element content of legal relations also consists of sub-elements (nested elements), namely, the method of regulation, influencing objects and definition (defining expression, revealing the meaning of the defined concept or term or establishing the meaning of the concept or term, which in practice means another name of the subject or object of legal relations, or the definition of the subject or object of legal relations). Thus, preferably, based on the practical task and the said formalized model formed for its solution, the number and types of elements of the said formalized model (elements that do not contain sub-elements and sub-elements) are determined. In this case, preferably, each element of such a formalized model has unique semantic functions of the subject area, representing the relevant elements of such a formalized model. Preferably, such an actual formalized model is a guideline for the formation of an actual formalized model of a simple judgment (a formalized model of the logical construction of a judgment), and in such a simple judgment the structural element "predicate" should be divided into such a number of subelements that is at least equal to the number of actual elements of the formalized model of the subject area minus one - since among the actual elements of the formalized model of the subject area there is necessarily one actual element that corresponds to (correlates with) the structural element "subject". In this case, preferably, such an actual formalized model of a simple judgment (a formalized model of the logical construction of a judgment) contains actual elements of a simple judgment with actual semantic functions.
[82] В качестве примера, но не ограничения, в таблице №2 продемонстрированы логические роли и смысловые функции структурных элементов простых суждений (логических объектов) предложения «Уполномоченный продавец обязан передать покупателю товар после его оплаты» без учета решения практической задачи и актуальной формализованной модели предметной области.[82] As an example, but not a limitation, Table No. 2 demonstrates the logical roles and semantic functions of the structural elements of simple judgments (logical objects) of the sentence “The authorized seller is obliged to transfer the goods to the buyer after payment” without taking into account the solution of a practical problem and the current formalized model of the subject area.
[83] Таблица №2:[83] Table No. 2:
[84] Таким образом, предпочтительно, приведенный пример показывает, что простое суждение имеет минимальное количество элементов простого суждения равное двум (субъект, предикат). При этом, предпочтительно, максимальное количество элементов простого суждения зависит исключительно от актуальной формализованной модели простого суждения. В качестве примера, но не ограничения, в таблице №3 продемонстрированы логические роли и смысловые функции актуальных элементов простых суждений (логических объектов) предложения «Уполномоченный продавец обязан передать покупателю товар после его оплаты» с учетом решения практической задачи и с учетом актуальной формализованной модели логической конструкции суждения и актуальной формализованной модели предметной области.[84] Thus, preferably, the given example shows that a simple judgment has a minimum number of elements of a simple judgment equal to two (subject, predicate). At the same time, preferably, the maximum number of elements of a simple judgment depends solely on the current formalized model of a simple judgment. As an example, but not a limitation, Table No. 3 demonstrates the logical roles and semantic functions of the current elements of simple judgments (logical objects) of the sentence "The authorized seller is obliged to transfer the goods to the buyer after payment" taking into account the solution of a practical problem and taking into account the current formalized model of the logical structure of the judgment and the current formalized model of the subject area.
[85] Таблица №3:[85] Table No. 3:
[86] Таким образом, предпочтительно, компонентами простого суждения 71 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 являются все элементы простого суждения, установленные в актуальной формализованной модели простого суждения (формализованной модели логической конструкции суждения), причем такая актуальная формализованная модель простого суждения содержится в первой пользовательской базе данных (первой ПБД). Предпочтительно, не ограничиваясь, информация о том, какие текстовые элементы 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 составляют отдельные компоненты простого суждения 71 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, содержится в базе данных лингво-логическо-предметных признаков 30 (БДЛЛПП 30), сформированной в ходе этапа 1007. Причем, предпочтительно, вид упомянутых компонентов простого суждения 71 и способ корреляции (соотнесения) актуальных логических объектов также содержится в БДЛЛПП 20.[86] Thus, preferably, the components of the simple judgment 71 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 are all elements of the simple judgment established in the current formalized model of the simple judgment (the formalized model of the logical construction of the judgment), whereby such current formalized model of the simple judgment is contained in the first user database (the first PDB). Preferably, without limitation, information about which text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 constitute individual components of the simple judgment 71 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 is contained in the database of linguistic-logical-subject features 30 (DLSF 30), formed during step 1007. Moreover, preferably, the type of the mentioned components of the simple judgment 71 and the method of correlation (relationship) of the actual logical objects are also contained in DLSF 20.
[87] Предпочтительно, не ограничиваясь, компоненты простого суждения 71 (КПС 71) могут быть как минимум двух видов - первые КПС 71.1 и вторые КПС 71.х. предпочтительно, не ограничиваясь, количество вторых КПС 71.х будет соответствовать числу элементов простого суждения в модели простого суждения (формализованной модели логической конструкции суждения). При этом, не ограничиваясь, первым КПС 71.1 (элементом «1» в актуальной формализованной модели логической конструкции суждения) всегда будет субъект. При идентификации вторых КПС 71.х каждый идентифицированный КПС 71.х получит такое значение индекса «х», которое будет соответствовать порядковому номеру элемента простого суждения, представленному в актуальной формализованной модели логической конструкции суждения. Предпочтительно, не ограничиваясь, значениями 711 компонентов простого суждения 71 лингвистических предложений 51, 52, 53 четвертой структуры данных являются значения 711 компонентов простого суждения 71 всех видов (первые КПС 71.1 и вторые КПС 71.х.), которые составляют компонент простого суждения 71. При этом, предпочтительно, под значением 711 компонентов простого суждения 71 имеются в виду значения 711.1 и 711.х всех компонентов простого суждения 71.1 и 71.х, идентифицированных в лингвистическом предложении 51, 52, 53. Предпочтительно, не ограничиваясь, порядковым номером 712 компонента простого суждения 71 являются порядковые номера 712 компонентов простого суждения 71 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. В шестой структуре данных 7 элементы 71, в качестве примера, но не ограничения, могут именоваться как «КПС1», КПС2», «КПС3» «КПСn», где n≥1 - порядковый номер компонента простого суждения 71 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. При этом, не ограничиваясь, первый по порядку компонент простого суждения 71 в лингвистическом предложении 51, 52, 53 получает порядковый номер «1», следующий получает порядковый номер «2», и так далее до последнего компонента простого суждения в лингвистическом предложении 51, 52, 53, который получает последний по счету порядковый номер. Причем, предпочтительно, последовательность компонентов простого суждения 71 в лингвистическом предложении 51, 52, 53 определяется порядковым номером первого текстового элемента 61, из которого сформирована лингвистическая конструкция 41, которая является источником данных для формирования лингвистического предложения 51, 52, 53. Иными словами, предпочтительно, последовательность компонентов, исходя из порядкового номера его первого текстового элемента, может быть не вида «1-2-3-4» и так далее, а, например, не ограничиваясь, вида «3-7-11-12-14-20» и так далее, то есть на основании номеров первых текстовых элементов 61 компонентов простого суждения 71 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. При этом, предпочтительно, под значениями 712 компонентов простого суждения 71 имеются в виду значения 712.1 и 712.х всех компонентов простого суждения 71.1 и 71.х, идентифицированных в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. Предпочтительно, не ограничиваясь, при этом различные виды 71.1, 71.х компонентов простого суждения 71 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 идентифицируют и формируют на основании данных из базы данных лингво-логическо-предметных признаков 30 (БДЛЛПП 30), содержащей, как информацию о видах элементов простого суждения, так и информацию о содержании отдельных элементов простого суждения (то есть, из каких текстовых элементов 61 состоит каждый компонент простого суждения 71 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5). Предпочтительно, не ограничиваясь, идентификацию и формирование компонентов простого суждения 71 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 в ходе этапа 10081 производят путем комплексного лингво-логического анализа элементов 61 пятой структуры данных 6 - упомянутых текстовых элементов 61 и их идентификационных данных. Такой комплексный анализ текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 производится с помощью сведений о текстовых элементах 61 из сформированной БДЛЛПП 20, а также на основании данных актуальной формализованной модели логической конструкции суждения (ФМЛКС). При этом, предпочтительно, актуальная формализованная модель логической конструкции суждения содержит, как минимум, два вида компонентов - первый КПС 71.1 и второй КПС 71.х. Таким образом, предпочтительно, формализованной моделью логической конструкции суждения считается такая система описания простого суждения, которая имеет не менее чем два упомянутых компонента. Целью упомянутого комплексного анализа является выявление в лингвистическом предложении всех компонентов простого суждения, установленных формализованной моделью логической конструкции суждения. Предпочтительно, не ограничиваясь, идентификация и формирование компонентов простого суждения 71 шестой структуры данных 7 в ходе этапа 10081 производится итеративно. Количество шагов этапа 10081 зависит от используемой актуальной формализованной модели логической конструкции суждения. Предпочтительно, не ограничиваясь, упомянутая модель содержит установленное число видов элементов простого суждения, и в соответствии с этим количеством видов определяется количество шагов этапа 10081, поскольку в рамках одного шага возможны идентификация одного вида элемента простого суждения и формирование только одного вида компонента простого суждения 71. При этом, не ограничиваясь, поскольку формализованная модель логической конструкции суждения минимально может содержать не менее двух компонентов, минимальное число шагов также будет равняться двум. В качестве примера, но не ограничения, в таблице №4 приведен пример идентификации и формирования компонентов простого суждения 71 в лингвистическом предложении «Уполномоченный продавец обязан передать покупателю товар после его оплаты» в соответствии с восьмиэлементной актуальной формализованной моделью логической конструкции суждения, указанной в таблице №4.[87] Preferably, without limitation, the components of simple judgment 71 (CPS 71) may be of at least two types - the first CPS 71.1 and the second CPS 71.x. Preferably, without limitation, the number of second CPS 71.x will correspond to the number of elements of the simple judgment in the model of the simple judgment (the formalized model of the logical construction of the judgment). In this case, without limitation, the first CPS 71.1 (element "1" in the current formalized model of the logical construction of the judgment) will always be the subject. When identifying the second CPS 71.x, each identified CPS 71.x will receive such a value of the index "x" that will correspond to the ordinal number of the element of the simple judgment, presented in the current formalized model of the logical construction of the judgment. Preferably, but not limited to, the values 711 of the components of the simple judgment 71 of the linguistic sentences 51, 52, 53 of the fourth data structure are the values 711 of the components of the simple judgment 71 of all types (the first CPS 71.1 and the second CPS 71.x) that make up the component of the simple judgment 71. In this case, preferably, the value 711 of the components of the simple judgment 71 means the values 711.1 and 711.x of all the components of the simple judgment 71.1 and 71.x identified in the linguistic sentence 51, 52, 53. Preferably, but not limited to, the ordinal number 712 of the component of the simple judgment 71 are the ordinal numbers 712 of the components of the simple judgment 71 in the linguistic sentence 51, 52, 53 of the fourth data structure 5. In the sixth data structure 7, the elements 71, by way of example but not limitation, may be referred to as "KPS1", "KPS2", "KPS3" "KPSn", where n≥1 is the ordinal number of the component of the simple proposition 71 in the linguistic sentence 51, 52, 53 of the fourth data structure 5. In this case, without limitation, the first in order component of the simple proposition 71 in the linguistic sentence 51, 52, 53 receives the ordinal number "1", the next receives the ordinal number "2", and so on until the last component of the simple proposition in the linguistic sentence 51, 52, 53, which receives the last ordinal number. Moreover, preferably, the sequence of components of the simple judgment 71 in the linguistic sentence 51, 52, 53 is determined by the ordinal number of the first text element 61 from which the linguistic construction 41 is formed, which is the source of data for the formation of the linguistic sentence 51, 52, 53. In other words, preferably, the sequence of components, based on the ordinal number of its first text element, may not be of the form “1-2-3-4” and so on, but, for example, without limitation, of the form “3-7-11-12-14-20” and so on, that is, based on the numbers of the first text elements 61 of the components of the simple judgment 71 in the linguistic sentence 51, 52, 53 of the fourth data structure 5. In this case, preferably, by the values 712 of the components of the simple judgment 71 are meant the values 712.1 and 712.x of all components of the simple judgments 71.1 and 71.x identified in the linguistic sentence 51, 52, 53 of the fourth data structure 5. Preferably, without being limited to, the various types 71.1, 71.x of the components of the simple judgment 71 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 are identified and formed on the basis of data from the database of linguo-logical-subject features 30 (DLSF 30), containing both information on the types of elements of the simple judgment and information on the content of individual elements of the simple judgment (i.e., what text elements 61 each component of the simple judgment 71 in the linguistic sentence 51, 52, 53 of the fourth data structure 5 consists of). Preferably, without limitation, the identification and formation of the components of the simple judgment 71 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 during step 10081 is performed by means of a comprehensive linguistic-logical analysis of the elements 61 of the fifth data structure 6 - the mentioned text elements 61 and their identification data. Such a comprehensive analysis of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 is performed using information about the text elements 61 from the generated BDLLPP 20, as well as on the basis of the data of the current formalized model of the logical construction of the judgment (FMLCS). In this case, preferably, the current formalized model of the logical construction of the judgment contains at least two types of components - the first CPS 71.1 and the second CPS 71.x. Thus, preferably, a formalized model of the logical construction of a judgment is considered to be such a system of description of a simple judgment, which has not less than two mentioned components. The purpose of the mentioned complex analysis is to identify in a linguistic sentence all components of a simple judgment, established by the formalized model of the logical construction of a judgment. Preferably, without limitation, the identification and formation of components of a simple judgment 71 of the sixth data structure 7 during step 10081 is performed iteratively. The number of steps of step 10081 depends on the actual formalized model of the logical construction of a judgment used. Preferably, without being limited, the said model contains a set number of types of elements of a simple judgment, and in accordance with this number of types, the number of steps of stage 10081 is determined, since within the framework of one step, it is possible to identify one type of element of a simple judgment and to form only one type of component of a simple judgment 71. In this case, without being limited, since the formalized model of the logical construction of a judgment can contain at least two components, the minimum number of steps will also be equal to two. As an example, but not a limitation, Table No. 4 shows an example of identifying and forming components of a simple judgment 71 in the linguistic sentence "The authorized seller is obliged to transfer the goods to the buyer after their payment" in accordance with the eight-element actual formalized model of the logical construction of a judgment, specified in Table No. 4.
[88] Таблица №4:[88] Table No. 4:
/
ШагаItem No.
/
Step
[89] Предпочтительно, не ограничиваясь, именование актуальных элементов формализованной модели простого суждения, идентификацию актуальных элементов формализованной модели простого суждения в лингвистическом предложении, идентификацию вида КПС 71, идентификацию значения КПС 71 при необходимости производят путем организации запроса в базу данных лингво-логическо-предметных признаков 30 (БДЛЛПП 30) текстовых элементов 61 лингвистических предложений 51, 52, 53 четвертой структуры данных 5, формируемую в рамках этапа 1007, состоящего из идентификационных данных текстовых элементов 61 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, и получения перечня элементов актуальной формализованной модели простого суждения, а также информацию по каждому текстовому элементу 61 и о том, в какие элементы простого суждения входят упомянутые текстовые элементы 61. Предпочтительно, не ограничиваясь, такие идентификация и формирование элементов КПС 71 могут быть выполнены любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[89] Preferably, without limitation, the naming of the current elements of the formalized model of a simple judgment, the identification of the current elements of the formalized model of a simple judgment in a linguistic sentence, the identification of the type of CPS 71, the identification of the meaning of CPS 71, if necessary, are carried out by organizing a request to the database of linguo-logical-subject features 30 (DLSS 30) of text elements 61 of linguistic sentences 51, 52, 53 of the fourth data structure 5, formed within the framework of stage 1007, consisting of the identification data of the text elements 61 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, and obtaining a list of elements of the current formalized model of a simple judgment, as well as information on each text element 61 and on which elements of a simple judgment the said text elements 61 are included. Preferably, not without limitation, such identification and formation of elements of the CPS 71 can be performed by any method known from the state of the art and, accordingly, is not described in detail further. For example, without limitation, such a complex analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by applying neural network training technology (AI systems).
[90] Предпочтительно, не ограничиваясь, формирование шестой структуры данных 7 СМД в ходе этапа 10082 производят путем объединения в одной структуре данных элементов 71 (КПС 71) шестой структуры данных 7, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.[90] Preferably, without limitation, the formation of the sixth data structure 7 of the SMD during step 10082 is carried out by combining in one data structure the elements 71 (CPS 71) of the sixth data structure 7, as well as their identification data, according to principles and methods known from the prior art, which, accordingly, are not described in detail below.
[91] На фиг. 19, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1009 формирования седьмой структуры данных 8. Предпочтительно, не ограничиваясь, этап 1009 характеризуется: выполнением этапа 10091 формирования элементов 81 седьмой структуры данных 8, на котором на основании сведений, содержащихся в базе данных лингво-логическо-предметных признаков 30 и шестой структуре данных 7, из сформированных компонентов простых суждений 71 в соответствии с актуальной формализованной моделью логической конструкции суждения формируют элементы 81 седьмой структуры данных 8, являющиеся простыми суждениями 81, а также идентификационные данные простых суждений 81, представляющие собой значения 811 простых суждений и порядковые номера 812 простых суждений в лингвистических предложениях 51, 52, 53 четвертой структуры данных 5; выполнением этапа 10092 формирования седьмой структуры данных 8, на котором формируют седьмую структуру данных 8 из сформированных простых суждений 81 и их идентификационных данных.[91] Fig. 19, by way of example and not limitation, shows a general diagram of the execution of the steps of step 1009 of forming the seventh data structure 8. Preferably, without limitation, step 1009 is characterized by: the execution of step 10091 of forming the elements 81 of the seventh data structure 8, in which, based on the information contained in the database of linguistic-logical-subject features 30 and the sixth data structure 7, from the formed components of simple judgments 71 in accordance with the current formalized model of the logical construction of the judgment, the elements 81 of the seventh data structure 8 are formed, which are simple judgments 81, as well as the identification data of the simple judgments 81, which are the values 811 of the simple judgments and the ordinal numbers 812 of the simple judgments in the linguistic sentences 51, 52, 53 of the fourth data structure 5; performing step 10092 of forming the seventh data structure 8, at which the seventh data structure 8 is formed from the formed simple judgments 81 and their identification data.
[92] На фиг. 20, в качестве примера, но не ограничения, изображена общая структура сформированной седьмой структуры данных 8. Предпочтительно, не ограничиваясь, седьмая структура данных 8 (седьмая СД 8) содержит элементы 81 седьмой структуры данных 8, представляющие собой простые суждения 81 каждого лингвистического предложения 51, 52, 53 четвертой структуры данных 5 и идентификационные данные упомянутых простых суждений 81, представляющие собой в качестве примера, но не ограничения значения 811 упомянутых простых суждений 81, порядковые номера 812 простых суждений 81 в соответствующем лингвистическом предложении 51, 52, 53 четвертой структуры данных 5.[92] Fig. 20, by way of example and not limitation, shows the general structure of the generated seventh data structure 8. Preferably, without limitation, the seventh data structure 8 (seventh SD 8) contains elements 81 of the seventh data structure 8, representing simple judgments 81 of each linguistic sentence 51, 52, 53 of the fourth data structure 5 and identification data of said simple judgments 81, representing, by way of example and not limitation, the values 811 of said simple judgments 81, the ordinal numbers 812 of the simple judgments 81 in the corresponding linguistic sentence 51, 52, 53 of the fourth data structure 5.
[93] Предпочтительно, не ограничиваясь, простые суждения 81 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 представляют собой совокупность элементов простого суждения. Предпочтительно, такие элементы простого суждения 81, согласно теории логики, представляют собой структурные элементы простого суждения - субъект и предикат. При этом, предпочтительно, субъектом именуется предмет, о котором что-либо утверждается или опровергается в простом суждении, а предикатом - то, о чем говорится в данном простом суждении. При этом, предпочтительно, с практической точки зрения элементом простого суждения 81 являются субъект и какое-то число субэлементов (вложенных элементов) предиката, причем такая разбивка предиката на субэлементы обоснована исключительно практическими целями в рамках решения актуальной задачи. Решение актуальных задач обуславливает актуальные модели логической конструкции суждения, в которых содержатся актуальные элементы простого суждения 81, на основании которых на этапе 1008 идентифицируют и формируют компоненты простого суждения 71 лингвистического предложения 51, 52, 53 четвертой структуры данных 5. Предпочтительно, не ограничиваясь, простое суждение 81 представляет собой первичную логическую конструкцию мышления с помощью которой формируется и передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). Предпочтительно, с лингвистической точки зрения простые суждения 81 - это простые предложения, либо упрощенные простые предложения. При этом, предпочтительно, возможны различные варианты простых предложений, которые могут считаться простыми суждениями 81, например, но не ограничиваясь данным примером, можно привести следующие виды простых предложений: простые предложения в изначальном, непреобразованном виде; а также простые предложения в преобразованном (упрощенном) виде, например, не ограничиваясь: без причастных или деепричастных оборотов, которые сами формируют упрощенные простые предложения, являющиеся влияющими простыми суждениями; без однородностей (обезоднородненные, без рядов однородных членов, что приводит к формированию однородных упрощенных простых предложений); без вставок (без текста в скобках); без условных именований (без текста в кавычках); без обстоятельств (условий); и тому подобные, включая сочетания вышеуказанных и неуказанных видов. Предпочтительно, не ограничиваясь, простые суждения 81, с точки зрения наличия синтаксических связей между словами предложения, содержащими упомянутые простые суждения 81, могут являться как главными простыми суждения, так и влияющими простыми суждениями.[93] Preferably, without limitation, the simple judgments 81 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 represent a set of elements of a simple judgment. Preferably, such elements of a simple judgment 81, according to the theory of logic, represent the structural elements of a simple judgment - a subject and a predicate. In this case, the subject is preferably called the object about which something is asserted or refuted in the simple judgment, and the predicate is what is said in this simple judgment. In this case, preferably, from a practical point of view, the element of a simple judgment 81 is the subject and a certain number of subelements (nested elements) of the predicate, and such a breakdown of the predicate into subelements is justified exclusively by practical purposes within the framework of solving the current problem. The solution of actual problems determines actual models of the logical construction of judgment, which contain actual elements of simple judgment 81, on the basis of which, at step 1008, the components of simple judgment 71 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 are identified and formed. Preferably, without being limited to, simple judgment 81 represents the primary logical construction of thinking with the help of which the thought is formed and conveyed that something (predicate of judgment) is asserted or refuted about the subject of judgment (subject of judgment). Preferably, from the linguistic point of view, simple judgments 81 are simple sentences or simplified simple sentences. In this case, various variants of simple sentences are preferably possible, which can be considered simple judgments 81, for example, but not limited to this example, the following types of simple sentences can be given: simple sentences in their original, untransformed form; as well as simple sentences in a transformed (simplified) form, for example, but not limited to: without participial or adverbial participial phrases, which themselves form simplified simple sentences that are influencing simple judgments; without homogeneities (non-homogeneous, without rows of homogeneous members, which leads to the formation of homogeneous simplified simple sentences); without insertions (without text in brackets); without conditional names (without text in quotation marks); without circumstances (conditions); and the like, including combinations of the above and unspecified types. Preferably, without limitation, simple judgments 81, from the point of view of the presence of syntactic connections between the words of the sentence containing the mentioned simple judgments 81, can be both main simple judgments and influencing simple judgments.
[94] Предпочтительно, не ограничиваясь, простые суждения 81 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 имеют идентификационные данные: значение 811 простого суждения 81 и порядковый номер 812 простого суждения 81. Предпочтительно, не ограничиваясь, значением 811 простого суждения 81 является совокупность значений текстовых элементов 61 всех компонентов простого суждения 71, составляющих простое суждение 81 лингвистического предложения 51, 52, 53 четвертой структуры данных. Предпочтительно, не ограничиваясь, порядковым номером 812 простого суждения 81 является порядковый номер простого суждения 81 в лингвистическом предложении 51 четвертой структуры данных. В структуре данных элементы 81 в качестве примера, но не ограничения могут именоваться как «ПС1», «ПС2», «ПС3», «ПСn», где n≥1 - порядковый номер простого суждения 81 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5. Предпочтительно, не ограничиваясь, формирование простых суждений 81 лингвистического предложения 51 четвертой структуры данных 5 в ходе этапа 10091 производят на основании сформированных на этапе 1008 компонентов простого суждения 71 в лингвистическом предложении 51, 52, 53 четвертой структуры данных 5 путем объединения упомянутых компонентов простого суждения 71 согласно актуальной формализованной модели логической конструкции суждения и с учетом сведений из базы данных лингво-логическо-предметных признаков 30 текстовых элементов 61 о наличии синтаксических связей между текстовым элементами 61, входящими в различные компоненты простого суждения 71. Неограничивающий пример формирования простого суждения 81 лингвистического предложения 51, 52, 53 четвертой структуры данных приведен в таблице №5 (сноска под символом «*» означает эллипсис).[94] Preferably, but not limited to, the simple propositions 81 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 have identification data: a value 811 of the simple proposition 81 and an ordinal number 812 of the simple proposition 81. Preferably, but not limited to, the value 811 of the simple proposition 81 is the set of values of the text elements 61 of all components of the simple proposition 71 that make up the simple proposition 81 of the linguistic sentence 51, 52, 53 of the fourth data structure. Preferably, but not limited to, the ordinal number 812 of the simple proposition 81 is the ordinal number of the simple proposition 81 in the linguistic sentence 51 of the fourth data structure. In the data structure, the elements 81, by way of example but not limitation, may be referred to as "PS1", "PS2", "PS3", "PSn", where n≥1 is the ordinal number of the simple judgment 81 in the linguistic sentence 51, 52, 53 of the fourth data structure 5. Preferably, without limitation, the formation of the simple judgments 81 of the linguistic sentence 51 of the fourth data structure 5 during step 10091 is carried out on the basis of the components of the simple judgment 71 formed at step 1008 in the linguistic sentence 51, 52, 53 of the fourth data structure 5 by combining the said components of the simple judgment 71 according to the current formalized model of the logical construction of the judgment and taking into account information from the database of linguo-logical-subject features 30 of the text elements 61 on the presence of syntactic links between the text elements 61 included in the various components of the simple judgment 71. A non-limiting example of the formation of a simple judgment 81 of linguistic sentence 51, 52, 53 of the fourth data structure is given in Table No. 5 (the footnote under the symbol “*” means an ellipsis).
[95] Таблица №5:[95] Table No. 5:
[96] Предпочтительно, не ограничиваясь, идентификацию значения 811 простого суждения 81 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 в ходе этапа 10091 производят путем отождествления значения 811 простого суждения 81 со значениями 711 всех компонентов простого суждения 71, формирующих данное простое суждение 81. Предпочтительно, не ограничиваясь, идентификацию порядковых номеров 812 простого суждения 81 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 в ходе этапа 10091 производят путем сравнения порядковых номеров каждого простого суждения 81 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 с порядковыми номерами других простых суждений 81 того же лингвистического предложения 51, 52, 53 четвертой структуры данных 5. Предпочтительно, не ограничиваясь, такое простое суждение 81, у которого компонент простого суждения 71 с минимальным порядковым номером, будет иметь порядковый номер «1». Если же таких простых суждений 81 окажется больше, чем одно, то у таких простых суждений 81 следует проверять следующий компонент простого суждения 71, у которого порядковый номер - следующий по порядку возрастания, при этом, не ограничиваясь, такое простое суждение 81 получает в итоге порядковый номер «1». Предпочтительно, не ограничиваясь, следующие по порядку порядковые номера устанавливаются по таким же правилам, при этом, не ограничиваясь, в упомянутом сравнении уже не участвуют простые суждения 81, получившие порядковый номер 812. Такие идентификация и формирование элементов 81 седьмой структуры данных 8 могут быть выполнены любым известным из уровня техники способом и, соответственно, подробно далее не описываются. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[96] Preferably, without limitation, the identification of the value 811 of the simple proposition 81 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 during step 10091 is performed by identifying the value 811 of the simple proposition 81 with the values 711 of all components of the simple proposition 71 that form this simple proposition 81. Preferably, without limitation, the identification of the ordinal numbers 812 of the simple proposition 81 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 during step 10091 is performed by comparing the ordinal numbers of each simple proposition 81 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 with the ordinal numbers of other simple propositions 81 of the same linguistic sentence 51, 52, 53 of the fourth data structure 5. Preferably, without being limited, such a simple judgment 81, which has a component of the simple judgment 71 with the minimum ordinal number, will have the ordinal number "1". If there are more than one such simple judgments 81, then the next component of the simple judgment 71, which has the next ordinal number in ascending order, should be checked for such simple judgments 81, and, without being limited, such a simple judgment 81 ultimately receives the ordinal number "1". Preferably, without being limited, the next ordinal numbers in order are established according to the same rules, and, without being limited, the simple judgments 81 that have received the ordinal number 812 no longer participate in the mentioned comparison. Such identification and formation of elements 81 of the seventh data structure 8 can be performed by any method known from the prior art and, accordingly, are not described in detail further. For example, but not limited to, such a complex analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are enough examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by applying neural network (AI systems) training technology.
[97] Предпочтительно, не ограничиваясь, формирование седьмой структуры данных 8 в ходе этапа 10092 производят путем объединения в одной структуре данных элементов 81 седьмой структуры данных 8 и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.[97] Preferably, without limitation, the formation of the seventh data structure 8 during step 10092 is carried out by combining in one data structure the elements 81 of the seventh data structure 8 and their identification data according to principles and methods known from the prior art, which, accordingly, are not described in detail below.
[98] На фиг. 21, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1010 формирования восьмой структуры данных 9. Предпочтительно, не ограничиваясь, этап 1010 характеризуется: выполнением этапа 10101 формирования элементов 91 восьмой структуры данных 9, на котором на основании сведений, содержащихся в базе данных лингво-логическо-предметных признаков 30 и в седьмой структуре данных 8, а также в соответствии с актуальной формализованной моделью логической конструкции суждения идентифицируют и формируют элементы 91 восьмой структуры данных 9, являющиеся итоговыми суждениями 91 соответствующих лингвистических предложений 51, 52, 53 четвертой структуры данных 5, а также идентификационные данные итоговых суждений 91, представляющие собой значения 911 итоговых суждений 911 и порядковые номера 912 итоговых суждений 91 в восьмой структуре данных 9; выполнением этапа 10102 формирования восьмой структуры данных 9, на котором формируют восьмую структуру данных 9 из идентифицированных итоговых суждений 91 и их идентификационных данных.[98] In Fig. 21, as an example, but not limitation, a general diagram of the execution of the stages of stage 1010 of forming the eighth data structure 9 is shown. Preferably, without limitation, stage 1010 is characterized by: the execution of stage 10101 of forming the elements 91 of the eighth data structure 9, in which, on the basis of information contained in the database of linguistic-logical-subject features 30 and in the seventh data structure 8, as well as in accordance with the current formalized model of the logical construction of the judgment, elements 91 of the eighth data structure 9 are identified and formed, which are the final judgments 91 of the corresponding linguistic sentences 51, 52, 53 of the fourth data structure 5, as well as the identification data of the final judgments 91, representing the values 911 of the final judgments 911 and the ordinal numbers 912 of the final judgments 91 in the eighth data structure 9; performing step 10102 of forming the eighth data structure 9, in which the eighth data structure 9 is formed from the identified final judgments 91 and their identification data.
[99] На фиг. 22, в качестве примера, но не ограничения, изображена общая структура сформированной восьмой структуры данных 9. Предпочтительно, не ограничиваясь, восьмая структура данных 9 (восьмая СД 9) содержит элементы 91 восьмой структуры данных 9, представляющие собой итоговые суждения 91 каждого лингвистического предложения 51, 52, 53 четвертой структуры данных 5 и идентификационные данные упомянутых итоговых суждений 91, представляющие собой, в качестве примера, но не ограничения, значения 911 упомянутых итоговых суждений 91 и порядковые номера 912 упомянутых итоговых суждений 91 в восьмой структуре данных 9. Предпочтительно, не ограничиваясь, итоговые суждения 91 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 представляют собой с точки зрения причинно-следственных связей обусловленные суждения и/или безусловные суждения. Безусловные суждения - это такие утверждения или опровержения о предмете суждения, которые не подразумевают наличие каких-либо условий данного утверждения или опровержения. Иными словами, не предпочтительно, если суждение имеет признак безусловное суждения, то, значит, оно имеет форму простого суждения. Предпочтительно, такое единственное простое суждение в составе итогового суждения 91 является главным простым суждением (правилом). Предпочтительно, обусловленные суждения, наоборот, подразумевают наличие некого условия или совокупности условий, при выполнении которых утверждения или опровержения о предмете суждения являются актуальными или истинными. Предпочтительно, любое обусловленное суждение имеет форму сложного суждения, то есть группы простых суждений, элементы которых связаны друг с другом подчинительной синтаксической связью. При этом, предпочтительно, простое суждение, элементы которого не содержат слов, имеющих роль синтаксического потомка (подчиненного слова в паре слов с подчинительной синтаксической связью), является главным простым суждением (правилом), а простое суждение, элементы которого содержат слово или слова, имеющие роль синтаксического потомка являются влияющим простым суждением (обусловленностью).[99] Fig. 22 shows, by way of example and not limitation, the general structure of the generated eighth data structure 9. Preferably, without limitation, the eighth data structure 9 (eighth SD 9) contains elements 91 of the eighth data structure 9, which represent the final judgments 91 of each linguistic sentence 51, 52, 53 of the fourth data structure 5 and the identification data of said final judgments 91, which represent, by way of example and not limitation, the values 911 of said final judgments 91 and the ordinal numbers 912 of said final judgments 91 in the eighth data structure 9. Preferably, without limitation, the final judgments 91 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 represent, from the point of view of causal relationships, conditioned judgments and/or unconditional judgments. Unconditional judgments are such assertions or refutations about the subject of judgment that do not imply the presence of any conditions of this assertion or refutation. In other words, it is not preferable that if a judgment has the feature of an unconditional judgment, then it has the form of a simple judgment. Preferably, such a single simple judgment in the composition of the final judgment 91 is the main simple judgment (rule). Preferably, conditioned judgments, on the contrary, imply the presence of a certain condition or set of conditions, under which the assertions or refutations about the subject of judgment are relevant or true. Preferably, any conditioned judgment has the form of a complex judgment, that is, a group of simple judgments, the elements of which are connected with each other by a subordinate syntactic connection. In this case, preferably, a simple judgment, the elements of which do not contain words that have the role of a syntactic descendant (a subordinate word in a pair of words with a subordinate syntactic connection), is the main simple judgment (rule), and a simple judgment, the elements of which contain a word or words that have the role of a syntactic descendant, is an influencing simple judgment (conditionality).
[100] Предпочтительно, не ограничиваясь, на основании факта наличия безусловных и обусловленных суждений итоговые суждения 91 могут состоять из простых суждений 81 двух видов - первых простых суждений 81.1 (ППС 81.1), к которым относятся главные простые суждения (правила), и вторых простых суждений 81.Y (ВПС 81.Y) (где Y≥2 - порядковый индекс ВПС 81.Y в составе итогового суждения 91), к которым относятся влияющие простые суждения (обусловленности). Причем оба вида простых суждений 81 (ППС 81.1 и ВПС 81.Y) формируют на этапе 1009 из компонентов простого суждения 71. При этом, предпочтительно, безусловные суждения содержат только одно ППС 81.1, а обусловленные суждения содержат одно ППС 81.1, но также дополнительно и одно или несколько ВПС 81.Y. Предпочтительно, порядковый индекс «Y» ВПС 81.Y в составе итогового суждения 91 определяется порядковым номером 612 текстового элемента 61 в элементе итогового суждения 91 ВПС 81.Y, имеющем роль синтаксического потомка. Предпочтительно, элемент итогового суждения 91 ВПС 81.Y, имеющий роль синтаксического потомка с минимальным порядковым номером 612 текстового элемента 61 среди всех элементов итогового суждения 91 ВПС 81.Y одного обусловленного суждения получает индекс «2» (то есть ВПС 81.2). Предпочтительно, далее по такому же принципу нумеруются оставшиеся непронумерованные элементы ВПС 81.Y того же итогового суждения 91, получая далее порядковые индексы «Y» равные «3», «4» и так далее. В качестве примера, но не ограничения, можно продемонстрировать первые и вторые простые суждения в лингвистическом предложении 51, 52, 53. Например, не ограничиваясь, лингвистическое предложение «Полиция незамедлительно приходит на помощь каждому, кто нуждается в ее защите от преступных и иных противоправных посягательств» содержит следующие простые суждения 81: «Полиция незамедлительно приходит на помощь каждому»; «Кто нуждается в ее защите от преступных посягательств»; «Кто нуждается в ее защите от иных противоправных посягательств»; из простых суждений 81 вышеупомянутого лингвистического предложения формируются два сложных суждения; при этом синтаксическим родителем - главным текстовым элементом 61 в паре текстовых элементов 61 с подчинительной синтаксической связью - является текстовый элемент 61 «каждому», а синтаксическим потомком является текстовый элемент 61 «кто»; при этом, соответственно, первым простым суждением 81.1 (ППС 81.1.) является простое суждение «Полиция незамедлительно приходит на помощь каждому»; «Кто нуждается в ее защите от преступных посягательств», а вторыми простыми суждениями являются простое суждение 81.2 (ВПС 81.2) «Кто нуждается в ее защите от преступных посягательств» и второе простое суждение 81.3 (ВПС 81.3) «Кто нуждается в ее защите от иных противоправных посягательств». Предпочтительно, таким образом получают два итоговых суждения 91, являющихся по составу элементов сложным суждением. Одно итоговое суждение 91, являющееся сложным суждением, состоит из ППС 81.1 и ВПС 81.2 («Полиция незамедлительно приходит на помощь каждому кто нуждается в ее защите от преступных посягательств»), а другое итоговое суждение 91, также являющееся сложным суждением, состоит из ППС 81.1 и ВПС 81.3 («Полиция незамедлительно приходит на помощь каждому кто нуждается в ее защите от иных противоправных посягательств»).[100] Preferably, without limitation, based on the fact of the presence of unconditional and conditioned judgments, the final judgments 91 may consist of simple judgments 81 of two types - first simple judgments 81.1 (FSJ 81.1), which include the main simple judgments (rules), and second simple judgments 81.Y (SSJ 81.Y) (where Y≥2 is the ordinal index of the SSJ 81.Y in the final judgment 91), which include the influencing simple judgments (conditionalities). Moreover, both types of simple judgments 81 (PPS 81.1 and VPS 81.Y) are formed at step 1009 from the components of the simple judgment 71. In this case, preferably, unconditional judgments contain only one PPS 81.1, and conditioned judgments contain one PPS 81.1, but also additionally one or more VPS 81.Y. Preferably, the ordinal index “Y” of the VPS 81.Y in the composition of the final judgment 91 is determined by the ordinal number 612 of the text element 61 in the element of the final judgment 91 of the VPS 81.Y, which has the role of a syntactic descendant. Preferably, the element of the final judgment 91 of the VPS 81.Y, which has the role of a syntactic descendant with the minimum ordinal number 612 of the text element 61 among all elements of the final judgment 91 of the VPS 81.Y of one conditioned judgment, receives the index "2" (i.e., VPS 81.2). Preferably, the remaining unnumbered elements of the VPS 81.Y of the same final judgment 91 are then numbered according to the same principle, receiving further ordinal indices "Y" equal to "3", "4", and so on. By way of example, but not limitation, the first and second simple judgments in the linguistic sentence 51, 52, 53 can be demonstrated. For example, without limitation, the linguistic sentence "The police immediately come to the aid of everyone who needs their protection from criminal and other unlawful encroachments" contains the following simple judgments 81: "The police immediately come to the aid of everyone"; "Who needs their protection from criminal encroachments"; "Who needs their protection from other unlawful encroachments"; from the simple judgments 81 of the above-mentioned linguistic sentence, two complex judgments are formed; wherein the syntactic parent - the main text element 61 in the pair of text elements 61 with a subordinate syntactic connection - is the text element 61 "to everyone", and the syntactic descendant is the text element 61 "who"; in this case, the first simple judgment 81.1 (PPS 81.1.) is the simple judgment "The police immediately come to the aid of everyone"; "Who needs its protection from criminal encroachments", and the second simple judgments are the simple judgment 81.2 (VPS 81.2) "Who needs its protection from criminal encroachments" and the second simple judgment 81.3 (VPS 81.3) "Who needs its protection from other illegal encroachments". Preferably, in this way two final judgments 91 are obtained, which are a complex judgment according to the composition of their elements. One final judgment 91, which is a complex judgment, consists of PPS 81.1 and VPS 81.2 (“The police shall promptly come to the aid of anyone who needs its protection from criminal attacks”), and another final judgment 91, which is also a complex judgment, consists of PPS 81.1 and VPS 81.3 (“The police shall promptly come to the aid of anyone who needs its protection from other unlawful attacks”).
[101] Предпочтительно, не ограничиваясь, итоговые суждения 91 лингвистического предложения представляют собой, с точки зрения взаимосвязанности правил суждения, независимые правила суждений и взаимозависимые правила суждений; при этом независимые правила суждений содержат одно ППС 81.1, а взаимозависимые правила суждений содержат два или более ППС 81.1. Предпочтительно, взаимозависимые правила суждений формируются на основе признаков зависимости простых суждений, установленных в требованиях по формированию суждений для актуальной формализованной модели логической конструкции суждения, содержащихся во второй пользовательской базе данных. В качестве примера, но не ограничения, такие требования могут касаться наличия между отдельными ППС 81.1 сочинительной связи вида логического «И». Не ограничиваясь, такая связь указывает на взаимозависимость таких правил суждения, либо, иными словами, на искажение сути суждения при использовании отдельных правил суждения, являющихся взаимозависимыми правилами суждений. Предпочтительно, наличие «взаимозависимых правил» можно продемонстрировать, в качестве примера, но не ограничения, в итоговых суждениях 91 следующего предложения: «Превышение установленной скорости движения транспортного средства на величину более 20, но не более 40 километров в час влечет наложение административного штрафа в размере пятисот рублей». Данное предложение содержит два простых суждения: «Превышение установленной скорости движения транспортного средства на величину более 20 километров в час влечет наложение административного штрафа в размере пятисот рублей»; и «Превышение установленной скорости движения транспортного средства на величину не более 40 километров в час влечет наложение административного штрафа в размере пятисот рублей». При этом, не ограничиваясь, использование лингвистического инструмента, определяющего границы чего-либо («от…до»; «более…, но не более»; «менее…, но не менее»; «с…по»; и тому подобных) говорит о взаимосвязанности и неразрывности формируемых простых суждений, основанных на логическом «И». Предпочтительно, таким образом, указанные в таком примере два простых суждения являются взаимозависимыми суждениями и с точки зрения итоговых суждений 91 представляют собой одно итоговое суждение 91. Другим примером, но не ограничением, выявления между ППС 81.1. сочинительной связи вида логического «И» является наличие в предложении деепричастного оборота, когда деепричастие является синтаксическим потомком слова из ППС 81.1. Например, в предложении «Водитель должен вести транспортное средство со скоростью, не превышающей установленного ограничения, учитывая при этом интенсивность движения» идентифицируют три простых суждения 81: «Водитель должен вести транспортное средство со скоростью»; «Водитель учитывая при этом интенсивность движения»; «Скоростью, не превышающей установленного ограничения». При этом, предпочтительно, простые суждения «Водитель должен вести транспортное средство со скоростью» и «Водитель учитывая при этом интенсивность движения» являются взаимозависимыми суждениями, а простое суждение «Скоростью, не превышающей установленного ограничения» является обусловленностью простого суждения «Водитель должен вести транспортное средство со скоростью».[101] Preferably, but not limited to, the resulting judgments 91 of the linguistic sentence are, from the point of view of the interrelationship of judgment rules, independent judgment rules and interdependent judgment rules; wherein the independent judgment rules contain one PPS 81.1, and the interdependent judgment rules contain two or more PPS 81.1. Preferably, the interdependent judgment rules are formed on the basis of the features of dependence of simple judgments established in the requirements for forming judgments for the current formalized model of the logical construction of the judgment contained in the second user database. As an example, but not limitation, such requirements may concern the presence of a coordinating connection of the logical "AND" type between individual PPS 81.1. Without limitation, such a connection indicates the interdependence of such judgment rules, or, in other words, the distortion of the essence of the judgment when using individual judgment rules that are interdependent judgment rules. Preferably, the presence of "interdependent rules" can be demonstrated, by way of example, but not limitation, in the final judgments 91 of the following sentence: "Exceeding the established speed limit of a vehicle by more than 20 but not more than 40 kilometers per hour shall entail the imposition of an administrative fine in the amount of five hundred rubles." This sentence contains two simple judgments: "Exceeding the established speed limit of a vehicle by more than 20 kilometers per hour shall entail the imposition of an administrative fine in the amount of five hundred rubles"; and "Exceeding the established speed limit of a vehicle by no more than 40 kilometers per hour shall entail the imposition of an administrative fine in the amount of five hundred rubles." In this case, without limitation, the use of a linguistic tool defining the boundaries of something ("from...to"; "more..., but not more"; "less..., but not less"; "from...to"; and the like) speaks of the interconnectedness and inseparability of the formed simple judgments based on the logical "AND". Preferably, therefore, the two simple judgments specified in such an example are interdependent judgments and, from the point of view of the final judgments 91, represent one final judgment 91. Another example, but not a limitation, of identifying a coordinating connection of the logical "AND" type between PPS 81.1 is the presence of an adverbial participle in a sentence, when the adverbial participle is a syntactic descendant of a word from PPS 81.1. For example, in the sentence "The driver must drive a vehicle at a speed not exceeding the established limit, taking into account the traffic density," three simple judgments 81 are identified: "The driver must drive a vehicle at a speed"; "The driver taking into account the traffic density"; "At a speed not exceeding the established limit." In this case, it is preferable that the simple judgments “The driver must drive the vehicle at a speed” and “The driver takes into account the traffic intensity” are interdependent judgments, and the simple judgment “At a speed not exceeding the established limit” is a condition of the simple judgment “The driver must drive the vehicle at a speed”.
[102] Предпочтительно, не ограничиваясь, значением 911 итогового суждения 91 являются значения 811 простых суждений 81, из которых сформировано итоговое суждение 91. При этом значениями 811 простых суждений 81 является значение 811.1 первого простого сужения (ППС 81.1.) и значения 811.Y вторых простых суждений (ВПС 81.Y), из которых сформировано итоговое суждение 91. Предпочтительно, не ограничиваясь, порядковым номером 912 итогового суждения 91 являются порядковые номера итогового суждения 91 в восьмой структуре данных 9. В структуре данных итоговые суждения 91, в качестве примера, но не ограничения, могут именоваться как «ИС1», «ИС2», «ИС3», «ИСn», где n≥1 - порядковый номер элемента 91 в восьмой структуре данных 9. Предпочтительно, не ограничиваясь, присвоение порядковых номеров 912 итоговым суждениям 91 лингвистического предложения 51, 52, 53 четвертой структуры данных 5 производят следующим образом: порядковый номер «1» получает итоговое суждение 91, сформированное из лингвистического предложения 51, 52, 53 с порядковым номером «1» и состоящее из простого суждения 81 с порядковым номером «1». Предпочтительно, если в лингвистическом предложении 51, 52, 53 с порядковым номером «1» простое суждение 81 с порядковым номером «1» принадлежит к обусловленному суждению, то порядковый номер «1» получает такое итоговое суждение 91, которое имеет минимальное число вторых простых суждений 81.Y с минимальным порядковым номером 811 простого суждения 81. Предпочтительно, порядковый номер «2» получает такое итоговое суждение 91, в котором элементы итогового суждения 91 ВПС 81.Y имеют больший порядковый номер простого суждения 81, чем в итоговом суждении 91 с порядковым номером «1», или, если таких же вторых простых суждений 81.Y нет, то такое итоговое суждение 91, в котором элементы итогового суждения 91 ППС 81.1 имеют больший порядковый номер простого суждения 81, чем в итоговом суждении 91 с порядковым номером «1». Предпочтительно, такое же правило распространяется и далее на определение порядковых номеров 912 всех элементов 91 восьмой структуры данных 9. Предпочтительно, не ограничиваясь, в случае, когда ППС 81.1 итогового суждения 91 представляет собой группу взаимосвязанных правил суждения, то нумерация отдельных простых суждений, входящих в группу взаимосвязанных правил суждения не производят, поскольку эти простые суждения уже имеют уникальные порядковые номера, как простое суждение 81.[102] Preferably, but not limited to, the value 911 of the final judgment 91 are the values 811 of the simple judgments 81 from which the final judgment 91 is formed. In this case, the values 811 of the simple judgments 81 are the value 811.1 of the first simple narrowing (FSN 81.1.) and the value 811.Y of the second simple judgments (SSJ 81.Y) from which the final judgment 91 is formed. Preferably, but not limited to, the ordinal number 912 of the final judgment 91 are the ordinal numbers of the final judgment 91 in the eighth data structure 9. In the data structure, the final judgments 91, by way of example but not limitation, may be referred to as “IS1”, “IS2”, “IS3”, “ISn”, where n≥1 is the ordinal number of the element 91 in the eighth data structure 9. Preferably, not limiting ourselves, the assignment of ordinal numbers 912 to the final judgments 91 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 is carried out as follows: the ordinal number “1” is assigned to the final judgment 91, formed from the linguistic sentence 51, 52, 53 with the ordinal number “1” and consisting of the simple judgment 81 with the ordinal number “1”. Preferably, if in a linguistic sentence 51, 52, 53 with the ordinal number "1" the simple judgment 81 with the ordinal number "1" belongs to a conditioned judgment, then the ordinal number "1" is assigned to such a final judgment 91, which has a minimum number of second simple judgments 81.Y with the minimum ordinal number 811 of the simple judgment 81. Preferably, the ordinal number "2" is assigned to such a final judgment 91, in which the elements of the final judgment 91 of the IPC 81.Y have a higher ordinal number of the simple judgment 81 than in the final judgment 91 with the ordinal number "1", or, if there are no such second simple judgments 81.Y, then such a final judgment 91, in which the elements of the final judgment 91 of the IPC 81.1 have a higher ordinal number of the simple judgment 81, than in the final judgment 91 with the ordinal number "1". Preferably, the same rule also extends further to the determination of the ordinal numbers 912 of all elements 91 of the eighth data structure 9. Preferably, without limitation, in the case where the PPS 81.1 of the final judgment 91 represents a group of interrelated judgment rules, then the numbering of individual simple judgments included in the group of interrelated judgment rules is not performed, since these simple judgments already have unique ordinal numbers, like the simple judgment 81.
[103] Предпочтительно, не ограничиваясь, идентификацию и формирование итоговых суждений 91 восьмой структуры данных 9 производят в ходе этапа 10101 итеративно. На первом шаге этапа 10101 производят идентификацию правил итоговых суждений 91 (первых простых суждений 81.1). На втором шаге этапа 10101 производят идентификацию обусловленностей итоговых суждений 91 (вторых простых суждений 81.Y) для идентифицированных правил итоговых суждений 91. На третьем шаге этапа 10101 производится объединение идентифицированных правил итоговых суждений 91 и обусловленностей итоговых суждений 91 для формирования итоговых суждений 91. Предпочтительно, не ограничиваясь, идентификацию правил итоговых суждений 91 (первых простых суждений 81.1) на первом шаге этапа 10101 производят путем третьего комплексного анализа элементов 81 седьмой структуры данных 8 - простых суждений 81 и их идентификационных данных. Такой анализ простых суждений 81 производится с помощью сведений о текстовых элементах 61 и с помощью сведений из сформированной БДЛЛПП 20, а также с учетом требований к простому суждению 81, как к простому суждению первого вида, то есть, к простому суждению, компоненты которого не содержат текстовых элементов, являющихся синтаксическими потомками. Предпочтительно, целью упомянутого третьего комплексного анализа является выявление среди элементов 81 седьмой структуры данных 8 таких простых суждений 81, которые соответствуют требованиям к первому простому суждению 81.1. Предпочтительно, не ограничиваясь, идентификацию обусловленностей итоговых суждений 91 (вторых простых суждений 81.Y) на втором шаге этапа 10101 производят путем четвертого комплексного анализа элементов 81 седьмой структуры данных 8 - простых суждений 81 и их идентификационных данных. Предпочтительно, не ограничиваясь, такой анализ простых суждений 81 производится с помощью сведений о текстовых элементах 61 и с помощью сведений из сформированной БДЛЛПП 20, а также с учетом требований к простому суждению 81, как к простому суждению второго вида, то есть к простому суждению, компоненты которого содержат текстовые элементы, являющиеся синтаксическими потомками. Предпочтительно, целью упомянутого четвертого комплексного анализа является выявление для каждого идентифицированного первого простого суждения 81.1 среди элементов 81 седьмой структуры данных 8 таких простых суждений 81, которые соответствуют требованиям ко второму простому суждению 81.Y. Предпочтительно, не ограничиваясь, объединение идентифицированных правил итоговых суждений 91 (первых простых суждений 81.1) и обусловленностей итоговых суждений 91 (вторых простых суждений 81.Y) для формирования итоговых суждений 91 на третьем шаге этапа 10101 производят путем пятого комплексного анализа идентифицированных правил суждений 91 и обусловленностей итоговых суждений 91 и их идентификационных данных. Предпочтительно, не ограничиваясь, такой анализ производится с помощью сведений о текстовых элементах 61 и с помощью сведений из сформированной БДЛЛПП 20, а также с учетом требований к сборке итоговых суждений 91 из первых и вторых простых суждений. Предпочтительно, целью упомянутого пятого комплексного анализа является идентификация и формирование элементов 91 восьмой структуры данных 9. В качестве примера, но не ограничения, требования к формированию итоговых суждений 91 из первых и вторых простых суждений содержат, как минимум, следующие условия: если для первого простого суждения 81.1 не идентифицировано ни одного второго простого суждения 81.Y, то итоговое суждение 91 формируется только из одного простого суждения 81 - ППС 81.1; если для первого простого суждения 81.1 идентифицировано одно второе простое суждение 81.Y, то итоговое суждение 91 формируется из двух простых суждений 81 - из ППС 81.1 и ВПС 81.Y; если для первого простого суждения 81.1 идентифицировано более чем одно второе простое суждение 81.Y, то для формирования итогового суждения 91 необходимо установить синтаксические подчинительные связи между идентифицированными вторыми простыми суждениями 81.Y, после чего необходимо сформировать итоговое суждение 91 из первого простого суждения 81.1 и вторых простых суждений, имеющих между собой подчинительную синтаксическую связь; не ограничиваясь, в результате может быть реализован один из трех вариантов формирования итогового суждения 91: по первому варианту, при котором все идентифицированные вторые простые суждения 81.Y будут иметь между собой подчинительную синтаксическую связь, будет сформирован один элемент 91 из простых суждений 81 - из ППС 81.1 и всех ВПС 81.Y, расположенных в последовательности подчинительных синтаксических связей между собой в соответствии с порядковым номером индекса «Y»; по второму варианту, при котором все идентифицированные вторые простые суждения 81.Y не будут иметь между собой непрерывную подчинительную синтаксическую связь, будет сформировано столько элементов 91 из ВПС 81.Y, сколько вторых простых суждений 81.Y будут иметь одного и того же синтаксического потомка; по третьему варианту, при котором, если часть идентифицированных вторых простых суждений 81.Y будут иметь между собой непрерывную подчинительную синтаксическую связь, а часть идентифицированных вторых простых суждений 81.Y не будут иметь между собой непрерывную подчинительную синтаксическую связь, то будет сформировано такое число элементов 91, которое соответствует правилам формирования суждений по первому и второму вариантам. В качестве примера, но не ограничения, может быть рассмотрено следующее предложение: «Полиция обязана обеспечить каждому гражданину возможность ознакомления с документами и материалами, непосредственно затрагивающими его права и свободы, если иное не установлено федеральным законом». Из рассматриваемого предложения сформированы следующие простые суждения 81 (ПС 81) с маркировками отдельных текстовых элементов 61 (слов) их синтаксическими ролями (СРn - синтаксический родитель и СПn - синтаксический потомок, где n≥1 - порядковый номер синтаксического родителя или синтаксического потомка в данном примере), определяющими синтаксическую подчинительную связь между простыми суждениями рассматриваемого предложения (таблица №6):[103] Preferably, without limitation, the identification and formation of the final judgments 91 of the eighth data structure 9 is carried out iteratively during step 10101. In the first step of step 10101, the rules of the final judgments 91 (the first simple judgments 81.1) are identified. In the second step of stage 10101, the identification of the conditions of the final judgments 91 (the second simple judgments 81.Y) is performed for the identified rules of the final judgments 91. In the third step of stage 10101, the identified rules of the final judgments 91 and the conditions of the final judgments 91 are combined to form the final judgments 91. Preferably, without limitation, the identification of the rules of the final judgments 91 (the first simple judgments 81.1) in the first step of stage 10101 is performed by means of a third complex analysis of the elements 81 of the seventh data structure 8 - the simple judgments 81 and their identification data. Such analysis of simple judgments 81 is performed using information about text elements 61 and using information from the generated BDLLPP 20, as well as taking into account the requirements for simple judgment 81 as a simple judgment of the first type, that is, a simple judgment whose components do not contain text elements that are syntactic descendants. Preferably, the purpose of said third complex analysis is to identify among the elements 81 of the seventh data structure 8 such simple judgments 81 that meet the requirements for the first simple judgment 81.1. Preferably, without being limited to, the identification of the conditions of the final judgments 91 (the second simple judgments 81.Y) at the second step of stage 10101 is performed by means of a fourth complex analysis of the elements 81 of the seventh data structure 8 - simple judgments 81 and their identification data. Preferably, without limitation, such analysis of simple judgments 81 is performed using information about text elements 61 and using information from the generated BDLLPP 20, as well as taking into account the requirements for the simple judgment 81 as a simple judgment of the second type, that is, a simple judgment whose components contain text elements that are syntactic descendants. Preferably, the purpose of said fourth complex analysis is to identify for each identified first simple judgment 81.1 among the elements 81 of the seventh data structure 8 such simple judgments 81 that correspond to the requirements for the second simple judgment 81.Y. Preferably, without being limited to, the combination of the identified rules of the final judgments 91 (the first simple judgments 81.1) and the conditions of the final judgments 91 (the second simple judgments 81.Y) for forming the final judgments 91 at the third step of stage 10101 is carried out by means of a fifth complex analysis of the identified rules of judgments 91 and the conditions of the final judgments 91 and their identification data. Preferably, without being limited to, such analysis is carried out using information about the text elements 61 and using information from the formed BDLLPP 20, as well as taking into account the requirements for assembling the final judgments 91 from the first and second simple judgments. Preferably, the purpose of said fifth complex analysis is to identify and generate elements 91 of the eighth data structure 9. By way of example, but not limitation, the requirements for generating final judgments 91 from the first and second simple judgments contain at least the following conditions: if no second simple judgment 81.Y is identified for the first simple judgment 81.1, then the final judgment 91 is generated from only one simple judgment 81 - the PPS 81.1; if one second simple judgment 81.Y is identified for the first simple judgment 81.1, then the final judgment 91 is generated from two simple judgments 81 - from the PPS 81.1 and the IPS 81.Y; if more than one second simple judgment 81.Y is identified for the first simple judgment 81.1, then in order to form the final judgment 91 it is necessary to establish syntactic subordinate connections between the identified second simple judgments 81.Y, after which it is necessary to form the final judgment 91 from the first simple judgment 81.1 and the second simple judgments that have a subordinate syntactic connection between themselves; without limitation, as a result one of three options for forming the final judgment 91 can be implemented: according to the first option, in which all identified second simple judgments 81.Y will have a subordinate syntactic connection between themselves, one element 91 will be formed from simple judgments 81 - from the PPS 81.1 and all the VPS 81.Y, located in the sequence of subordinate syntactic connections between themselves in accordance with the ordinal number of the index "Y"; according to the second option, in which all identified second simple judgments 81.Y will not have a continuous subordinate syntactic connection between themselves, as many elements 91 from the VPS 81.Y will be formed as the number of second simple judgments 81.Y will have the same syntactic descendant; according to the third option, in which if some of the identified second simple judgments 81.Y will have a continuous subordinate syntactic connection between themselves, and some of the identified second simple judgments 81.Y will not have a continuous subordinate syntactic connection between themselves, then such number of elements 91 will be formed that corresponds to the rules for forming judgments according to the first and second options. As an example, but not a limitation, the following sentence may be considered: "The police are obliged to provide each citizen with the opportunity to familiarize themselves with documents and materials that directly affect their rights and freedoms, unless otherwise established by federal law." The following simple judgments 81 (PS 81) were formed from the sentence under consideration, with individual text elements 61 (words) marked with their syntactic roles (SRn is the syntactic parent and SPn is the syntactic descendant, where n≥1 is the ordinal number of the syntactic parent or syntactic descendant in this example), defining the syntactic subordinate relationship between the simple judgments of the sentence under consideration (table No. 6):
[104] Таблица №6:[104] Table No. 6:
[105] В ходе первого шага этапа 10101 идентифицированы первые простые суждения 81.1 (ППС 81.1) (таблица №7):[105] During the first step of stage 10101, the first simple judgments 81.1 (PPS 81.1) were identified (table No. 7):
[106] Таблица №7:[106] Table No. 7:
[107] В ходе второго шага этапа 10101 для идентифицированных первых простых суждений 81.1 идентифицированы все связанные с ними синтаксической подчинительной связью вторые простые суждения 81.Y (ВПС 81.Y) (таблица №8):[107] During the second step of stage 10101, for the identified first simple judgments 81.1, all second simple judgments 81.Y (SSP 81.Y) associated with them by syntactic subordination were identified (table No. 8):
[108] Таблица №8:[108] Table No. 8:
[109] В ходе третьего шага этапа 10101 для формирования итоговых суждений 91 на основе каждого первого простого суждения 81.1 устанавливают вариант формирования итогового суждения 91. Для обоих первых простых суждений 81.1 установлено, что, во-первых, все вторые простые суждения 81.Y между собой не имеют никакой синтаксической подчинительной связи, а, во-вторых, два вторых простых суждения - ВПС 81.3 и ВПС 81.4 для ППС 81.1 с порядковым номером «1»; ВПС 81.5 и ВПС 81.6 для ППС 81.1 с порядковым номером «2» - имеют одного синтаксического потомка: СП2 - у ВПС 81.3 и ВПС 81.4 для ППС 81.1 с порядковым номером «1»; СП3 - у ВПС 81.5 и ВПС 81.6 для ППС 81.1 с порядковым номером «2»). В связи с этим, на основе каждого первого простого суждения 81.1 с порядковыми номерами «1» и «2» формируют по два итоговых суждения 91 (ИС 91) (таблица №9):[109] During the third step of stage 10101 for forming final judgments 91 on the basis of each first simple judgment 81.1, a variant of forming the final judgment 91 is established. For both first simple judgments 81.1, it is established that, firstly, all second simple judgments 81.Y do not have any syntactic subordinate connection with each other, and, secondly, the two second simple judgments - VPS 81.3 and VPS 81.4 for PPS 81.1 with the ordinal number "1"; VPS 81.5 and VPS 81.6 for PPS 81.1 with the ordinal number "2" - have one syntactic descendant: SP2 - for VPS 81.3 and VPS 81.4 for PPS 81.1 with the ordinal number "1"; SP3 - for VPS 81.5 and VPS 81.6 for PPS 81.1 with ordinal number "2"). In this regard, on the basis of each first simple judgment 81.1 with ordinal numbers "1" and "2" two final judgments 91 (IS 91) are formed (table No. 9):
[110] Таблица №9:[110] Table No. 9:
[111] Предпочтительно, такие идентификация и формирование элементов 91 восьмой структуры данных 9 могут быть выполнены любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам»). Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[111] Preferably, such identification and formation of elements 91 of the eighth data structure 9 can be performed by any method known from the prior art and, accordingly, is not described in detail further. For example, without limitation, such a complex analysis can be performed traditionally by a linguist, or with the help of a software algorithm of a linguistic (syntactic) processor, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules"). Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by applying neural network (AI systems) training technology.
[112] Предпочтительно, не ограничиваясь, формирование восьмой структуры данных 9 в ходе этапа 10102 производят путем объединения в одной структуре данных элементов 91 восьмой структуры данных 9 СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.[112] Preferably, without limitation, the formation of the eighth data structure 9 during step 10102 is carried out by combining in one data structure the elements 91 of the eighth data structure 9 of the SMD, as well as their identification data, according to principles and methods known from the prior art, which, accordingly, are not described in detail below.
[113] На фиг. 23, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1011 формирования девятой структуры данных 10. Предпочтительно, не ограничиваясь, этап 1011 характеризуется: выполнением этапа 10111, формирования элементов 92 девятой структуры данных 10, на котором на основании сведений, содержащихся в базе данных лингво-логическо-предметных признаков 30, во второй пользовательской базе данных, в шестой структуре данных 7, в седьмой структуре данных 8 и в восьмой структуре данных 9, а также в соответствии с актуальной формализованной моделью базовой конструкции предметной области идентифицируют и формируют элементы 92 девятой структуры данных 10, являющиеся базовыми конструкциями предметной области 92, а также идентификационные данные базовых конструкций предметной области 92, представляющие собой значения 921 базовых конструкций предметной области и порядковые номера 922 базовых конструкций предметной области в девятой структуре данных 10; выполнением этапа 10112 формирования девятой структуры данных 10, на котором формируют девятую структуру данных 10 из идентифицированных базовых конструкций предметной области 92 и их идентификационных данных.[113] In Fig. 23, as an example, but not limitation, a general diagram of the execution of the stages of stage 1011 of forming the ninth data structure 10 is shown. Preferably, without limitation, stage 1011 is characterized by: executing stage 10111, forming elements 92 of the ninth data structure 10, in which, on the basis of information contained in the database of linguistic-logical-subject features 30, in the second user database, in the sixth data structure 7, in the seventh data structure 8 and in the eighth data structure 9, as well as in accordance with the current formalized model of the basic structure of the subject area, elements 92 of the ninth data structure 10, which are basic structures of the subject area 92, are identified and formed, as well as identification data of the basic structures of the subject area 92, representing the values 921 of the basic structures of the subject area and the ordinal numbers 922 of the basic structures of the subject area in the ninth data structure 10; performing step 10112 of forming the ninth data structure 10, in which the ninth data structure 10 is formed from the identified basic constructions of the subject area 92 and their identification data.
[114] На фиг. 24, в качестве примера, но не ограничения, изображена общая структура сформированной девятой структуры данных 10. Предпочтительно, не ограничиваясь, девятая структура данных 10 (девятая СД 10) содержит элементы 92 девятой структуры данных 10, представляющие собой базовые конструкции предметной области 92 (БКПО 92) каждого лингвистического предложения 51, 52, 53 четвертой структуры данных 5 и идентификационные данные упомянутых БКПО 92, представляющие собой в качестве примера, но не ограничения значения 921 упомянутых БКПО 92 и порядковые номера 922 упомянутых БКПО 92 в девятой структуре данных 10. Предпочтительно, не ограничиваясь, базовые конструкции предметной области 92 лингвистического предложения 51, 52, 53 четвертой структуры 5 данных представляют собой с логической точки зрения итоговые суждения. Иными словами, если восьмая СД 9, содержащая элементы 91, являющиеся итоговыми суждениями 91, является исключительно логической конструкцией безотносительно области, то девятая СД 10, содержащая элементы 92, являющиеся базовыми конструкциями предметной области 92, является уже логической конструкцией предметной области. При этом, предпочтительно, как исключительно логическая конструкция безотносительно области, так и логическая конструкция предметной области с логической точки зрения состоят из обусловленных и/или безусловных суждений. Предпочтительно, разница между исключительно логической конструкцией безотносительно области и логической конструкцией предметной области состоит с логической точки зрения в том, что элементами простых суждений в исключительно логической конструкции безотносительно области являются компоненты простого суждения 71, содержащие логические объекты, установленные в актуальной формализованной модели логической конструкции суждения (ФМЛКС), а элементами простых суждений в логической конструкции предметной области являются компоненты базовой предметной конструкции 72 (КБПК 72), содержащие базовые предметные объекты, установленные в актуальной формализованной модели базовой конструкции предметной области (ФМБКПО). При этом элементы 71 в ФМЛКС могут быть идентичны, либо не идентичны элементам 72 в ФМБКПО. Правила преобразования элементов 71 в элементы 72 устанавливают в таблице корреляции логических и предметных объектов, содержащейся во второй пользовательской базе данных. При этом также, то есть по тем же правилам, как из компонентов простого суждения 71 формируют первые простые суждения 81.1 и вторые простые суждения 81.Y исключительно логической конструкцией безотносительно области, из компонентов базовой предметной конструкции 72 формируют первые простые суждения 82.1 логической конструкции предметной области (первые базовые предметные конструкции 82.1) и вторые простые суждения 82.Y логической конструкции предметной области (вторые базовые предметные конструкции 82.Y). При этом первая базовая предметная конструкция 82.1 и вторые базовые предметные конструкции 82.Y являются базовыми предметными конструкциями 82 соответствующих БКПО 92.[114] Fig. 24 shows, by way of example and not limitation, the general structure of the generated ninth data structure 10. Preferably, without limitation, the ninth data structure 10 (ninth SD 10) contains elements 92 of the ninth data structure 10, which are basic constructions of the subject area 92 (BCPO 92) of each linguistic sentence 51, 52, 53 of the fourth data structure 5 and identification data of said BCPO 92, which are, by way of example and not limitation, values 921 of said BCPO 92 and ordinal numbers 922 of said BCPO 92 in the ninth data structure 10. Preferably, without limitation, the basic constructions of the subject area 92 of the linguistic sentence 51, 52, 53 of the fourth data structure 5 represent, from a logical point of view, final judgments. In other words, if the eighth SD 9, containing elements 91, which are final judgments 91, is an exclusively logical construction regardless of the domain, then the ninth SD 10, containing elements 92, which are basic constructions of the subject area 92, is already a logical construction of the subject area. In this case, preferably, both the exclusively logical construction regardless of the domain and the logical construction of the subject area from a logical point of view consist of conditioned and/or unconditional judgments. Preferably, the difference between the purely logical construction irrespective of the domain and the logical construction of the subject area consists, from the logical point of view, in that the elements of simple judgments in the purely logical construction irrespective of the domain are the components of the simple judgment 71 containing the logical objects established in the current formalized model of the logical construction of the judgment (FMLCS), and the elements of simple judgments in the logical construction of the subject area are the components of the basic subject construction 72 (BSPC 72) containing the basic subject objects established in the current formalized model of the basic construction of the subject area (FMBCDA). In this case, the elements 71 in the FMLCS may be identical or not identical to the elements 72 in the FMBCDA. The rules for converting the elements 71 into the elements 72 are established in the correlation table of logical and subject objects contained in the second user database. In this case, also, that is, according to the same rules as the first simple judgments 81.1 and the second simple judgments 81.Y are formed from the components of the simple judgment 71 exclusively by the logical construction regardless of the domain, the first simple judgments 82.1 of the logical construction of the subject domain (the first basic subject constructions 82.1) and the second simple judgments 82.Y of the logical construction of the subject domain (the second basic subject constructions 82.Y) are formed from the components of the basic subject construction 72. In this case, the first basic subject construction 82.1 and the second basic subject constructions 82.Y are the basic subject constructions 82 of the corresponding BCPO 92.
[115] Предпочтительно, не ограничиваясь, из первых базовых предметных конструкций 82.1 и вторых базовых предметных конструкций 82.Y, формируют базовую конструкцию предметной области 92, эквивалентную итоговому суждению 91 по составу и содержанию простых суждений, содержащихся в итоговом суждении 91, делая это аналогичным образом, как при формировании итогового суждения 91 из первых простых суждений 81.1 и вторых простых суждений 81.Y, процесс которого подробно описан со ссылкой на этап 1010.[115] Preferably, without limitation, from the first basic subject constructions 82.1 and the second basic subject constructions 82.Y, a basic construction of the subject area 92 is formed, equivalent to the final judgment 91 in terms of the composition and content of the simple judgments contained in the final judgment 91, doing this in a similar manner as when forming the final judgment 91 from the first simple judgments 81.1 and the second simple judgments 81.Y, the process of which is described in detail with reference to step 1010.
[116] Предпочтительно, не ограничиваясь, базовые конструкции предметной области 92 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, состоящие из элементов двух видов - элементов 82.1 и элементов 82.Y - имеют идентификационные данные БКПО 92: в качестве примера, но не ограничения, значения 921 БКПО, состоящие из значений 821.1 элементов 82.1 и значений 821.Y элементов 82.Y, и порядкового номера 922 БКПО 92 в девятой структуре данных 10.[116] Preferably, without limitation, the basic constructions of the subject area 92 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, consisting of elements of two types - elements 82.1 and elements 82.Y - have identification data of the BCPO 92: as an example, but not limitation, the values 921 of the BCPO, consisting of the values 821.1 of the elements 82.1 and the values 821.Y of the elements 82.Y, and the ordinal number 922 of the BCPO 92 in the ninth data structure 10.
[117] Предпочтительно, не ограничиваясь, значениями 921 БКПО 92 являются значения 821 базовых предметных конструкций 82, из которых сформирована эта БКПО 92. При этом значениями 821 базовых предметных конструкций 82 являются соответствующие значения 821.1 первой базовой предметной конструкции 82.1 и значения 821.Y вторых базовых предметных конструкций 82.Y, из которых сформирована БКПО 92.[117] Preferably, without limitation, the values 921 of the BCPO 92 are the values 821 of the basic subject constructions 82 from which this BCPO 92 is formed. In this case, the values 821 of the basic subject constructions 82 are the corresponding values 821.1 of the first basic subject construction 82.1 and the values 821.Y of the second basic subject constructions 82.Y from which the BCPO 92 is formed.
[118] Предпочтительно, не ограничиваясь, порядковыми номерами 922 БКПО 92 являются порядковые номера БКПО 92 в девятой структуре данных 10. В структуре данных БКПО 92, в качестве примера, но не ограничения, могут именоваться как «БКПО1», «БКПО1», «БКПО3», «БКПОn», где n≥1 - порядковый номер элемента БКПО 92 в девятой структуре данных 10. При этом, предпочтительно, порядковая нумерация элементов 92 в девятой структуре данных 10 полностью соответствует порядковой нумерации элементов 91 в восьмой структуре данных 9.[118] Preferably, without limitation, the ordinal numbers 922 of the BCPO 92 are the ordinal numbers of the BCPO 92 in the ninth data structure 10. In the data structure, the BCPO 92, by way of example, but not limitation, may be named as “BCPO1”, “BCPO1”, “BCPO3”, “BCPOn”, where n≥1 is the ordinal number of the BCPO element 92 in the ninth data structure 10. In this case, preferably, the ordinal numbering of the elements 92 in the ninth data structure 10 fully corresponds to the ordinal numbering of the elements 91 in the eighth data structure 9.
[119] Предпочтительно, не ограничиваясь, идентификацию и формирование элементов 92 девятой структуры данных 10 производят в ходе этапа 10111 пошагово. На первом шаге этапа 10111 производят идентификацию и формирование компонентов базовой предметной конструкции 72 (КБПК 72) из элементов КПС 71 шестой структуры данных 7. На втором шаге этапа 10111 производят формирование базовых предметных конструкций 82 из элементов КБПК 72. На третьем шаге этапа 10111 производят идентификацию первых базовых предметных конструкций 82.1 и производят идентификацию вторых базовых предметных конструкций 82.Y. На четвертом шаге этапа 10111 производят объединение идентифицированных первых базовых предметных конструкций 82.1 и вторых базовых предметных конструкций 82.Y для формирования БКПО 92 девятой структуры данных 10.[119] Preferably, without limitation, the identification and formation of elements 92 of the ninth data structure 10 is performed in the course of step 10111 in a step-by-step manner. In the first step of step 10111, the components of the basic subject construction 72 (BSC 72) are identified and formed from the elements of the CPS 71 of the sixth data structure 7. In the second step of step 10111, the basic subject constructions 82 are formed from the elements of the BSC 72. In the third step of step 10111, the first basic subject constructions 82.1 are identified and the second basic subject constructions 82.Y are identified. In the fourth step of step 10111, the identified first basic subject constructions 82.1 and the second basic subject constructions 82.Y are combined to form the BCPC 92 of the ninth data structure 10.
[120] Предпочтительно, не ограничиваясь, идентификацию и формирование КБПК 72 на первом шаге этапа 10111 производят на основании данных из таблицы корреляции актуальных базовых предметных объектов (актуальных БПО) и актуальных логических объектов (актуальных ЛогО), содержащейся во второй пользовательской базе данных (второй ПБД). При этом логическими объектами являются КПС 71, а базовыми предметными объектами - КБПК 72. Предпочтительно, не ограничиваясь, по составу элементы КБПК 72 могут представлять собой один или несколько КПС 71; при этом точный состав каждого КБПК 72 уникального наименования устанавливается в таблице корреляции актуальных БПО и актуальных ЛогО. Предпочтительно, не ограничиваясь, формирование базовых предметных конструкций 82, на втором шаге этапа 10111 производят из КПК 72 аналогичным образом, как производят формирование простых суждений 81 из компонентов простых суждений 71, процесс которого подробно описан со ссылкой на этап 1009. Предпочтительно, не ограничиваясь, идентификацию первых базовых предметных конструкций 82.1 и вторых базовых предметных конструкций 82.Y на третьем шаге этапа 10111 производят аналогично идентификации правил итоговых суждений 91 (первых простых суждений 81.1) и обусловленностей итоговых суждений 91 (вторых простых суждений 81.Y), процесс идентификации которых подробно описан со ссылкой на этап 1010. Предпочтительно, не ограничиваясь, объединение идентифицированных первых базовых предметных конструкций 82.1 и вторых базовых предметных конструкций 82.Y для формирования базовых конструкций предметной области 92 и их идентификационных данных на четвертом шаге этапа 10111 производят аналогичным образом, как производят формирование итоговых суждений 91 и их идентификационных данных, процесс которого подробно описан со ссылкой на этап 1010.[120] Preferably, without being limited to, the identification and formation of the KBPC 72 at the first step of stage 10111 is performed on the basis of data from the correlation table of the current basic subject objects (current BPO) and the current logical objects (current LogO) contained in the second user database (second PBD). In this case, the logical objects are the KPS 71, and the basic subject objects are the KBPC 72. Preferably, without being limited to, the elements of the KBPC 72 can represent one or more KPS 71; in this case, the exact composition of each KBPC 72 of a unique name is established in the correlation table of the current BPO and the current LogO. Preferably, without being limited to, the formation of basic subject constructions 82, in the second step of stage 10111, is carried out from the CPC 72 in the same way as the formation of simple judgments 81 from the components of simple judgments 71, the process of which is described in detail with reference to stage 1009. Preferably, without being limited to, the identification of the first basic subject constructions 82.1 and the second basic subject constructions 82.Y in the third step of stage 10111 is carried out in the same way as the identification of the rules of the final judgments 91 (the first simple judgments 81.1) and the conditions of the final judgments 91 (the second simple judgments 81.Y), the identification process of which is described in detail with reference to stage 1010. Preferably, without being limited to, the combination of the identified first basic subject constructions 82.1 and the second basic subject constructions 82.Y for the formation of the basic constructions of the subject area 92 and their identification data in the fourth step of stage 10111 is produced in a similar manner to the formation of final judgments 91 and their identification data, the process of which is described in detail with reference to step 1010.
[121] В качестве примера, но не ограничения, для предметной области права суждение может быть соотнесено с базовой предметной конструкцией «структурная часть правовой нормы», а именно в качестве примера, но не ограничения, с диспозицией (то есть с правилом, которое необходимо соблюдать), санкцией (то есть, правилом, которое определяет меру ответственности за нарушение правил) или гипотезой (то есть, обусловленностью правила, отражающего какое-либо предварительное действие, ситуацию или состояние). Данные правовые объекты - гипотеза, диспозиция, санкция - содержатся, в том числе, в простых предложениях нормативных актов. Для преобразования суждения в предметной области права необходимо создать формализованную модель базовой конструкции предметной области - формализованную модель структурной части правовой нормы (ФМСЧПН). В рамках профессиональной дискуссии может быть сформулировано некоторое количество различных ФМСЧПН. Для формирования девятой структуры данных 10 СМД необходимо создать актуальную ФМСЧПН, а также таблицу корреляции элементов актуальной формализованной модели логической конструкции суждения (ФМЛКС) с элементами актуальной формализованной модели структурной части правовой нормы. При этом, не ограничиваясь, специалистам в данной области техники должна быть очевидна жесткая связь между логическим простым суждением и частью правовой нормы (гипотезой, диспозицией, санкцией), что в качестве примера, но не ограничения продемонстрировано в следующих примерах в рамках некоторых сформированных исключительно для примера формализованной моделью логической конструкции суждения, формализованной моделью структурной части правовой нормы и таблицей корреляции. В качестве примера, но не ограничения, рассмотрено следующее предложение нормативного акта - закона «О полиции»: «При обращении к гражданину сотрудник полиции обязан в случае применения к нему мер, ограничивающих его права и свободы, разъяснить ему причины и основания применения таких мер, а также возникающие в связи с этим права и обязанности гражданина». В качестве примера, но не ограничения, актуальная формализованная модель логической конструкции суждения может содержать следующие элементы простого суждения - компоненты простого суждения 71 (таблица №10):[121] As an example, but not a limitation, for the subject area of law, a judgment may be related to the basic subject construction of the "structural part of a legal norm", namely, as an example, but not a limitation, to a disposition (i.e., a rule that must be followed), a sanction (i.e., a rule that determines the measure of liability for violating the rules), or a hypothesis (i.e., the conditionality of a rule that reflects some preliminary action, situation, or state). These legal objects - hypothesis, disposition, sanction - are contained, among other things, in simple sentences of regulatory acts. To transform a judgment in the subject area of law, it is necessary to create a formalized model of the basic construction of the subject area - a formalized model of the structural part of a legal norm (FMSPRN). Within the framework of a professional discussion, a number of different FMSPRNs may be formulated. To form the ninth data structure of the 10 SMD, it is necessary to create an up-to-date FMSCHPN, as well as a correlation table of the elements of the up-to-date formalized model of the logical construction of a judgment (FMLCS) with the elements of the up-to-date formalized model of the structural part of a legal norm. At the same time, without limitation, specialists in this field of technology should clearly see a rigid connection between a simple logical judgment and a part of a legal norm (hypothesis, disposition, sanction), which is demonstrated by way of example, but not limitation, in the following examples within the framework of some formalized model of the logical construction of a judgment, a formalized model of the structural part of a legal norm and a correlation table formed solely for the purpose of an example. As an example, but not limitation, the following sentence of the normative act - the Law "On Police" is considered: "When addressing a citizen, a police officer is obliged, in the event of measures being applied to him that restrict his rights and freedoms, to explain to him the reasons and grounds for applying such measures, as well as the rights and obligations of the citizen arising in connection therewith." As an example, but not limitation, the current formalized model of the logical construction of a judgment may contain the following elements of a simple judgment - components of a simple judgment 71 (Table No. 10):
[122] Таблица №10:[122] Table No. 10:
[123] В качестве примера, но не ограничения, актуальная формализованная модель структурной части правовой нормы может содержать следующие элементы - компоненты базовой предметной конструкции 72 (КБКП 72) (таблицы №11 и №12):[123] As an example, but not a limitation, the current formalized model of the structural part of a legal norm may contain the following elements - components of the basic subject construction 72 (BSC 72) (Tables No. 11 and No. 12):
[124] Таблица №11:[124] Table No. 11:
[125] Таблица №12:[125] Table No. 12:
[126] В качестве примера, но не ограничения, на этапе 1010 была сформирована восьмая СД 9, представляющая собой итоговые суждения 91 рассматриваемого предложения (таблица №13):[126] As an example, but not limitation, at step 1010 an eighth SD 9 was formed, representing the final judgments of the 91 sentences under consideration (Table No. 13):
[127] Таблица №13:[127] Table No. 13:
[128] В качестве примера, но не ограничения, на этапе 1011 была сформирована десятая СД 10, представляющая собой базовую конструкцию предметной области, являющаяся в предметной области права формализованной моделью структурной части правовой нормы (таблицы №14 и № 15):[128] As an example, but not limitation, at stage 1011 the tenth SD 10 was formed, representing the basic structure of the subject area, which in the subject area of law is a formalized model of the structural part of a legal norm (tables No. 14 and No. 15):
[129] Таблица №14:[129] Table No. 14:
[130] Таблица №15:[130] Table No. 15:
[131] Предпочтительно, не ограничиваясь, такие идентификация и формирование элементов 92 девятой СД 10 могут быть выполнены любым известным из уровня техники способом и, соответственно, подробно далее не описываются. Например, не ограничиваясь, такие идентификация и формирование могут быть выполнены традиционно специалистом-юристом, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам») с использованием программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[131] Preferably, without being limited, such identification and formation of elements 92 of the ninth SD 10 can be performed by any method known from the prior art and, accordingly, are not described in detail further. For example, without being limited, such identification and formation can be performed traditionally by a legal specialist, or based on traditional programming by solving problems using coding of unchangeable rules (IT solution "by rules") using a software algorithm of a linguistic (syntactic) processor. Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by using neural network (AI systems) training technology.
[132] Предпочтительно, не ограничиваясь, формирование девятой структуры данных 10 в ходе этапа 10112 производят путем объединения в одной структуре данных элементов 92 девятой структуры данных 10, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.[132] Preferably, without limitation, the formation of the ninth data structure 10 during step 10112 is carried out by combining in one data structure the elements 92 of the ninth data structure 10, as well as their identification data, according to principles and methods known from the prior art, which, accordingly, are not described in detail below.
[133] На фиг. 25, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 1012 формирования итоговой структуры данных 12. Предпочтительно, не ограничиваясь, этап 1012 характеризуется: выполнением этапа 10121 формирования элементов 93 итоговой структуры данных 12, на котором на основании сведений, содержащихся в третьей пользовательской базе данных и в девятой структуре данных 10, а также в соответствии с актуальной формализованной моделью целевой конструкции предметной области идентифицируют и формируют элементы 93 итоговой структуры данных 12, являющиеся целевыми конструкциями предметной области 93, а также идентификационные данные целевых конструкций предметной области 93, представляющие собой: значения 931 целевых конструкций предметной области 93, и порядковые номера 932 целевых конструкций предметной области 93 в итоговой структуре данных 12; выполнением этапа 10122 формирования итоговой структуры данных 12, на котором формируют итоговую структуру данных 12 из идентифицированных целевых конструкций предметной области 93 и их идентификационных данных.[133] Fig. 25, by way of example and not limitation, shows a general diagram of the execution of the steps of step 1012 of forming the final data structure 12. Preferably, without limitation, step 1012 is characterized by: executing step 10121 of forming elements 93 of the final data structure 12, in which, based on the information contained in the third user database and in the ninth data structure 10, as well as in accordance with the current formalized model of the target construct of the subject area, elements 93 of the final data structure 12 are identified and formed, which are the target constructs of the subject area 93, as well as the identification data of the target constructs of the subject area 93, representing: values 931 of the target constructs of the subject area 93, and ordinal numbers 932 of the target constructs of the subject area 93 in the final data structure 12; performing stage 10122 of forming the final data structure 12, at which the final data structure 12 is formed from the identified target structures of the subject area 93 and their identification data.
[134] На фиг. 26, в качестве примера, но не ограничения, изображена общая структура сформированной итоговой структуры данных 12. Предпочтительно, не ограничиваясь, итоговая структура данных 12 (итоговая СД 12) содержит элементы 93 итоговой структуры данных 12, представляющие собой целевые конструкции предметной области 93 (ЦКПО 93) каждого лингвистического предложения 51, 52, 53 четвертой структуры данных 5 и идентификационные данные упомянутых целевых конструкций предметной области 93, представляющие собой в качестве примера, но не ограничения значения 931 упомянутых элементов 93 и порядковые номера 932 упомянутых элементов 93 в итоговой структуре данных 12.[134] Fig. 26, by way of example and not limitation, shows the general structure of the generated final data structure 12. Preferably, without limitation, the final data structure 12 (final SD 12) contains elements 93 of the final data structure 12, which represent target constructions of the subject area 93 (TCS 93) of each linguistic sentence 51, 52, 53 of the fourth data structure 5 and identification data of said target constructions of the subject area 93, which represent, by way of example and not limitation, values 931 of said elements 93 and ordinal numbers 932 of said elements 93 in the final data structure 12.
[135] Предпочтительно, не ограничиваясь, целевые конструкции предметной области 93 (ЦКПО 93) лингвистического предложения 51, 52, 53 четвертой структуры данных 5 представляют собой одноэлементные, многоэлементные или смешанные конструкции. Предпочтительно, одноэлементные конструкции - это такие элементы 93 итоговой структуры данных 12, которые фактически идентичны элементам 92 девятой структуры данных 10 - базовым конструкциям предметной области 92 (БКПО 92); иными словами, вид (состав элементов) целевой конструкции предметной области 93 у одноэлементных конструкций совпадает с видом (составом элементов) базовой конструкцией предметной области 92. При этом, предпочтительно, все идентифицированные элементы ЦКПО 93 имеют одинаковые уникальные функциональные наименования.[135] Preferably, without limitation, the target constructions of the subject area 93 (TCS 93) of the linguistic sentence 51, 52, 53 of the fourth data structure 5 are single-element, multi-element or mixed constructions. Preferably, single-element constructions are such elements 93 of the final data structure 12 that are actually identical to the elements 92 of the ninth data structure 10 - the basic constructions of the subject area 92 (BCS 92); in other words, the type (composition of elements) of the target construction of the subject area 93 in single-element constructions coincides with the type (composition of elements) of the basic construction of the subject area 92. In this case, preferably, all identified elements of the TCS 93 have the same unique functional names.
[136] Предпочтительно, не ограничиваясь, многоэлементные конструкции, подразумевают наличие как минимум двух элементов ЦКПО 93 различных уникальных функциональных наименований, а также выполнение условий, при которых отдельные БКПО 92 идентифицируют как элементы ЦКПО 93 различных уникальных функциональных наименований, а также выполнения правил объединения идентифицированных БКПО 92 различных уникальных функциональных наименований в многоэлементную конструкцию. Предпочтительно, не ограничиваясь, смешанные конструкции подразумевают наличие в ЦКПО 93 как одноэлементных конструкций, так и многоэлементных конструкций.[136] Preferably, but not limited to, multi-element structures imply the presence of at least two elements of the CKPO 93 of different unique functional names, as well as the fulfillment of conditions under which individual BKPO 92 are identified as elements of the CKPO 93 of different unique functional names, as well as the fulfillment of rules for combining the identified BKPO 92 of different unique functional names into a multi-element structure. Preferably, but not limited to, mixed structures imply the presence in the CKPO 93 of both single-element structures and multi-element structures.
[137] Предпочтительно, не ограничиваясь, в связи с наличием вышеописанных видов конструкций элементов 93 (одноэлементные, многоэлементные, смешанные конструкции), целевые конструкции предметной области 93 могут состоять из БКПО 92 двух видов - главная БКПО 92.1 и дополнительные БКПО 92.Y; при этом одноэлементные конструкции содержат только одну главную БКПО 92.1, а многоэлементные конструкции содержат одну главную БКПО 92.1, но, также содержат дополнительно еще и одну или несколько дополнительных БКПО 92.Y, где Y≥2 - порядковый индекс БКПО 92 уникального наименования в составе ЦКПО 93.[137] Preferably, without limitation, in connection with the presence of the above-described types of element structures 93 (single-element, multi-element, mixed structures), the target structures of the subject area 93 can consist of two types of BCPO 92 - the main BCPO 92.1 and additional BCPO 92.Y; in this case, single-element structures contain only one main BCPO 92.1, and multi-element structures contain one main BCPO 92.1, but also additionally contain one or more additional BCPO 92.Y, where Y≥2 is the ordinal index of the BCPO 92 of the unique name in the composition of the CCO 93.
[138] В качестве примера, но не ограничения, можно продемонстрировать главные БКПО 92.1 и дополнительные БКПО 92.Y в предметной области права; при этом необходимо пояснить, что в предметной области права целевой конструкцией предметной области 93 (ЦКПО 93), в качестве примера, но не ограничения, может быть конструкция правовой нормы. В отличии от состава структурных элементов правовой нормы (гипотеза, диспозиция, санкция) состав элементов правовой нормы (конструкция правовой нормы) является дискуссионным вопросом в юридическом сообществе. Существуют множество концепций, касающихся состава правовых норм, среди которых можно выделить следующие основные группы по конструкциям (составу) правовой нормы: правовые нормы, регулирующие правоотношения в повседневной жизни, представляющие собой двухэлементные конструкции, состоящие, как минимум, из структурных частей правовой нормы «диспозиция» и «санкция»; правовые нормы, устанавливающие нормативные определения отдельным субъектам или объектам правоотношений, представляющие собой одноэлементные конструкции, состоящие, как минимум, из структурной части правовой нормы «диспозиция»; правовые нормы, устанавливающие принципы, гарантии, декларации, представляющие собой одноэлементные конструкции, состоящие, как минимум, из структурной части правовой нормы «диспозиция»; правовые нормы, имеющие одноэлементную или двухэлементную конструкцию, и содержащие структурную часть правовой нормы, обосновывающую диспозицию, причем такая диспозиция представляет собой результат или последствие исполнения правил и/или условий, установленных в иных нормативных правилах, подтверждающих для диспозиции статус актуальной (действующей и допустимой) для ее применения в конкретной отрасли (институте, субинституте) права, на базе конкретных правовых принципов, гарантий и деклараций, в конкретных правовых обстоятельствах, на конкретных территориях, в конкретный временной период. Такие иные нормативные правила будут являться для упомянутых диспозиций их неотъемлемой структурной частью - гипотезой. При этом количество таких гипотез может не ограничиваться одной, а представлять собой конструкцию гипотез, среди которых актуальность диспозиции будут обосновывать не одна, а несколько гипотез. Кроме этого, в такой конструкции гипотез могут присутствовать не только гипотезы, обосновывающие актуальность диспозиции, но и гипотезы, обосновывающие актуальность гипотез, входящих в конструкцию гипотез. Предпочтительно, не ограничиваясь, таким образом ЦКПО 93 включает элементы 92.1 и 92.Y девятой структуры данных 10.[138] As an example, but not a limitation, it is possible to demonstrate the main BKPO 92.1 and additional BKPO 92.Y in the subject area of law; it is necessary to explain that in the subject area of law the target construction of subject area 93 (TCPO 93), as an example, but not a limitation, can be the construction of a legal norm. In contrast to the composition of the structural elements of a legal norm (hypothesis, disposition, sanction), the composition of the elements of a legal norm (the construction of a legal norm) is a controversial issue in the legal community. There are many concepts concerning the composition of legal norms, among which the following main groups can be distinguished according to the constructions (composition) of a legal norm: legal norms regulating legal relations in everyday life, which are two-element constructions consisting, at a minimum, of the structural parts of the legal norm “disposition” and “sanction”; legal norms establishing normative definitions for individual subjects or objects of legal relations, representing single-element constructions consisting, at a minimum, of the structural part of the legal norm "disposition"; legal norms establishing principles, guarantees, declarations, representing single-element constructions consisting, at a minimum, of the structural part of the legal norm "disposition"; legal norms having a single-element or dual-element construction and containing a structural part of the legal norm justifying the disposition, wherein such disposition represents the result or consequence of the execution of the rules and/or conditions established in other normative rules confirming the status of the disposition as relevant (valid and permissible) for its application in a specific branch (institution, sub-institution) of law, on the basis of specific legal principles, guarantees and declarations, in specific legal circumstances, in specific territories, in a specific time period. Such other normative rules will be an integral structural part - a hypothesis - for the aforementioned dispositions. In this case, the number of such hypotheses may not be limited to one, but represent a construction of hypotheses, among which the relevance of the disposition will be substantiated not by one, but by several hypotheses. In addition, such a construction of hypotheses may contain not only hypotheses substantiating the relevance of the disposition, but also hypotheses substantiating the relevance of the hypotheses included in the construction of hypotheses. Preferably, without being limited in this way, the CCP 93 includes elements 92.1 and 92.Y of the ninth data structure 10.
[139] Предпочтительно, не ограничиваясь, целевые конструкции предметной области 93 лингвистического предложения 51, 52, 53 четвертой структуры данных 5, состоящие из элементов 92 двух видов - 92.1 и 92.Y, имеют идентификационные данные ЦКПО 93: в качестве примера, но не ограничения, значения 931 ЦКПО 93, состоящие из значений 921.1 и 921.Y элементов 92.1 и 92.Y, и порядковые номера 932 ЦКПО 93, являющиеся порядковыми номерами 932 ЦКПО 93 в итоговой структуре данных 12.[139] Preferably, without limitation, the target constructions of the subject area 93 of the linguistic sentence 51, 52, 53 of the fourth data structure 5, consisting of elements 92 of two types - 92.1 and 92.Y, have identification data of the CPC 93: as an example, but not limitation, values 931 of the CPC 93, consisting of values 921.1 and 921.Y of elements 92.1 and 92.Y, and ordinal numbers 932 of the CPC 93, which are ordinal numbers 932 of the CPC 93 in the final data structure 12.
[140] Предпочтительно, не ограничиваясь, значениями 931 ЦКПО 93 являются значения 921.1 и 921.Y соответствующих элементов 92.1 и 92.Y соответствующей БКПО 92 девятой структуры данных 10, из которых сформирована соответствующая ЦКПО 93.[140] Preferably, without limitation, the values 931 of the CPC 93 are the values 921.1 and 921.Y of the corresponding elements 92.1 and 92.Y of the corresponding BKPO 92 of the ninth data structure 10, from which the corresponding CPC 93 is formed.
[141] Предпочтительно, не ограничиваясь, порядковыми номерами 932 ЦКПО 93 являются порядковые номера 932 ЦКПО 93 в итоговой структуре данных 12. В структуре данных ЦКПО 93 в качестве примера, но не ограничения каждый элемент 93 может именоваться как «ЦКПО1», «ЦКПО2», «ЦКПО3», «ЦКПОn», где n≥1 - порядковый номер элемента ЦКПО 93 в итоговой структуре данных 12. Предпочтительно, не ограничиваясь, порядковую нумерацию элементов 93 в массиве целевых конструкций предметной области лингвистического предложения 51, 52, 53 четвертой структуры данных 5 производят следующим образом: порядковый номер «1» получает ЦКПО 93, сформированная из лингвистического предложения 51, 52, 53 с порядковым номером «1», состоящая из БКПО 92 с порядковым номером «1»; если же в лингвистическом предложении 51, 52, 53 с порядковым номером «1» элемент 92 с порядковым номером «1» относится к дополнительному БКПО 92 (92.Y), то порядковый номер «1» получает такая ЦКПО 93, которая имеет минимальное число БКПО 92.Y с минимальным порядковым номером; порядковый номер «2» получает такая ЦКПО 93, в которой элементы БКПО 92.Y имеют больший порядковый номер БКПО 92.Y, чем в ЦКПО 93 с порядковым номером «1», или, если таких же БКПО 92.Y нет, то такая ЦКПО 93, в которой элементы БКПО 92.1 имеют больший порядковый номер БКПО 92.1, чем в ЦКПО 93 с порядковым номером «1»; и так далее по такому же принципу нумеруются порядковым номером все элементы 93 итоговой структуры данных 12 СМД.[141] Preferably, without being limited to, the ordinal numbers 932 of the CPC 93 are the ordinal numbers 932 of the CPC 93 in the final data structure 12. In the data structure of the CPC 93, by way of example but not limitation, each element 93 may be referred to as "CPC1", "CPC2", "CPC3", "CPCn", where n≥1 is the ordinal number of the element of the CPC 93 in the final data structure 12. Preferably, without being limited to, the ordinal numbering of the elements 93 in the array of target constructions of the subject area of the linguistic sentence 51, 52, 53 of the fourth data structure 5 is performed as follows: the ordinal number "1" is received by the CPC 93 formed from the linguistic sentence 51, 52, 53 with the ordinal number "1", consisting of the BKPO 92 with the ordinal number "1"; if in linguistic sentence 51, 52, 53 with ordinal number "1" element 92 with ordinal number "1" refers to additional BCPO 92 (92.Y), then ordinal number "1" is received by such BCPO 93, which has the minimum number of BCPO 92.Y with the minimum ordinal number; ordinal number "2" is received by such BCPO 93, in which elements of BCPO 92.Y have a higher ordinal number of BCPO 92.Y than in BCPO 93 with ordinal number "1", or, if there are no such BCPO 92.Y, then such BCPO 93, in which elements of BCPO 92.1 have a higher ordinal number of BCPO 92.1 than in BCPO 93 with ordinal number "1"; and so on, according to the same principle, all elements of the 93 final data structure 12 SMD are numbered with a serial number.
[142] Предпочтительно, не ограничиваясь, идентификацию и формирование ЦКПО 93 итоговой структуры данных производят в ходе этапа 10121 пошагово. На первом шаге этапа 10121 производят идентификацию главных БКПО 92.1 ЦКПО 93. На втором шаге этапа 10121 производят идентификацию дополнительных БКПО 92.Y ЦКПО 93 для идентифицированных элементов БКПО 92.1 многоэлементных конструкций ЦКПО 93. На третьем шаге этапа 10121 производится объединение идентифицированных главных БКПО 92.1 ЦКПО 93 и дополнительных БКПО 92.Y ЦКПО 93 (если такие были идентифицированы для соответствующих БКПО 92.1) для формирования ЦКПО 93 лингвистического предложения 51, 52, 53 четвертой структуры данных 5.[142] Preferably, but not limited to, the identification and formation of the final data structure CKPO 93 is performed in the course of step 10121 in a step-by-step manner. In the first step of step 10121, the main BKPO 92.1 of the CKPO 93 is identified. In the second step of step 10121, the additional BKPO 92.Y of the CKPO 93 is identified for the identified elements of the BKPO 92.1 of the multi-element constructions of the CKPO 93. In the third step of step 10121, the identified main BKPO 92.1 of the CKPO 93 and the additional BKPO 92.Y of the CKPO 93 (if such were identified for the corresponding BKPO 92.1) are combined to form the CKPO 93 of the linguistic sentence 51, 52, 53 of the fourth data structure 5.
[143] Предпочтительно, не ограничиваясь, идентификацию главных БКПО 92.1 ЦКПО 93 на первом шаге этапа 10121 производят путем шестого комплексного анализа элементов девятой структуры данных 10 СМД - БКПО 92 и их идентификационных данных; такой анализ БКПО 92 производится с помощью сведений о текстовых элементах 61 и с помощью сведений из сформированной БДЛЛПП 30, а также с учетом требований к БКПО 92 как к главной БКПО 92.1, получаемых, например, не ограничиваясь, из данных таблицы корреляции базовых конструкций предметной области девятой СД 10 и актуальных элементов целевых конструкций предметной области, содержащихся в формализованной модели целевой конструкции предметной области (ФМЦКПО); целью упомянутого шестого комплексного анализа является выявление среди элементов 92 девятой структуры данных 10 таких БКПО 92, которые соответствуют требованиям к главным БКПО 92.1 ЦКПО 93.[143] Preferably, without limitation, the identification of the main BKPO 92.1 of the CKPO 93 at the first step of stage 10121 is carried out by means of the sixth complex analysis of the elements of the ninth data structure 10 of the SMD - BKPO 92 and their identification data; such analysis of BKPO 92 is carried out using information about the text elements 61 and using information from the generated BDLLPP 30, as well as taking into account the requirements for BKPO 92 as the main BKPO 92.1, obtained, for example, without limitation, from the data of the correlation table of the basic constructions of the subject area of the ninth SD 10 and the current elements of the target constructions of the subject area, contained in the formalized model of the target construction of the subject area (FMTSKPO); the purpose of the said sixth complex analysis is to identify among the elements 92 of the ninth data structure 10 such BCPO 92 that meet the requirements for the main BCPO 92.1 of the CKPO 93.
[144] Предпочтительно, не ограничиваясь, идентификацию дополнительных БКПО 92.Y ЦКПО 93 на втором шаге этапа 10121 производят путем седьмого комплексного анализа элементов девятой структуры данных 10 СМД - БКПО 92 и их идентификационных данных; такой анализ БКПО 92 производится с помощью сведений о текстовых элементах 61 и с помощью сведений из сформированной БДЛЛПП 30, а также с учетом требований к БКПО 92, как к дополнительной БКПО 92.Y, получаемых, например, не ограничиваясь, из данных таблицы корреляции базовых конструкций предметной области девятой СД 10 и актуальных элементов целевых конструкций предметной области, содержащихся в ФМЦКПО; целью упомянутого седьмого комплексного анализа является выявление среди элементов девятой структуры данных 10 таких БКПО 92, которые соответствуют требованиям к дополнительным БКПО 92.Y ЦКПО 93.[144] Preferably, without limitation, the identification of additional BCPO 92.Y TsKPO 93 in the second step of stage 10121 is carried out by means of the seventh comprehensive analysis of the elements of the ninth data structure 10 SMD - BCPO 92 and their identification data; such analysis of BCPO 92 is carried out using information about text elements 61 and using information from the generated BDLLPP 30, as well as taking into account the requirements for BCPO 92, as an additional BCPO 92.Y, obtained, for example, without limitation, from the data of the correlation table of basic constructions of the subject area of the ninth SD 10 and the current elements of the target constructions of the subject area contained in the FMCKPO; the purpose of the aforementioned seventh comprehensive analysis is to identify among the elements of the ninth data structure 10 such BCPO 92 that meet the requirements for additional BCPO 92.Y TsKPO 93.
[145] Предпочтительно, не ограничиваясь, объединение идентифицированных главных БКПО 92.1 ЦКПО 93 и дополнительных БКПО 92.Y ЦКПО 93 для формирования ЦКПО 93 на третьем шаге этапа 10121 производят путем восьмого комплексного анализа идентифицированных главных БКПО 92.1 ЦКПО 93 и дополнительных БКПО 92.Y ЦКПО 93 и их идентификационных данных; такой анализ производится с помощью сведений о текстовых элементах 61 и с помощью сведений из сформированной БДЛЛПП 30, а также с учетом требований к формированию ЦКПО 93 из главных БКПО 92.1 и дополнительных БКПО 92.Y, содержащихся в ФМЦКПО; целью упомянутого восьмого комплексного анализа является идентификация и формирование ЦКПО 93 лингвистического предложения 51, 52, 53 четвертой структуры данных 5. В качестве примера, но не ограничения, требования к формированию ЦКПО 93 из главных БКПО 92.1 и дополнительных БКПО 92.Y содержат, как минимум, следующие условия: если для главной БКПО 92.1 не идентифицировано ни одного дополнительного БКПО 92.Y, то ЦКПО 93 формируется только из одного элемента ЦКПО 93 - из БКПО 92.1; если для главной БКПО 92.1 идентифицирована одна дополнительная БКПО 92.Y, то ЦКПО 93 формируется из двух элементов ЦКПО 93 - из главной БКПО 92.1 и БКПО 92.Y; если для главной БКПО 92.1 идентифицирована более, чем одна дополнительная БКПО 92.Y, то для формирования ЦКПО 93 необходимо установить уникальное наименование дополнительной БКПО 92.Y, после чего необходимо сформировать ЦКПО 93 из главной БКПО 92.1 и дополнительных БКПО 92.Y, имеющих уникальное наименование, в соответствии с требованиями формирования ЦКПО 93 на основании формализованной модели целевой конструкции предметной области (ФМЦКПО). В качестве примера, но не ограничения, могут быть рассмотрены следующие предложения, на основе которых можно продемонстрировать этап формирования ЦКПО 93: первое: «Водитель должен вести транспортное средство со скоростью, не превышающей установленного ограничения, учитывая при этом интенсивность движения и состояние транспортного средства»; второе: «Превышение установленной скорости движения транспортного средства на величину более 20, но не более 40 километров в час влечет наложение административного штрафа в размере пятисот рублей».[145] Preferably, without limitation, the combination of the identified main BKPO 92.1 TsKPO 93 and the additional BKPO 92.Y TsKPO 93 to form the TsKPO 93 in the third step of stage 10121 is performed by means of an eighth comprehensive analysis of the identified main BKPO 92.1 TsKPO 93 and the additional BKPO 92.Y TsKPO 93 and their identification data; such analysis is performed using information about the text elements 61 and using information from the generated BDLLPP 30, as well as taking into account the requirements for the formation of the TsKPO 93 from the main BKPO 92.1 and the additional BKPO 92.Y contained in the FMCKPO; the purpose of the mentioned eighth complex analysis is the identification and formation of the CKPO 93 of the linguistic sentence 51, 52, 53 of the fourth data structure 5. As an example, but not limitation, the requirements for the formation of the CKPO 93 from the main BKPO 92.1 and additional BKPO 92.Y contain, at a minimum, the following conditions: if no additional BKPO 92.Y is identified for the main BKPO 92.1, then the CKPO 93 is formed from only one element of the CKPO 93 - from BKPO 92.1; if one additional BKPO 92.Y is identified for the main BKPO 92.1, then the CKPO 93 is formed from two elements of the CKPO 93 - from the main BKPO 92.1 and BKPO 92.Y; If more than one additional BKPO 92.Y is identified for the main BKPO 92.1, then in order to form the CKPO 93 it is necessary to establish a unique name for the additional BKPO 92.Y, after which it is necessary to form the CKPO 93 from the main BKPO 92.1 and additional BKPO 92.Y that have a unique name, in accordance with the requirements for forming the CKPO 93 based on the formalized model of the target design of the subject area (FMTSKPO). As an example, but not a limitation, the following sentences can be considered, on the basis of which it is possible to demonstrate the stage of forming the CKPO 93: first: "The driver must drive a vehicle at a speed not exceeding the established limit, taking into account the traffic intensity and the condition of the vehicle"; second: "Exceeding the established speed of a vehicle by more than 20 but not more than 40 kilometers per hour shall entail the imposition of an administrative fine in the amount of five hundred rubles."
[146] Из рассматриваемого первого предложения на этапе 1010 сформированы следующие итоговые суждения 91 (таблица №16):[146] From the first sentence under consideration at stage 1010, the following final judgments 91 were formed (table No. 16):
[147] Таблица №16:[147] Table No. 16:
[148] Из рассматриваемого второго предложения на этапе 1010 сформированы следующие итоговые суждения 91 (таблица №17):[148] From the second sentence under consideration at stage 1010, the following final judgments 91 were formed (table No. 17):
[149] Таблица №17:[149] Table No. 17:
[150] Из рассматриваемого первого предложения на этапе 1011 сформированы следующие базовые конструкции предметной области 92, представляющие собой в предметной области права структурные части правовых норм (таблицы №18 и №19):[150] From the first sentence under consideration at stage 1011, the following basic constructions of subject area 92 were formed, which represent structural parts of legal norms in the subject area of law (tables No. 18 and No. 19):
[151] Таблица №18:[151] Table No. 18:
ПС 81No.
PS 81
[152] Таблица №19:[152] Table No. 19:
ПС 81No.
PS 81
[153] Из рассматриваемого второго предложения на этапе 1011 сформированы следующие БКПО 92, представляющие собой в предметной области права структурные части правовых норм (таблицы №20 и №21):[153] From the second sentence under consideration, at stage 1011, the following BKPO 92 were formed, which represent structural parts of legal norms in the subject area of law (tables No. 20 and No. 21):
[154] Таблица №20:[154] Table No. 20:
ПС 81No.
PS 81
[155] Таблица №21:[155] Table No. 21:
ПС 81No.
PS 81
[156] Из рассматриваемых первого и второго предложений на этапе 1012 сформированы следующие ЦКПО 93, представляющие собой в предметной области права правовые нормы, представляющие собой, согласно формализованной модели целевой конструкции предметной области, двухэлементные конструкции правовой нормы, состоящие из структурных частей правовой нормы «диспозиция» и «санкция» (таблицы №22, №23, №24, №25):[156] From the first and second sentences considered at stage 1012, the following CCPO 93 were formed, which represent legal norms in the subject area of law, which, according to the formalized model of the target design of the subject area, are two-element designs of a legal norm, consisting of the structural parts of the legal norm “disposition” and “sanction” (tables No. 22, No. 23, No. 24, No. 25):
[157] Таблица №22:[157] Table No. 22:
ПС 81No.
PS 81
[158] Таблица №23:[158] Table No. 23:
ПС 81No.
PS 81
[159] Таблица №24:[159] Table No. 24:
ПС 81No.
PS 81
[160] Таблица №25[160] Table No. 25
ПС 81No.
PS 81
[161] Такие идентификация и формирование ЦКПО 93 итоговой СД 12 могут быть выполнены любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такие идентификация и формирование могут быть выполнены традиционно специалистом-юристом, или же на основе традиционного программирования путем решения задач с помощью кодирования неизменяемых правил (IT-решение «по правилам») с использованием программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети, систем ИИ) посредством применения технологии обучения нейросети (систем ИИ).[161] Such identification and formation of the final SD 12 CPC 93 may be performed by any method known from the state of the art and, accordingly, is not described in detail below. For example, without limitation, such identification and formation may be performed traditionally by a legal specialist, or based on traditional programming by solving problems using the coding of unchangeable rules (IT solution "by rules") using the software algorithm of the linguistic (syntactic) processor. Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network, AI systems) by using the technology of training the neural network (AI systems).
[162] Предпочтительно, не ограничиваясь, формирование итоговой структуры данных 12 в ходе этапа 10122 производят путем объединения в одной структуре данных элементов 93 (ЦКПО 93) итоговой структуры данных 12, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.[162] Preferably, without limitation, the formation of the final data structure 12 during step 10122 is carried out by combining in one data structure the elements 93 (DCS 93) of the final data structure 12, as well as their identification data, according to principles and methods known from the prior art, which, accordingly, are not described in detail below.
[163] На фиг. 27, в качестве примера, но не ограничения, проиллюстрирована примерная схема системы 2000 преобразования структурированного массива данных, которая в предпочтительном варианте реализации содержит, по меньшей мере, одно или более компьютерных устройств 2001 преобразования структурированного массива данных, содержащих, по меньшей мере, один или более процессоров 20011 и память 20012. Упомянутые устройства 2001 преобразования структурированного массива данных могут представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет и тому подобное. Память (машиночитаемый носитель данных) 20012 устройства 2001 преобразования структурированного массива данных, содержит код программы, который при выполнении побуждает упомянутые один или более процессоры 20011 упомянутого устройства 2001 выполнять действия описанных ранее способов преобразования структурированного массива данных. В некоторых случаях компьютерное устройство 2001 может представлять собой серверное компьютерное устройство, связанное с пользовательским компьютерным устройством, выполненным с возможностью передачи серверному компьютерному устройству 2001 команды или команд, побуждающих процессор или процессоры 20011 серверного компьютерного устройства выполнять код программы, который при выполнении процессором или процессорами серверного компьютерного устройства 20011 побуждает процессор или процессоры 20011 серверного компьютерного устройства выполнять действия какого-либо из описанных ранее способов преобразования структурированного массива данных. Пользовательское компьютерное устройство 2002 может представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет, тонкий клиент и тому подобное. Пользовательское компьютерное устройство 2002 может быть связано с серверным компьютерным устройством 2001 посредством проводного или беспроводного соединения. Упомянутая память 20012 компьютерного устройства 2001 (серверного компьютерного устройства 2001) содержит подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, а также может содержать любую из описанных ранее структур данных для какого-либо из описанных ранее способов преобразования структурированного массива данных. Более того, подлежащие преобразованию один или несколько структурированных массивов данных, пользовательские базы данных, другие базы данных, модели и таблицы данных, другие данные могут являться загружаемыми и храниться, в частности, в базе данных 2003 системы преобразования структурированного массива данных. В качестве примера, но не ограничения, машиночитаемый носитель данных (память 20012) может включать в себя оперативную память (RAM); постоянное запоминающее устройство (ROM); электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM); флэш-память или другие технологии памяти; CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для кодирования требуемой информации, и к которому может быть осуществлен доступ посредством устройства 2001. Память включает в себя носитель данных на основе запоминающего устройства компьютера в форме энергозависимой или энергонезависимой памяти, или их комбинации. Примерные аппаратные устройства включают в себя твердотельную память, накопители на жестких дисках, накопители на оптических дисках и так далее. В памяти хранится примерная среда, в которой при помощи компьютерных команд или кодов, хранящихся в памяти устройства, может быть осуществлена процедура преобразования структурированного массива данных. Устройство содержит один или более процессоров 20011, которые предназначены для выполнения компьютерных команд или кодов, хранящихся в памяти устройства с целью обеспечения выполнения процедуры преобразования структурированного массива данных. Компьютерные команды или коды, хранящиеся в памяти, предназначены для выполнения преобразования структурированного массива данных. Система 2000 также может включать в себя базу данных (БД) 2003. БД 2003 может представлять собой, но не ограничиваясь: иерархическую БД, сетевую БД, реляционную БД, объектную БД, объектно-ориентированную БД, объектно-реляционную БД, пространственную БД, комбинацию перечисленных двух и более БД, и тому подобное. БД 2003 хранит данные в памяти, которая может представлять собой, но не ограничиваясь: постоянное запоминающее устройство (ROM), электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для хранения требуемой информации, и к которому может быть осуществлен доступ посредством устройства 2001 преобразования структурированного массива данных. БД 2003 служит для хранения данных, представляющих собой, по меньшей мере, команды для выполнения этапов описанных ранее способов преобразования структурированного массива данных; подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, или одну из описанных ранее исходных для какого-либо способа преобразования структур данных, которые могут быть загружены в память 20012 устройства 2001 преобразования структурированного массива данных; и других данных, необходимых для функционирования системы. Примерная система 2000 преобразования структурированного массива данных дополнительно может содержать серверное компьютерное устройство 2001, которое помимо описанных ранее функций, сохраняет и содействует манипуляции компьютерными командами или кодами, ранее описанными в данном документе, которые, соответственно, дополнительно не описываются. Серверное компьютерное устройство 2001, помимо описанных ранее функций, может обеспечивает регулирование обменом данных в системе 2000 преобразования структурированного массива данных, а также обеспечивает обработку данных при условии подключения к нему одного или более чем одного пользовательских компьютерных устройств 2002. В этом случае все вычислительные мощности, необходимые для обеспечения выполнения процедуры преобразования структурированного массива данных, расположены на серверном компьютерном устройстве 2001. Система 2000 так же может содержать одну или более сетей 2004 передачи данных. Сети 2004 передачи данных могут включать в себя, но не ограничиваться, одну или более локальных сетей (LAN) и/или глобальных сетей (WAN), или могут представлять собой информационно-телекоммуникационную сеть Интернет, или Интранет, или виртуальную частную сеть (VPN), или их комбинацию, и тому подобное. Серверное компьютерное устройство 2001 также имеет возможность обеспечивать виртуальную вычислительную среду (Virtual Machine) для обеспечения взаимодействия между пользовательским компьютерным устройством 2002 и БД 2003. Сеть 2004 служит для обеспечения взаимодействия между компьютерным устройством 2001, базой данных 2003 и пользовательским компьютерным устройством 2002 системы 2000 преобразования структурированного массива данных. При этом пользовательское компьютерное устройство 2002 может быть связано с серверным компьютерным устройством 2001 напрямую, используя известные из уровня техники проводные и беспроводные способы и методы связи, которые, соответственно, далее не подробно не описываются. Упомянутые устройства 2001, 2002, в качестве примера, но не ограничения, могут быть снабжены устройствами ввода-вывода (i/o), пригодными для предоставления пользователю результатов выполнения тех или иных описанных ранее этапов какого-либо из заявленных способов, описанных со ссылкой на фиг. 1-26.[163] In Fig. 27, by way of example and not limitation, an exemplary diagram of a structured data transformation system 2000 is illustrated, which in a preferred embodiment comprises at least one or more computer devices 2001 for transforming a structured data array, comprising at least one or more processors 20011 and a memory 20012. Said devices 2001 for transforming a structured data array may be, but are not limited to: a personal computer, a laptop computer, a tablet computer, a pocket computer, a smartphone, a phablet, and the like. The memory (machine-readable storage medium) 20012 of the device 2001 for transforming a structured data array contains program code that, when executed, causes said one or more processors 20011 of said device 2001 to perform the actions of the previously described methods for transforming a structured data array. In some cases, the computing device 2001 may be a server computing device associated with a user computing device configured to transmit to the server computing device 2001 a command or commands causing the processor or processors 20011 of the server computing device to execute a program code that, when executed by the processor or processors of the server computing device 20011, causes the processor or processors 20011 of the server computing device to perform actions of any of the previously described methods for converting a structured array of data. The user computing device 2002 may be, but is not limited to: a personal computer, a portable computer, a tablet computer, a pocket computer, a smartphone, a phablet, a thin client, and the like. The user computing device 2002 may be associated with the server computing device 2001 via a wired or wireless connection. The mentioned memory 20012 of the computer device 2001 (the server computer device 2001) contains one or more structured data arrays to be converted, containing at least a linguistic sentence, and may also contain any of the previously described data structures for any of the previously described methods of converting a structured data array. Moreover, the one or more structured data arrays to be converted, user databases, other databases, models and data tables, other data may be loadable and stored, in particular, in the database 2003 of the structured data array conversion system. As an example, but not limitation, the machine-readable data carrier (memory 20012) may include random access memory (RAM); read-only memory (ROM); electrically erasable programmable read-only memory (EEPROM); flash memory or other memory technologies; CDROM, digital versatile disc (DVD) or other optical or holographic data carriers; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic storage devices, carrier waves or other data carrier that can be used to encode the desired information and that can be accessed by means of the device 2001. The memory includes a data carrier based on a computer storage device in the form of volatile or non-volatile memory, or a combination thereof. Exemplary hardware devices include solid-state memory, hard disk drives, optical disk drives, etc. An exemplary medium is stored in the memory, in which a procedure for converting a structured data array can be carried out using computer instructions or codes stored in the device memory. The device contains one or more processors 20011, which are designed to execute computer instructions or codes stored in the device memory in order to ensure execution of the procedure for converting a structured data array. The computer instructions or codes stored in the memory are designed to perform the conversion of the structured data array. The system 2000 may also include a database (DB) 2003. The DB 2003 may be, but is not limited to: a hierarchical DB, a network DB, a relational DB, an object DB, an object-oriented DB, an object-relational DB, a spatial DB, a combination of two or more of these DBs, and the like. The DB 2003 stores data in a memory that may be, but is not limited to: a read-only memory (ROM), an electrically erasable programmable read-only memory (EEPROM), a flash memory, a CDROM, a digital versatile disk (DVD), or other optical or holographic storage media; magnetic cassettes, magnetic tape, magnetic disk storage device, or other magnetic storage devices, carrier waves, or other storage medium that can be used to store the required information and that can be accessed by means of the structured data array conversion device 2001. The DB 2003 serves to store data representing at least commands for performing the stages of the previously described methods of transforming a structured data array; one or more structured data arrays to be transformed, containing at least a linguistic sentence, or one of the previously described initial data structures for any method of transforming, which can be loaded into the memory 20012 of the device 2001 for transforming a structured data array; and other data necessary for the functioning of the system. The exemplary system 2000 for transforming a structured data array may additionally contain a server computer device 2001, which, in addition to the previously described functions, stores and facilitates the manipulation of computer commands or codes previously described in this document, which, accordingly, are not further described. The server computer device 2001, in addition to the functions described earlier, can provide for the regulation of data exchange in the system 2000 for converting a structured data array, and also provides for data processing provided that one or more user computer devices 2002 are connected to it. In this case, all computing power required to ensure the execution of the structured data array conversion procedure is located on the server computer device 2001. The system 2000 can also contain one or more data transmission networks 2004. The data transmission networks 2004 can include, but are not limited to, one or more local area networks (LAN) and/or wide area networks (WAN), or can represent the Internet information and telecommunications network, or an Intranet, or a virtual private network (VPN), or a combination thereof, and the like. The server computer device 2001 also has the ability to provide a virtual computing environment (Virtual Machine) for ensuring interaction between the user computer device 2002 and the DB 2003. The network 2004 serves to ensure interaction between the computer device 2001, the database 2003 and the user computer device 2002 of the structured data array transformation system 2000. In this case, the user computer device 2002 can be connected to the server computer device 2001 directly using wired and wireless communication methods and techniques known from the prior art, which, accordingly, are not described in more detail below. The mentioned devices 2001, 2002, as an example, but not limitation, can be equipped with input/output (i/o) devices suitable for providing the user with the results of performing one or another of the previously described stages of any of the claimed methods described with reference to Figs. 1-26.
[164] Настоящее описание осуществления заявленного изобретения демонстрирует лишь частные варианты осуществления и не ограничивает иные варианты реализации заявленного изобретения, поскольку возможные иные альтернативные варианты осуществления заявленного изобретения, не выходящие за пределы объема информации, изложенной в настоящей заявке, должны быть очевидными для специалиста в данной области техники, имеющим обычную квалификацию, на которого рассчитано заявленное изобретение.[164] This description of the implementation of the claimed invention demonstrates only particular embodiments and does not limit other embodiments of the claimed invention, since possible other alternative embodiments of the claimed invention, not going beyond the scope of the information set forth in this application, should be obvious to a specialist in this field of technology, having the usual qualifications for whom the claimed invention is intended.
Claims (53)
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2846351C1 true RU2846351C1 (en) | 2025-09-04 |
Family
ID=
Citations (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2544739C1 (en) * | 2014-03-25 | 2015-03-20 | Игорь Петрович Рогачев | Method to transform structured data array |
| RU2571406C1 (en) * | 2014-06-27 | 2015-12-20 | Игорь Петрович Рогачев | Method of double-level search of information in previously converted structured data array |
| RU2571405C1 (en) * | 2014-06-27 | 2015-12-20 | Игорь Петрович Рогачев | Method for preliminary conversion of structured data array |
| RU2572367C1 (en) * | 2014-06-27 | 2016-01-10 | Игорь Петрович Рогачев | Method of searching for information in pre-transformed structured data array |
| US20160224537A1 (en) * | 2015-02-03 | 2016-08-04 | Abbyy Infopoisk Llc | Method and system for machine-based extraction and interpretation of textual information |
| US20170132498A1 (en) * | 2015-11-11 | 2017-05-11 | Adobe Systems Incorporated | Structured Knowledge Modeling, Extraction and Localization from Images |
| RU2685960C1 (en) * | 2018-06-07 | 2019-04-23 | Игорь Петрович Рогачев | Method of converting structured data array, containing syntactic units |
| US10303771B1 (en) * | 2018-02-14 | 2019-05-28 | Capital One Services, Llc | Utilizing machine learning models to identify insights in a document |
| US10510000B1 (en) * | 2010-10-26 | 2019-12-17 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
| RU2713568C1 (en) * | 2019-11-10 | 2020-02-05 | Игорь Петрович Рогачев | Method of transforming structured data array |
| RU2717718C1 (en) * | 2019-11-10 | 2020-03-25 | Игорь Петрович Рогачев | Method of transforming a structured data array containing simple judgments |
| RU2717719C1 (en) * | 2019-11-10 | 2020-03-25 | Игорь Петрович Рогачев | Method of forming a data structure containing simple judgments |
Patent Citations (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10510000B1 (en) * | 2010-10-26 | 2019-12-17 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
| RU2544739C1 (en) * | 2014-03-25 | 2015-03-20 | Игорь Петрович Рогачев | Method to transform structured data array |
| RU2571406C1 (en) * | 2014-06-27 | 2015-12-20 | Игорь Петрович Рогачев | Method of double-level search of information in previously converted structured data array |
| RU2571405C1 (en) * | 2014-06-27 | 2015-12-20 | Игорь Петрович Рогачев | Method for preliminary conversion of structured data array |
| RU2572367C1 (en) * | 2014-06-27 | 2016-01-10 | Игорь Петрович Рогачев | Method of searching for information in pre-transformed structured data array |
| US20160224537A1 (en) * | 2015-02-03 | 2016-08-04 | Abbyy Infopoisk Llc | Method and system for machine-based extraction and interpretation of textual information |
| US20170132498A1 (en) * | 2015-11-11 | 2017-05-11 | Adobe Systems Incorporated | Structured Knowledge Modeling, Extraction and Localization from Images |
| US10303771B1 (en) * | 2018-02-14 | 2019-05-28 | Capital One Services, Llc | Utilizing machine learning models to identify insights in a document |
| RU2685960C1 (en) * | 2018-06-07 | 2019-04-23 | Игорь Петрович Рогачев | Method of converting structured data array, containing syntactic units |
| RU2713568C1 (en) * | 2019-11-10 | 2020-02-05 | Игорь Петрович Рогачев | Method of transforming structured data array |
| RU2717718C1 (en) * | 2019-11-10 | 2020-03-25 | Игорь Петрович Рогачев | Method of transforming a structured data array containing simple judgments |
| RU2717719C1 (en) * | 2019-11-10 | 2020-03-25 | Игорь Петрович Рогачев | Method of forming a data structure containing simple judgments |
Non-Patent Citations (1)
| Title |
|---|
| Hybridization of Intelligent Solutions Architecture for Text Understanding and Text Generation; Ivaschenko A. et al., Appl. Sci. 2021, 11, 5179, https://doi.org/10.3390/app11115179. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2846351C1 (en) | System for converting a structured data array containing information objects of a digitized document | |
| RU2840220C1 (en) | Machine-readable data medium for transforming structured data array containing information objects of digitized document | |
| RU2846324C1 (en) | Device for converting a structured data array containing information objects of a digitized document | |
| RU2841014C1 (en) | Machine-readable data medium for transforming structured data array containing information objects of digitized document | |
| RU2846326C1 (en) | System for converting structured data array containing information objects of digitized document | |
| RU2840224C1 (en) | System for converting structured data array containing information objects of digitized document | |
| RU2839824C1 (en) | Method of transforming structured data array containing information objects of digitized document | |
| RU2840629C1 (en) | Method of transforming structured data array containing information objects of digitized document | |
| RU2840233C1 (en) | System for converting structured data array containing information objects of digitized document | |
| RU2846373C1 (en) | Method of converting a structured data array containing information objects of a digitized document | |
| RU2840632C1 (en) | Machine-readable data medium for transforming structured data array containing information objects of digitized document | |
| RU2846349C1 (en) | Device for converting a structured data array containing information objects of a digitized document | |
| RU2844756C1 (en) | Device for converting a structured data array containing information objects of a digitized document | |
| RU2846325C1 (en) | System for converting structured data array containing information objects of digitized document | |
| RU2846371C1 (en) | System for converting a structured data array containing information objects of a digitized document | |
| RU2846361C1 (en) | Method of transforming structured data array containing information objects of digitized document | |
| RU2841039C1 (en) | Method of transforming structured data array containing information objects of digitized document | |
| RU2841477C1 (en) | Machine-readable data medium for transforming the structured data array containing information objects of the digitized document | |
| RU2840623C1 (en) | System for converting structured data array containing information objects of digitized document | |
| RU2841016C1 (en) | Method of transforming structured data array containing information objects of digitized document | |
| RU2846367C1 (en) | Method of transforming a structured data array containing information objects of a digitized document | |
| RU2846363C1 (en) | Method of transforming structured data array containing information objects of digitized document | |
| RU2846369C1 (en) | Device for converting a structured data array containing information objects of a digitized document | |
| RU2840232C1 (en) | System for converting structured data array containing information objects of digitized document | |
| RU2846355C1 (en) | System for converting a structured data array containing information objects of a digitized document |