[go: up one dir, main page]

RU2732071C1 - Method and system for automatic legal decision-making - Google Patents

Method and system for automatic legal decision-making Download PDF

Info

Publication number
RU2732071C1
RU2732071C1 RU2019139543A RU2019139543A RU2732071C1 RU 2732071 C1 RU2732071 C1 RU 2732071C1 RU 2019139543 A RU2019139543 A RU 2019139543A RU 2019139543 A RU2019139543 A RU 2019139543A RU 2732071 C1 RU2732071 C1 RU 2732071C1
Authority
RU
Russia
Prior art keywords
document
legal
extracted
documents
decision
Prior art date
Application number
RU2019139543A
Other languages
Russian (ru)
Inventor
Михаил Валерьевич Карпец
Искандер Наилевич Накипов
Илья Вячеславович Денисов
Ярослав Игоревич Емельянов
Ольга Сергеевна Волкова
Михаил Юрьевич Новиков
Максим Викторович Кузнецов
Марина Валериевна Бурлакова
Дарья Андреевна Крылова
Глеб Игоревич Клыков
Сергей Александрович Шульга
Original Assignee
Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) filed Critical Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк)
Priority to RU2019139543A priority Critical patent/RU2732071C1/en
Priority to PCT/RU2019/000887 priority patent/WO2021112704A1/en
Priority to EA201992843A priority patent/EA039140B1/en
Application granted granted Critical
Publication of RU2732071C1 publication Critical patent/RU2732071C1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

FIELD: computer equipment.SUBSTANCE: invention relates to computer engineering. Technical result is achieved by the fact that the system for automatic legal decision making comprises a system for intelligent recognition of documents, including a processing module, which performs a request to form a legal solution, obtaining at least one document associated with said request, an entity extraction module which enables to detect at least one entity relating to the request of the legal decision in the document, and its extraction from a document using a machine learning algorithm, an automated decision making system which enables legal analysis of said at least one extracted entity using a set of rules generated using the object-oriented language, generation of a legal solution based on the legal analysis of said extracted entities of said at least one document.EFFECT: technical result consists in providing automated verification of documents for making a legal decision based on the incoming request.22 cl, 10 dwg

Description

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

[0001] Данное техническое решение, в общем, относится к вычислительной области техники, а в частности, к способам и системам автоматического принятия правового решения на основании обработки документов.[0001] This technical solution generally relates to the computing field, and in particular to methods and systems for automatic legal decision-making based on document processing.

УРОВЕНЬ ТЕХНИКИTECHNOLOGY LEVEL

[0002] В настоящее время работа юридического департамента крупной компании сопряжена не только с анализом и обработкой больших массивов данных, но и с необходимостью внедрения комплексных систем автоматизации учета, контроля и управления данными, например, о контрагентах.[0002] Currently, the work of the legal department of a large company is associated not only with the analysis and processing of large amounts of data, but also with the need to implement complex automation systems for accounting, control and management of data, for example, about counterparties.

[0003] Общее ускорение бизнес-процессов приводит к тому, что юристам необходимо подготавливать документы и принимать решения в кратчайшие сроки, обрабатывая при этом большие массивы данных. В результате этого становится невозможно эффективно выполнять задачи, работая устаревшими методами, ведя расчеты на бумаге или в стандартных программах, контролируя ход дел по обычным календарям и спискам. Ручная обработка и проверка данных о контрагентах на основании большого объема информации может привести к катастрофическим ошибкам для бизнеса.[0003] General acceleration of business processes leads to the fact that lawyers need to prepare documents and make decisions in the shortest possible time, while processing large amounts of data. As a result, it becomes impossible to efficiently complete tasks using outdated methods, conducting calculations on paper or in standard programs, monitoring the progress of affairs using ordinary calendars and lists. Manual processing and verification of counterparty data based on a large amount of information can lead to catastrophic business errors.

[0004] Из уровня техники известны различные технические решения в области подходов по автоматизации анализа данных, относящихся к юридическим текстам или иному виду нормативно-правовых документов. Например, в патенте США US 6772149 (правообладатель: LexisNexis Group, дата публикации: 03.08.2004) раскрывается подход по машинному анализу текстов судебных актов, с помощью выявления юридических фактов, содержащихся в теле того или иного документа с их последующей классификацией, которая впоследствии может применяться для обучения модели машинного обучения.[0004] Various technical solutions are known from the prior art in the field of approaches to automate the analysis of data related to legal texts or other types of regulatory documents. For example, US patent US 6772149 (copyright holder: LexisNexis Group, publication date: 08/03/2004) discloses an approach to machine analysis of the texts of judicial acts, by identifying legal facts contained in the body of a document with their subsequent classification, which can subsequently used to train a machine learning model.

[0005] Из другой патентной заявки США US 20190266196 (правообладатель: Confidentiality Corp, дата публикации: 29.08.2019) известно решение по анализу документов, содержащих, например, юридические тексты, для целей выявления связанных документов по тому или иному типу связей (фактов, атрибутов и т.п.) и выявлению схожих документов или их частей.[0005] From another US patent application US20190266196 (copyright holder: Confidentiality Corp, publication date: 08/29/2019), a solution is known for the analysis of documents containing, for example, legal texts, in order to identify related documents for one or another type of relationship (facts, attributes, etc.) and identifying similar documents or parts of them.

[0006] Известные из уровня техники решения тем или иным образом позволяют оптимизировать юридическую деятельность под заданные условия, передав часть работы на автоматизацию, однако не обеспечивают комплексного решения задачи по автоматизации всего процесса принятия правового решения, в частности, принятие правового решения по заранее заданному запросу на основании любых документов клиента, определяя степень их относимости к рассматриваемому вопросу, выявляя наличие в них имеющих значение для решения поставленной задачи юридических фактов, анализируя выявленные юридические факты (при их наличии), выявляя и обрабатывая при этом недостатки в заполнении данных документов.[0006] The solutions known from the prior art in one way or another allow you to optimize legal activities for the given conditions, transferring part of the work to automation, but do not provide a comprehensive solution to the problem of automating the entire process of making a legal decision, in particular, making a legal decision on a predetermined request on the basis of any documents of the client, determining the degree of their relevance to the issue under consideration, identifying the presence in them of legal facts that are important for solving the task, analyzing the identified legal facts (if any), identifying and processing shortcomings in filling out these documents.

СУЩНОСТЬ ТЕХНИЧЕСКОГО РЕШЕНИЯESSENCE OF THE TECHNICAL SOLUTION

[0007] Заявленное техническое решение предлагает новый подход в области алгоритмизации проведения правовой экспертизы и формирования юридических заключений по заданной теме.[0007] The claimed technical solution proposes a new approach in the field of algorithmic legal expertise and the formation of legal opinions on a given topic.

[0008] Решаемой технической проблемой или технической задачей является создание автоматизированного способа принятия правовых решений и системы формирования юридических заключений.[0008] The technical problem or technical problem to be solved is the creation of an automated method for making legal decisions and a system for forming legal opinions.

[0009] Основным техническим результатом, достигающимся при решении вышеуказанной проблемы, является обеспечение автоматизированной проверки документов для принятия правового решения на основании поступающего запроса с помощью анализа и выявления соответствия имеющихся в них юридических фактов на основании знаний предметной области техники с помощью алгоритмов машинного обучения.[0009] The main technical result achieved when solving the above problem is to provide an automated check of documents for making a legal decision based on an incoming request by analyzing and identifying the correspondence of the legal facts available in them based on knowledge of the subject area of technology using machine learning algorithms.

[0010] Дополнительным техническим результатом, достигающимся при решении вышеуказанной проблемы, является повышение скорости принятия правовых решений, а также анализ документов на соответствие требованиям нормативно-правовых актов и внутренней нормативной документации (далее - ВИД) компании.[0010] An additional technical result achieved by solving the above problem is an increase in the speed of legal decision-making, as well as the analysis of documents for compliance with the requirements of regulatory legal acts and internal regulatory documents (hereinafter - VID) of the company.

[0011] Заявленные результаты достигаются за счет осуществления компьютерно-реализуемого способа автоматического принятия правового решения, выполняемого с помощью по меньшей мере одного процессора и содержащего этапы, на которых:[0011] The claimed results are achieved through the implementation of a computer-implemented method of automatic legal decision-making, performed using at least one processor and containing the steps at which:

• получают запрос на формирование правового решения;• receive a request for the formation of a legal decision;

• получают по меньшей мере один документ, соответствующий упомянутому запросу;• receive at least one document corresponding to the said request;

• обрабатывают полученный документ на предмет выявления в документе по меньшей мере одной сущности, относящейся к запросу правового решения, и осуществляют ее извлечение из документа с помощью алгоритма машинного обучения;• process the received document to identify in the document at least one entity related to the request for a legal decision, and extract it from the document using a machine learning algorithm;

• осуществляют юридический анализ упомянутой по меньшей мере одной извлеченной сущности с помощью набора правил, сформированных с помощью предметно-ориентированного языка;• performing legal analysis of the mentioned at least one extracted entity using a set of rules generated using a domain-specific language;

• формируют правовое решение на основании проведенного юридического анализа упомянутых извлеченных сущностей упомянутого по меньшей мере одного документа.• form a legal decision on the basis of the conducted legal analysis of the mentioned extracted entities of the mentioned at least one document.

[0012] В одном из частных вариантов осуществления способа на этапе обработки документа осуществляется распознавание печатного текста документа, при котором выполняется автоматическое распознавания изображения документов и извлечение текстовых данных из них.[0012] In one of the particular embodiments of the method, at the stage of document processing, the printed text of the document is recognized, which automatically recognizes the image of the documents and extracts text data from them.

[0013] В другом частном варианте осуществления способа на основании извлеченных текстовых данных формируется новый документ.[0013] In another particular embodiment of the method, a new document is generated based on the extracted text data.

[0014] В другом частном варианте осуществления способа выполняется определение типа документа с помощью сравнения извлеченных текстовых данных с шаблоном документа.[0014] In another particular embodiment of the method, a document type determination is performed by comparing the extracted text data with a document template.

[0015] В другом частном варианте осуществления способа при получении нескольких документов осуществляется их обработка на предмет объединения в рамках полученного запроса формирования правового решения.[0015] In another particular embodiment of the method, upon receipt of several documents, they are processed for combining within the received request for the formation of a legal decision.

[0016] В другом частном варианте осуществления способа выполняется сравнение изображения печатного текста документа с новым документом, сформированным по итогам извлечения текстовых данных, сохраненным в новом документе, образованном в результате распознавания.[0016] In another particular embodiment of the method, an image of the printed text of the document is compared with a new document generated by the extraction of text data stored in a new document generated as a result of recognition.

[0017] В другом частном варианте осуществления способа при наличии расхождения между документами в результате сравнения, в новом документе выполняют исправления ошибок распознавания изображения документа.[0017] In another particular embodiment of the method, if there is a discrepancy between the documents as a result of the comparison, corrections of the document image recognition errors are performed in the new document.

[0018] В другом частном варианте осуществления способа дополнительно выполняют верификацию по меньшей мере одной извлеченной сущности из документа.[0018] In another particular embodiment of the method, verification of at least one extracted entity from the document is additionally performed.

[0019] В другом частном варианте осуществления способа выполняется анализ смыслового соответствия по меньшей мере одной извлеченной сущности участку текста документа, из которого было осуществлено упомянутое извлечение.[0019] In another particular embodiment of the method, the analysis of the semantic correspondence of at least one extracted entity to the portion of the text of the document from which the extraction was carried out is performed.

[0020] В другом частном варианте осуществления способа выполняется корректировка по меньшей мере одной извлеченной сущности, причем такая корректировка включает в себя, по меньшей мере одно из: исправление орфографических ошибок, пунктуации, технических ошибок, смысловых ошибок.[0020] In another particular embodiment of the method, correction of at least one extracted entity is performed, and such correction includes at least one of: correction of spelling errors, punctuation, technical errors, semantic errors.

[0021] В другом частном варианте осуществления способа выполняется фильтрация документов, по меньшей мере утративших юридическую силу.[0021] In another particular embodiment of the method, filtering is performed on documents that have at least become invalid.

[0022] В другом частном варианте осуществления способа на этапе выполняется кросс-проверка юридических сущностей, при которой осуществляется сравнение юридических фактов, содержащихся в документах, отобранных для формирования юридического заключения.[0022] In another particular embodiment of the method, at a stage, a cross-check of legal entities is performed, in which a comparison of legal facts contained in the documents selected for the formation of a legal opinion is carried out.

[0023] Заявленное техническое решение также осуществляется с помощью устройства автоматического принятия правового решения, и данное устройство содержит по меньшей мере один процессор и по меньшей мере одно средство памяти, соединенное с процессором и содержащее машиночитаемые инструкции, которые при их исполнении процессором обеспечивают выполнение вышеуказанного способа.[0023] The claimed technical solution is also carried out using an automatic legal decision-making device, and this device contains at least one processor and at least one memory means connected to the processor and containing computer-readable instructions that, when executed by the processor, ensure the implementation of the above method ...

[0024] В другом предпочтительном варианте осуществления заявленного технического решения представлена система автоматического принятия правового решения, содержащая:[0024] In another preferred embodiment of the claimed technical solution, an automatic legal decision-making system is provided, comprising:

систему интеллектуального распознавания документов, включающую модуль обработки, выполняющий получение запроса на формирование правового решения;an intelligent document recognition system, including a processing module that receives a request for the formation of a legal decision;

получение по меньшей мере одного документа, связанного с упомянутым запросом;obtaining at least one document associated with said request;

модуль извлечения сущности, обеспечивающий выявление в документе по меньшей мере одной сущности, относящейся к запросу правового решения, и ее извлечение из документа с помощью алгоритма машинного обучения;an entity extraction module, which ensures that at least one entity related to the request for a legal decision is identified in the document and extracted from the document using a machine learning algorithm;

систему автоматизированного принятия решений, обеспечивающую выполнение юридического анализа упомянутой по меньшей мере одной извлеченной сущности с помощью набора правил, сформированных с помощью предметно-ориентированного языка;an automated decision-making system that provides a legal analysis of said at least one extracted entity using a set of rules generated using a domain-specific language;

формирование правового решения на основании проведенного юридического анализа упомянутых извлеченных сущностей упомянутого по меньшей мере одного документа.formation of a legal decision on the basis of the conducted legal analysis of said extracted entities of said at least one document.

[0025] В одном из частных примеров реализации система дополнительно содержит модуль верификации извлеченных сущностей, выполняющий проверку правильности извлечения атрибутов;[0025] In one particular implementation example, the system further comprises a retrieved entity verification module that checks the correctness of the retrieved attributes;

[0026] В другом частном примере реализации системы модуль верификации выполняет анализ смыслового соответствия по меньшей мере одной извлеченной сущности участку текста документа, из которого было осуществлено упомянутое извлечение.[0026] In another particular example of the implementation of the system, the verification module analyzes the semantic correspondence of at least one extracted entity to the portion of the text of the document from which the extraction was performed.

[0027] В другом частном примере реализации системы модуль верификации выполняет корректировку по меньшей мере одной извлеченной сущности, причем такая корректировка включает в себя, по меньшей мере одно из: исправление орфографических ошибок, пунктуации, технических ошибок, смысловых ошибок.[0027] In another particular example of the implementation of the system, the verification module performs correction of at least one extracted entity, and such correction includes at least one of: correction of spelling errors, punctuation, technical errors, semantic errors.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF DRAWINGS

[0028] Признаки и преимущества настоящего изобретения станут очевидными из приводимого ниже подробного описания изобретения и прилагаемых чертежей, на которых:[0028] Features and advantages of the present invention will become apparent from the following detailed description of the invention and the accompanying drawings, in which:

[0029] Фиг. 1 иллюстрирует блок-схему выполнения заявленного способа.[0029] FIG. 1 illustrates a block diagram of the implementation of the claimed method.

[0030] Фиг. 2 иллюстрирует фрагмент с текстом документа, из которого производится извлечение атрибутов.[0030] FIG. 2 illustrates a fragment with the text of the document from which the attributes are extracted.

[0031] Фиг. 3 иллюстрирует пример результата извлечения сущности.[0031] FIG. 3 illustrates an example of an entity retrieval result.

[0032] Фиг. 4 иллюстрирует пример разметки данных.[0032] FIG. 4 illustrates an example of data markup.

[0033] Фиг. 5 иллюстрирует пример дочерних документов.[0033] FIG. 5 illustrates an example of child documents.

[0034] Фиг. 6 иллюстрирует пример сообщения о проверке сущностей.[0034] FIG. 6 illustrates an example of an entity validation message.

[0035] Фиг. 7 иллюстрирует пример сформированного правового заключения.[0035] FIG. 7 illustrates an example of a formed legal opinion.

[0036] Фиг. 8 иллюстрирует пример работы заявленного решения для целей предоставления услуг клиенту.[0036] FIG. 8 illustrates an example of how the claimed solution works for the purpose of providing services to a client.

[0037] Фиг. 9 иллюстрирует блок-схему процесса обработки запроса на осуществление проверки документов клиента.[0037] FIG. 9 illustrates a flow diagram of a process for processing a request to verify customer documents.

[0038] Фиг. 10 иллюстрирует общий вид вычислительного устройства для реализации заявленного способа.[0038] FIG. 10 illustrates a general view of a computing device for implementing the claimed method.

ПОДРОБНОЕ ОПИСАНИЕ ТЕХНИЧЕСКОГО РЕШЕНИЯDETAILED DESCRIPTION OF THE TECHNICAL SOLUTION

[0039] Заявленное техническое решение может применяться для формирования правовых решений различного профиля и характера, исходя из требуемого запроса. Например, проверка правоспособности контрагента, в ходе которой будут в автоматическом режиме проанализированы все его документы, в том числе на предмет выявления единоличного исполнительного органа и подтверждения сроков его полномочий, проверка и подтверждение полномочий органов управления, выявление ограничений на совершение определенных сделок и т.п. Основной особенностью решения является обеспечение в автоматизированном режиме интеллектуального анализа входящих документов для генерирования правового решения. Итоги проведенной проверки автоматически вносятся в правовое решение, формируя итоговое решение по вопросу. При отсутствии документов или неактуальности имеющихся будет сформирован соответствующий список для запроса у клиента с обоснованием причин такого запроса.[0039] The claimed technical solution can be used to form legal decisions of various profiles and nature, based on the required request. For example, checking the legal capacity of the counterparty, during which all its documents will be automatically analyzed, including for identifying the sole executive body and confirming the terms of its powers, checking and confirming the powers of the governing bodies, identifying restrictions on certain transactions, etc. ... The main feature of the solution is the provision in an automated mode of intellectual analysis of incoming documents to generate a legal decision. The results of the audit are automatically entered into the legal decision, forming the final decision on the issue. In the absence of documents or if the existing ones are out of date, an appropriate list will be formed for requesting from the client, justifying the reasons for such a request.

[0040] Данное техническое решение может быть реализовано на компьютере, в виде автоматизированной информационной системы (АИС) или машиночитаемого носителя, содержащего инструкции, например, программные, для выполнения вышеупомянутого способа.[0040] This technical solution can be implemented on a computer, in the form of an automated information system (AIS) or a computer-readable medium containing instructions, such as software, for performing the above method.

[0041] Техническое решение может быть реализовано в виде распределенной компьютерной системы, которая может быть установлена на централизованном сервере (наборе серверов). Доступ пользователей к системе возможен как из сети Интернет, так и из внутренней сети предприятия/организации посредством мобильного устройства связи, на котором установлено программное обеспечение с соответствующим графическим интерфейсом пользователя, или персонального компьютера с доступом к веб-версии системы с соответствующим графическим интерфейсом пользователя.[0041] The technical solution may be implemented as a distributed computer system that may be installed on a centralized server (set of servers). User access to the system is possible both from the Internet and from the internal network of an enterprise / organization via a mobile communication device on which software with a corresponding graphical user interface is installed, or a personal computer with access to the web version of the system with a corresponding graphical user interface.

[0042] Ниже будут описаны термины и понятия, необходимые для реализации настоящего технического решения.[0042] The following will describe the terms and concepts necessary to implement the present technical solution.

[0043] В данном решении под системой подразумевается компьютерная система, ЭВМ (электронно-вычислительная машина), ЧПУ (числовое программное управление), ПЛК (программируемый логический контроллер), компьютеризированные системы управления и любые другие устройства, способные выполнять заданную, четко определенную последовательность вычислительных операций (действий, инструкций).[0043] In this solution, the system means a computer system, a computer (electronic computer), CNC (numerical control), PLC (programmable logic controller), computerized control systems and any other devices capable of performing a given, well-defined sequence of computing operations (actions, instructions).

[0044] Под устройством обработки команд подразумевается электронный блок либо интегральная схема (микропроцессор), исполняющая машинные инструкции (программы).[0044] By a command processing device is meant an electronic unit or an integrated circuit (microprocessor) that executes machine instructions (programs).

[0045] Устройство обработки команд считывает и выполняет машинные инструкции (программы) с одного или более устройства хранения данных. В роли устройства хранения данных могут выступать, но, не ограничиваясь, жесткие диски (HDD), флеш-память, ПЗУ (постоянное запоминающее устройство), твердотельные накопители (SSD), оптические приводы.[0045] An instruction processing device reads and executes machine instructions (programs) from one or more storage devices. Data storage devices can be, but are not limited to, hard disks (HDD), flash memory, ROM (read only memory), solid-state drives (SSD), optical drives.

[0046] Программа - последовательность инструкций, предназначенных для исполнения устройством управления вычислительной машины или устройством обработки команд.[0046] A program is a sequence of instructions for execution by a computer control device or command processing device.

[0047] Способ автоматического принятия решения для юриста показан на Фиг. 1 (100) в виде блок-схемы и далее будет подробно поэтапно раскрыт.[0047] An automatic decision making method for a lawyer is shown in FIG. 1 (100) in the form of a block diagram and will hereinafter be disclosed in detail step by step.

[0048] На первом этапе (110) выполняется получение запроса на формирование правового решения. В запросе содержится указание на специфику требуемой проверки, в ходе которой предоставляется один или несколько документов (120). В качестве документов, полученных на этапе (120) могут представляться отсканированные копии оригиналов документов, или цифровые формы документов. Данные документы могут получать из внутренних хранилищ данных организации или из внешних источников информации. Например, если в запросе содержится требование проведения проверки юридического лица с целью выдачи кредита, то среди предоставленных документом могут присутствовать уставы, протоколы и т.д. Запрос на формирование может не ограничиваться только одной областью знаний, относящейся к области юриспруденции, и может также применяться для иной области, в которой также возможно формирование решение (заключение) по тому или иному вопросу.[0048] In the first step (110), a request for forming a legal decision is received. The request contains an indication of the specifics of the required verification, during which one or more documents are provided (120). Scanned copies of original documents or digital forms of documents can be presented as documents obtained at step (120). These documents can be obtained from internal data stores of the organization or from external sources of information. For example, if the request contains a requirement to conduct an audit of a legal entity in order to issue a loan, then among the documents provided by the document there may be charters, protocols, etc. A request for formation may not be limited to only one area of knowledge related to the field of jurisprudence, and can also be applied to another area in which it is also possible to form a decision (conclusion) on a particular issue.

[0049] Полученный документ или ряд документов в ходе обработки запроса на этапе (120) передается в систему интеллектуального распознавания документов (далее - СИРД). Система интеллектуального распознавания документов (СИРД) состоит из модуля обработки, модуля извлечения атрибутов и модуля верификации извлеченных атрибутов.[0049] The received document or a series of documents during the processing of the request at step (120) is transferred to the intelligent document recognition system (hereinafter referred to as SIDD). The Intelligent Document Recognition System (IDRD) consists of a processing module, an attribute extraction module, and a extracted attributes verification module.

[0050] Если документ ранее уже проходил все модули СИРД, и в досье клиента был сформирован соответствующий дочерний документ, то данный документ повторно не проходит модули СИРД - дочерний документ сразу передается в систему автоматического принятия решения. Описание дочернего документа будет дано далее в настоящем описании.[0050] If the document has previously passed all the SIRD modules, and a corresponding child document was generated in the client's dossier, then this document does not pass the SIRD modules again - the child document is immediately transferred to the automatic decision-making system. The description of the child document will be given later in this description.

[0051] Набор документов может храниться в форматах XML, XLS, DBF, CSV, TXT и изображений TIFF, JPEG, JPEG 2000, PDF, PDF/A, PCX, BMP, PNG, или иных поддерживаемых форматах, не ограничиваясь.[0051] A set of documents can be stored in XML, XLS, DBF, CSV, TXT and TIFF, JPEG, JPEG 2000, PDF, PDF / A, PCX, BMP, PNG images, or other supported formats, but not limited to.

[0052] Далее на этапе (130) выполняется обработка полученного запроса и соответствующих ему одного или нескольких документов для выявления и извлечения сущностей, содержащих атрибуты, относящиеся к юридическому факту, связанному с запросом на формирование правового заключения.[0052] Next, at step (130), the received request and its corresponding one or more documents are processed to identify and retrieve entities containing attributes related to a legal fact associated with the request for the formation of a legal opinion.

[0053] В частности, при исполнении этапа (130) выполняется распознавание и типизация документов, верификация распознанного текста, объединение документов (при необходимости). Распознавание документов осуществляется на базе технологии OCR (англ. Optical Character Recognition), которая позволяет автоматически перевести изображение печатного текста документа в текстовые данные (набор текстовых символов). Технология представляет собой комплекс действий, включающих обработку изображений, детектирование в них текста и его распознавание, и может выполняться с помощью известных алгоритмов и программно-аппаратных подходов.[0053] In particular, during the execution of step (130), the recognition and typing of documents, verification of the recognized text, merging of documents (if necessary) are performed. Recognition of documents is carried out on the basis of OCR technology (English Optical Character Recognition), which allows you to automatically translate the image of the printed text of the document into text data (a set of text characters). The technology is a complex of actions, including image processing, detection of text in them and its recognition, and can be performed using well-known algorithms and software and hardware approaches.

[0054] Действия по обработке изображения направлены на улучшение качества документа и повышение качества детектирования текста. Для детекции текста используется ИНС, архитектурно представляющая собой CNN (сверточная нейросеть), обученную на наборе из 5000 документов, содержащих размеченные блоки текста. Для распознавания текста используется ИНС, основанная на архитектуре CRNN (сверточная рекуррентная нейросеть). Данная нейросеть обучена на наборе синтетических (сгенерированных) данных, представляющих собой образцы текста, размещенные на нескольких типовых фонах, которые наиболее часто встречаются в документах. Каждый образец представляет собой пару элементов: текст на фоне в формате изображения и его расшифровка в текстовом виде. Для обучения было использовано около 100000 наиболее частотных слов русского языка, на основе которых было сгенерировано больше 10 млн. изображений.[0054] Image processing actions are aimed at improving the quality of the document and improving the quality of text detection. For text detection, an ANN is used, which is architecturally a CNN (convolutional neural network) trained on a set of 5000 documents containing marked blocks of text. An ANN based on the CRNN architecture (Convolutional Recurrent Neural Network) is used for text recognition. This neural network is trained on a set of synthetic (generated) data, which are text samples placed on several typical backgrounds that are most often found in documents. Each sample is a pair of elements: text on the background in the format of an image and its decryption in text form. For training, about 100,000 most frequent words of the Russian language were used, on the basis of which more than 10 million images were generated.

[0055] Одновременно может осуществляться типизация распознаваемого документа. Для определения типа документа, модуль обработки соотносит набор текстовых символов документа с шаблонной структурой, характеризующей определенный тип документа. Процесс соотнесения представляет собой поиск в распознанном текстовом слое характерных словесных конструкций, присущих определенному шаблону.[0055] At the same time, typing of the recognized document can be performed. To determine the type of the document, the processing module correlates the set of text symbols of the document with the template structure that characterizes a certain type of document. The matching process is a search in a recognized text layer for characteristic verbal constructions inherent in a certain pattern.

[0056] Шаблон (шаблонная структура) создается на основании алгоритмов, которые анализируют вариативность структуризации различных типов документов. Данные алгоритмы устанавливают закономерности в структуре документов и формируют на основании этого шаблон. Например, шаблонной структурой в уставе является наличие разделов с характерным наименованием («Общие положения», «Уставной капитал» и т.д.), упорядоченность следования пунктов, наличие титульного листа с указанием слова «Устав» и т.д.[0056] The template (template structure) is created based on algorithms that analyze the variability of structuring of different types of documents. These algorithms establish patterns in the structure of documents and form a template based on this. For example, the template structure in the charter is the presence of sections with a characteristic name ("General Provisions", "Authorized Capital", etc.), the ordering of paragraphs, the presence of a title page indicating the word "Charter", etc.

[0057] Опционально может выполняться этап верификации (131) с помощью модуля верификации. Полнотекстовая верификация производится путем сравнения изображения печатного текста документа с набором текстовых символов, сохраненным в новом документе, образованном в результате распознавания. При наличии расхождений между изображением печатного текста и набором текстовых символов в новом документе, модуль обработки производит исправление ошибок распознавания, в частности выполняется изменение и замена некорректно распознанных текстовых символов на достоверные символы.[0057] Optionally, a verification step (131) may be performed with a verification module. Full-text verification is performed by comparing the image of the printed text of the document with a set of text symbols saved in a new document, formed as a result of recognition. If there are discrepancies between the image of the printed text and the set of text characters in the new document, the processing module corrects recognition errors, in particular, changes and replaces the incorrectly recognized text characters with valid characters.

[0058] По результатам распознавания и типизации набор текстовых символов по отдельному документу, сохраняется во вновь созданном документе. Исходные документы используются в формате html, doc, txt, pdf и иных форматах, не ограничиваясь.[0058] According to the results of recognition and typing, a set of text characters for a separate document is stored in the newly created document. Source documents are used in html, doc, txt, pdf and other formats, not limited to.

[0059] Далее модуль обработки определяет необходимость объединения типизированных документов. Объединение производится если на этапе (120) было предоставлено два и более документов (набор документов), относящихся к обработке полученного запроса на этапе (110), при наличии в наборе документов основного документа и другого документа, содержащего изменения текста основного документа. Например, при выявлении в пакете документов Устава (основной документ) и Изменения к уставу (изменяющий документ) система направляет их на объединение с целью формирования финальной версии соответствующего документа.[0059] Next, the processing module determines whether to combine typed documents. The merging is performed if at step (120) two or more documents (a set of documents) were provided related to the processing of the received request at step (110), if there is a main document in the set of documents and another document containing changes to the text of the main document. For example, if a package of documents of the Charter (main document) and Amendments to the Charter (amending document) are identified, the system sends them to be merged in order to form the final version of the corresponding document.

[0060] Процесс объединения документов состоит из следующих шагов: определение структуры объединяемых документов, определение объема и типа изменений, применение выявленных изменений (непосредственно объединение).[0060] The process of merging documents consists of the following steps: determining the structure of the merged documents, determining the scope and type of changes, applying the identified changes (directly merging).

[0061] Определение структуры основного (изменяемого) документа заключается в разделении его на блоки информации в соответствии с примененной в документе нумерацией. Например, блоками основного документа могут являться пункты, статьи или параграфы. Определение структуры изменяющего документа заключается в выявлении текста всех правок, которые необходимо внести в изменяемый документ. Под правкой понимается выраженное на естественном языке указание на изменение текста основного документа. Например, правкой будет является следующий текст в Изменениях к уставу: «Пункт 38 раздела 2 Устава Общества изложить в следующей редакции: «Размер уставного капитала Общества составляет 150000 рублей».[0061] The definition of the structure of the main (changeable) document consists in dividing it into blocks of information in accordance with the numbering used in the document. For example, the blocks of the main document can be clauses, articles, or paragraphs. Determining the structure of the changing document is to identify the text of all the edits that need to be made in the changed document. A revision is an indication expressed in natural language that the text of the main document has been changed. For example, the amendment will be the following text in the Amendments to the Articles of Association: “Clause 38 of Section 2 of the Articles of Association of the Company shall be stated as follows:“ The size of the authorized capital of the Company is 150,000 rubles ”.

[0062] Каждая правка подразделяется на элементы: заголовок правки (например, «пункт 38 раздела 2 Устава Общества изложить в следующей редакции») и содержание правки (например, «размер уставного капитала Общества составляет 150 ООО рублей»). Содержание правки является опциональным полем. Например, правки на удаление текста представляются только заголовком.[0062] Each amendment is subdivided into elements: the title of the amendment (for example, “Clause 38 of Section 2 of the Charter of the Company shall be stated in the following edition”) and the content of the amendment (for example, “the size of the authorized capital of the Company is 150,000 rubles”). The content of the revision is optional. For example, edits to delete text are represented by a title only.

[0063] Затем определяется тип заголовка правки. Заголовок подразделяется на типы: изменение блока, добавление, удаление, изменение слов и фраз по всему тексту. После определения типа заголовка правки осуществляется извлечение адреса блока из заголовка правки. Под адресом блока понимается конкретный номер пункта, номер статьи абзаца или непосредственное слово, или фраза, подлежащая изменению (например, «генеральный директор» заменить на «директор»). Затем извлеченная информация (адрес блока, правка, тип заголовка), которая по сути является входными данными для объединения документов, проходит обработку модулем обработки для исполнения операций по объединению документов. Модуль обработки выполняет операцию по объединению документов -действие по физической замене исходного текста на текст правки, добавлению или удалению на основании входных данных. В результате данной операции образуется новый документ, в котором к исходному документу применены все операции правок (внесены изменения).[0063] Next, the type of the revision title is determined. The heading is divided into types: block change, add, delete, change words and phrases throughout the text. After determining the type of revision header, the block address is extracted from the revision header. The block address means a specific item number, paragraph article number, or a direct word, or a phrase to be changed (for example, “general director” is replaced by “director”). Then the extracted information (block address, revision, header type), which is essentially the input data for combining documents, is processed by the processing module to perform operations to combine documents. The processing module performs the operation of combining documents - the action of physically replacing the original text with the text of editing, adding or removing based on the input data. As a result of this operation, a new document is formed, in which all editing operations are applied to the original document (changes have been made).

[0064] Далее с помощью модуля извлечения сущности инициируется процесс извлечения атрибутов из обработанных документов. Под атрибутом в данном техническом решении понимается единица информации, формирующая сущность, относящуюся к юридическому факту. Например, наименование субъекта и населенного пункта, зафиксированные в Уставе в качестве местонахождения организации (см. Фиг. 2), формируют два соответствующих атрибута (Фиг. 3) - «Субъект РФ» и «НасПункт».[0064] Next, using the entity extraction module, the process of extracting attributes from processed documents is initiated. An attribute in this technical solution is understood as a unit of information that forms an entity related to a legal fact. For example, the name of the subject and settlement, recorded in the Charter as the location of the organization (see Fig. 2), form two corresponding attributes (Fig. 3) - "Subject of the Russian Federation" and "NasPunkt".

[0065] Под сущностью в данном техническом решении понимается набор атрибутов, объединенных в одну группу по какому-либо признаку, относящихся к юридическому факту. На основе примера, приведенного выше, атрибуты, указывающие на наименование субъекта и населенного пункта, формируют сущность «местонахождение». На Фиг. 3-«МН».[0065] An entity in this technical solution refers to a set of attributes combined into one group according to some attribute related to a legal fact. Based on the example above, attributes indicating the name of the subject and settlement form the entity "location". FIG. 3- "MN".

[0066] В приведенном примере из Устава, объединенного с Изменениями к нему, были извлечены следующие данные по местонахождению организации (сущность «МН»): субъект - «Ярославская» (атрибут «СубъектРФ»), населенный пункт - «Переславль-Залесский» (атрибут «НасПункт»).[0066] In the above example, from the Charter, combined with the Amendments to it, the following data on the location of the organization (entity "MN") were extracted: subject - "Yaroslavl" (attribute "Subject RF"), settlement - "Pereslavl-Zalessky" ( attribute "UsPunkt").

[0067] Состав извлекаемых атрибутов и сущностей формируется пользователем применительно к каждому документу в отдельности и представляет собой Глоссарий атрибутов. Глоссарий - отражает область знаний, в которой применяется тот или иной документ.Таким образом, его формирование осуществляется специалистом в соответствующей предметной области самостоятельно - без привлечения специалистов, обладающих специальными знаниями и навыками в области программирования.[0067] The composition of the extracted attributes and entities is formed by the user for each document separately and is a Glossary of Attributes. Glossary - reflects the area of knowledge in which this or that document is applied. Thus, its formation is carried out by a specialist in the relevant subject area independently - without the involvement of specialists with special knowledge and skills in the field of programming.

[0068] Извлечение атрибутов производится автоматически путем информационного поиска сущности и выделения из ее состава юридически значимой информации (атрибутов) с помощью алгоритмов машинного обучения. Разработка алгоритмов машинного обучения включает в себя следующие основные этапы, не ограничиваясь: определение источника данных, формирование на их основе обучающей выборки, подбор оптимальных методов машинного обучения на полученной обучающей выборке, обучение. Описание этапов приведено ниже.[0068] The extraction of attributes is performed automatically by information retrieval of the entity and the extraction of legally significant information (attributes) from it using machine learning algorithms. The development of machine learning algorithms includes the following main stages, but is not limited to: determining the data source, forming a training sample on their basis, selecting the optimal machine learning methods on the received training sample, training. The steps are described below.

[0069] Машинное обучение проводится на клиентских данных, а также данных, раскрытых в рамках корпоративного законодательства. Под раскрытием информации в рамках исполнения требований корпоративного законодательства следует понимать установленные законными и подзаконными актами нормы права, обеспечивающие доступность информации всем заинтересованным лицам, независимо от целей получения данной информации в соответствии с процедурой, гарантирующей ее нахождение и получение.[0069] Machine learning is conducted on customer data as well as data disclosed under corporate law. Disclosure of information in the framework of compliance with the requirements of corporate legislation should be understood as the norms of law established by legal and by-laws that ensure the availability of information to all interested parties, regardless of the purpose of obtaining this information in accordance with the procedure that guarantees its finding and receipt.

[0070] Для формирования обучающей выборки для алгоритмов машинного обучения, применяемых в настоящем техническом решении, используются выборки с различными типами документов для выявления в них различных юридических фактов. Количество документов в выборках составляет от 100 до 5000 документов (например, различные типы уставов, договоров и т.п.). После отбора документов инициируется их распознавание (описание технологии приведено выше) и разметка.[0070] To form a training sample for machine learning algorithms used in this technical solution, samples with different types of documents are used to identify various legal facts in them. The number of documents in the samples ranges from 100 to 5000 documents (for example, various types of statutes, agreements, etc.). After the selection of documents, their recognition is initiated (the technology is described above) and markup.

[0071] Разметка представляет собой выделение в тексте юридических фактов с указанием к какой юридической сущности и атрибуту он относится. Пример представлен на Фиг. 4. Разметка может выполняться с помощью обученной модели машинного обучения при извлечении юридических фактов из текста.[0071] Markup is a selection of legal facts in the text, indicating which legal entity and attribute it refers to. An example is shown in FIG. 4. Markup can be done with a trained machine learning model while extracting legal facts from text.

[0072] Обучение производится в рамках решения следующих задач: классификация, регрессия, написание детерминированных алгоритмов. В настоящем решении используется ансамбль из 16 моделей машинного обучения, которые обучаются от 3 до 18 эпох в зависимости от момента достижения требуемого показателя точности выявления и классификации данных. Модели, представленные в ансамбле, являются архитектурами следующих видов: CNN (сверточная сеть), RNN (рекуррентная сеть), которые могут включать в себя специальные слои LSTM (долгая краткосрочная память), механизмы self-attention (контроль внимания) и др. Также используются доработанные модели представления текста: w2v, elmo и др.[0072] Training is carried out in the framework of solving the following tasks: classification, regression, writing deterministic algorithms. In this solution, an ensemble of 16 machine learning models is used, which are trained from 3 to 18 epochs, depending on the moment the required indicator of the accuracy of data identification and classification is achieved. The models presented in the ensemble are architectures of the following types: CNN (convolutional network), RNN (recurrent network), which can include special layers LSTM (long short-term memory), self-attention mechanisms (attention control), etc. modified models of text presentation: w2v, elmo, etc.

[0073] Результатом прохождения этапа (130) является формирование файла в формате xml, который может также при необходимости передаваться в модуль верификации извлеченных атрибутов на этапе (131).[0073] The result of passing through step (130) is the generation of a file in xml format, which can also, if necessary, be transferred to the extracted attributes verification module in step (131).

[0074] Как представлено на Фиг. 3 файл содержит в том числе следующую информацию: тип документа, извлеченные атрибуты и сущности. Каждой единице извлеченной информации в файле соответствует путь следующего вида, не ограничиваясь: ТипДокумента\Сущность\Атрибут (Фиг. 3).[0074] As shown in FIG. 3 file contains including the following information: document type, extracted attributes and entities. Each unit of extracted information in the file corresponds to the following path, not limited to: Document Type \ Entity \ Attribute (Fig. 3).

[0075] При выполнении этапа (131) модуль верификации производит проверку правильности извлечения атрибутов, полученных на этапе (130), с целью передачи их в систему автоматического принятия решения.[0075] In step (131), the verification module verifies that the attributes obtained in step (130) are retrieved correctly in order to transfer them to the automatic decision system.

[0076] Проверка юридического факта, содержащегося в извлеченном атрибуте, производится путем поиска данного факта в наборе текстовых символов в соответствующем документе и последующей проверки правильности произведенного извлечения на основании контекстного поиска (смыслового соответствия извлеченного атрибута участку текста, где он был найден). Например, данная проверка позволяет выявлять ситуации, когда вместо цифры, характеризующей уставной капитал, в соответствующий атрибут попала цифра, отвечающая за количество членов совета директоров. Если искомый атрибут отсутствует или не соответствует набору текстовых символов, модуль верификации извлеченных атрибутов вносит исправления в файл, удаляя или корректируя рассматриваемый атрибут.[0076] Verification of the legal fact contained in the extracted attribute is performed by searching for this fact in the set of text characters in the corresponding document and then checking the correctness of the extraction based on the contextual search (semantic correspondence of the extracted attribute to the piece of text where it was found). For example, this check allows you to identify situations when, instead of the number characterizing the authorized capital, the corresponding attribute includes a number that is responsible for the number of board members. If the required attribute is missing or does not match the set of text characters, the extracted attributes verification module makes corrections to the file, deleting or correcting the considered attribute.

[0077] Результатом прохождения этапа верификации (131) извлеченных атрибутов является сохранение итогового файла, сформированного на этапе (130) с выполненными корректировками (при необходимости) в хранилище документов.[0077] The result of passing the verification step (131) of the extracted attributes is to save the final file generated in step (130) with the corrections (if necessary) made in the document storage.

[0078] Хранилище документов содержит документы представленные в ходе обработки запроса (ПО) на этапе (120) или полученные из смежных систем для выполнения формирования правового решения. В хранилище хранятся как основные, так и дочерние (связанные) документы.[0078] the Document store contains documents submitted during the processing of the request (PO) at step (120) or received from adjacent systems to perform the formation of a legal decision. The repository stores both main and child (linked) documents.

[0079] Под дочерним документом в данном техническом решении понимается документ, сформированный по итогам прохождения этапа извлечения атрибутов из документа, представленного клиентом, и этапа их последующей верификации. Например, к Протоколу об избрании единоличного исполнительного органа, размещенному в досье клиента в формате pdf, после прохождения этапа верификации извлеченных из него атрибутов будет сохранен дочерний документ в формате xml, содержащий извлеченные из него сущности и атрибуты (Фиг. 5).[0079] A child document in this technical solution means a document generated as a result of passing the stage of extracting attributes from the document submitted by the client and the stage of their subsequent verification. For example, to the Protocol on the election of the sole executive body posted in the client's dossier in pdf format, after passing the verification stage of the attributes extracted from it, a child document in xml format will be saved containing the entities and attributes extracted from it (Fig. 5).

[0080] Далее система интеллектуального распознания документов (СИРД) передает сохраненный файл, сформированный на этапе (130) и скорректированный при необходимости на этапе (131), в систему автоматического принятия решения, которая содержит хранилище набора правил для формирования правового решения и обеспечивает последующую обработку для формирования юридического анализа.[0080] Next, the intelligent document recognition system (IIDR) transmits the saved file, generated at step (130) and corrected, if necessary, at step (131), to the automatic decision making system, which contains a store of a set of rules for forming a legal decision and provides subsequent processing for the formation of legal analysis.

[0081] На этапе (140) выполняется применение сформированного набора правил для юридического анализа извлеченных сущностей из обработанных документов. На данном этапе система автоматического принятия решений автоматически преобразовывает в скрипт на языке Python каждое правило, ранее подготовленное и написанное на предметно-ориентированном языке, которые хранятся в специализированном хранилище (141), например, базе данных.[0081] In step (140), the generated ruleset is applied to legally analyze the extracted entities from the processed documents. At this stage, the automatic decision-making system automatically converts into a Python script each rule previously prepared and written in a domain-specific language, which are stored in a specialized storage (141), for example, a database.

[0082] Созданный для решения данной задачи предметно-ориентированный язык позволяет формировать необходимые наборы правил пользователю, не обладающему специальными знаниями и навыками в области программирования.[0082] The domain-specific language created for solving this problem allows the user who does not have special knowledge and skills in the field of programming to form the necessary sets of rules.

[0083] Правило подразумевает под собой набор действий, аналогичный логике и порядку действий, производимых человеком (юристом) во время проведения проверки, анализа юридических фактов и принятия решения. Каждое правило представляет собой анализ извлеченных атрибутов и сущностей посредством использования операторов кода.[0083] Rule means a set of actions similar to the logic and order of actions performed by a person (lawyer) during the inspection, analysis of legal facts and decision-making. Each rule is an analysis of the extracted attributes and entities using code statements.

[0084] Анализируемые атрибуты типизируются в зависимости от вида информации, которую они содержат, и специфики проводимой проверки. Примерами типов атрибутов могут служить: строка, число, дата и т.д. Типизация позволяет осуществлять специфические для соответствующего типа атрибутов операции. Например, к атрибутам, типизированным как «число», возможно применение математических операторов.[0084] The parsed attributes are typed depending on the type of information they contain and the specifics of the validation being performed. Examples of attribute types are: string, number, date, etc. Typing allows for operations specific to the corresponding attribute type. For example, attributes typed as "number" can be matched with mathematical operators.

[0085] Под оператором кода в данном техническом решении понимается заранее предустановленный формализованный список команд для реализации возможности написания алгоритмов с использованием правил логики. Команды представляют собой набор логических конструкций и применяемых математических операторов. Примерами операторов кода могут выступать, но, не ограничиваясь, конструкции типа: «если… то», «и», «содержит» и т.д.[0085] Under the code operator in this technical solution is understood as a pre-established formalized list of commands to implement the possibility of writing algorithms using the rules of logic. Commands are a collection of logical constructs and applied mathematical operators. Examples of code operators can be, but are not limited to, constructions like: "if ... then", "and", "contains", etc.

[0086] Результатом анализа на этапе (140) является набор выводов, формируемых в зависимости от результата прохождения каждого правила. Под выводом понимается позитивное (формируемое в случае успешного прохождения правил) или негативное (формируемое в случае отрицательного результата прохождения правил) сообщение. В случае реализации негативного сценария сообщение содержит соответствующие пояснения о его причинах. Например, в отношении выписки из ЕГРЮЛ проводится проверка, в том числе, на наличие в ней атрибута с полным наименованием юридического лица, являющегося обязательным для данного документа. При отсутствии данного атрибута, выводится негативное сообщение с пояснением «В ЕГРЮЛ отсутствует полное наименование ЮЛ» (Фиг. 6).[0086] The result of the analysis in step (140) is a set of conclusions generated depending on the result of passing each rule. A conclusion is understood as a positive (generated in case of successful passage of the rules) or negative (generated in case of a negative result of passage of the rules) message. In the event of a negative scenario, the message contains appropriate explanations about its reasons. For example, in relation to an extract from the Unified State Register of Legal Entities, a check is carried out, including for the presence in it of an attribute with the full name of a legal entity, which is mandatory for this document. In the absence of this attribute, a negative message is displayed with the explanation "There is no full name of legal entity in the Unified State Register of Legal Entities" (Fig. 6).

[0087] Наборы правил, сгруппированных в зависимости от специфики проводимой проверки, формируют блоки проверки. Примерами блоков могут служить блок по проверке клиента по выписке из ЕГРЮЛ или блок проверки срока действия общества. Пример представлен ниже:[0087] Sets of rules, grouped depending on the specifics of the test, form test blocks. Examples of blocks are a block for checking a client based on an extract from the Unified State Register of Legal Entities or a block for checking the validity of a company. An example is shown below:

Раздел 1 «Проверка правоспособности»Section 1 "Verification of legal capacity"

Блок 1 «Проверка правоспособности на основании данных ЕГРЮЛ»Block 1 "Verification of legal capacity based on data from the Unified State Register of Legal Entities"

Блок 2 «Проверка срока действия общества по Уставу».Block 2 "Checking the period of validity of the company under the Charter".

[0088] На этапе (140) выполняется также валидация документов. Под валидацией понимается процесс первичного отбора документов для последующей проверки. Например, производится определение принадлежности документа Обществу и наличия в документе императивных атрибутов (атрибутов, наличие которых в документе обязательно в силу закона). Из сформированного списка валидированных документов исключаются документы, утратившие юридическую силу, и документы, юридическая проверка которых в рамках формирования данного заключения не требуется. Например, среди всех найденных протоколов о назначении единоличного исполнительного органа для проведения дальнейшей проверки будет оставлен только актуальный (протокол с датой, наиболее близкой к дате проверки).[0088] In step (140), document validation is also performed. Validation refers to the process of the initial selection of documents for subsequent verification. For example, the document is determined to belong to the Company and the presence of imperative attributes in the document (attributes, the presence of which in the document is mandatory by virtue of the law). From the generated list of validated documents, documents that have lost their legal force and documents whose legal verification is not required as part of the formation of this conclusion are excluded. For example, among all the protocols found on the appointment of the sole executive body for further verification, only the current one will be left (the protocol with the date closest to the verification date).

[0089] Если на этапе (120) было получено несколько документов для обработки запроса (110), то может выполняться кросс-проверка их атрибутов. Под кросс-проверкой атрибутов понимается сравнение юридических фактов, содержащихся в различных документах, между собой. Например, кросс-проверка должности единоличного исполнительного органа, указанной в уставе и в протоколе, производится путем проверки совпадения информации, содержащейся в атрибутах, которые были получены в результате извлечения наименования соответствующей должности из протокола и устава соответственно.[0089] If at step (120) multiple documents were received to process the request (110), then their attributes may be cross-checked. Cross-attribute validation refers to the comparison of legal facts contained in different documents with each other. For example, a cross-check of the position of the sole executive body specified in the charter and in the minutes is performed by checking the coincidence of the information contained in the attributes that were obtained as a result of extracting the name of the corresponding position from the minutes and the charter, respectively.

[0090] Факт извлечения атрибута означает наличие соответствующего юридического факта в документе. Примером проверки факта извлечения атрибута может служить выявление атрибута, свидетельствующего о нахождении в залоге долей учредителей клиента. В данном случае само отсутствие либо наличие данного атрибута влияет на развитие дальнейшей логики проверки.[0090] The fact of extracting an attribute means the presence of a corresponding legal fact in the document. An example of verifying the fact of extracting an attribute is identifying an attribute indicating that the shares of the client's founders are pledged. In this case, the very absence or presence of this attribute affects the development of further verification logic.

[0091] Сопоставление атрибута с каким-либо критерием осуществляется, как правило, но не ограничиваясь, с использованием логических операторов сравнения («больше», «меньше») или контекстного поиска («содержит»). Например, вхождение в состав атрибута, отвечающего за наименование должности единоличного исполнительного органа, фразы «Индивидуальный предприниматель» влияет на развитие дальнейшей логики проверки.[0091] Matching an attribute with any criterion is performed, as a rule, but not limited to, using logical comparison operators ("greater than", "less") or contextual search ("contains"). For example, the inclusion of the phrase "Individual entrepreneur" in the attribute responsible for the name of the position of the sole executive body affects the development of further verification logic.

[0092] В качестве примера задачи анализа извлеченных атрибутов можно рассмотреть начальный этап алгоритма поиска комплекта устава и изменений к нему, являющегося актуальным на момент проведения проверки. На данном этапе проверки отбираются уставы и изменения, принадлежащие анализируемому клиенту. Отбор производится путем проверки совпадения атрибутов, содержащих основной государственный регистрационный номер (ОГРН) и государственный регистрационный номер (ГРН), извлеченных со штампа регистрирующего органа (далее штамп) с аналогичными атрибутами, извлеченными из единого государственного реестра юридических лиц (ЕГРЮЛ). При этом учитываются случаи, когда ОГРН и ГРН на штампе перепутаны местами, один из номеров отсутствует или в обоих графах штампа указан один и тот же номер. Также при проверке учитываются возможные опечатки в указанных номерах.[0092] As an example of the task of analyzing the extracted attributes, we can consider the initial stage of the algorithm for searching for a set of regulations and changes to it, which is relevant at the time of verification. At this stage of verification, charters and changes belonging to the analyzed client are selected. The selection is made by checking the coincidence of the attributes containing the main state registration number (OGRN) and the state registration number (GRN) extracted from the stamp of the registering authority (hereinafter the stamp) with similar attributes extracted from the unified state register of legal entities (USRLE). This takes into account the cases when the OGRN and GRN on the stamp are reversed, one of the numbers is missing or the same number is indicated in both columns of the stamp. Also, when checking, possible typos in the indicated numbers are taken into account.

[0093] На этапе (150) выполняется формирование правового решения на основании проведенной проверки набора атрибутов. На данном этапе система автоматического принятия решения формирует юридическое заключение по результатам проведенных проверок набора извлеченных сущностей и атрибутов. Данное заключение содержит в том числе список использованных атрибутов, набор сообщений, сформированных в рамках проведенной проверки и информацию о положительном или отрицательном результате прохождения проверки в рамках каждого блока правил. Под отрицательным результатом понимается выявление системой автоматического принятия решения следующих обстоятельств, но не ограничиваясь: 1) необходимость получения от клиента дополнительных документов (в этом случае клиенту направляется список требуемых документов); 2) необходимость привлечения к проведению данной проверки человека-эксперта; 3) необходимость исключения клиента из дальнейшей автоматизированной проверки в виду выявленных в отношении него ограничений. Примером таких ограничений может служить нахождение клиента в стадии банкротства или ликвидации. Во всех остальных случаях результат проверки блока правил считается положительным.[0093] At step (150), a legal decision is generated based on the verification of the set of attributes. At this stage, the automatic decision-making system generates a legal opinion based on the results of the checks carried out on the set of extracted entities and attributes. This conclusion contains, among other things, a list of used attributes, a set of messages generated as part of the test and information about a positive or negative result of passing the test within each block of rules. A negative result is understood as the detection by the automatic decision-making system of the following circumstances, but not limited to: 1) the need to obtain additional documents from the client (in this case, the client is sent a list of required documents); 2) the need to involve a human expert in this inspection; 3) the need to exclude the client from further automated verification in view of the limitations identified in relation to him. An example of such restrictions is when a client is in the stage of bankruptcy or liquidation. In all other cases, the result of checking the block of rules is considered positive.

[0094] В примере алгоритма поиска актуального комплекта устава и изменений, рассмотренном на этапе (140), сформированное правовое решение будет включать в себя перечень использованных атрибутов, содержащих ОГРН, ГРН и даты, указанные в уставах, изменениях и в выписке из ЕГРЮЛ (Фиг. 7). Если актуальный комплект был найден (положительный результат), то в заключении будет содержаться соответствующее сообщение с указанием дат регистрации актуального устава и изменений. Если же, по каким-то причинам, актуальный комплект найден не был (отрицательный результат), то заключение будет включать в себя запрос актуального комплекта, состоящего из устава и изменений (например, если найденный комплект не совпал с соответствующим списком изменений в выписке из ЕГРЮЛ), или вывод о необходимости проведения определенного этапа проверки с участием человека-эксперта (например, если во всех уставах в комплекте атрибуты, содержащие ОГРН, не совпадают с атрибутом, содержащим ОГРН, в выписке из ЕГРЮЛ).[0094] In the example of the algorithm for searching for the current set of articles of association and amendments considered at step (140), the generated legal decision will include a list of used attributes containing the OGRN, GRN and the dates specified in the statutes, changes and in the extract from the Unified State Register of Legal Entities (Fig . 7). If the current set was found (positive result), then the conclusion will contain a corresponding message indicating the dates of registration of the current charter and changes. If, for some reason, the actual set was not found (negative result), then the conclusion will include a request for the current set, consisting of the charter and changes (for example, if the found set did not match the corresponding list of changes in the extract from the Unified State Register of Legal Entities ), or the conclusion about the need to conduct a certain stage of verification with the participation of a human expert (for example, if in all the statutes in the set the attributes containing the OGRN do not match the attribute containing the OGRN in the extract from the Unified State Register of Legal Entities).

[0095] На Фиг. 8 представлен пример организации системы (200) для применения вышеописанного способа принятия юридических решений (100). Исполняемая программная логика способа (100) может располагаться на централизованном вычислительном устройстве, например, сервере (220), доступ к которому обеспечивается посредством сети передачи данных, в частности, сети «Интернет», с помощью устройства пользователя (210).[0095] FIG. 8 shows an example of the organization of the system (200) for applying the above-described method of making legal decisions (100). The executable program logic of the method (100) can be located on a centralized computing device, for example, a server (220), access to which is provided via a data transmission network, in particular, the Internet, using a user device (210).

[0096] Запрос на получение той или иной услуги, требующей предоставления одного или нескольких документов (20) пользователем (10), осуществляется через соответствующий ресурс (веб-портал, мобильное приложение и т.п.), взаимодействие с которым осуществляется с помощью устройства пользователя (210). В качестве устройства (210) может применяться широкий спектр вычислительных устройств, например, персональный компьютер, ноутбук, смартфон, планшет, смарт-ТВ и т.п.[0096] A request for a particular service requiring the provision of one or more documents (20) by the user (10) is carried out through an appropriate resource (web portal, mobile application, etc.), interaction with which is carried out using the device user (210). A wide range of computing devices can be used as a device (210), for example, a personal computer, laptop, smartphone, tablet, smart TV, etc.

[0097] При выборе требуемого типа услуги клиентом (10), приложение на ресурсе с помощью вычислительного устройства (210) в ответ на запрос клиента (10) направляет информацию на устройство (210) с перечнем необходимых документов (20), которые будут требоваться для дальнейшего оказания услуги, и проверка которых будет осуществляться с помощью исполнения способа (100) на сервере (220).[0097] When the client (10) selects the required type of service, the application on the resource using the computing device (210) in response to the client's (10) request sends information to the device (210) with a list of required documents (20) that will be required for further provision of services, and the verification of which will be carried out using the execution of the method (100) on the server (220).

[0098] Передача документов (20) с помощью устройства (210) может осуществляться с помощью стандартизованной формы и принципов передачи данных, например, e-mail, мессенджеры, фотографическая съемка камерой устройства (210) с помощью специализированной функции мобильного или веб приложения (например, приложение Сбербанк Онлайн) и т.п. Документы (20), как правило, предоставляются в виде цифровых изображений (скан копий, фотоснимков) в одном из поддерживаемых форматов, например, JPG, JPEG, TIFF, PNG и т.п.[0098] The transmission of documents (20) using the device (210) can be carried out using a standardized form and principles of data transmission, for example, e-mail, instant messengers, photographic shooting by the camera of the device (210) using a specialized function of a mobile or web application (for example , Sberbank Online application), etc. Documents (20), as a rule, are provided in the form of digital images (scanned copies, photographs) in one of the supported formats, for example, JPG, JPEG, TIFF, PNG, etc.

[0099] На Фиг. 9 представлена блок-схема процесса обработки документов (300) на сервере (220) с помощью выполнения алгоритмической работы способа (100). Обработка документов осуществляется при их поступлении на сервер (220) в процессе требуемого анализа по формированию юридического заключения.[0099] FIG. 9 shows a flowchart of a document processing process (300) on a server (220) by performing the algorithmic work of method (100). The processing of documents is carried out when they arrive at the server (220) in the course of the required analysis to form a legal opinion.

[0100] Обработка полученных документов (302) клиента (10) выполняется на основании поступающего запроса (301) с помощью работы способа (100), описанного ранее. По итогам проверки на этапе (303) осуществляется формирование юридического заключения, которое далее передается на устройство (210) клиента (10) или в другие смежные системы. Формируемое заключение (303) может содержать информацию о положительном или отрицательном итоге проверки документов. В частности, заключение может содержать сведения о соответствии документов заданным требованиям (например, для оказания услуги), либо, содержать информацию о необходимости совершения дополнительных действий.[0100] The processing of the received documents (302) of the client (10) is performed based on the incoming request (301) using the method (100) described earlier. Based on the results of the check at step (303), a legal opinion is formed, which is then transmitted to the device (210) of the client (10) or to other related systems. The generated conclusion (303) may contain information about the positive or negative result of document verification. In particular, the conclusion may contain information about the compliance of documents with the specified requirements (for example, for the provision of a service), or contain information about the need for additional actions.

[0101] При отрицательном результате проверки дополнительными действиями могут служить, например, предоставление дополнительных документов или предоставление ранее представленных документов в более высоком качестве. Также, на этапе (303) может формироваться отрицательное решение по представленным документам (20) на основании их несоответствия нормам, установленным законом и/или ВНД.[0101] If the verification result is negative, additional actions can be, for example, the provision of additional documents or the provision of previously submitted documents in a higher quality. Also, at step (303), a negative decision can be formed on the submitted documents (20) on the basis of their non-compliance with the norms established by law and / or GNI.

[0102] Формирование юридического заключения (303) может выполняться для широкого профиля задач, например, получение кредита, открытие вклада, выпуск карт оплаты, заключение сделок (например, с помощью смарт-контрактов и т.п.), консультационная проверка договора/контракта и т.п.[0102] The formation of a legal opinion (303) can be performed for a wide range of tasks, for example, obtaining a loan, opening a deposit, issuing payment cards, concluding transactions (for example, using smart contracts, etc.), consulting verification of an agreement / contract etc.

[0103] На Фиг. 10 представлен пример общего вида вычислительного устройства (400), на базе которого может быть реализована одна или несколько автоматизированных систем, обеспечивающих реализацию заявленного способа (100) или (300). Упомянутые в настоящих материалах заявки такие устройства, как сервер, устройство пользователя и т.д. могут выполняться полностью или частично на базе устройства (400).[0103] FIG. 10 shows an example of a general view of a computing device (400), on the basis of which one or more automated systems can be implemented that provide the implementation of the claimed method (100) or (300). Devices such as a server, a user's device, etc. referred to in these applications. can be performed in whole or in part based on the device (400).

[0104] В общем случае, устройство (400) содержит объединенные общей шиной информационного обмена (410) один или несколько процессоров (401), средства памяти, такие как ОЗУ (402) и ПЗУ (403), интерфейсы ввода/вывода (404), устройства ввода/вывода (405), и устройство для сетевого взаимодействия (406).[0104] In the General case, the device (400) contains one or more processors (401) united by a common data exchange bus (410), memory means such as RAM (402) and ROM (403), input / output interfaces (404) , input / output devices (405), and a device for networking (406).

[0105] Процессор (401) (или несколько процессоров, многоядерный процессор и т.п.) может выбираться из ассортимента устройств, широко применяемых в настоящее время, например, таких производителей, как: Intel™, AMD™, Apple™, Samsung Exynos™, MediaTEK™, Qualcomm Snapdragon™ и т.п. Под процессором или одним из используемых процессоров в устройстве (400) также необходимо учитывать графический процессор, например, GPU NVIDIA или Graphcore, тип которых также является пригодным для полного или частичного выполнения способа (100), а также может применяться для обучения и применения моделей машинного обучения в различных информационных системах.[0105] The processor (401) (or multiple processors, multi-core processor, etc.) can be selected from a range of devices currently widely used, for example, manufacturers such as: Intel ™, AMD ™, Apple ™, Samsung Exynos ™, MediaTEK ™, Qualcomm Snapdragon ™, etc. Under the processor or one of the processors used in the device (400), it is also necessary to take into account a graphics processor, for example, NVIDIA GPU or Graphcore, the type of which is also suitable for full or partial execution of the method (100), and can also be used for training and applying machine models. training in various information systems.

[0106] ОЗУ (402) представляет собой оперативную память и предназначено для хранения исполняемых процессором (401) машиночитаемых инструкций для выполнения необходимых операций по логической обработке данных. ОЗУ (402), как правило, содержит исполняемые инструкции операционной системы и соответствующих программных компонент (приложения, программные модули и т.п.). При этом, в качестве ОЗУ (402) может выступать доступный объем памяти графической карты или графического процессора.[0106] RAM (402) is a random access memory and is intended for storing machine-readable instructions executed by the processor (401) for performing necessary operations for logical data processing. RAM (402) typically contains executable instructions of the operating system and associated software components (applications, software modules, etc.). In this case, the available memory of the graphics card or the graphics processor can act as RAM (402).

[0107] ПЗУ (403) представляет собой одно или более устройств постоянного хранения данных, например, жесткий диск (HDD), твердотельный накопитель данных (SSD), флэш-память (EEPROM, NAND и т.п.), оптические носители информации (CD-R/RW, DVD-R/RW, BlueRay Disc, MD) и др.[0107] ROM (403) is one or more persistent storage devices, such as a hard disk drive (HDD), solid state data storage device (SSD), flash memory (EEPROM, NAND, etc.), optical storage media ( CD-R / RW, DVD-R / RW, BlueRay Disc, MD), etc.

[0108] Для организации работы компонентов устройства (400) и организации работы внешних подключаемых устройств применяются различные виды интерфейсов В/В (404). Выбор соответствующих интерфейсов зависит от конкретного исполнения вычислительного устройства, которые могут представлять собой, не ограничиваясь: PCI, AGP, PS/2, IrDa, FireWire, LPT, COM, SATA, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232 и т.п.[0108] Various types of I / O interfaces (404) are used to organize the operation of device components (400) and to organize the operation of external connected devices. The choice of the appropriate interfaces depends on the specific version of the computing device, which can be, but are not limited to: PCI, AGP, PS / 2, IrDa, FireWire, LPT, COM, SATA, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS / Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232, etc.

[0109] Для обеспечения взаимодействия пользователя с устройством (400) применяются различные средства (405) В/В информации, например, клавиатура, дисплей (монитор), сенсорный дисплей, тач-пад, джойстик, манипулятор, мышь, световое перо, стилус, сенсорная панель, трекбол, динамики, микрофон, средства дополненной реальности, оптические сенсоры, планшет, световые индикаторы, проектор, камера, средства биометрической идентификации (сканер сетчатки глаза, сканер отпечатков пальцев, модуль распознавания голоса) и т.п.[0109] To ensure user interaction with the device (400), various I / O means (405) are used, for example, a keyboard, display (monitor), touch display, touch pad, joystick, manipulator, mouse, light pen, stylus, touch panel, trackball, speakers, microphone, augmented reality, optical sensors, tablet, light indicators, projector, camera, biometric identification (retina scanner, fingerprint scanner, voice recognition module), etc.

[0110] Средство сетевого взаимодействия (406) обеспечивает передачу данных посредством внутренней или внешней вычислительной сети, например, Интранет, Интернет, ЛВС и т.п.В качестве одного или более средств (406) может использоваться, но не ограничиваться: Ethernet карта, GSM модем, GPRS модем, LTE модем, 5G модем, модуль спутниковой связи, NFC модуль, Bluetooth и/или BLE модуль, Wi-Fi модуль и др.[0110] The means of networking (406) provides data transmission via an internal or external computer network, for example, Intranet, Internet, LAN, etc. One or more means (406) may be used, but not limited to: Ethernet card, GSM modem, GPRS modem, LTE modem, 5G modem, satellite communication module, NFC module, Bluetooth and / or BLE module, Wi-Fi module, etc.

[0111] Представленные материалы заявки раскрывают предпочтительные примеры реализации технического решения и не должны трактоваться как ограничивающие иные, частные примеры его воплощения, не выходящие за пределы испрашиваемой правовой охраны, которые являются очевидными для специалистов соответствующей области техники.[0111] The submitted application materials disclose preferred examples of the implementation of the technical solution and should not be interpreted as limiting other, particular examples of its implementation, not going beyond the scope of the claimed legal protection, which are obvious to specialists in the relevant field of technology.

Claims (32)

1. Компьютерно-реализуемый способ автоматического принятия правового решения, выполняемый с помощью по меньшей мере одного процессора, содержащий этапы, на которых:1. A computer-implemented method of automatic legal decision-making, performed using at least one processor, containing the stages at which: • получают запрос на формирование правового решения;• receive a request for the formation of a legal decision; • получают по меньшей мере один документ, соответствующий упомянутому запросу;• receive at least one document corresponding to the said request; • обрабатывают полученный документ на предмет выявления в документе по меньшей мере одной сущности, относящейся к запросу правового решения, и осуществляют ее извлечение из документа с помощью алгоритма машинного обучения;• process the received document to identify in the document at least one entity related to the request for a legal decision, and extract it from the document using a machine learning algorithm; • осуществляют юридический анализ упомянутой по меньшей мере одной извлеченной сущности с помощью набора правил, сформированных с помощью предметно-ориентированного языка;• performing legal analysis of the mentioned at least one extracted entity using a set of rules generated using a domain-specific language; • формируют правовое решение на основании проведенного юридического анализа упомянутых извлеченных сущностей упомянутого по меньшей мере одного документа.• form a legal decision on the basis of the conducted legal analysis of the mentioned extracted entities of the mentioned at least one document. 2. Способ по п. 1, характеризующийся тем, что на этапе обработки документа осуществляется распознавание печатного текста документа, при котором выполняется автоматическое распознавания изображения документов и извлечение текстовых данных из них.2. The method according to claim 1, characterized in that at the stage of document processing, the printed text of the document is recognized, in which automatic recognition of the document image and extraction of text data from them is performed. 3. Способ по п. 2, характеризующийся тем, что на основании извлеченных текстовых данных формируется новый документ.3. The method according to claim 2, characterized in that a new document is generated based on the extracted text data. 4. Способ по п. 3, характеризующийся тем, что выполняется определение типа документа с помощью сравнения извлеченных текстовых данных.4. The method according to claim 3, characterized in that the document type is determined by comparing the extracted text data. 5. Способ по п. 1, характеризующийся тем, что при получении нескольких документов осуществляется их обработка на предмет объединения в рамках полученного запроса формирования правового решения.5. The method according to claim 1, characterized in that when several documents are received, they are processed for merging within the framework of the received request for the formation of a legal decision. 6. Способ по п. 3, характеризующийся тем, что выполняется сравнение изображения печатного текста документа с новым документом, сформированным по итогам извлечения текстовых данных, сохраненным в новом документе, образованном в результате распознавания.6. The method according to claim 3, characterized in that the image of the printed text of the document is compared with a new document generated as a result of extracting text data stored in a new document generated as a result of recognition. 7. Способ по п. 6, характеризующийся тем, что при наличии расхождения между документами в результате сравнения, в новом документе выполняют исправления ошибок распознавания изображения документа.7. The method according to claim 6, characterized in that if there is a discrepancy between the documents as a result of comparison, the new document is corrected for errors in recognizing the document image. 8. Способ по п. 1, характеризующийся тем, что дополнительно выполняют верификацию по меньшей мере одной извлеченной сущности из документа.8. The method according to claim 1, characterized in that at least one extracted entity from the document is verified. 9. Способ по п. 8, характеризующийся тем, что выполняется анализ смыслового соответствия по меньшей мере одной извлеченной сущности участку текста документа, из которого было осуществлено упомянутое извлечение.9. The method according to claim 8, characterized in that the analysis of the semantic correspondence of at least one extracted entity to a portion of the document text from which said extraction was performed is performed. 10. Способ по п. 8, характеризующийся тем, что выполняется корректировка по меньшей мере одной извлеченной сущности, причем такая корректировка включает в себя, по меньшей мере одно из: исправление орфографических ошибок, пунктуации, технических ошибок, смысловых ошибок.10. A method according to claim 8, characterized in that the correction of at least one extracted entity is performed, and such correction includes at least one of: correction of spelling errors, punctuation, technical errors, semantic errors. 11. Способ по п. 5, характеризующийся тем, что выполняется фильтрация документов, по меньшей мере утративших юридическую силу.11. The method according to claim 5, characterized in that the filtration of documents that have at least become invalid is performed. 12. Способ по п. 5, характеризующийся тем, что на этапе выполняется кросс-проверка юридических сущностей, при которой осуществляется сравнение юридических фактов, содержащихся в документах, отобранных для формирования юридического заключения.12. The method according to claim 5, characterized in that at the stage a cross-check of legal entities is performed, in which a comparison of legal facts contained in the documents selected for the formation of a legal opinion is carried out. 13. Устройство автоматического принятия правового решения, содержащее по меньшей мере один процессор и по меньшей мере одно средство памяти, соединенное с процессором и содержащее машиночитаемые инструкции, которые при их исполнении процессором обеспечивают выполнение вышеуказанного способа по любому из пп. 1-12.13. An automatic legal decision-making device comprising at least one processor and at least one memory means connected to the processor and containing machine-readable instructions, which, when executed by the processor, ensure the implementation of the above method according to any one of claims. 1-12. 14. Система автоматического принятия правового решения, содержащая систему интеллектуального распознавания документов, включающую модуль обработки, выполняющий получение запроса на формирование правового решения;14. The system of automatic legal decision-making, containing a system of intelligent recognition of documents, including a processing module that receives a request for the formation of a legal decision; получение по меньшей мере одного документа, связанного с упомянутым запросом;obtaining at least one document associated with said request; модуль извлечения сущности, обеспечивающий выявление в документе по меньшей мере одной сущности, относящейся к запросу правового решения, и ее извлечение из документа с помощью алгоритма машинного обучения;an entity extraction module, which ensures that at least one entity related to the request for a legal decision is identified in the document and extracted from the document using a machine learning algorithm; систему автоматизированного принятия решений, обеспечивающуюan automated decision-making system that provides выполнение юридического анализа упомянутой по меньшей мере одной извлеченной сущности с помощью набора правил, сформированных с помощью предметно-ориентированного языка;performing legal analysis of said at least one extracted entity using a set of rules generated using a domain-specific language; формирование правового решения на основании проведенного юридического анализа упомянутых извлеченных сущностей упомянутого по меньшей мере одного документа.formation of a legal decision on the basis of the conducted legal analysis of said extracted entities of said at least one document. 15. Система по п. 14, характеризующаяся тем, что дополнительно содержит модуль верификации извлеченных сущностей, выполняющий проверку правильности извлечения атрибутов документов.15. The system according to claim 14, characterized in that it additionally contains a verification module of the extracted entities that checks the correctness of the extraction of document attributes. 16. Система по п. 15, характеризующаяся тем, что модуль верификации выполняет анализ смыслового соответствия по меньшей мере одной извлеченной сущности участку текста документа, из которого было осуществлено упомянутое извлечение.16. The system according to claim 15, characterized in that the verification module analyzes the semantic correspondence of at least one extracted entity to a portion of the document text from which said extraction was performed. 17. Система по п. 15, характеризующаяся тем, что модуль верификации выполняет корректировку по меньшей мере одной извлеченной сущности, причем такая корректировка включает в себя, по меньшей мере одно из: исправление орфографических ошибок, пунктуации, технических ошибок, смысловых ошибок.17. The system of claim. 15, characterized in that the verification module performs correction of at least one extracted entity, and such correction includes at least one of: correction of spelling errors, punctuation, technical errors, semantic errors. 18. Система по п. 14, характеризующаяся тем, что модуль обработки выполняет распознавание печатного текста документа, при котором выполняется автоматическое распознавание изображения документов и извлечение текстовых данных из них.18. The system of claim. 14, characterized in that the processing module performs recognition of the printed text of the document, in which automatic recognition of the document image and extraction of text data from them is performed. 19. Система по п. 18, характеризующаяся тем, что на основании извлеченных текстовых данных формируется новый документ.19. The system according to claim 18, characterized in that a new document is generated based on the extracted text data. 20. Система по п. 18, характеризующаяся тем, что выполняется определение типа документа с помощью сравнения извлеченных текстовых данных.20. The system according to claim 18, characterized in that the document type is determined by comparing the extracted text data. 21. Система по п. 19, характеризующаяся тем, что выполняется сравнение изображения печатного текста документа с новым документом, сформированным по итогам извлечения текстовых данных, сохраненным в новом документе, образованном в результате распознавания.21. The system according to claim 19, characterized in that the image of the printed text of the document is compared with a new document generated as a result of extracting text data stored in a new document generated as a result of recognition. 22. Система по п. 21, характеризующаяся тем, что при наличии расхождения между документами в результате сравнения, в новом документе выполняют исправления ошибок распознавания изображения документа.22. The system according to claim 21, characterized in that if there is a discrepancy between the documents as a result of comparison, the new document is corrected for errors in the recognition of the document image.
RU2019139543A 2019-12-04 2019-12-04 Method and system for automatic legal decision-making RU2732071C1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2019139543A RU2732071C1 (en) 2019-12-04 2019-12-04 Method and system for automatic legal decision-making
PCT/RU2019/000887 WO2021112704A1 (en) 2019-12-04 2019-12-04 Method and system for automatic legal decision making
EA201992843A EA039140B1 (en) 2019-12-04 2019-12-26 Method and system for automatic legal decision making

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2019139543A RU2732071C1 (en) 2019-12-04 2019-12-04 Method and system for automatic legal decision-making

Publications (1)

Publication Number Publication Date
RU2732071C1 true RU2732071C1 (en) 2020-09-11

Family

ID=72516376

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019139543A RU2732071C1 (en) 2019-12-04 2019-12-04 Method and system for automatic legal decision-making

Country Status (3)

Country Link
EA (1) EA039140B1 (en)
RU (1) RU2732071C1 (en)
WO (1) WO2021112704A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022197201A1 (en) * 2021-03-17 2022-09-22 Публичное Акционерное Общество "Сбербанк России" Method and device for checking operations and transactions for legal risks
RU2828182C1 (en) * 2024-02-16 2024-10-07 Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" Device for recognizing conditionally rigid business documents with automatic binding of their fields

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230102198A1 (en) * 2021-09-30 2023-03-30 Intuit Inc. Artificial intelligence based compliance document processing

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU710599B2 (en) * 1996-06-11 1999-09-23 Yeong Kuang Oon Iterative problem solving technique
US20120072859A1 (en) * 2008-06-02 2012-03-22 Pricewaterhousecoopers Llp System and method for comparing and reviewing documents
US20130297540A1 (en) * 2012-05-01 2013-11-07 Robert Hickok Systems, methods and computer-readable media for generating judicial prediction information
US20150046369A1 (en) * 2013-08-09 2015-02-12 Axiom Global Inc. Document generation, interpretation, and administration system with built in workflows and analytics
RU151947U1 (en) * 2014-08-18 2015-04-20 Открытое акционерное общество "Татнефть" им. В.Д. Шашина KNOWLEDGE BASIS FORMATION SYSTEM
US20170287090A1 (en) * 2016-03-31 2017-10-05 Clause, Inc. System and method for creating and executing data-driven legal contracts
CN107807962A (en) * 2017-10-11 2018-03-16 中国软件与技术服务股份有限公司 A kind of method for carrying out similarity mode to legal decision document using LDA topic models

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10535017B2 (en) * 2015-10-27 2020-01-14 Legility Data Solutions, Llc Apparatus and method of implementing enhanced batch-mode active learning for technology-assisted review of documents
CN106934483A (en) * 2016-11-18 2017-07-07 北京工业大学 A kind of criminal justice reasoning by cases method based on body by linear programming
US10936672B2 (en) * 2018-02-28 2021-03-02 Confidentiality Corp Automatic document negotiation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU710599B2 (en) * 1996-06-11 1999-09-23 Yeong Kuang Oon Iterative problem solving technique
US20120072859A1 (en) * 2008-06-02 2012-03-22 Pricewaterhousecoopers Llp System and method for comparing and reviewing documents
US20130297540A1 (en) * 2012-05-01 2013-11-07 Robert Hickok Systems, methods and computer-readable media for generating judicial prediction information
US20150046369A1 (en) * 2013-08-09 2015-02-12 Axiom Global Inc. Document generation, interpretation, and administration system with built in workflows and analytics
RU151947U1 (en) * 2014-08-18 2015-04-20 Открытое акционерное общество "Татнефть" им. В.Д. Шашина KNOWLEDGE BASIS FORMATION SYSTEM
US20170287090A1 (en) * 2016-03-31 2017-10-05 Clause, Inc. System and method for creating and executing data-driven legal contracts
CN107807962A (en) * 2017-10-11 2018-03-16 中国软件与技术服务股份有限公司 A kind of method for carrying out similarity mode to legal decision document using LDA topic models

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022197201A1 (en) * 2021-03-17 2022-09-22 Публичное Акционерное Общество "Сбербанк России" Method and device for checking operations and transactions for legal risks
RU2828182C1 (en) * 2024-02-16 2024-10-07 Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" Device for recognizing conditionally rigid business documents with automatic binding of their fields

Also Published As

Publication number Publication date
WO2021112704A1 (en) 2021-06-10
EA039140B1 (en) 2021-12-09
EA201992843A1 (en) 2021-06-30

Similar Documents

Publication Publication Date Title
US10387565B2 (en) Systems and methods for advanced grammar checking
US10733675B2 (en) Accuracy and speed of automatically processing records in an automated environment
US20210081566A1 (en) Device, process and system for risk mitigation
CN112631997A (en) Data processing method, device, terminal and storage medium
US11586815B2 (en) Method, system and computer program product for generating artificial documents
US12067039B1 (en) Systems and methods for providing user interfaces for configuration of a flow for extracting information from documents via a large language model
US20220350814A1 (en) Intelligent data extraction
CN119047450A (en) Contract template data processing method and device and computer equipment
RU2732071C1 (en) Method and system for automatic legal decision-making
CN118313348A (en) Document format typesetting method, device, computer equipment, storage medium and product
US11321531B2 (en) Systems and methods of updating computer modeled processes based on real time external data
CN113220885A (en) Text processing method and system
CN119377415B (en) Chinese bad language theory detection method and system
CN120410179A (en) Contract risk auditing method and device
CN120632125A (en) Document processing method and system based on text content extraction
CN120181067A (en) Tender document compliance detection method, device, system, equipment and storage medium
RU2755606C2 (en) Method and system for classifying data for identifying confidential information in the text
US20220122184A1 (en) Document Monitoring, Visualization, and Error Handling
US12242799B2 (en) System and method for reviewing and evaluating discrepancies between two or more documents
WO2024220417A1 (en) Machine learning systems for auto-splitting and classifying documents
Pukas et al. Intelligent Analyzing Module in the Academic Staff Performance Appraisal System.
Blinova et al. Individual attendance data for over 30 years of international climate change talks
Ustenko et al. Amazon Textract and artficial intelegence system at banking document managment system
Cholissodin et al. Audit system development for government institution documents using stream deep learning to support smart governance
US20250384707A1 (en) Method and appratus for dataset evaluation and database management