JP2025118034A - Processing device, processing program, and processing method - Google Patents
Processing device, processing program, and processing methodInfo
- Publication number
- JP2025118034A JP2025118034A JP2024013091A JP2024013091A JP2025118034A JP 2025118034 A JP2025118034 A JP 2025118034A JP 2024013091 A JP2024013091 A JP 2024013091A JP 2024013091 A JP2024013091 A JP 2024013091A JP 2025118034 A JP2025118034 A JP 2025118034A
- Authority
- JP
- Japan
- Prior art keywords
- information
- contract
- document
- document information
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 文書情報をより効率的に処理可能な処理装置、処理プログラム及び処理方法を提供する。
【解決手段】 少なくとも一つのプロセッサを具備する処理装置であって、前記少なくとも一つのプロセッサが、入力された文書情報を取得し、取得した前記文書情報が契約書情報を含むか否かを判定し、前記判定の結果に応じて取得した前記文書情報を分類するための処理を実行するように構成された処理装置が提供される。
【選択図】 図4
A processing device, a processing program, and a processing method are provided that are capable of processing document information more efficiently.
[Solution] A processing device is provided that has at least one processor, wherein the at least one processor is configured to acquire input document information, determine whether the acquired document information includes contract information, and execute processing to classify the acquired document information according to the result of the determination.
[Selected figure] Figure 4
Description
本開示は、文書情報を処理するように構成された処理装置、処理プログラム及び処理方法に関する。 This disclosure relates to a processing device, a processing program, and a processing method configured to process document information.
従来より、契約書に記載された事項を取得して契約書に関する審査を行うためのシステムが提案されている。例えば、特許文献1には、「予め作成された所定のリース契約依頼書に記載された記載事項データと当該リース契約に係るリース物件販売者の信用情報データとに基づいて、当該リース物件利用者の信用度を点数化した評価点数を算出するためのスコアリング手段と、前記リース契約依頼書に記載された記載事項と前記スコアリング手段が算出した評価点数に基づいて当該リース契約依頼が所定の承認基準を満たすものであるか否かを審査するための審査手段と、前記審査手段が承認基準を満たすものであると判断した場合には、当該リース契約依頼を承認するリース契約承認手段と、前記リース契約依頼書に記載された記載事項に基づいてリース料金を算出して前記リース物件利用者(リース契約者)とのリース契約書を自動作成する契約書作成手段と、の各手段を具備することを特徴とするリース契約を支援するための情報処理システム」が記載されている。 Systems for acquiring details from contracts and conducting contract reviews have been proposed. For example, Patent Document 1 describes an information processing system for supporting lease contracts, comprising: "a scoring unit for calculating an evaluation score representing the creditworthiness of a lease property user based on data on details entered in a predetermined lease contract request form prepared in advance and credit information data on the lease property seller related to the lease contract; an evaluation unit for evaluating whether the lease contract request satisfies predetermined approval criteria based on the details entered in the lease contract request form and the evaluation score calculated by the scoring unit; a lease contract approval unit for approving the lease contract request if the evaluation unit determines that the approval criteria are met; and a contract creation unit for calculating a lease fee based on the details entered in the lease contract request form and automatically creating a lease contract with the lease property user (leaseholder)."
そこで、上記のような技術を踏まえ、本開示では、様々な実施形態により、文書情報をより効率的に処理可能な処理装置、処理プログラム及び処理方法を提供することを目的とする。 Based on the above-mentioned technologies, the present disclosure aims to provide, through various embodiments, a processing device, processing program, and processing method that can process document information more efficiently.
本開示の一態様によれば、「少なくとも一つのプロセッサを具備する処理装置であって、前記少なくとも一つのプロセッサが、入力された文書情報を取得し、取得した前記文書情報が契約書情報を含むか否かを判定し、前記判定の結果に応じて取得した前記文書情報を分類するための処理を実行するように構成された処理装置」が提供される。 One aspect of the present disclosure provides a processing device including at least one processor, the processing device being configured to acquire input document information, determine whether the acquired document information includes contract information, and execute processing to classify the acquired document information in accordance with the result of the determination.
本開示の一態様によれば、「少なくとも一つのプロセッサにより実行されることにより、入力された文書情報を取得し、取得した前記文書情報が契約書情報を含むか否かを判定し、前記判定の結果に応じて取得した前記文書情報を分類するように前記少なくとも一つのプロセッサを機能させる処理プログラム」が提供される。 One aspect of the present disclosure provides a processing program that, when executed by at least one processor, causes the at least one processor to acquire input document information, determine whether the acquired document information includes contract information, and classify the acquired document information in accordance with the result of the determination.
本開示の一態様によれば、「少なくとも一つのプロセッサにより実行される処理方法であって、入力された文書情報を取得する段階と、取得した前記文書情報が契約書情報を含むか否かを判定する段階と、前記判定の結果に応じて取得した前記文書情報を分類する段階とを含む処理方法」が提供される。 One aspect of the present disclosure provides a processing method executed by at least one processor, the processing method including the steps of acquiring input document information, determining whether the acquired document information includes contract information, and classifying the acquired document information in accordance with the result of the determination.
本開示によれば、文書情報をより効率的に処理可能な処理装置、処理プログラム及び処理方法を提供することができる。 This disclosure provides a processing device, processing program, and processing method that can process document information more efficiently.
なお、上記効果は説明の便宜のための例示的なものであるにすぎず、限定的なものではない。上記効果に加えて、又は上記効果に代えて、本開示中に記載されたいかなる効果や当業者であれば明らかな効果を奏することも可能である。 The above effects are merely illustrative for the sake of convenience and are not limiting. In addition to or instead of the above effects, any effect described in this disclosure or any effect that would be obvious to one skilled in the art may be achieved.
1.処理システム1の概要
本開示に係る処理システム1は、取得した文書情報が契約書情報を含むか否かを判定し、その判定の結果に応じて取得した当該文書情報を分類するために利用されるシステムである。特に、処理システム1は、ユーザの端末装置の入力インターフェイスを介して入力された文書情報を取得して、取得した文書情報についてその中に契約書情報を含むか否かを判定する。そして、処理システム1は、その判定した結果に応じて文書情報を分類する。処理システム1は、上記の通り取得された文書情報が契約書情報を含んでいる場合には、契約書情報の解析処理を実行するなど、その分類された結果に応じて適切な処理を実行することができる。
1. Overview of Processing System 1 The processing system 1 according to the present disclosure is a system used to determine whether acquired document information includes contract information and classify the acquired document information according to the results of the determination. In particular, the processing system 1 acquires document information input via an input interface of a user's terminal device and determines whether the acquired document information includes contract information. The processing system 1 then classifies the document information according to the results of the determination. If the acquired document information includes contract information as described above, the processing system 1 can perform appropriate processing according to the classification results, such as performing an analysis process of the contract information.
なお、本開示において、文書情報は、個人又は組織において参照されることを前提として記憶される情報である。このような文書情報の一例としては、公文書、公文書、契約書、議事録、規則、通知書、規定書、請求書、見積書、報告書、届出書、案内文書及び規程など、様々な種別の文書が挙げられる。また、文書情報は、日本語、英語、中国語又はこれらの組み合わせなど、記載された言語は問わない。このような文書情報は、ドキュメントデータ形式、プレゼンテーションデータ形式、画像データ形式、印刷レイアウトデータ形式、これら形式のファイルからテキスト情報を抽出したテキストデータ形式など、いかなる形式であってもよい。 In this disclosure, document information refers to information stored with the intention of being referenced by individuals or organizations. Examples of such document information include various types of documents, such as official documents, contracts, minutes, rules, notices, regulations, invoices, estimates, reports, notifications, guide documents, and regulations. Document information may be written in any language, such as Japanese, English, Chinese, or a combination of these. Such document information may be in any format, such as document data format, presentation data format, image data format, print layout data format, or text data format in which text information is extracted from files in these formats.
契約書情報は、上記文書情報の種別の一つであり、法的な効力を有する内容を含むものである。例えば、2以上の当事者(個人であっても組織であってもよい)間で少なくともいずれかの意思表示や、当事者同士の合意の事実、特に契約の成立を証明するために用いられる。このような契約書情報の一例としては、秘密保持契約書、業務委託契約書、取引基本契約書、開発委託契約書、ライセンス契約書、贈与契約書、売買契約書、賃貸借契約書、和解契約書、及び共同研究契約書などの契約書に加えて、上記事実や契約の成立を証明することが可能な覚書、規約、規程、合意書、申込書、注文書、依頼書、念書及び請書など、様々な形態の文書が含まれる。このような契約書情報は、文書情報で説明した通り、日本語、英語、中国語又はこれらの組み合わせなど、記載された言語は問わない。このような契約書情報は、ドキュメントデータ形式、プレゼンテーションデータ形式、画像データ形式、印刷レイアウトデータ形式、これら形式のファイルからテキスト情報を抽出したテキストデータ形式など、いかなる形式であってもよい。なお、以下においては、契約書情報の一例として業務委託契約書を挙げて説明するが、当然これのみに限定されるわけではない。 Contract information is one type of document information described above and contains legally binding content. For example, it is used to demonstrate at least one expression of intent between two or more parties (who may be individuals or organizations), or to prove the fact of an agreement between the parties, particularly the formation of a contract. Examples of such contract information include non-disclosure agreements, outsourcing agreements, master transaction agreements, development outsourcing agreements, license agreements, gift agreements, purchase and sale agreements, lease agreements, settlement agreements, and joint research agreements, as well as various other documents that can prove the facts or formation of the above contracts, such as memoranda, regulations, rules, agreements, applications, purchase orders, requests, memoranda, and acknowledgements. As described for document information, such contract information can be written in any language, including Japanese, English, Chinese, or a combination of these. Such contract information can be in any format, such as document data, presentation data, image data, print layout data, or text data extracted from files in these formats. In the following, we will use a business outsourcing contract as an example of contract information, but of course this is not limited to this.
2.処理システム1の構成
図1は、本開示の一実施形態に係る処理システム1の構成を示すブロック図である。図1によれば、処理システム1は、サーバ装置100と端末装置200とを少なくとも含み、各装置が有線又は無線ネットワークを介して通信可能に接続されている。サーバ装置100は、端末装置200から取得した文書情報について契約書情報を含むか否かを判定し、その判定の結果に応じて取得した文書情報を分類する。端末装置200は、入力インターフェイスを介してユーザによる操作入力を受け付けて文書情報を入力すると共に、サーバ装置100から受信した各種情報(例えば、文書判定画面)を表示する。
2. Configuration of Processing System 1 FIG. 1 is a block diagram showing the configuration of a processing system 1 according to an embodiment of the present disclosure. According to FIG. 1 , the processing system 1 includes at least a server device 100 and a terminal device 200, which are communicatively connected via a wired or wireless network. The server device 100 determines whether document information acquired from the terminal device 200 includes contract information and classifies the acquired document information according to the results of the determination. The terminal device 200 receives user input via an input interface to input document information, and displays various information received from the server device 100 (e.g., a document determination screen).
なお、本開示において、処理装置は、サーバ装置100、端末装置200又はそれらの組み合わせを意味する。すなわち、以下においてはサーバ装置100が処理装置として機能する場合について説明するが、端末装置200も同様に処理装置として機能することが可能である。また、本開示においては、処理装置が行う記憶や処理は、他の端末装置や他のサーバ装置などに分散させる場合もある。つまり、処理装置は、単一の筐体から構成されるもののみに限定されるわけではなく、サーバ装置100、端末装置200、他のサーバ装置、他の端末装置又はそれらの組み合わせを含む。 In this disclosure, the processing device refers to the server device 100, the terminal device 200, or a combination thereof. In other words, although the following describes the case where the server device 100 functions as a processing device, the terminal device 200 can also function as a processing device. In addition, in this disclosure, the storage and processing performed by the processing device may be distributed to other terminal devices, other server devices, etc. In other words, the processing device is not limited to those configured from a single housing, but includes the server device 100, the terminal device 200, other server devices, other terminal devices, or a combination thereof.
また、図1において、端末装置200は一台しか記載されていない。しかし、複数のユーザが処理システム1を利用することが可能である。すなわち、端末装置200は当然一台のみに限られることはなく、ユーザの数に応じて複数の端末装置200を含みうる。 Furthermore, in Figure 1, only one terminal device 200 is shown. However, multiple users can use the processing system 1. In other words, the number of terminal devices 200 is not necessarily limited to one, and multiple terminal devices 200 may be included depending on the number of users.
3.サーバ装置100の構成
図2は、本開示の一実施形態に係るサーバ装置100の構成を示すブロック図である。図2によると、サーバ装置100は、プロセッサ111、メモリ112及び通信インターフェイス113を含む。これらの各構成要素は、互いに、制御ライン及びデータラインを介して互いに電気的に接続される。サーバ装置100は、図2に示す構成要素の全てを備える必要はなく、一部を省略して構成することも可能であるし、他の構成要素を加えることも可能である。例えばメモリとして通信可能に接続された外部メモリや、データベース装置、サーバ装置などを利用することも可能である。また、一部の処理を他のサーバ装置を含む処理装置と分散して実行することも可能である。すなわち、サーバ装置100は、単一の装置のみに限定されるわけではなく、その情報の取り扱いや処理負担に応じて複数の装置に分散している場合も含む。
3. Configuration of the Server Device 100 FIG. 2 is a block diagram showing the configuration of the server device 100 according to an embodiment of the present disclosure. According to FIG. 2, the server device 100 includes a processor 111, a memory 112, and a communication interface 113. These components are electrically connected to each other via control lines and data lines. The server device 100 does not need to include all of the components shown in FIG. 2; some components may be omitted, or other components may be added. For example, an external memory, a database device, a server device, or the like connected in a communicable manner as memory may be used. Furthermore, some processing may be distributed and executed among processing devices, including other server devices. In other words, the server device 100 is not limited to a single device, but may be distributed across multiple devices depending on the information handling and processing load.
プロセッサ111は、メモリ112に記憶された処理プログラムに基づいて処理システム1の他の構成要素の制御を行う制御部として機能する。プロセッサ111は、メモリ112に記憶された処理プログラムに基づいて、取得した文書情報に契約書情報を含むか否かを判定し、その判定の結果に応じて文書情報を分類する処理を実行する。具体的には、「入力された文書情報を取得する処理」、及び「判定の結果に応じて取得した文書情報を分類する処理」などを、メモリ112に記憶された処理プログラムに基づいて実行する。プロセッサ111は、主に一又は複数のCPUにより構成されるが、適宜GPUやFPGAなどを組み合わせてもよい。 The processor 111 functions as a control unit that controls the other components of the processing system 1 based on the processing program stored in the memory 112. Based on the processing program stored in the memory 112, the processor 111 determines whether the acquired document information contains contract information, and executes a process to classify the document information according to the result of that determination. Specifically, the processor 111 executes processes such as "processing to acquire input document information" and "processing to classify the acquired document information according to the result of the determination" based on the processing program stored in the memory 112. The processor 111 is primarily composed of one or more CPUs, but may also be combined with a GPU, FPGA, etc. as appropriate.
メモリ112は、RAM、ROM、不揮発性メモリ、HDD、SSD等から構成され、記憶部として機能する。メモリ112は、本実施形態に係る処理システム1の様々な制御のための指示命令を処理プログラムとして記憶する。具体的には、メモリ112は、「入力インターフェイスを介して入力された文書情報を取得する処理」、及び「判定の結果に応じて取得した文書情報を分類するする処理」など、プロセッサ111が実行するためのプログラムを記憶する。また、メモリ112は、当該プログラムのほかに、文書管理テーブルなどに記憶された様々な情報を記憶する。なお、これらの情報は、サーバ装置100内のメモリ112に常に記憶されている必要はなく、遠隔に設置されたデータベース装置に記憶されていてもよい。その場合は、当該データベース装置もメモリ112に含まれる。 The memory 112 is composed of RAM, ROM, non-volatile memory, HDD, SSD, etc., and functions as a storage unit. The memory 112 stores instructions and commands for various controls of the processing system 1 according to this embodiment as processing programs. Specifically, the memory 112 stores programs to be executed by the processor 111, such as "processing for acquiring document information input via an input interface" and "processing for classifying acquired document information according to the results of judgment." In addition to these programs, the memory 112 also stores various information stored in document management tables, etc. Note that this information does not need to be constantly stored in the memory 112 within the server device 100, and may be stored in a database device installed remotely. In this case, the database device is also included in the memory 112.
通信インターフェイス113は、有線又は無線ネットワークを介して接続された端末装置200との間で様々な情報の送受信をするための通知部として機能する。通信インターフェイス113の一例としては、USB、SCSIなどの有線通信用コネクタや、無線LAN、Bluetooth(登録商標)、LTE等の広帯域無線通信、赤外線などの無線通信用送受信デバイスや、プリント実装基板やフレキシブル実装基板用の各種接続端子など、様々なものが挙げられる。通信インターフェイス113は、例えば、端末装置200から文書情報を受信したり、端末装置200に文書判定画面の出力情報を送信したりする。 The communication interface 113 functions as a notification unit for sending and receiving various information to and from the terminal device 200 connected via a wired or wireless network. Examples of the communication interface 113 include wired communication connectors such as USB and SCSI, broadband wireless communication devices such as wireless LAN, Bluetooth (registered trademark), and LTE, wireless communication transmission/reception devices such as infrared, and various connection terminals for printed circuit boards and flexible circuit boards. The communication interface 113, for example, receives document information from the terminal device 200 and sends output information of the document judgment screen to the terminal device 200.
4.その他の装置
端末装置200の構成については、例えば、制御部として機能するプロセッサ、記憶部として機能するメモリ、入力部として機能する入力インターフェイス、出力部として機能する出力インターフェイス、及び通信部として機能する通信インターフェイスを含む。これらの各構成要素は、互いに、制御ライン及びデータラインを介して互いに電気的に接続される。なお、端末装置200は、これら構成要素の全てを備える必要はなく、一部を省略して構成することも可能であるし、他の構成要素を加えることも可能である。端末装置200は、サーバ装置100と有線又は無線ネットワークを介して通信可能なものであればいずれでもよく、スマートフォン装置、タブレット装置、ラップトップPC装置、デスクトップPC装置、スキャナ装置、撮影装置、及び複合機などが端末装置200として利用される。なお、端末装置200は、上記の通り複数のユーザが存在する場合、ユーザごとに複数台の端末装置200が利用されるが、各端末装置200がそれぞれ異なる形態の端末装置であってもよい。また、必ずしも一のユーザに対して一の端末装置200が存在する必要はなく、複数のユーザが一台の端末装置200を利用してもよいし、一人のユーザが複数の端末装置200を利用してもよい。
4. Other Devices The configuration of the terminal device 200 includes, for example, a processor functioning as a control unit, a memory functioning as a storage unit, an input interface functioning as an input unit, an output interface functioning as an output unit, and a communication interface functioning as a communication unit. These components are electrically connected to each other via control lines and data lines. Note that the terminal device 200 does not necessarily need to include all of these components; it may be configured with some of the components omitted, or other components may be added. The terminal device 200 may be any device capable of communicating with the server device 100 via a wired or wireless network. Examples of the terminal device 200 include smartphones, tablets, laptop PCs, desktop PCs, scanners, image capture devices, and multifunction peripherals. Note that, as described above, when there are multiple users, multiple terminal devices 200 are used for each user, but the terminal devices 200 may each be a different type of terminal device. Furthermore, it is not necessary for one terminal device 200 to exist for one user; multiple users may use one terminal device 200, or one user may use multiple terminal devices 200.
端末装置200は、例えば、メモリに記憶されたプログラムをプロセッサが処理することによって、入力インターフェイスを介して契約書などの様々な文書に関する文書情報を入力し、通信インターフェイスを介して入力した文書情報をサーバ装置100に送信する。具体的には、端末装置200のプロセッサは、入力インターフェイスとして機能するカメラユニットを介して文書を撮影し、当該撮影した画像データを文書情報として入力する。また、端末装置200のプロセッサは、入力インターフェイスとして機能するタッチパネル等の操作ユニットを介してユーザの操作入力を受け付けて、選択されたドキュメント形式のファイルを文書情報として入力する。また、端末装置200のプロセッサは、入力インターフェイスとして機能するタッチパネル等の操作ユニットを介して、スキャナユニットを介して文書の画像データを取り込み、取り込んだ当該画像データを文書情報として入力する。端末装置200のプロセッサは、通信インターフェイスを介して、このような方法により入力された文書情報をサーバ装置に送信する。 The terminal device 200 inputs document information related to various documents, such as contracts, via an input interface and transmits the input document information to the server device 100 via a communication interface, for example, by having the processor process a program stored in memory. Specifically, the processor of the terminal device 200 photographs a document via a camera unit that functions as an input interface and inputs the photographed image data as document information. The processor of the terminal device 200 also accepts user input via an operation unit, such as a touch panel, that functions as an input interface, and inputs a file in the selected document format as document information. The processor of the terminal device 200 also captures document image data via a scanner unit and an operation unit, such as a touch panel, that functions as an input interface, and inputs the captured image data as document information. The processor of the terminal device 200 transmits the document information input in this manner to the server device via the communication interface.
端末装置200は、例えば、メモリに記憶されたプログラムをプロセッサが処理することによって、さらに、通信インターフェイスを介して受信した様々な出力情報を、出力インターフェイスを介して出力する。具体的には、端末装置200のプロセッサは、サーバ装置100から文書情報に関する文書判定画面の出力情報を、通信インターフェイスを介して受信し、当該画面をディスプレイ等の出力インターフェイスに出力する。 The terminal device 200, for example, has a processor that processes a program stored in memory, and further outputs various output information received via a communication interface via the output interface. Specifically, the processor of the terminal device 200 receives output information for a document judgment screen related to document information from the server device 100 via the communication interface, and outputs the screen to an output interface such as a display.
本実施形態においてはサーバ装置100が文書情報を取得すると、当該文書情報を学習済み判定モデルに入力することによって契約書情報を含むか否かの判定を行う。そのため、処理システム1は、場合によっては、さらにモデル生成装置を含むことが可能である。当該モデル生成装置は、プロセッサ、メモリ及び通信インターフェイスを含み、これらの各要素が互いに制御ライン又はデータラインを介して電気的に接続されている。モデル生成装置は、メモリに記憶されたプログラムをプロセッサが処理することによって、学習用に用意された学習用文書情報と、当該文書情報をラベル付けした学習用判定結果情報との組を学習させて、学習済み判定モデルを生成する。 In this embodiment, when the server device 100 acquires document information, it inputs the document information into a trained judgment model to determine whether it contains contract information. Therefore, the processing system 1 may, in some cases, further include a model generation device. The model generation device includes a processor, memory, and a communication interface, with these elements electrically connected to each other via control lines or data lines. The model generation device generates a trained judgment model by having the processor process a program stored in memory, learning pairs of training document information prepared for training and training judgment result information that labels the document information.
なお、このようなモデル生成装置は必ずしも必要ではなく、サーバ装置100又は端末装置200が学習済み判定モデルを生成することも可能である。 Note that such a model generation device is not necessarily required; the server device 100 or the terminal device 200 can also generate a trained decision model.
5.処理システム1における処理で用いられる各種情報
図3Aは、本開示の一実施形態に係るサーバ装置100に記憶される文書情報テーブルを概念的に示す図である。図3Aによれば、本実施形態の文書管理テーブルには、文書ID情報に対応付けて、文書情報、分類情報、ひな形情報、属性情報、関連契約書情報、及びリスク情報などが記憶される。
5. Various Information Used in Processing in the Processing System 1 Fig. 3A is a diagram conceptually illustrating a document information table stored in the server device 100 according to an embodiment of the present disclosure. According to Fig. 3A, the document management table of this embodiment stores document information, classification information, template information, attribute information, related contract information, risk information, and the like, in association with document ID information.
「文書ID情報」は、例えば、各文書情報に固有の情報で、各文書情報を特定するための情報である。文書ID情報は、例えば、新たな文書情報が受信されるたびにサーバ装置100によって生成される。 "Document ID information" is, for example, information unique to each piece of document information and is used to identify each piece of document information. Document ID information is generated by the server device 100, for example, each time new document information is received.
「文書情報」は、個人又は組織において参照されることを前提として記憶される情報である。「分類情報」は、文書情報が契約書情報を含むか否かの判定の結果に応じて付与される情報である。すなわち、分類情報は、文書情報に契約書情報が含まれているか否かが識別できればよく、「契約書情報を含む」、「契約書情報を含まない」などの表現や、上記事項を意味する特定のコードなどいかなる形式であってもよい。また、契約書情報を含む場合には、さらに細かく業務委託契約書、秘密保持契約書などの契約書の種別に応じた分類を分類情報として記憶してもよい。同様に、契約書情報を含まない場合には、さらに細かく職務発明規程、就業規則などの非契約文書の種別に応じた分類を分類情報として記憶してもよい。「ひな形情報」は、文書情報に契約書情報が含まれる場合に記憶される情報で、当該契約書情報として記憶される契約書がいずれの当事者から提供されたひな形であるのか否かを識別するための情報である。すなわち、ひな形情報は、例えば「自社」、「自組織」、「自分」、「他社」、「他組織」、又は「相手」などの立場や、システム内に保存されたひな形の1つであることを示す情報(例えばひな形の名称やひな形を特定可能なID等)等、いかなる形式であってもよい。また、ひな形情報は、契約書のひな形として実際にどちらから提供されたかを示す情報のみならず、ひな形判定処理の結果を示すものであってもよい。後者の場合は、実際にどちらから提供されたかという事実とは相違する場合もありうる。 "Document information" is information stored with the assumption that it will be referenced by individuals or organizations. "Classification information" is information assigned based on the results of a determination of whether the document information contains contract information. In other words, classification information can be in any form, such as "contains contract information" or "does not contain contract information," as long as it can identify whether the document information contains contract information. It can also be in any form, such as expressions like "contains contract information" or "does not contain contract information," or specific codes that represent the above. Furthermore, if contract information is included, classification information can be stored as more detailed classifications based on the type of contract, such as outsourcing contracts or non-disclosure agreements. Similarly, if contract information is not included, classification information can be stored as more detailed classifications based on the type of non-contract document, such as employee invention regulations or work rules. "Template information" is information stored when document information includes contract information, and is information used to identify which party provided the contract stored as contract information. That is, the template information may be in any form, such as information indicating the position of "our company," "our organization," "yourself," "another company," "another organization," or "the other party," or information indicating that it is one of the templates stored in the system (such as the name of the template or an ID that can identify the template). Furthermore, the template information may not only indicate which party actually provided the contract template, but may also indicate the results of the template determination process. In the latter case, this may differ from the fact of who actually provided it.
「属性情報」は、文書情報が契約書情報を含む場合に記憶される情報で、文書情報の属性を示す情報である。このような属性情報には、例えば契約書の特徴を示す情報や別途ユーザにより入力された情報などが含まれる。属性情報としては、例えば、契約書のタイトル、契約書の当事者名、取引金額、契約開始日、契約終了日、自動更新の有無、契約期間、契約解除通知期限、及び契約締結日などが、一例として挙げられる。なお、属性情報は、少なくとも契約書情報を含む場合に記憶されていればよく、当然に契約書情報を含んでいない場合であっても属性情報が記憶されてもよい。 "Attribute information" is information that is stored when document information includes contract information, and indicates the attributes of the document information. Such attribute information includes, for example, information that indicates the characteristics of the contract, as well as information separately entered by the user. Examples of attribute information include the contract title, names of the parties to the contract, transaction amount, contract start date, contract end date, whether or not automatic renewal occurs, contract period, contract termination notice deadline, and contract conclusion date. Attribute information only needs to be stored when at least contract information is included, and of course attribute information may also be stored even if contract information is not included.
「関連契約書情報」は、文書情報が契約書情報を含む場合に記憶される情報で、契約書情報により示される契約書に関連する他の契約書を示す情報である。例えば、契約書情報により示される契約書が業務委託契約書である場合、その業務委託契約書の契約内容を変更するように締結された覚書が関連契約書に相当する。関連契約書情報は、上記のように関連する契約書がある場合には、その関連が特定可能な情報、例えば関連する当該契約書に対して付与された文書ID情報を記憶する。なお、関連契約書情報は、少なくとも契約書情報を含む場合に記憶されていればよく、当然に契約書情報を含んでいない場合であっても関連契約書情報が記憶されてもよい。また、関連契約書が存在しない場合は、関連契約書情報は記憶されないか、関連契約書がないことを示す情報が記憶される。 "Related contract information" is information stored when document information includes contract information, and indicates other contracts related to the contract indicated by the contract information. For example, if the contract indicated by the contract information is a service outsourcing contract, a memorandum concluded to change the content of that service outsourcing contract corresponds to the related contract. When there is a related contract as described above, the related contract information stores information that can identify the relationship, such as the document ID information assigned to the related contract. Note that related contract information only needs to be stored when at least contract information is included, and naturally related contract information may be stored even if contract information is not included. Furthermore, when there is no related contract, related contract information is not stored, or information indicating that there is no related contract is stored.
「リスク情報」は、文書情報が契約書情報を含む場合に記憶される情報で、契約書情報により示される契約書についてリスクを判定した結果を示す情報である。このようなリスク情報には、契約書全体に基づいて総合的に判定した結果を示す情報、契約書に含まれる個々の条項について条単位又は項単位でリスクを判定した結果を示す情報、個々の条項を構成する単語や文節、文章単位でリスクを判定した結果を示す情報など、いずれをも含む。リスク情報としては、リスクの程度を示す「高」、「中」、「低」などの分類表現や、数値、リスクの程度を示す文章表現、リスクの内容、リスクに対する対処方法、及びこれらの組み合わせなどが一例として挙げられる。なお、リスク情報は、少なくとも契約書情報を含む場合に記憶されていればよく、当然に契約書情報を含んでいない場合であってもリスク情報が記憶されてもよい。また、リスク情報が存在しない場合は、リスク情報は記憶されないか、リスク情報がないことを示す情報が記憶される。 "Risk information" is information stored when document information includes contract information, and indicates the results of a risk assessment of the contract indicated by the contract information. Such risk information includes information indicating the results of a comprehensive assessment based on the entire contract, information indicating the results of a risk assessment on an article-by-article or paragraph-by-paragraph basis for individual clauses included in the contract, and information indicating the results of a risk assessment on the words, phrases, or sentences that make up individual clauses. Examples of risk information include classification expressions such as "high," "medium," or "low" that indicate the level of risk, numerical values, sentence expressions that indicate the level of risk, risk content, methods for dealing with risk, and combinations of these. Note that risk information only needs to be stored when at least contract information is included; it may naturally be stored even if contract information is not included. Furthermore, if no risk information exists, either no risk information is stored, or information indicating the absence of risk information is stored.
なお、このような文書管理テーブルにおいて、各文書情報を入力したユーザを示すユーザID情報や、当該ユーザの権限を示す権限情報、当該ユーザが属する組織を特定する組織ID情報など、他の情報を適宜記憶するようにしてもよい。 In addition, such a document management table may also store other information as appropriate, such as user ID information indicating the user who entered each document information, authority information indicating the authority of that user, and organization ID information identifying the organization to which the user belongs.
図3Bは、本開示の一実施形態に係るサーバ装置100に記憶される文書情報の一例を概念的に示す図である。図3Bによると、文書情報の一例として、契約書情報を含む文書情報B1が示されている。文書情報B1は、パーツ情報S1~S20として示されているように複数のパーツ情報により構成されている。パーツ情報は、文書情報を所定単位で区分したものである。図3Bの例では、文書情報を区分する単位としてページ単位を採用した例を挙げているが、当然にページ単位に限らず、単元、項目、ページ、文章、文節、単語など、任意の単位を採用することが可能である。 Figure 3B is a conceptual diagram illustrating an example of document information stored in a server device 100 according to an embodiment of the present disclosure. Figure 3B shows document information B1, which includes contract information, as an example of document information. Document information B1 is composed of multiple pieces of part information, as shown as part information S1 to S20. Part information is document information divided into predetermined units. In the example of Figure 3B, page units are used as units for dividing document information, but of course, this is not limited to page units, and any unit can be used, such as unit, item, page, sentence, phrase, or word.
図3Bに示す文書情報B1の例では、業務委託契約書の契約書本文であるパーツ情報S1~S4、当該業務委託契約書の当事者(相手方)となる会社(Y株式会社)の公文書(例えば、登記簿)であるパーツ情報S5~S7、業務委託契約書の当事者と結んだ秘密保持契約書であるパーツ情報S8~S17、及び契約において当事者間で行った交渉の議事録であるパーツ情報S18~S20を含む。すなわち、文書情報B1は、パーツ情報S1~S4、パーツ情報S5~S7、パーツ情報S8~S17及びパーツ情報S18~S20の各パーツ情報が例えば画像データ形式で取り込まれ、一体のデータファイルとして構成されている。 The example of document information B1 shown in Figure 3B includes parts information S1-S4, which is the main text of the service contract; parts information S5-S7, which is an official document (e.g., a registry) of the company (Corporation Y) that is the party (other party) to the service contract; parts information S8-S17, which is a non-disclosure agreement concluded with the parties to the service contract; and parts information S18-S20, which is the minutes of negotiations between the parties to the contract. In other words, document information B1 is configured as an integrated data file, with parts information S1-S4, parts information S5-S7, parts information S8-S17, and parts information S18-S20 imported in image data format, for example.
本実施形態では、文書情報B1の中に契約書情報を含むか否かを判定するが、文書情報B1を構成するパーツ情報単位で判定することも可能である。図3Bの例では、契約書情報であるパーツ情報S1~S4及びパーツ情報S8~S17を含む。そのため、文書情報B1は、全体として契約書情報を含むと判定するようにしてもよい。また、文書情報B1から契約書情報であるパーツ情報S1~S4及びパーツ情報S8~S17をそれぞれ抽出し、パーツ情報S1~S4を新たな文書情報B1-1及びパーツ情報S8~S17をさらに新たな文書情報B1-2として文書管理テーブルに記憶するようにしてもよい。 In this embodiment, a determination is made as to whether document information B1 contains contract information, but it is also possible to make this determination on a part information basis that makes up document information B1. In the example of Figure 3B, part information S1-S4 and part information S8-S17, which are contract information, are included. Therefore, document information B1 as a whole may be determined to contain contract information. Alternatively, part information S1-S4 and part information S8-S17, which are contract information, may be extracted from document information B1, and part information S1-S4 may be stored as new document information B1-1 and part information S8-S17 may be stored as new document information B1-2 in the document management table.
また、判定は、ページ単位で出力されてもよく、同じ文書情報である範囲を示す情報として出力されてもよい。具体的には、文書情報B1のパーツ情報のS1とS2とS3とS4が契約書情報を含むという判定を出力してもよく、パーツ情報のS1からS4の範囲が契約書情報を含むという判定を出力してもよい。 The determination may also be output on a page-by-page basis, or as information indicating a range of the same document information. Specifically, a determination may be output that part information S1, S2, S3, and S4 of document information B1 contain contract information, or a determination may be output that the range of part information S1 to S4 contains contract information.
6.サーバ装置100で実行される処理フロー
図4は、本開示の一実施形態に係るサーバ装置100において実行される処理フローを示す図である。具体的には、図4は、端末装置200から文書情報を受信して、当該文書情報に契約書情報を含むか否かの判定等を行い、その結果を文書判定画面として出力するまでの一連の処理フローを示す図である。当該処理フローは、主にサーバ装置100のプロセッサ111がメモリ112に記憶されたプログラムを読み出して実行することにより行われる。
6. Processing Flow Executed by Server Device 100 Figure 4 is a diagram showing a processing flow executed by the server device 100 according to an embodiment of the present disclosure. Specifically, Figure 4 is a diagram showing a series of processing flows from receiving document information from the terminal device 200, determining whether the document information includes contract information, and outputting the results as a document determination screen. This processing flow is mainly performed by the processor 111 of the server device 100 reading and executing a program stored in the memory 112.
図4に示すように、本実施形態では、プロセッサ111は、通信インターフェイス113を介して、例えば端末装置200から文書情報を取得する(S111)。この場合、端末装置200においては、端末装置のプロセッサの処理により、入力インターフェイスを介して文書情報の入力を受け付けて、通信インターフェイスを介して入力された文書情報がサーバ装置100に送信される。このような文書情報の入力は、例えば、
・入力インターフェイスとして機能するカメラユニットを介して文書を撮影し、当該撮影した画像データを文書情報として入力する
・入力インターフェイスとして機能するタッチパネル等の操作ユニットを介してユーザの操作入力を受け付けて、選択されたドキュメント形式のファイルを文書情報として入力する
・入力インターフェイスとして機能するタッチパネル等の操作ユニットを介して、スキャナユニットを介して文書の画像データを取り込み、取り込んだ当該画像データを文書情報として入力する
などの、様々な方法・手順により実行することが可能である。
4, in this embodiment, the processor 111 acquires document information from, for example, the terminal device 200 via the communication interface 113 (S111). In this case, the terminal device 200 receives input of document information via the input interface through processing by the processor of the terminal device, and transmits the document information input via the communication interface to the server device 100. Such input of document information is, for example,
This can be done using a variety of methods and procedures, such as: - Photographing a document via a camera unit that functions as an input interface and inputting the photographed image data as document information; - Accepting user input via an operation unit such as a touch panel that functions as an input interface and inputting a file in the selected document format as document information; - Importing image data of a document via a scanner unit via an operation unit such as a touch panel that functions as an input interface and inputting the imported image data as document information.
なお、文書情報の取得は、上記方法のみに限らない。例えば、文書情報の取得は、
・端末装置200に記憶された複数の文書情報を、一括アップロードシステムや一括移行システムを用いてこれらシステムのサーバ装置に移行し、当該サーバ装置からサーバ装置100が受信することにより取得する
・端末装置200のユーザが利用するクラウドストレージサービスや電子契約サービスを提供するサーバ装置から、ユーザにより指定された文書情報をサーバ装置100が受信することにより取得する
・端末装置200のユーザが利用するクラウドストレージサービスや電子契約サービスを利用するために、端末装置200から文書情報が当該サービスを提供するサーバ装置にアップロードされたときに、サーバ装置100にも自動的に転送されることにより取得する
など、様々な方法・手段により実行することが可能である。
The method for obtaining document information is not limited to the above method. For example, document information can be obtained by the following method:
- Acquires multiple pieces of document information stored in the terminal device 200 by transferring them to the server device of these systems using a bulk upload system or bulk transfer system, and having the server device 100 receive them from the server device; - Acquires document information specified by the user by having the server device 100 receive it from a server device that provides a cloud storage service or electronic contract service used by the user of the terminal device 200; - Acquires document information by automatically transferring it to the server device 100 when the document information is uploaded from the terminal device 200 to the server device that provides the cloud storage service or electronic contract service used by the user of the terminal device 200, in order to use the cloud storage service or electronic contract service used by the user of the terminal device 200.
また、サーバ装置100は、図4において説明する各種処理(例えば、内容解析処理等)を行うため専用に設けられたものでなく、クラウドストレージサービスや電子契約サービスなどを提供するサーバ装置の一部として設けられたものであってもよい。このような場合、例えば、文書情報の取得は、
・端末装置200のユーザが利用するクラウドストレージサービスや電子契約サービスを利用するために、端末装置200から文書情報が当該サービスを提供するためのサーバ装置にアップロードされることにより取得する
など、様々な方法・手段により実行することが可能である。
Furthermore, the server device 100 does not have to be dedicated to performing the various processes (e.g., content analysis process, etc.) described in Fig. 4, but may be provided as part of a server device that provides a cloud storage service, an electronic contract service, etc. In such a case, for example, document information is obtained by
- In order to use cloud storage services or electronic contract services used by the user of the terminal device 200, this can be done using various methods and means, such as obtaining document information from the terminal device 200 by uploading it to a server device that provides the service.
このように、文書情報の取得は、端末装置200において入力された文書情報を直接受信する場合に限らず、他のサーバ装置などから取得する場合など、その方法・手段や、文書情報の入力を行う主体や文書情報の送信元はいずれであってもよい。 In this way, the acquisition of document information is not limited to directly receiving document information input into the terminal device 200, but can also be acquired from other server devices, etc. The method and means, the entity that inputs the document information, and the source of the document information can be any.
プロセッサ111は、文書情報を受信すると、新たに文書ID情報を生成して、生成された文書ID情報に対応付けて受信した文書情報を文書管理テーブルに記憶する。なお、文書情報は、例えば、文書情報が関連する案件情報に関連付けて保存されてもよい。案件情報は案件ID情報等の案件を示す情報である。案件は、例えば、ある文書情報に関する契約の審査などの業務の単位である。案件又は案件情報は、文書情報の入力の前に設定されていてもよく、文書情報の入力をトリガーとして生成又は設定されてもよい。 When the processor 111 receives document information, it generates new document ID information and stores the received document information in the document management table in association with the generated document ID information. Note that the document information may be saved, for example, in association with the case information to which the document information relates. Case information is information that indicates a case, such as case ID information. A case is, for example, a unit of work, such as the review of a contract related to certain document information. The case or case information may be set before the document information is input, or may be generated or set as a trigger when the document information is input.
プロセッサ111は、記憶した文書情報を文書管理テーブルから読み出して、当該文書情報に契約書情報を含むか否かを判定するために、学習済み判定モデルに入力する(S112)。これによって、プロセッサ111は、学習済み判定モデルから入力された文書情報に契約書情報が含まれるか否かの判定結果を出力として取得する。 The processor 111 reads the stored document information from the document management table and inputs it into the trained judgment model to determine whether the document information contains contract information (S112). As a result, the processor 111 obtains as output the judgment result from the trained judgment model as to whether the input document information contains contract information.
ここで、図5は、本開示の一実施形態に係るサーバ装置100において実行される処理フローを示す図である。具体的には、図5は、図4のS112において用いられる学習済み判定モデルを生成するための処理フローの一例を示す図である。当該処理フローは、主にサーバ装置100のプロセッサ111がメモリ112に記憶されたプログラムを読み出して実行することにより行われる。図5に示す学習済み判定モデルの生成処理は、図4に示す契約書情報を含むか否かの判定の前に行われる。 Here, FIG. 5 is a diagram showing a processing flow executed in the server device 100 according to an embodiment of the present disclosure. Specifically, FIG. 5 is a diagram showing an example of a processing flow for generating a trained judgment model used in S112 of FIG. 4. This processing flow is mainly performed by the processor 111 of the server device 100 reading and executing a program stored in the memory 112. The processing for generating the trained judgment model shown in FIG. 5 is performed before the determination of whether or not the contract information shown in FIG. 4 is included.
図5によると、プロセッサ111は、学習用の文書情報(学習用文書情報)を取得するステップを実行する(S211)。学習用文書情報としては、一例としては、図3Bに例示された文書情報が挙げられるが、契約書情報が全く含まれていない文書情報であってもよいし、契約書情報のみの文書情報であってもよい。そして、プロセッサ111は、各文書情報を構成するパーツ情報ごとに、例えば処理システム1の管理者等の判定に基づいて、契約書情報であることを示す正解ラベルを付与する処理ステップを実行する(S212)。当該ラベル付けが終了すると、プロセッサ111は、付与された正解ラベル情報を判定結果情報として学習用文書情報に対応付けて記憶するステップを実行する(S213)。 As shown in FIG. 5, the processor 111 executes a step of acquiring learning document information (learning document information) (S211). An example of learning document information is the document information illustrated in FIG. 3B, but it may also be document information that does not contain any contract information, or document information that contains only contract information. The processor 111 then executes a processing step of assigning a correct label indicating that the information is contract information to each piece of part information that makes up the document information, based on a determination by, for example, an administrator of the processing system 1 (S212). Once the labeling is complete, the processor 111 executes a step of storing the assigned correct label information as determination result information in association with the learning document information (S213).
学習用文書情報及びそれに対応付けられた正解ラベル情報がそれぞれ得られると、プロセッサ111は、それらを用いて文書情報を構成する各パーツ情報について契約書文書であるか否かの判定パターンの機械学習を行うステップを実行する(S214)。当該機械学習は、一例として、ニューロンを組み合わせたニューラルネットワークに対して、これら情報の組を与え、ニューラルネットワークからの出力が正解ラベル情報と同じになるように、各ニューロンのパラメータを調整しながら学習を繰り返すことにより行われる。そして、学習済みの判定モデルを取得するステップが実行される(S215)。取得された学習済み判定モデルは、サーバ装置100のメモリ112やサーバ装置100と有線又は無線ネットワークを介して接続された他の装置内に記憶されていてもよい。 Once the training document information and the associated correct label information have been obtained, the processor 111 executes a step of using them to perform machine learning of a determination pattern for determining whether each piece of part information that makes up the document information is a contract document (S214). As an example, this machine learning is performed by providing this set of information to a neural network that combines neurons, and repeatedly learning while adjusting the parameters of each neuron so that the output from the neural network is the same as the correct label information. Then, a step of acquiring a trained determination model is executed (S215). The acquired trained determination model may be stored in the memory 112 of the server device 100 or in another device connected to the server device 100 via a wired or wireless network.
なお、上記においては学習器としてニューラルネットワークを用いているが、ニューラルネットワーク以外にも畳み込みニューラルネットワーク、多層ハーセプトン(MLP)、LSTM(Long Short Term Memory)、GRU(Gated Recurrent Unit)、GNN(Graph Neural Network)、トランスフォーマー(Transformer)等のニューラルネットワークを用いた手法、LightGBM(Light Gradient Boosting Machine)、XGBoost、CatBoost等の勾配ブースティング決定木(GBDT)を用いた手法、リッジ回帰、ロジスティック回帰、サポートベクター回帰(SVR)、ニアレストネイバー法、決定木、回帰木、ランダムフォレスト等を用いた学習器を用いることも可能である。 Note that while a neural network is used as the learning machine in the above example, it is also possible to use other learning machines, such as convolutional neural networks, multi-layer hierarchical neural networks (MLP), long short term memory (LSTM), gated recurrent units (GRU), graph neural networks (GNN), and transformers; gradient boosting decision trees (GBDTs) such as Light Gradient Boosting Machine (LightGBM), XGBoost, and CatBoost; ridge regression, logistic regression, support vector regression (SVR), nearest neighbor methods, decision trees, regression trees, and random forests.
また、図5では、学習用文書情報と正解ラベルの組を学習させて生成された学習済み判定モデルについて説明したが、例えば生成系学習済み判定モデルなどの深層学習を利用した学習済み判定モデルを用いることも可能である。このような生成系学習済み判定モデルの中でも、特に大規模言語モデル(LLM(Large Language Model))と呼ばれる学習済み判定モデルが好ましい。このような学習済み判定モデルには、BERT(Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)がさらに好ましい例として挙げられ、これらの中でもChatGPT又はGPT-4等が特に好ましい例として挙げられる。このように、学習済み判定モデルには、当該判定処理のみのために生成されたものではなく、汎用の学習済みモデルを用いることが可能である。 In addition, Figure 5 describes a trained judgment model generated by training pairs of training document information and correct labels. However, it is also possible to use a trained judgment model that utilizes deep learning, such as a generative trained judgment model. Among such generative trained judgment models, a trained judgment model known as a large-scale language model (LLM) is particularly preferred. More preferred examples of such trained judgment models include BERT (Bidirectional Encoder Representations from Transformers) and GPT (Generative Pre-trained Transformer), with ChatGPT or GPT-4 being particularly preferred. In this way, a general-purpose trained model can be used as the trained judgment model, rather than one generated solely for the judgment process.
上記の通り例示される学習済み判定モデルは、サーバ装置100内のメモリ112にプログラムとして記憶され、プロセッサ111が当該プログラムを実行することによって処理されるものであってもよいし、サーバ装置100と通信可能に接続された他の処理装置内のメモリにプログラムとして記憶され当該処理装置内のプロセッサによって処理されるものであってもよい。後者の場合は、サーバ装置100のプロセッサ111が質問文形式の入力情報を処理装置に送信し、当該処理装置から回答情報を出力として取得することとなる。 The trained judgment model exemplified above may be stored as a program in memory 112 within server device 100 and processed by processor 111 executing the program, or it may be stored as a program in memory within another processing device communicatively connected to server device 100 and processed by a processor within that processing device. In the latter case, processor 111 of server device 100 sends input information in the form of a question to the processing device and obtains answer information as output from that processing device.
また、学習済み判定モデルは、単一の学習済み判定モデルによって形成される必要はなく、複数の学習済み判定モデルを組み合わせて利用することも可能である。このような一例としては、学習用文書情報は同じであるが学習器の構造が異なる学習済み判定モデルを用いたり、一方の学習済み判定モデルには汎用的な学習用情報に基づいて学習した大規模言語モデルを用いて他方の学習済み判定モデルには契約書情報等を含む学習用文書情報に基づいて学習した学習済み判定モデルを用いたりすることが可能である。このように複数の学習済み判定モデルを用いた場合には、各学習済み判定モデルからの回答情報をアンサンブルすることによって出力を得ることが可能となる。また、学習済み判定モデルに入力される学習用文書情報や判定処理に用いられる文書情報は、適宜エンベディングなどの変換処理を行って、学習済み判定モデルで処理しやすい数値表現(例えば、ベクトル値)に変換されてもよい。 Furthermore, the trained judgment model does not have to be formed from a single trained judgment model; multiple trained judgment models can be combined and used. As an example, trained judgment models with the same training document information but different learning device structures can be used, or one trained judgment model can be a large-scale language model trained based on general-purpose training information, while the other trained judgment model can be a trained judgment model trained based on training document information including contract information, etc. When multiple trained judgment models are used in this way, output can be obtained by ensembling the answer information from each trained judgment model. Furthermore, the training document information input to the trained judgment model and the document information used in the judgment process can be converted into a numerical representation (e.g., vector values) that is easy to process with the trained judgment model by appropriate conversion processing such as embedding.
また、図5では、各処理をサーバ装置100のプロセッサ111が行う場合について説明したが、当該処理については、例えばサーバ装置100と有線又は無線ネットワークを介して接続されたモデル生成装置によって生成されてもよい。 Furthermore, while Figure 5 illustrates a case in which each process is performed by the processor 111 of the server device 100, the process may also be generated by, for example, a model generation device connected to the server device 100 via a wired or wireless network.
再び図4に戻り、プロセッサ111は、学習済み判定モデルから、入力された文書情報に契約書情報が含まれるか否かの判定結果を出力として取得すると、当該判定結果が契約書情報を含むことを示しているか否かを判断する(S113)。そして、プロセッサ111は、契約書情報を含むという判定結果である場合には、契約書情報を含むことを示す「契約文書」という分類情報を付与して、文書ID情報に対応付けて当該分類情報を文書管理テーブルに記憶する(S114)。他方、プロセッサ111は、契約書情報を含まないという判定結果である場合には、契約書情報を含まないことを示す「非契約文書」という分類情報を付与して、文書IDに対応付けて当該分類情報を文書管理テーブルに記憶する(S119)。 Returning again to FIG. 4, when processor 111 obtains as output from the trained judgment model the judgment result as to whether or not contract information is included in the input document information, it determines whether or not the judgment result indicates that contract information is included (S113). If the judgment result indicates that contract information is included, processor 111 assigns classification information called "contract document" indicating that contract information is included, and stores the classification information in the document management table in association with the document ID information (S114). On the other hand, if the judgment result indicates that contract information is not included, processor 111 assigns classification information called "non-contract document" indicating that contract information is not included, and stores the classification information in association with the document ID in the document management table (S119).
ここで、図3Bに示す通り、文書情報中に契約書情報であるパーツ情報S1~S4及びS8~S17と、非契約書情報であるパーツ情報S5~S7及びS18~S20とを含む場合がある。このような場合には、プロセッサ111は、契約書情報であると判定されたパーツ情報S1~S4及びS8~S17をそれぞれ抽出することが好ましい。具体的には、プロセッサ111は、文書情報B1を構成するデータファイルを、パーツ情報S1~S4を構成するデータファイルと、パーツ情報S5~S7を構成するデータファイルと、パーツ情報S8~S17を構成するデータファイルと、パーツ情報S18~S20とに分割する。そして、プロセッサ111は、パーツ情報S1~S4に対して新たに文書ID情報としてB1-1を生成し、当該文書ID情報に対応付けて文書情報(パーツ情報S1~S4)と「契約文書」を示す分類情報を記憶する。また、同様に、プロセッサ111は、パーツ情報S8~S17に対して新たに文書ID情報としてB1-2を生成し、当該文書ID情報に対応付けて文書情報(パーツ情報S8~S17)と「契約文書」を示す分類情報を記憶する。また、同様に、プロセッサ111は、パーツ情報S5~S7に対して新たに文書ID情報としてB1-3を生成し、当該文書ID情報に対応付けて文書情報(パーツ情報S5~S7)と「非契約文書」を示す分類情報を記憶する。また、同様に、プロセッサ111は、パーツ情報S18~S20に対して新たに文書ID情報としてB1-4を生成し、当該文書ID情報に対応付けて文書情報(パーツ情報S18~S20)と「非契約文書」を示す分類情報を記憶する。そして、以降の処理においては、新たに抽出された文書情報ごとに処理されることとなる。これにより、契約書等の文書をより適切に取り扱うことができる。 As shown in FIG. 3B, the document information may include parts information S1-S4 and S8-S17, which are contract information, and parts information S5-S7 and S18-S20, which are non-contract information. In such cases, it is preferable for processor 111 to extract each of the parts information S1-S4 and S8-S17 determined to be contract information. Specifically, processor 111 divides the data files constituting document information B1 into data files constituting parts information S1-S4, data files constituting parts information S5-S7, data files constituting parts information S8-S17, and parts information S18-S20. Processor 111 then generates new document ID information B1-1 for parts information S1-S4, and stores the document information (parts information S1-S4) and classification information indicating a "contract document" in association with the document ID information. Similarly, the processor 111 generates new document ID information B1-2 for parts information S8 to S17 and stores the document information (parts information S8 to S17) and classification information indicating "contract document" in association with the document ID information. Similarly, the processor 111 generates new document ID information B1-3 for parts information S5 to S7 and stores the document information (parts information S5 to S7) and classification information indicating "non-contract document" in association with the document ID information. Similarly, the processor 111 generates new document ID information B1-4 for parts information S18 to S20 and stores the document information (parts information S18 to S20) and classification information indicating "non-contract document" in association with the document ID information. Then, in subsequent processing, each newly extracted document information is processed separately. This enables documents such as contracts to be handled more appropriately.
なお、このような処理は、文書情報中に契約書情報と非契約書情報とが混在している場合の一例である。すなわち、プロセッサ111は、混在している場合には、文書情報全体として契約書情報を含むと判定し、契約書情報を含むことを示す「契約文書」を付与するようにしてもよい。この場合、以降の処理においても文書情報全体をひとまとまりとして処理するようにしてもよい。 Note that this type of processing is an example of a case where contract information and non-contract information are mixed in the document information. In other words, when there is a mixture, the processor 111 may determine that the document information as a whole contains contract information and assign the label "contract document" to indicate that it contains contract information. In this case, the entire document information may be processed as a single entity in subsequent processing as well.
また、図4においては、分類情報として契約文書又は非契約文書の2つの分類のみを付しているが、学習済み判定モデルの生成の際のラベル付けをより細分化して学習させるなどの方法により、さらに細かな分類を付すことも可能である。すなわち、プロセッサ111は、契約書情報を含む場合には、細かく業務委託契約書、秘密保持契約書、注文書などの契約書の種別に応じた分類を分類情報として記憶してもよい。また、プロセッサ111は、契約書情報を含まない場合には、さらに細かく職務発明規程、就業規則などの非契約文書の種別に応じた分類を分類情報として記憶してもよい。 In addition, while Figure 4 shows only two classifications, contract documents and non-contract documents, as classification information, it is possible to provide even more detailed classifications by, for example, further subdividing the labels used when generating the trained judgment model and then training the model. That is, if contract information is included, processor 111 may store, as classification information, classifications based on the type of contract, such as outsourcing contracts, non-disclosure agreements, and purchase orders. Furthermore, if contract information is not included, processor 111 may store, as classification information, classifications based on the type of non-contract document, such as employee invention regulations and work rules.
また、図4においては、学習済み判定モデルにおいて契約書情報を含むか否かの判定を行っているが、学習済み判定モデルからの出力をさらにプロセッサ111が処理することによって当該判定をするようにしてもよい。また、上記の細分化した契約書種別や非契約書文書の出力の情報を、単に契約書情報または非契約書文書であると分類を丸める処理を行ってもよい。 In addition, in Figure 4, a determination is made as to whether or not contract information is included in the trained determination model, but this determination may also be made by further processing the output from the trained determination model by the processor 111. Furthermore, the output information for the above-mentioned subdivided contract types and non-contract documents may simply be rounded down to contract information or non-contract documents.
次に、プロセッサ111は、S113及びS114において契約書情報を含むと判定され、「契約文書」という分類が付与された場合には、当該文書情報がいずれの当事者から提供されたひな形であるのかを判定するひな形判定処理を実行する(S115)。ひな形判定処理の一例としては、プロセッサ111は、あらかじめ処理システム1により提供されるサービスのユーザ又は当該ユーザが属する組織ごとに、当該ユーザ又は当該組織が用意したひな形となる契約書の契約書情報(ひな形情報)を記憶する。そして、プロセッサ111は、当該ひな形情報との類似度(例えば、コサイン類似度、Jaccard係数など)を算出することにより、自身が用意したひな形か否かを判定する。プロセッサ111は、ひな形との類似度に基づく判定の結果、自身のひな型であると判定された場合には(S116)、当該文書情報に対して「自身のひな型」というラベルを付与して、文書情報の文書ID情報に対応付けて付与されたラベルをひな形情報として記憶する(S117)。 Next, if processor 111 determines in S113 and S114 that the document information contains contract information and is assigned the classification of "contract document," it executes a template determination process to determine which party provided the document information as a template (S115). As an example of the template determination process, processor 111 stores contract information (template information) of a template contract prepared by each user of a service provided by processing system 1 or each organization to which the user belongs. Processor 111 then determines whether the template was prepared by itself by calculating the similarity with the template information (e.g., cosine similarity, Jaccard coefficient, etc.). If processor 111 determines that the document information is its own template based on the similarity with the template (S116), it assigns a label "own template" to the document information and stores the assigned label in association with the document ID information of the document information as template information (S117).
次に、プロセッサ111は、S113及びS114において契約書情報を含むと判定され、「契約文書」という分類が付与された場合には、当該文書情報に対して内容解析処理を実行する(S118)。当該内容解析処理は、契約書情報により示される契約書の内容を解析する処理であればいずれでもよいが、一例としては、
・契約書情報から属性情報を抽出する処理
・契約書情報から関連契約書情報を特定する処理
・契約書情報から契約書におけるリスクを解析する処理
・これらの処理の組み合わせ
が挙げられる。
Next, if it is determined in S113 and S114 that the document information contains contract information and is classified as a "contract document," the processor 111 executes a content analysis process on the document information (S118). The content analysis process may be any process that analyzes the content of the contract indicated by the contract information.
- Processing to extract attribute information from contract information - Processing to identify related contract information from contract information - Processing to analyze risks in a contract from contract information - Combinations of these processing are examples.
ここで、図6は、本開示の一実施形態に係るサーバ装置100において実行される処理フローを示す図である。具体的には、図6は、図4のS118において実行される内容解析処理のうち、「契約書情報から属性情報を抽出する処理」及び「契約書情報から関連契約書情報を特定する処理」の処理フローの一例を示す図である。当該処理フローは、主にサーバ装置100のプロセッサ111がメモリ112に記憶されたプログラムを読み出して実行することにより行われる。 Here, FIG. 6 is a diagram showing a processing flow executed in the server device 100 according to an embodiment of the present disclosure. Specifically, FIG. 6 is a diagram showing an example of the processing flow of the "process of extracting attribute information from contract information" and the "process of identifying related contract information from contract information" from the content analysis processing executed in S118 of FIG. 4. This processing flow is mainly performed by the processor 111 of the server device 100 reading and executing a program stored in the memory 112.
図6によると、プロセッサ111は、契約書情報を含む文書情報を構成するファイルを読み出して(S311)、当該文書情報に含まれる属性情報を抽出する(S312)。当該抽出処理は、プロセッサ111が、文書情報を構成するファイルに対して文書解析プログラムを実行することによって行われる。一例として、プロセッサ111は、まず、文書情報を構成するファイルを解析することでテキスト情報を抽出する。なお、このテキスト情報は、文書種別の判定処理の際に抽出、記憶したテキスト情報を用いてもよい。そして、プロセッサ111は、抽出されたテキスト情報について言語解析することによって、契約書のタイトル、契約書の当事者名、取引金額、契約開始日、契約終了日、自動更新の有無、契約期間、契約解除通知期限、及び契約締結日などのあらかじめ設定された複数の項目の情報を抽出する。 As shown in FIG. 6, processor 111 reads files constituting document information including contract information (S311) and extracts attribute information contained in the document information (S312). This extraction process is performed by processor 111 executing a document analysis program on the files constituting the document information. As an example, processor 111 first extracts text information by analyzing the files constituting the document information. Note that this text information may be text information extracted and stored during the document type determination process. Processor 111 then performs linguistic analysis on the extracted text information to extract information on multiple pre-set items, such as the contract title, names of the parties to the contract, transaction amount, contract start date, contract end date, whether or not the contract is automatically renewed, contract period, contract termination notice deadline, and contract conclusion date.
プロセッサ111は、各項目について情報が抽出されると、抽出された各情報を、文書ID情報に対応付けて属性情報に記憶する(S313)。なお、抽出することができなかった項目については、空データが記憶される。 When information is extracted for each item, the processor 111 associates each piece of extracted information with the document ID information and stores it in the attribute information (S313). Note that for items that could not be extracted, null data is stored.
次に、プロセッサ111は、抽出された属性情報に基づいて検索語句を生成する(S314)。当該検索語句は、S311で読み出された契約書情報により示される契約書に関連する他の契約書(関連契約書)の候補を検索するために用いられる情報であり、いわゆる検索クエリに相当するものである。プロセッサ111は、例えば、S312において抽出された属性情報のうち、契約書の当事者名、契約書のタイトル、契約締結日などを検索語句として設定する。 Next, processor 111 generates a search term based on the extracted attribute information (S314). The search term is information used to search for candidates for other contracts (related contracts) related to the contract indicated by the contract information read in S311, and corresponds to a so-called search query. Processor 111 sets, for example, the names of the parties to the contract, the contract title, the contract conclusion date, etc., from the attribute information extracted in S312, as search terms.
次に、プロセッサ111は、文書管理テーブルに記憶されたすべての文書情報をS314において生成された検索語句で検索する(S315)。具体的には、プロセッサ111は、各文書情報について、検索語句との関連度を算出し、算出された関連度が所定値以上の文書情報を特定する。そして、プロセッサ111は、特定された文書情報の中から、分類情報として「契約文書」が記憶された文書情報の文書ID情報を、関連契約書の候補として抽出する。プロセッサ111は、各文書ID情報及び各文書情報を関連契約書の候補として、通信インターフェイス113を介して端末装置200に送信する(S316)。 Next, the processor 111 searches all document information stored in the document management table using the search term generated in S314 (S315). Specifically, the processor 111 calculates the relevance of each piece of document information to the search term, and identifies document information for which the calculated relevance is equal to or greater than a predetermined value. The processor 111 then extracts, from the identified document information, the document ID information of document information for which "contract document" is stored as classification information, as candidates for related contracts. The processor 111 transmits each document ID information and each document information as candidates for related contracts to the terminal device 200 via the communication interface 113 (S316).
関連契約書情報の候補を受信した端末装置200では、プロセッサの処理により、出力インターフェイスを介して関連契約書の候補の一覧が表示される。そして、端末装置200のプロセッサは、入力インターフェイスを介してユーザの操作入力を受け付けて、関連契約書を選択し、通信インターフェイスを介してその選択結果をサーバ装置に送信する。サーバ装置100のプロセッサ111は、通信インターフェイス113を介して選択結果を受信すると(S317)、受信した選択結果を関連契約書情報として文書ID情報に対応付けて記憶する(S318)。 When the terminal device 200 receives the related contract information candidates, the processor processes the terminal device 200 and displays a list of related contract candidates via the output interface. The processor of the terminal device 200 then accepts user input via the input interface, selects a related contract, and transmits the selection results to the server device via the communication interface. When the processor 111 of the server device 100 receives the selection results via the communication interface 113 (S317), it stores the received selection results as related contract information in association with the document ID information (S318).
以上により、図4のS118において実行される内容解析処理のうち、「契約書情報から属性情報を抽出する処理」及び「契約書情報から関連契約書情報を特定する処理」を行う場合の処理フローを終了する。なお、図6においては、「契約書情報から属性情報を抽出する処理」及び「契約書情報から関連契約書情報を特定する処理」の両方の処理が実行されているが、当然にいずれか一つの処理のみが実行されてもよいし、他の内容解析処理がさらに追加で実行されてもよい。 This completes the processing flow for performing the "processing to extract attribute information from contract information" and the "processing to identify related contract information from contract information" out of the content analysis processing executed in S118 of Figure 4. Note that in Figure 6, both the "processing to extract attribute information from contract information" and the "processing to identify related contract information from contract information" are executed, but it goes without saying that only one of these processes may be executed, or other content analysis processes may be executed in addition.
また、図7は、本開示の一実施形態に係るサーバ装置100において実行される処理フローを示す図である。具体的には、図7は、図4のS118において実行される内容解析処理のうち、「契約書情報から契約書におけるリスクを解析する処理」の処理フローの一例を示す図である。当該処理フローは、主にサーバ装置100のプロセッサ111がメモリ112に記憶されたプログラムを読み出して実行することにより行われる。 FIG. 7 is a diagram showing a processing flow executed by the server device 100 according to an embodiment of the present disclosure. Specifically, FIG. 7 is a diagram showing an example of the processing flow for "processing for analyzing risks in a contract from contract information" in the content analysis processing executed in S118 of FIG. 4. This processing flow is mainly performed by the processor 111 of the server device 100 reading and executing a program stored in the memory 112.
図7によると、プロセッサ111は、契約書情報を含む文書情報を構成するファイルを読み出して(S411)、読み出した文書情報を学習済みリスク解析モデルに入力する(S412)。具体的には、プロセッサ111は、対象の文書情報から抽出されたテキスト情報を、言語解析により契約書を構成する個々の条項単位に分解する。そして、プロセッサ111は、分解された個々の条項ごとに、個々の条項を構成するテキスト情報を学習済みリスク解析モデルに入力する。プロセッサ111は、当該学習済みリスク解析モデルから、個々の条項についてのリスクの解析結果を出力として取得する。 As shown in FIG. 7, processor 111 reads a file constituting document information including contract information (S411) and inputs the read document information into the trained risk analysis model (S412). Specifically, processor 111 uses language analysis to break down the text information extracted from the target document information into individual clauses constituting the contract. Then, processor 111 inputs the text information constituting each clause into the trained risk analysis model for each of the broken down clauses. Processor 111 obtains the risk analysis results for each clause as output from the trained risk analysis model.
学習済みリスク解析モデルは、例えば、以下のように生成されることができる。まず、プロセッサが、学習用の契約書を構成する個々の条項単位でテキスト情報を抽出した学習用テキスト情報を生成する。また、プロセッサは、生成された学習用契約文書情報に対して、あらかじめそのリスクの程度を示す情報(例えば、「高」、「中」、及び「低」)をラベル付けすることによりラベル情報を生成する。そして、プロセッサは、学習用テキスト情報とラベル情報との組を、ニューロンを組み合わせたニューラルネットワークに与え、ニューラルネットワークからの出力が上記ラベル情報と同じになるように、各パラメータを調整しながら学習を繰り返す。これにより、学習済みリスク解析モデルが取得される。 A trained risk analysis model can be generated, for example, as follows. First, a processor generates training text information by extracting text information for each individual clause that makes up the training contract. The processor also generates label information by labeling the generated training contract document information with information indicating the level of risk (e.g., "high," "medium," and "low"). The processor then provides the set of training text information and label information to a neural network that combines neurons, and repeats learning while adjusting each parameter so that the output from the neural network is the same as the label information. In this way, a trained risk analysis model is obtained.
なお、このような学習済みリスク解析モデルは、図5に示す学習済み判定モデルと同様に、ニューラルネットワーク以外の他の学習器を用いることも可能であるし、大規模言語モデル等の生成系学習済み解析モデルを利用することも可能である。また、学習済みリスク解析モデルは、図5に示す学習済み判定モデルと同様に、複数の学習済みリスク解析モデルを組み合わせることも可能である。 As with the trained judgment model shown in Figure 5, such trained risk analysis models can use learners other than neural networks, and can also utilize generative trained analysis models such as large-scale language models. Furthermore, as with the trained judgment model shown in Figure 5, trained risk analysis models can also combine multiple trained risk analysis models.
また、学習済みリスク解析モデルの生成は、サーバ装置100に限らず、サーバ装置100と有線又は無線ネットワークを介して接続されたモデル生成装置によって生成又は学習されてもよい。 Furthermore, the trained risk analysis model may not be generated by the server device 100, but may be generated or trained by a model generation device connected to the server device 100 via a wired or wireless network.
また、学習済みリスク解析モデルはサーバ装置100のメモリ112にプログラムとして記憶され、プロセッサ111が当該プログラムを実行することによって処理されるものであってもよいし、サーバ装置100と通信可能に接続された他の処理装置内のメモリにプログラムとして記憶され当該処理装置内のプロセッサによって処理されるものであってもよい。 The trained risk analysis model may be stored as a program in the memory 112 of the server device 100 and processed by the processor 111 executing the program, or it may be stored as a program in the memory of another processing device communicatively connected to the server device 100 and processed by the processor within that processing device.
サーバ装置100には、リスクの程度、条項のタイトル及び条項の内容であるテキスト情報に対応付けて、リスクの内容、リスクに対する対処方法などの様々なリスク関連情報が記憶されている。そのため、プロセッサ111は、学習済みリスク解析モデルからリスクの程度を示す解析結果を取得すると、当該解析結果と、学習済み解析モデルに入力された個々の条項のタイトル及びテキスト情報とに基づいて、リスクの内容及びリスクに対する対処方法を取得する。そして、プロセッサ111は、解析結果、リスクの内容、及びリスクに対する対処方法等をリスク情報として記憶する(S413)。 The server device 100 stores various risk-related information, such as risk content and how to deal with the risk, in association with text information that is the level of risk, the title of the clause, and the content of the clause. Therefore, when the processor 111 obtains analysis results indicating the level of risk from the trained risk analysis model, it obtains the risk content and how to deal with the risk based on the analysis results and the titles and text information of the individual clauses input to the trained analysis model. The processor 111 then stores the analysis results, risk content, how to deal with the risk, etc. as risk information (S413).
以上により、図4のS118において実行される内容解析処理のうち、「契約書情報から契約書におけるリスクを解析する処理」を行う場合の処理フローを終了する。なお、図7においては、「契約書情報から契約書におけるリスクを解析する処理」のみを実行する場合について説明したが、図6に示す各処理が追加で実行されてもい。 This completes the processing flow for performing the "process for analyzing risks in a contract from contract information" of the content analysis process executed in S118 of Figure 4. Note that Figure 7 describes the case where only the "process for analyzing risks in a contract from contract information" is executed, but the processes shown in Figure 6 may also be executed in addition.
再び図4に戻り、プロセッサ111は、各種の内容解析処理が終了すると、内容解析処理によって得られた、属性情報、関連契約書情報及びリスク情報等に基づいて文書判定画面の出力情報を生成する。そして、プロセッサ111は、通信インターフェイス113を介して生成した文書判定画面の出力情報を端末装置200に送信する(S120)。 Returning to Figure 4, once the various content analysis processes are completed, the processor 111 generates output information for the document judgment screen based on the attribute information, related contract information, risk information, etc. obtained through the content analysis processes. The processor 111 then transmits the generated output information for the document judgment screen to the terminal device 200 via the communication interface 113 (S120).
なお、図4のS113において、入力された文書情報に契約書情報が含まれていない場合には、分類情報として「非契約文書」が記憶され、「契約文書」に分類された文書情報に対して行われたひな形判定処理及び内容解析処理の実行が制限される。具体的には、プロセッサ111は、「非契約文書」に分類された文書情報に対して、ひな形判定処理及び内容解析処理の実行をスキップするか、その処理の一部を省略して実行するか、その処理内容と異なる処理を実行する。以上により、当該処理フローを終了する。 Note that in S113 of Figure 4, if the input document information does not include contract information, "non-contract document" is stored as the classification information, and the execution of the template determination process and content analysis process performed on document information classified as a "contract document" is restricted. Specifically, the processor 111 skips the execution of the template determination process and content analysis process on document information classified as a "non-contract document," omits part of the process, or executes a process different from the process content. This ends the processing flow.
このように、ひな形判定処理や図6及び図7に示す内容解析処理は、一般的にはサーバ装置100にとっても処理負担がかさむこととなる。このような処理をすべての文書情報に対して実行すると処理負担の無駄も生じることになるところ、図4において示すように文書情報に契約書情報を含むもののみについてひな形判定処理や内容解析処理が実行される。これによって、サーバ装置の処理負担を軽減すると共に、図4のS111において受信した文書情報についてその処理をより効率的に実行することが可能となる。 As such, the template determination process and content analysis process shown in Figures 6 and 7 generally impose a heavy processing burden on the server device 100. Performing such processes on all document information would result in unnecessary processing load, so as shown in Figure 4, the template determination process and content analysis process are performed only on document information that includes contract information. This reduces the processing burden on the server device and enables more efficient processing of the document information received in S111 of Figure 4.
7.文書判定画面の例
図8A~図8Dは、本開示の一実施形態に係る端末装置200において出力される画面の例を示す図である。具体的には、図8A~図8Dは、図4のS120において端末装置200に出力される文書判定画面の例を示す図である。すなわち、図8A~図8Dには、サーバ装置100から文書判定画面の出力情報を受信した端末装置200において、出力インターフェイスを介して出力される文書判定画面の例が示されている。
8A to 8D are diagrams illustrating examples of screens output on the terminal device 200 according to an embodiment of the present disclosure. Specifically, FIGS. 8A to 8D are diagrams illustrating examples of document judgment screens output on the terminal device 200 in S120 of FIG. 4. That is, FIGS. 8A to 8D illustrate examples of document judgment screens output via an output interface on the terminal device 200 that has received output information for the document judgment screen from the server device 100.
図8Aによると、文書判定画面のうち、図4のS113等において契約文書として分類され、図6の内容解析処理において抽出された属性情報を表示する場合の文書判定画面10が示されている。文書判定画面10は、分類情報表示領域11、文書情報表示領域12、関連情報表示領域13、及びひな形領域14を少なくとも含む。分類情報表示領域11は、図4のS113等において契約書情報を含むか否かの判定結果に基づいて分類された結果である分類情報を表示する領域である。図8Aの例では、分類情報表示領域11において「契約書」と表示されているため、文書情報表示領域12に表示されている文書情報が契約書情報を含むものであることを示している。なお、分類情報表示領域11の右側にある下三角のアイコンに対するユーザの操作入力が入力インターフェイスを介して受け付けられると、他の分類情報が付与された他の文書情報に切り替えることが可能である。 Figure 8A shows a document determination screen 10 that displays attribute information extracted in the content analysis process of Figure 6 after being classified as a contract document in S113 of Figure 4 or the like. The document determination screen 10 includes at least a classification information display area 11, a document information display area 12, a related information display area 13, and a template area 14. The classification information display area 11 is an area that displays classification information resulting from a classification based on the determination result of whether or not the document contains contract information in S113 of Figure 4 or the like. In the example of Figure 8A, "Contract" is displayed in the classification information display area 11, indicating that the document information displayed in the document information display area 12 contains contract information. Note that when a user's operation input to the downward-pointing triangle icon on the right side of the classification information display area 11 is accepted via the input interface, it is possible to switch to other document information with other classification information.
文書情報表示領域12は、図4のS111において受信された文書情報15について、ドキュメントデータ形式、プレゼンテーションデータ形式、画像データ形式、印刷レイアウトデータ形式、これら形式のファイルからテキスト情報を抽出したテキストデータ形式のうちの任意の形式で表示するための領域である。図8Aの例では、これらデータ形式のうちの画像データ形式で表示された例が示されているが、例えばユーザの所望により他のデータ形式で表示されてもよい。図8Aを参照すると、文書情報表示領域12に表示されている文書情報15には、「業務委託契約書」という契約書のタイトルや、さらに「株式会社Xは・・・を締結する」や「第1条(目的)・・・」などのテキストが含まれている。すなわち、文書情報表示領域12に文書情報15の具体的な内容を表示することで、その後の処理の結果を示す情報と文書情報15とを照らし合わせながら確認することが可能となる。 The document information display area 12 is an area for displaying the document information 15 received in S111 of FIG. 4 in any of the following formats: document data, presentation data, image data, print layout data, or text data extracted from files in these formats. The example in FIG. 8A shows an example of display in image data format, but the document information may be displayed in another data format, depending on the user's preferences. Referring to FIG. 8A, the document information 15 displayed in the document information display area 12 includes the contract title "Service Outsourcing Agreement," as well as text such as "X Corporation enters into..." and "Article 1 (Purpose)...." In other words, by displaying the specific contents of the document information 15 in the document information display area 12, it is possible to confirm the document information 15 by comparing it with information indicating the results of subsequent processing.
関連情報表示領域13は、文書情報に対してなされた様々な処理によって取得された各種情報(例えば、図3Aに示す、属性情報、関連契約書情報又はリスク情報)の少なくともいずれかを表示するための領域である。関連情報表示領域13は、その上部に属性アイコン16及び関連契約書アイコン17を含む。すなわち、属性アイコン16及び関連契約書アイコン17のいずれかに対するユーザの操作入力が入力インターフェイスを介して受け付けられると、操作入力がされたアイコンに対応する情報が関連情報表示領域13に表示されることとなる。図8Aにおいては、属性アイコン16が関連契約書アイコン17に対して識別可能に表示され、属性アイコン16に対する操作入力が受け付けられたことを示している。したがって、関連情報表示領域13は、図6のS312及びS313の処理によって抽出し記憶された属性情報が表示されている。具体的には、関連情報表示領域13は、属性情報として、契約書のタイトル、当事者名、取引金額、契約変更の可否、契約開始日、契約終了日、自動更新の有無、契約期間、及び契約解除通知期限の各情報を表示している。また、関連情報表示領域13は、確認済みアイコン18及び修正アイコン19を含む。これらの各アイコンに対するユーザの操作入力が受け付けられると、記憶された属性情報について「確認済み」というフラグを記憶したり、その内容を修正するための修正処理を実行することが可能である。 The related information display area 13 is an area for displaying at least one of various pieces of information (e.g., attribute information, related contract information, or risk information shown in FIG. 3A) obtained through various processes performed on document information. The related information display area 13 includes an attribute icon 16 and a related contract icon 17 at its top. That is, when a user's operation input for either the attribute icon 16 or the related contract icon 17 is accepted via the input interface, information corresponding to the icon to which the operation input was made is displayed in the related information display area 13. In FIG. 8A, the attribute icon 16 is displayed in a manner distinguishable from the related contract icon 17, indicating that an operation input for the attribute icon 16 has been accepted. Therefore, the related information display area 13 displays the attribute information extracted and stored by the processes of S312 and S313 in FIG. 6. Specifically, the related information display area 13 displays the following attribute information: the contract title, the names of the parties, the transaction amount, whether the contract can be changed, the contract start date, the contract end date, whether automatic renewal is enabled, the contract period, and the contract termination notice deadline. The related information display area 13 also includes a confirmed icon 18 and a correction icon 19. When a user input is accepted for each of these icons, it is possible to store a "confirmed" flag for the stored attribute information or to execute a correction process to correct the content.
ひな形領域14は、図4のS115~S117において取得された、契約書がいずれの当事者から提供されたひな形であるのか否かを識別するためのひな型情報を表示するための領域である。図8Aの例では、ひな形領域14には、「自社ひな形」という表示の横にあるチェックボックスに対して「チェックマーク」が入力されている。これは、文書情報表示領域12に表示された文書情報15のひな形情報として自身が用意したひな形であることを示す情報が記憶されていることを示している。すなわち、ユーザは文書情報15が自身のひな型をベースに作成されたものであることを確認することができる。 The template area 14 is an area for displaying template information obtained in S115-S117 of Figure 4 to identify which party provided the template for the contract. In the example of Figure 8A, a check mark has been entered in the checkbox next to the "Company template" label in the template area 14. This indicates that information indicating that the template for document information 15 displayed in the document information display area 12 is a template prepared by the user has been stored. In other words, the user can confirm that document information 15 was created based on their own template.
次に、図8Bによると、文書判定画面のうち、図4のS113等において契約文書として分類され、図6の内容解析処理において特定された関連契約書情報を表示する場合の文書判定画面10が示されている。なお、図8Bに示す文書判定画面10のうち、分類情報表示領域11、文書情報表示領域12及びひな形領域14は図8Aと同様であるため、その説明は省略する。 Next, Figure 8B shows the document determination screen 10 for a document that has been classified as a contract document in S113 of Figure 4 or the like and that displays related contract information identified in the content analysis process of Figure 6. Note that, of the document determination screen 10 shown in Figure 8B, the classification information display area 11, document information display area 12, and template area 14 are the same as those in Figure 8A, and therefore their description will be omitted.
図8Bにおいては、関連情報表示領域13の関連契約書アイコン17が属性アイコン16に対して識別可能に表示され、関連契約書アイコン17に対する操作入力が受け付けられたことを示している。したがって、関連情報表示領域13は、図6のS314~S318の処理によって特定された関連契約書情報が表示されている。具体的には、関連情報表示領域13は、関連契約書情報として、業務委託条件変更の覚書、及び秘密保持契約書の各属性情報を表示している。また、関連情報表示領域13は、追加アイコン22及び修正アイコン23を含む。これら各アイコンに対するユーザの操作入力が受け付けられると、関連契約書情報として記憶された情報に対する追加や修正をユーザの所望により適宜行うことが可能である。 In Figure 8B, the related contract icon 17 in the related information display area 13 is displayed so as to be distinguishable from the attribute icon 16, indicating that operational input for the related contract icon 17 has been accepted. Therefore, the related information display area 13 displays the related contract information identified by the processing of S314 to S318 in Figure 6. Specifically, the related information display area 13 displays the attribute information for the memorandum of change to the outsourcing terms and the non-disclosure agreement as related contract information. The related information display area 13 also includes an add icon 22 and a modify icon 23. When user operational input for each of these icons is accepted, the information stored as related contract information can be added to or modified as desired by the user.
次に、図8Cによると、文書判定画面のうち、図4のS113等において契約文書として分類され、図7の内容解析処理において解析されたリスク情報を表示する場合の文書判定画面30が示されている。なお、図8Cに示す文書判定画面30のうち、分類情報表示領域31、文書情報表示領域32及びひな形領域34は、図8Aの分類情報表示領域11、文書情報表示領域12及びひな形領域14と同様であるため、その説明は省略する。 Next, Figure 8C shows a document determination screen 30 for a document that has been classified as a contract document in S113 of Figure 4 or the like and that displays risk information analyzed in the content analysis process of Figure 7. Of the document determination screen 30 shown in Figure 8C, the classification information display area 31, document information display area 32, and template area 34 are similar to the classification information display area 11, document information display area 12, and template area 14 of Figure 8A, and therefore their description will be omitted.
図8Cにおいては、関連情報表示領域33はリスク情報を含む。具体的には、関連情報表示領域33は、文書情報35で示された契約書全体のリスクの解析結果を示す全体結果領域36、並びに個々の条項についてのリスクの解析結果を示す条項リスク表示領域37及び38を含む。条項リスク表示領域37は、文書情報35に含まれる個々の条項におけるリスクを解析した結果、リスクの程度が「高」として判定されたものが示されている。また、条項リスク表示領域38には、文書情報35に含まれる個々の条項におけるリスクを解析した結果、リスクの程度が「低」として判定されたものが示されている。すなわち、条項リスク表示領域37及び条項リスク表示領域38は、リスクの程度に応じて異なる表示態様の外枠を有する。ユーザは、これによりリスクの程度をより直感的に視認することが可能である。 In FIG. 8C, the related information display area 33 includes risk information. Specifically, the related information display area 33 includes an overall result area 36 that displays the results of a risk analysis of the entire contract indicated in the document information 35, and clause risk display areas 37 and 38 that display the results of a risk analysis of individual clauses. The clause risk display area 37 displays clauses that have been determined to pose a "high" risk as a result of analyzing the risk of individual clauses included in the document information 35. The clause risk display area 38 displays clauses that have been determined to pose a "low" risk as a result of analyzing the risk of individual clauses included in the document information 35. In other words, the clause risk display area 37 and the clause risk display area 38 have outer frames that vary in display style depending on the level of risk. This allows the user to visually recognize the level of risk more intuitively.
また、個々の条項リスク表示領域37及び条項リスク表示領域38には、それぞれリスクの程度を示す表示(例えば、「重要度:高」や「重要度:低」という表示)、リスクの内容を示す表示(例えば、「<追加>委託料の内訳が定められていますか?」や「<抜け落ち>遅延損害金に関する規定がされていますか?」という表示)、及びリスクに対する対処方法を示す表示(例えば、「対応例:必要に応じて下記を追加・・・」という表示)を含む。すなわち、個々の条項リスク表示領域には、文書管理テーブルにリスク情報として記憶された内容がそれぞれ表示されることとなる。 In addition, each of the clause risk display areas 37 and 38 includes an indication of the degree of risk (for example, an indication such as "Importance: High" or "Importance: Low"), an indication of the content of the risk (for example, an indication such as "<Additional> Is the breakdown of the commission fee specified?" or "<Omission> Is there a provision regarding late payment penalties?"), and an indication of how to deal with the risk (for example, an indication such as "Example of response: Add the following as necessary..."). In other words, each of the clause risk display areas displays the content stored as risk information in the document management table.
全体結果領域36は、文書情報35に含まれる個々の条項についてリスクの解析をした結果の集計情報を含む。すなわち、全体結果領域36は、リスク(重要度)の程度が「高」と解析された条項の件数、リスクの程度が「中」と解析された条項の件数、及びリスクの程度が「低」と解析された条項の件数をそれぞれ集計した結果を含む。 The overall results area 36 contains aggregated information on the results of risk analysis for each clause included in the document information 35. In other words, the overall results area 36 contains the aggregated results of the number of clauses analyzed as having a "high" risk (importance), the number of clauses analyzed as having a "medium" risk, and the number of clauses analyzed as having a "low" risk.
なお、図8A及び図8Bにおいては、属性アイコン16及び関連契約書アイコン17に対する操作入力によって各情報を切り替えて表示する場合について説明した。図8Cに示すリスク情報に関しても、同様に、リスクアイコンを新たに設けて、各情報を切り替えて表示できるようにしてもよい。 Note that Figures 8A and 8B illustrate the case where each piece of information is switched and displayed by operating the attribute icon 16 and the related contract icon 17. Similarly, for the risk information shown in Figure 8C, a new risk icon may be provided so that each piece of information can be switched and displayed.
次に、図8Dによると、文書判定画面のうち、図4のS113等において非契約文書として分類された場合の文書判定画面50が示されている。文書判定画面50は、分類情報表示領域51、文書情報表示領域52、及び関連情報表示領域53を少なくとも含む。分類情報表示領域51は、図4のS113等において契約書情報を含むか否かの判定結果に基づいて分類された結果である分類情報を表示する領域である。図8Dの例では、分類情報表示領域51において「非契約書」と表示されているため、文書情報表示領域52に表示されている文書情報54が非契約書情報であることを示している。なお、分類情報表示領域51の右側にある下三角のアイコンに対するユーザの操作入力が入力インターフェイスを介して受け付けられると、他の分類情報が付与された他の文書情報に切り替えることが可能である。 Next, Figure 8D shows the document determination screen 50, which is displayed when the document is classified as a non-contract document in S113 or the like of Figure 4, from among the document determination screens. The document determination screen 50 includes at least a classification information display area 51, a document information display area 52, and a related information display area 53. The classification information display area 51 is an area that displays classification information resulting from the classification based on the determination result of whether or not the document contains contract information in S113 or the like of Figure 4. In the example of Figure 8D, "Non-contract" is displayed in the classification information display area 51, indicating that the document information 54 displayed in the document information display area 52 is non-contract information. Note that when a user's operation input to the downward-pointing triangle icon on the right side of the classification information display area 51 is accepted via the input interface, it is possible to switch to other document information assigned with other classification information.
文書情報表示領域52は、図4のS111において受信された文書情報54について、ドキュメントデータ形式、プレゼンテーションデータ形式、画像データ形式、印刷レイアウトデータ形式、これら形式のファイルからテキスト情報を抽出したテキストデータ形式のうちの任意の形式で表示するための領域である。図8Dの例では、これらデータ形式のうちの画像データ形式で表示された例が示されているが、例えばユーザの所望により他のデータ形式で表示されてもよい。図8Dを参照すると、文書情報表示領域52に表示されている文書情報54には、「就業規則」という文書のタイトルや、「第1条(目的)・・・」などのテキストが含まれている。すなわち、文書情報表示領域52に文書情報54の具体的な内容を表示することで、当該文書に対してなされたその後の処理の結果を示す情報と文書情報54とを照らし合わせながら確認することが可能となる。 The document information display area 52 is an area for displaying the document information 54 received in S111 of FIG. 4 in any of the following formats: document data format, presentation data format, image data format, print layout data format, or text data format obtained by extracting text information from files in these formats. The example in FIG. 8D shows an example of display in image data format, but the document may be displayed in another data format, depending on the user's preferences. Referring to FIG. 8D, the document information 54 displayed in the document information display area 52 includes the document title "Work Rules" and text such as "Article 1 (Purpose)...". In other words, by displaying the specific contents of the document information 54 in the document information display area 52, it is possible to check the document information 54 against information indicating the results of subsequent processing performed on the document.
関連情報表示領域53は、文書情報54に対してなされた様々な処理によって取得された各種情報(例えば、属性情報)を表示するための領域である。関連情報表示領域53は、例えば文書情報54に対してなされた属性解析処理によって抽出された属性情報が表示されている。具体的には、関連情報表示領域53は、属性情報として、文書のタイトルとその施行日の各情報を表示している。また、関連情報表示領域53は、確認済みアイコン55及び修正アイコン56を含む。これらの各アイコンに対するユーザの操作入力が受け付けられると、記憶された属性情報について「確認済み」というフラグを記憶したり、その内容を修正するための修正処理を実行したりすることが可能である。 The related information display area 53 is an area for displaying various information (e.g., attribute information) obtained through various processes performed on the document information 54. The related information display area 53 displays attribute information extracted through attribute analysis processes performed on the document information 54, for example. Specifically, the related information display area 53 displays the document title and its implementation date as attribute information. The related information display area 53 also includes a confirmed icon 55 and a correction icon 56. When a user input is accepted for each of these icons, it is possible to store a "confirmed" flag for the stored attribute information or to perform a correction process to correct its contents.
このように、図8Dによると、図8A~図8Cにおいて契約文書と分類された文書情報に対して表示された属性情報、関連契約書情報及びリスク情報とは異なる情報が表示されている。これは、非契約文書と分類された文書情報に対しては、図6及び図7の属性情報、関連契約書情報及びリスク情報を生成する各処理の実行がスキップされたか、各処理の少なくとも一部のみしか実行されなかったことによるものである。 As such, Figure 8D displays different information from the attribute information, related contract information, and risk information displayed for document information classified as a contract document in Figures 8A to 8C. This is because, for document information classified as a non-contract document, the execution of the processes for generating the attribute information, related contract information, and risk information in Figures 6 and 7 was skipped, or at least part of each process was only executed.
以上、本実施形態においては、文書情報をより効率的に処理可能な処理装置、処理プログラム及び処理方法を提供することができる。 As described above, this embodiment provides a processing device, processing program, and processing method that can process document information more efficiently.
8.その他
図4~図7においては、各判定又は解析に係る処理において、学習済み判定モデル又は学習済みリスク解析モデルを利用する場合について説明した。しかし、このような学習済みモデルを利用するのは一例であって、当然に学習済みモデルを利用しない方法によって判定や解析を行ってもよい。例えばあらかじめ契約文書の多数の文書例を記憶しておき、プロセッサ111が入力された文書情報と各文書例との類似度を算出したり、入力された文書情報のタイトルを認識することによって契約文書か非契約文書かの判定をする。また、文書情報に対して契約文書か非契約文書かを示す分類情報以外の他の分類情報(例えば、「2以上の当事者の記載があるか否かを示す分類」や、「合意又はそれに類似する文言表現が含まれているか否かを示す分類」など)や属性情報が付与されている場合、プロセッサは、当該他の分類情報や属性情報に基づいて契約文書か非契約文書かを判定してもよい。
8. Other
4 to 7 illustrate the use of a trained judgment model or a trained risk analysis model in the processes related to each judgment or analysis. However, using such a trained model is merely an example, and judgments and analyses may naturally be performed using methods that do not use a trained model. For example, a large number of example contract documents may be stored in advance, and the processor 111 may determine whether the input document information is a contract document or a non-contract document by calculating the similarity between the input document information and each example document or by recognizing the title of the input document information. Furthermore, if the document information is assigned classification information other than classification information indicating whether it is a contract document or a non-contract document (e.g., a classification indicating whether two or more parties are listed or whether an agreement or similar wording is included) or attribute information, the processor may determine whether the document information is a contract document or a non-contract document based on the other classification information or attribute information.
図6及び図7において、内容解析処理として、「契約書情報から属性情報を抽出する処理」、「契約書情報から関連契約書情報を特定する処理」及び「契約書情報から契約書におけるリスクを解析する処理」をそれぞれ実行する場合について説明したが、当然他の内容解析処理が実行されてもよい。このような内容解析処理としては、文書管理テーブルに記憶された各文書情報の属性情報の集計結果を示すダッシュボード生成処理や、文書情報の編集処理などを一例として挙げることが可能である。 In Figures 6 and 7, the content analysis processes described are "processing to extract attribute information from contract information," "processing to identify related contract information from contract information," and "processing to analyze risks in a contract from contract information." However, other content analysis processes may also be performed. Examples of such content analysis processes include a dashboard generation process that displays the results of tallying the attribute information of each document information stored in the document management table, and a document information editing process.
また、契約文書と非契約文書を関連付けることも可能である。例えば、1つのファイルから分割されて生成された契約文書と非契約文書や、1つのフォルダに入れられた状態でアップロードされた複数のファイルに契約文書と非契約文書が含まれる場合、非契約文書は契約文書を補足する情報を含む可能性が高い。このような複数のファイルは関連付けて記憶されることが業務効率上好ましい。そのため、契約文書と判定されたファイルと非契約文書と判定された文書を関連付ける、又は一つの案件に対して関連付けて記憶するか、ユーザに対して関連付けるよう促すことが好ましい。この契約文書と非契約文書の関連付けは内容解析処理の一例である。 It is also possible to associate contract documents with non-contract documents. For example, if a contract document and a non-contract document are generated by splitting a single file, or if multiple files uploaded in a single folder contain contract documents and non-contract documents, the non-contract documents are likely to contain information that supplements the contract document. For business efficiency, it is preferable to store such multiple files in an associated manner. Therefore, it is preferable to associate files determined to be contract documents with documents determined to be non-contract documents, or to store them in an associated manner for a single case, or to prompt the user to associate them. This association of contract documents with non-contract documents is an example of content analysis processing.
なお、本開示の実施形態及び各変形例は、例として提示したものであり、本開示の範囲を限定することは意図していない。本実施形態及び各変形例は、その他の様々な形態で実施されることが可能であり、本開示の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 The embodiments and variations of this disclosure are presented as examples and are not intended to limit the scope of this disclosure. This embodiment and variations may be implemented in a variety of other forms, and various omissions, substitutions, and modifications may be made without departing from the spirit of this disclosure. These embodiments and variations are within the scope and spirit of the invention, and are included in the invention and its equivalents as set forth in the claims.
本開示で説明される処理及び手順は、実施形態において明示的に説明されたものによってのみならず、ソフトウェア、ハードウェア又はこれらの組み合わせによっても実現可能である。具体的には、本開示で説明された処理及び手順は、集積回路、揮発性メモリ、不揮発性メモリ、磁気ディスク、光ストレージ等の媒体に、当該処理に相当するロジックを実装することによって実現される。また、本開示で説明される処理及び手順は、それらの処理・手順をコンピュータプログラムとして実装し、処理装置やサーバ装置を含む各種のコンピュータに実行させることが可能である。 The processes and procedures described in this disclosure can be realized not only by those explicitly described in the embodiments, but also by software, hardware, or a combination of these. Specifically, the processes and procedures described in this disclosure can be realized by implementing logic corresponding to the processes in media such as integrated circuits, volatile memory, non-volatile memory, magnetic disks, and optical storage. Furthermore, the processes and procedures described in this disclosure can be implemented as computer programs and executed by various computers, including processing devices and server devices.
本開示において説明される処理及び手順が単一の装置、ソフトウェア、コンポーネント、モジュールによって実行される旨が説明されたとしても、そのような処理又は手順は、複数の装置、複数のソフトウェア、複数のコンポーネント、及び/又は、複数のモジュールによって実行されるものとすることができる。また、本開示において説明される各種情報が単一のメモリや記憶部に格納される旨が説明されたとしても、そのような情報は、単一の装置に備えられた複数のメモリ又は複数の装置に分散して配置された複数のメモリに分散して格納されるものとすることができる。さらに、本開示において説明されるソフトウェア及びハードウェアの要素は、それらをより少ない構成要素に統合して、又は、より多い構成要素に分解することによって実現されるものとすることができる。 Even if the processes and procedures described in this disclosure are described as being performed by a single device, software, component, or module, such processes or procedures may be performed by multiple devices, multiple software, multiple components, and/or multiple modules. Furthermore, even if the various pieces of information described in this disclosure are described as being stored in a single memory or storage unit, such information may be stored in multiple memories provided in a single device or in multiple memories distributed across multiple devices. Furthermore, the software and hardware elements described in this disclosure may be realized by integrating them into fewer components or by decomposing them into more components.
1 処理システム
100 サーバ装置
200 端末装置
1 Processing system 100 Server device 200 Terminal device
Claims (12)
前記少なくとも一つのプロセッサが、
入力された文書情報を取得し、
取得した前記文書情報が契約書情報を含むか否かを判定し、
前記判定の結果に応じて取得した前記文書情報を分類する、
ための処理を実行するように構成された処理装置。 A processing device comprising at least one processor,
the at least one processor:
Obtain the input document information,
determining whether the acquired document information includes contract information;
classifying the acquired document information according to the result of the determination;
a processing unit configured to perform processing for:
前記複数のパーツ情報のそれぞれについて契約書情報を含むか否かを判定し、
前記判定の結果、前記複数のパーツ情報のうちの少なくとも一つのパーツ情報に契約書情報が含まれている場合には、前記文書情報が契約書情報を含むと判定する、
ための処理を実行するように構成された、請求項4に記載の処理装置。 The at least one processor:
determining whether or not each of the plurality of pieces of part information includes contract information;
If the result of the determination is that at least one piece of part information among the plurality of pieces of part information includes contract information, it is determined that the document information includes contract information.
The processing device of claim 4 configured to perform processing for:
前記複数のパーツ情報のそれぞれについて契約書情報を含むか否かを判定し、
前記判定の結果、前記複数のパーツ情報のうちの少なくとも一つのパーツ情報に契約書情報が含まれている場合には、前記少なくとも一つのパーツ情報に対して契約書情報を含むことを示す分類情報を付与する、
ための処理を実行するように構成された、請求項4に記載の処理装置。 The at least one processor:
determining whether or not each of the plurality of pieces of part information includes contract information;
If the result of the determination is that at least one piece of part information among the plurality of pieces of part information includes contract information, classification information indicating that the at least one piece of part information includes contract information is assigned to the at least one piece of part information.
The processing device of claim 4 configured to perform processing for:
入力された文書情報を取得し、
取得した前記文書情報が契約書情報を含むか否かを判定し、
前記判定の結果に応じて取得した前記文書情報を分類する、
ように前記少なくとも一つのプロセッサを機能させる処理プログラム。 When executed by at least one processor,
Obtain the input document information,
determining whether the acquired document information includes contract information;
classifying the acquired document information according to the result of the determination;
A processing program that causes the at least one processor to function in such a manner.
入力された文書情報を取得する段階と、
取得した前記文書情報が契約書情報を含むか否かを判定する段階と、
前記判定の結果に応じて取得した前記文書情報を分類する段階と、
を含む処理方法。 A processing method executed by at least one processor, comprising:
obtaining input document information;
determining whether the acquired document information includes contract information;
classifying the acquired document information according to the result of the determination;
A processing method comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2024013091A JP2025118034A (en) | 2024-01-31 | 2024-01-31 | Processing device, processing program, and processing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2024013091A JP2025118034A (en) | 2024-01-31 | 2024-01-31 | Processing device, processing program, and processing method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2025118034A true JP2025118034A (en) | 2025-08-13 |
Family
ID=96701405
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024013091A Pending JP2025118034A (en) | 2024-01-31 | 2024-01-31 | Processing device, processing program, and processing method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2025118034A (en) |
-
2024
- 2024-01-31 JP JP2024013091A patent/JP2025118034A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12197873B2 (en) | Creation of component templates based on semantically similar content | |
| US9514417B2 (en) | Cloud-based plagiarism detection system performing predicting based on classified feature vectors | |
| CN112631997A (en) | Data processing method, device, terminal and storage medium | |
| US8589786B2 (en) | Trademark report with store layout diagram | |
| Tito et al. | ICDAR 2021 competition on document visual question answering | |
| CN111695014A (en) | Method, system, device and storage medium for automatically generating manuscripts based on AI (artificial intelligence) | |
| CN113868419B (en) | Text classification method, device, equipment and medium based on artificial intelligence | |
| CN110765301A (en) | Picture processing method, device, equipment and storage medium | |
| US20200074300A1 (en) | Artificial-intelligence-augmented classification system and method for tender search and analysis | |
| CN114564938A (en) | Document parsing method and device, storage medium and processor | |
| US20240211518A1 (en) | Automated document intake system | |
| CN110647504B (en) | Method and device for searching judicial documents | |
| CN112783825A (en) | Data archiving method, data archiving device, computer device and storage medium | |
| CN118981526B (en) | Multi-mode zero-code form modeling intelligent question-answering method and related equipment thereof | |
| CN114492446A (en) | Legal document processing method and device, electronic equipment and storage medium | |
| KR20220022065A (en) | Sharing Methods for Clustering User Searched Image and Implementation Thereof | |
| JP2021149364A (en) | Information processor, material creation support system, material creation support method, and material creation support program | |
| JP2025118034A (en) | Processing device, processing program, and processing method | |
| CN113822215A (en) | Device operation guide file generation method, device, electronic device and storage medium | |
| CN115114505B (en) | Online education content distribution system | |
| JP2020009453A (en) | Information processing device and program | |
| CN116775813B (en) | Service searching method, device, electronic equipment and readable storage medium | |
| US12346649B1 (en) | Systems and methods for using a text-based document format to provide context for a large language model | |
| CN119917464B (en) | File processing method and device | |
| JP2022163700A (en) | Data processing apparatus, data processing system, data processing method, and program |