[go: up one dir, main page]

JP2018195171A - Information processing apparatus, information processing system, control method thereof, and program - Google Patents

Information processing apparatus, information processing system, control method thereof, and program Download PDF

Info

Publication number
JP2018195171A
JP2018195171A JP2017099820A JP2017099820A JP2018195171A JP 2018195171 A JP2018195171 A JP 2018195171A JP 2017099820 A JP2017099820 A JP 2017099820A JP 2017099820 A JP2017099820 A JP 2017099820A JP 2018195171 A JP2018195171 A JP 2018195171A
Authority
JP
Japan
Prior art keywords
category
certainty
document
character string
certainty factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017099820A
Other languages
Japanese (ja)
Inventor
大樹 三浦
Daiki Miura
大樹 三浦
下郡山 敬己
Itsuki Shimokooriyama
敬己 下郡山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Original Assignee
Canon Marketing Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc filed Critical Canon Marketing Japan Inc
Priority to JP2017099820A priority Critical patent/JP2018195171A/en
Publication of JP2018195171A publication Critical patent/JP2018195171A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide an information processing apparatus which allows a user to reach re-input of a search character string efficiently, an information processing system, a control method thereof, and a program.SOLUTION: An information processing apparatus receives a character string as a search condition, specifies certainty of a document searched with the character string, with respect to the received character string, specifies certainty of a category with respect to the received character string, determines whether the certainty of the category has reached a threshold, determines, when the threshold is reached, whether the certainty of the document has reached a threshold, presents the category as a search refinement condition when the certainty of the document has not reached the threshold, and presents information for prompting a user to input a character string again as a search condition without determining the certainty of the document when the certainty of the category has not reached the threshold.SELECTED DRAWING: Figure 6

Description

本発明は、情報処理装置、情報処理システム、その制御方法及びプログラムに関する。   The present invention relates to an information processing apparatus, an information processing system, a control method thereof, and a program.

従来から、大量の文書を検索するための情報検索技術が開発されている。しかしながら、質問応答システムにおいて、ユーザが入力した検索条件に対して尤もらしい回答となるデータ・文書を適切に応答するには、高精度に検索を行うことができる情報検索技術を有するだけでなく、そもそもユーザによって入力される検索条件が適切でなければならない。   Conventionally, an information retrieval technique for retrieving a large amount of documents has been developed. However, in the question answering system, in order to appropriately respond to data / documents that are plausible answers to the search conditions entered by the user, not only has an information search technology that can perform a search with high accuracy, In the first place, the search conditions entered by the user must be appropriate.

例えば文書検索に際して検索条件のキーワードが漠然としていると、いくら高精度な検索技術で検索を行ったとしても検索結果にノイズが混じったり、検索結果として文書が多数抽出・提示されたりする。こうなると、ユーザはさらに当該多数の文書の中から自身の所望する文書を探し出す作業を行わなければならない。   For example, if the search condition keyword is vague at the time of document search, no matter how high-precision search technology is used, the search result may contain noise, or many documents may be extracted and presented as the search result. In this case, the user must further perform an operation of searching for the desired document from the large number of documents.

また、そもそも入力された条件が、ユーザの所望する文書を得るための条件として不適切な場合、当該検索結果の文書群の中にユーザの所望する文書が含まれない可能性がある。つまり、適切な検索結果を抽出したり提示したりするためには、様々想定される検索条件の中から適切な検索条件を選定することについてユーザの習熟度が求められる。   Further, if the input condition is inappropriate as a condition for obtaining a document desired by the user, the document desired by the user may not be included in the document group of the search result. That is, in order to extract or present an appropriate search result, a user's skill level is required for selecting an appropriate search condition from various assumed search conditions.

例えば検索対象となる文書を分類し、ユーザの入力した検索条件に基づいて文書の検索と前記分類した情報を利用した処理を統合して、ユーザの習熟度が低くても、目的となる文書を提示するための技術が開発されている。   For example, a document to be searched is classified, and a document search and a process using the classified information are integrated based on a search condition input by the user. Techniques to present have been developed.

特許文献1においては、文書集合に事前に分類を付与し、あるいは検索時に動的に分類して、当該分類を話題の一覧としてユーザに提示し、ユーザは、自分が目的とする情報が含まれる話題を選択することで、ユーザが所望する情報を含む文書を絞り込んでいく技術が記載されている。   In Patent Document 1, classification is given to a document set in advance, or classification is performed dynamically at the time of retrieval, and the classification is presented to the user as a list of topics, and the user includes information intended by the user. A technique for narrowing down documents including information desired by a user by selecting a topic is described.

特許文献2においては、ユーザが入力した検索条件により検索結果として抽出された文書集合に対してクラスタリングを行い、分類された文書が最も多い最大クラスタを表すカテゴリ名をユーザに提示して、当該カテゴリが検索条件を検索したいカテゴリかユーザに選択させること。その選択結果に応じて、当該最大クラスタ内の文書集合又はそれ以外のクラスタ内の文書集合を検索結果として提示することが記載されている。   In Patent Document 2, clustering is performed on a document set extracted as a search result according to a search condition input by a user, a category name representing the largest cluster with the largest number of classified documents is presented to the user, and the category Allows the user to select the category or conditions that they want to search for. It is described that a document set in the maximum cluster or a document set in another cluster is presented as a search result according to the selection result.

特開2002−324077号公報JP 2002-324077 A 特開2009−301221号公報JP 2009-301221 A

特許文献1および特許文献2における技術によれば、検索結果として応答・提示する文書をユーザにより選択された話題・カテゴリ等の分類で絞り込むことで、ユーザが所望する情報を的確に見つけることが可能となる。   According to the techniques in Patent Document 1 and Patent Document 2, it is possible to accurately find information desired by the user by narrowing down documents to be responded / presented as search results by classification of topics / categories selected by the user. It becomes.

しかしユーザは、検索結果を確認するために必ず分類を選択する操作をしなければならない。   However, the user must always perform an operation of selecting a classification in order to confirm the search result.

また、実行した検索の検索結果の精度が十分である場合であっても分類が提示されるため煩わしい。   Further, even if the accuracy of the search result of the executed search is sufficient, the classification is presented, which is troublesome.

また、そもそも検索条件が適切か不適切かの判断を行っておらず、不適切な検索条件が入力され検索結果の精度が十分でない場合であっても検索結果を提示するため、ユーザは、当該検索結果を確認しなければ検索結果の精度が十分でないことが分からない。精度が不十分で所望する検索結果が得られていない場合には、ユーザは別の検索条件を入力・選択して再検索しなければならない。   In addition, the user does not determine whether the search condition is appropriate or inappropriate in the first place, and since the search result is presented even when the inappropriate search condition is input and the accuracy of the search result is not sufficient, If the search result is not confirmed, it cannot be understood that the accuracy of the search result is not sufficient. If the desired search result is not obtained due to insufficient accuracy, the user must input / select another search condition and search again.

また、そもそも検索のための文字列が不適切な場合、ユーザはそのことを可能な限り早く知り、前回と異なる文字列で検索作業を行いたい。   If the character string for search is inappropriate in the first place, the user wants to know that as soon as possible and wants to search using a character string different from the previous one.

検索のための文字列が不適切なことの通知や再検索用の画面表示が遅くなれば、その分、ユーザが1度目の検索を行ってから次の検索を行うまでの時間が延びることになり、延びた時間は検索の試行回数が重なることで蓄積され、大きなタイムロスに繋がる可能性がある。   If the notification that the character string for search is inappropriate or the screen display for re-searching is delayed, the time from the user performing the first search until the next search is extended accordingly. Therefore, the extended time is accumulated by the number of search attempts overlapping, which may lead to a large time loss.

本発明は、ユーザが効率的に検索文字列の再入力に辿り着くことが可能な仕組みを提供することを目的とする。   An object of the present invention is to provide a mechanism that allows a user to efficiently arrive at re-input of a search character string.

本発明は、カテゴリを特定可能な文書を記憶する記憶装置と情報処理装置とを含む情報処理システムであって、検索条件とする文字列を受け付ける文字列受付手段と、前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段と、を備えることを特徴とする。   The present invention is an information processing system including a storage device that stores a document whose category can be specified and an information processing device, and accepts a character string accepting unit that accepts a character string as a search condition and the character string accepting unit. A certainty factor specifying means for specifying the certainty factor of the document searched for the character string, and a category specifying the certainty factor of the category for the character string received by the character string accepting unit. A certainty factor identifying unit; a category certainty factor determining unit that determines whether the certainty factor of the category specified by the category certainty factor identifying unit has reached a threshold; and a certainty factor of the category determined by the category certainty factor determining unit. Whether the certainty factor of the document specified by the document certainty factor specifying unit has reached a threshold when it is determined that When it is determined by the document certainty determination means to be determined and the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the category certainty determination When the means determines that the certainty factor of the category has not reached the threshold, the notification that prompts the user to re-enter the character string as the search condition without performing the determination by the document certainty factor determining unit And means.

本発明によれば、ユーザが効率的に検索文字列の再入力に辿り着くことが可能な仕組みを提供することができる。   ADVANTAGE OF THE INVENTION According to this invention, the mechanism in which a user can arrive at the re-input of a search character string efficiently can be provided.

なお、検索文字列に対するカテゴリの確からしさが低い場合、当該カテゴリよりも下位の、当該カテゴリに属する文書の確からしさも低いと考えられる。   Note that if the likelihood of a category for a search character string is low, it is considered that the probability of a document belonging to the category that is lower than the category is also low.

本発明によれば、先に検索対象の文書のカテゴリについて検索の確からしさを確信し、確からしさが低い場合に検索結果の文書の確からしさを確認することで、検索文字列が不適切であると判定するまでの時間、及び、検索文字列の再入力を通知するまでの時間を短縮することが可能となる。   According to the present invention, the search character string is inappropriate by confirming the certainty of the search with respect to the category of the document to be searched first and confirming the certainty of the document as the search result when the certainty is low. It is possible to shorten the time until the determination is made and the time until notification of re-input of the search character string.

また、先に検索対象の文書のカテゴリについて検索の確からしさを確信し、確からしさが低い場合に検索結果の文書の確からしさを確認することで、検索文字列が不適切であると判定するまでのアルゴリズムを簡易化することが可能となっている。   In addition, until it is determined that the search character string is inappropriate by confirming the certainty of the search for the category of the document to be searched first and confirming the certainty of the document as the search result when the probability is low. This algorithm can be simplified.

本発明の実施形態における、情報処理装置の機能構成の一例を示す図である。It is a figure which shows an example of a function structure of the information processing apparatus in embodiment of this invention. 本発明の実施形態における、情報処理装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of information processing apparatus in embodiment of this invention. 本発明の実施形態における、検索対象となる文書の一例を示す図である。It is a figure which shows an example of the document used as search object in embodiment of this invention. 本発明の実施形態における、検索結果のカテゴリ及び文書と確信度の一例を示す図である。It is a figure which shows an example of the category of a search result, a document, and a certainty factor in embodiment of this invention. 本発明の実施形態における、表示画面の構成の一例を示す図である。It is a figure which shows an example of a structure of the display screen in embodiment of this invention. 本発明の実施形態における、処理の概要を示すフローチャートである。It is a flowchart which shows the outline | summary of a process in embodiment of this invention. 本発明の実施形態における、文書の確信度チェック処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the reliability check process of a document in embodiment of this invention. 本発明の実施形態における、カテゴリの確信度チェック処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the reliability check process of a category in embodiment of this invention. 本発明の実施形態における、テーブル構成の一例を示す図である。。It is a figure which shows an example of a table structure in embodiment of this invention. .

以下、図面を参照して、本発明の実施の形態の一例について説明する。   Hereinafter, an example of an embodiment of the present invention will be described with reference to the drawings.

まず図1を参照して、本発明の実施形態における、情報処理装置の機能構成の一例について説明する。   First, an example of a functional configuration of an information processing apparatus in the embodiment of the present invention will be described with reference to FIG.

入力文字列受付部101は、文書を検索するための検索条件となる入力文字列を受け付ける。   The input character string receiving unit 101 receives an input character string serving as a search condition for searching for a document.

当該入力文字列は、本発明における情報処理装置がクライアント装置として機能するコンピュータである場合には、当該コンピュータを使用するユーザから直接入力を受け付ける機能部である。   When the information processing apparatus according to the present invention is a computer that functions as a client device, the input character string is a functional unit that directly receives an input from a user who uses the computer.

文書検索部102は、入力文字列受付部101で入力された入力文字列に基づいて文書記憶部121に記憶されている文書を検索して取得する。   The document search unit 102 searches for and acquires a document stored in the document storage unit 121 based on the input character string input by the input character string receiving unit 101.

文書記憶部121において、各文書には予め当該文書の属するカテゴリが対応付けて記憶されているものとする。   In the document storage unit 121, it is assumed that a category to which the document belongs is associated with each document and stored in advance.

また、文書検索部102は、文書検索部102により検索された文書の、検索条件である文字列に対する確信度(信頼度)を、文書ごとに計算する。つまり、文書別の確信度の特定部である。   In addition, the document search unit 102 calculates the certainty factor (reliability) of the document searched by the document search unit 102 with respect to the character string that is the search condition for each document. That is, it is a specific part of the certainty factor by document.

確信度とは、入力された文字列に対して、検索結果である文書がどの程度尤もらしいか、つまり、検索条件と検索結果文書との適合度や、検索条件と検索結果の文書の属するカテゴリとの適合度を示す値(スコア)である。   The certainty factor is how likely the search result document is to the input character string, that is, the relevance between the search condition and the search result document, and the category to which the search condition and search result document belongs. This is a value (score) indicating the degree of fit.

確信度が高いほど、質問である検索条件に対して尤もらしい回答・カテゴリである。本実施形態の説明において、確信度の値は0.00〜1.00で算出、記憶される。値が1.00に近いほど確信度が高く、0.00に近いほど確信度が低い。確信度の値の表現や、高低の基準は上述した表現・基準に限定されるものではない。   The higher the certainty factor, the more likely the answer / category is to the search condition that is a question. In the description of the present embodiment, the certainty value is calculated and stored in the range of 0.00 to 1.00. The closer the value is to 1.00, the higher the certainty factor, and the closer the value is to 0.00, the lower the certainty factor. The expression of the certainty value and the high / low standard are not limited to the above-described expressions / standards.

当該文書の検索及び検索結果別の確信度の計算・特定は公知の技術を用いて行う。例えば、IBM(登録商標)のWATSON(登録商標)を用いた公知の検索およびランク付け(Retrieve and Rank)の技術を用いて行うことが可能である(https://retrieve-and-rank-demo.mybluemix.net/)。   The search of the document and the calculation / specification of the certainty factor for each search result are performed using a known technique. For example, it can be performed using a known search and ranking technique using IBM® WATSON® (https: // retrieve-and-rank-demo). .mybluemix.net /).

検索確信度計算部103は、文書検索部102により算出・特定された文書別の確信度の値から、検索確信度判定部104による判定に用いる確信度(検索結果文書の確信度の代表となる値)を計算・特定する。例えば、検索結果の文書のカテゴリの中で最も高い確信度の値を特定する。   The search certainty factor calculation unit 103 uses the certainty factor value for each document calculated and specified by the document search unit 102 to be used for the determination by the search certainty factor determination unit 104 (representing the certainty factor of the search result document). Value). For example, the highest certainty value is specified in the category of the search result document.

検索確信度判定部104は、検索確信度計算部103で特定された検索条件に対する検索結果文書の確信度が閾値に達しているか判定する。   The search certainty determination unit 104 determines whether the certainty factor of the search result document for the search condition specified by the search certainty calculation unit 103 has reached a threshold value.

カテゴリ別確信度特定部105は、検索条件である文字列の属するカテゴリの検索と、検索条件である文字列に対するカテゴリごとの確信度を計算して特定する。例えば、文書記憶部121に記憶されているカテゴリ大の一覧を記憶しておき、当該カテゴリ大の一覧において検索文字列に対する確信度をそれぞれ計算し、確信度が上位10位までのカテゴリを検索条件の文字列が属するカテゴリとして特定する。   The category-specific certainty specifying unit 105 searches for the category to which the character string that is the search condition belongs, and calculates and specifies the certainty factor for each category with respect to the character string that is the search condition. For example, a list of large categories stored in the document storage unit 121 is stored, the certainty factors for the search character strings are calculated in the large category list, and the categories with the highest certainty factor are the search conditions. The category to which the character string belongs is specified.

文字列がどのカテゴリに属するかの判断・特定とカテゴリごとの当該確信度の計算・特定は公知の技術を用いて行う。例えば、IBM(登録商標)のWATSON(登録商標)を用いた公知の自然言語分類(Natural Language Classifier)の技術を用いて行うことが可能である(https://www.ibm.com/watson/developercloud/doc/nl-classifier/)。   The determination / specification of which category the character string belongs to and the calculation / specification of the certainty factor for each category are performed using a known technique. For example, it can be performed using a known natural language classifier technology using IBM® WATSON® (https://www.ibm.com/watson/ developercloud / doc / nl-classifier /).

ここでいうカテゴリは、文書記憶部121に記憶されている文書が属するカテゴリである。   The category here is a category to which the document stored in the document storage unit 121 belongs.

カテゴリ確信度計算部106は、カテゴリ別確信度特定部105により算出・特定されたカテゴリ別の確信度の値から、カテゴリ確信度判定部107による判定に用いる確信度(カテゴリの確信度の代表となる値)を計算・特定する。例えば、カテゴリの中で最も高い確信度の値を特定する。   The category certainty factor calculation unit 106 uses the certainty factor value calculated by and specified by the category certainty factor identification unit 105 for each category, and the certainty factor used for the determination by the category certainty factor determination unit 107 (representative of the category certainty factor). Is calculated and specified. For example, the highest certainty value in the category is specified.

カテゴリ確信度判定部107は、検索確信度判定部104において、文書の確信度が閾値に達していないと判定された場合に、カテゴリ確信度計算部106で特定された確信度の値が閾値に達しているか判定する。   When the search certainty factor determination unit 104 determines that the document certainty factor has not reached the threshold value, the category certainty factor determination unit 107 uses the certainty factor value specified by the category certainty factor calculation unit 106 as the threshold value. Determine if it has reached.

表示部108は、カテゴリ確信度判定部107において、カテゴリの確信度が閾値に達していない場合には検索条件である文字列が不適切と判断し、文字列を再入力するよう促す表示をしてユーザに再入力を通知する。   The display unit 108 causes the category certainty determination unit 107 to display that the character string that is the search condition is inappropriate when the category certainty factor has not reached the threshold, and prompt the user to re-enter the character string. To notify the user of the input again.

また、表示部108は、カテゴリ確信度判定部107において、カテゴリの確信度が閾値に達していると判定された場合で、且つ、検索確信度判定部104において文書の確信度が閾値に達していないと判定された場合に、カテゴリを確信度が高い順に表示する処理部である。   Further, the display unit 108 is a case where the category certainty factor determining unit 107 determines that the category certainty factor has reached the threshold value, and the search certainty factor determining unit 104 has reached the document certainty factor. If it is determined that the category is not, the processing unit displays the categories in descending order of certainty.

また、検索確信度判定部104において、文書の確信度が閾値に達していると判定された場合、検索結果の文書を検索結果として画面に表示する処理部である。   In addition, when the search reliability determination unit 104 determines that the document reliability has reached the threshold, the search reliability determination unit 104 displays the search result document on the screen as a search result.

選択カテゴリ受付部109は、表示部に表示されたカテゴリの中で選択されたカテゴリを受け付ける。文書検索部102は、選択カテゴリ受付部109でカテゴリを受け付けたカテゴリに属する文書を対象として、当該カテゴリの表示に用いられた検索条件(文書の検索に用いられた文字列)を用いた検索を行う。つまり、選択されたカテゴリに絞り込んで再検索する。以上が図1の説明である。   The selected category receiving unit 109 receives a category selected from the categories displayed on the display unit. The document search unit 102 searches for a document belonging to the category whose category has been received by the selected category reception unit 109 using the search condition (character string used for searching the document) used to display the category. Do. In other words, the search is performed again after narrowing down to the selected category. The above is the description of FIG.

図2は、本発明の実施形態における、情報処理装置のハードウェア構成の一例を示すブロック図である。   FIG. 2 is a block diagram illustrating an example of a hardware configuration of the information processing apparatus according to the embodiment of this invention.

図2に示すように、情報処理装置100は、システムバス204を介してCPU(Central Processing Unit)201、RAM(Random Access Memory)202、ROM(Read Only Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、通信I/Fコントローラ208等が接続された構成を採る。   As illustrated in FIG. 2, the information processing apparatus 100 includes a central processing unit (CPU) 201, a random access memory (RAM) 202, a read only memory (ROM) 203, an input controller 205, and a video controller 206 via a system bus 204. The memory controller 207, the communication I / F controller 208, and the like are connected.

CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。   The CPU 201 comprehensively controls each device and controller connected to the system bus 204.

また、ROM203あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、各サーバあるいは各PCが実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。また、本発明を実施するために必要な情報が記憶されている。なお外部メモリは外付けハードディスク等の記憶装置(その他、データベースサーバ等)であってもよい。   Further, the ROM 203 or the external memory 211 will be described later, which is necessary for realizing the functions executed by each server or each PC, such as BIOS (Basic Input / Output System) and OS (Operating System) which are control programs of the CPU 201. Various programs are stored. Further, information necessary for carrying out the present invention is stored. The external memory may be a storage device such as an external hard disk (others such as a database server).

RAM202は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードし、ロードしたプログラムを実行することで各種動作を実現する。   The RAM 202 functions as a main memory, work area, and the like for the CPU 201. The CPU 201 implements various operations by loading a program or the like necessary for executing the processing from the ROM 203 or the external memory 211 to the RAM 202 and executing the loaded program.

また、入力コントローラ205は、キーボード(KB)209や不図示のマウス等のポインティングデバイス等からの入力を制御する。   The input controller 205 controls input from a keyboard (KB) 209 or a pointing device such as a mouse (not shown).

ビデオコントローラ206は、ディスプレイ210等の表示器への表示を制御する。尚、表示器は液晶ディスプレイ等の表示器でもよい。これらは、必要に応じて管理者が使用する。   The video controller 206 controls display on a display device such as the display 210. The display device may be a display device such as a liquid crystal display. These are used by the administrator as needed.

メモリコントローラ207は、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、あるいは、PCMCIA(Personal Computer Memory Card International Association)カードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。   The memory controller 207 is an external storage device (hard disk (HD)), flexible disk (FD), or PCMCIA (Personal Computer) that stores a boot program, various applications, font data, user files, editing files, various data, and the like. Controls access to an external memory 211 such as a Compact Flash (registered trademark) memory connected to a Memory Card International Association (Card Memory) card slot via an adapter.

通信I/Fコントローラ208は、ネットワークを介して外部機器と接続・通信し、ネットワークでの通信制御処理を実行する。例えば、TCP/IP(Transmission Control Protocol/Internet Protocol)を用いた通信等が可能である。   The communication I / F controller 208 connects and communicates with an external device via a network, and executes communication control processing on the network. For example, communication using TCP / IP (Transmission Control Protocol / Internet Protocol) is possible.

尚、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上に表示することが可能である。また、CPU201は、ディスプレイ210上のマウスカーソル(図示しない)等によるユーザ指示を可能とする。   Note that the CPU 201 can display on the display 210 by executing an outline font rasterization process on a display information area in the RAM 202, for example. Further, the CPU 201 enables a user instruction using a mouse cursor (not shown) on the display 210.

本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。以上が図2の説明である。   Various programs to be described later for realizing the present invention are recorded in the external memory 211 and executed by the CPU 201 by being loaded into the RAM 202 as necessary. The above is the description of FIG.

図3は、本発明の実施形態における、検索対象の文書の一例を示す図である。301a〜301dが1つ1つの文書の例を表している。各文書はテキストファイルとして、外部メモリ211の文書記憶部121に記憶されている。   FIG. 3 is a diagram showing an example of a search target document in the embodiment of the present invention. 301a to 301d represent examples of individual documents. Each document is stored in the document storage unit 121 of the external memory 211 as a text file.

各文書は、フィールドと呼ばれるいくつかの部分に分かれている。例えば、図3の文書は、「カテゴリ大」、「カテゴリ中」、「カテゴリ小」、「本文」に分かれている。つまり、カテゴリが特定可能な文書である。本例では「本文」を形態素(トークン)などの検索対象として使用する。   Each document is divided into several parts called fields. For example, the document of FIG. 3 is divided into “large category”, “medium category”, “small category”, and “text”. That is, it is a document whose category can be specified. In this example, “text” is used as a search target such as a morpheme (token).

フィールドは必ずしも上記の4つの部分だけではない。例えば、形態素解析され形態素(あるいはN−グラムのトークン)等として検索対象となる部分、1つの文字列、数値、日付等がある。以上が図3の説明である。   The field is not necessarily just the above four parts. For example, there are a part to be searched as a morpheme (or an N-gram token) analyzed by morpheme, a character string, a numerical value, a date, and the like. The above is the description of FIG.

次に図6を参照して、本発明の実施形態における処理の概要について説明する。   Next, an overview of processing in the embodiment of the present invention will be described with reference to FIG.

図6の処理は、情報処理装置100のCPU201が、自機の備える機能部の機能を用いて実行する。   The processing in FIG. 6 is executed by the CPU 201 of the information processing apparatus 100 using the function of the functional unit included in the own apparatus.

なお、ステップS601の開始時点においては、表示部108が既に図5の500aに示す検索画面を表示しているものとする。   Note that at the start of step S601, it is assumed that the display unit 108 has already displayed the search screen indicated by 500a in FIG.

ステップS601で、入力文字列受付部101は、文書検索用のチャット画面500a(検索画面)の「検索」ボタン502の押下を受け付けることで、文字列入力部501に入力されている文字列を表示部108より受け付ける。   In step S <b> 601, the input character string receiving unit 101 displays a character string input to the character string input unit 501 by receiving a press of a “search” button 502 on the chat screen 500 a (search screen) for document search. Accept from the unit 108.

ステップS602で、文書検索部102は、入力文字列受付部101が受け付けた文字列を検索条件(検索キー)として、文書記憶部121の文書の「本文」を検索し、検索結果として特定された文書を取得してRAM202に記憶する。   In step S602, the document search unit 102 searches the “text” of the document in the document storage unit 121 using the character string received by the input character string receiving unit 101 as a search condition (search key), and is specified as a search result. A document is acquired and stored in the RAM 202.

また、ステップS602で、文書検索部102は、検索結果の各文書(文書の「本文」)の検索条件に対する確信度を計算して特定し、文書(文書の「本文」)と対応付けてRAM202に記憶する。また、確信度の高い順に文書をソートする。ソート後の一例を図4の410に示す。   In step S602, the document search unit 102 calculates and specifies the certainty factor for the search condition of each document (document “text”) as a search result, and associates it with the document (document “text”). To remember. Also, the documents are sorted in descending order of certainty. An example after sorting is shown at 410 in FIG.

文書検索結果確信度410は、検索結果である文書の本文412と、各文書の本文の検索条件に対する確信度413、確信度の順位を示す順位411から構成される。   The document search result certainty factor 410 includes a document body 412 as a search result, a certainty factor 413 with respect to a search condition for the text of each document, and a rank 411 indicating the rank of the certainty factor.

ステップS603で、情報処理装置100は、カテゴリ別の確信度を計算・特定するようカテゴリ別確信度特定部105に指示する。   In step S603, the information processing apparatus 100 instructs the category-specific certainty factor identifying unit 105 to calculate and identify the certainty factor for each category.

当該指示を受け付けたカテゴリ別確信度特定部105は、検索条件に対する各カテゴリの確信度を計算して特定、及び検索条件の文字列の属するカテゴリの特定を行う。また、各カテゴリと確信度を対応付けてRAM202に記憶する。また、確信度の高い順にカテゴリをソートする。ソート後の一例を図4の400に示す。   The category certainty factor identifying unit 105 that has received the instruction calculates and identifies the certainty factor of each category with respect to the search condition, and identifies the category to which the character string of the search condition belongs. Each category and the certainty factor are stored in the RAM 202 in association with each other. The categories are sorted in descending order of certainty. An example after sorting is shown by 400 in FIG.

カテゴリ判定確信度400は、カテゴリ402と、検索条件に対する各カテゴリの確信度403、確信度の順位を示す順位401から構成される。   The category determination certainty factor 400 includes a category 402, a certainty factor 403 of each category with respect to the search condition, and a rank 401 indicating the rank of the certainty factor.

カテゴリ確信度計算部106は、当該カテゴリ判定確信度400を取得してRAM202に記憶し、ステップS604の処理を実行する。   The category certainty calculation unit 106 acquires the category determination certainty factor 400, stores it in the RAM 202, and executes the process of step S604.

ステップS604で、カテゴリ確信度計算部106及びカテゴリ確信度判定部107は、カテゴリの確信度チェック処理を行う。当該処理の詳細は図8の説明で後述する。   In step S604, the category certainty factor calculation unit 106 and the category certainty factor determination unit 107 perform a category certainty factor check process. Details of this processing will be described later with reference to FIG.

ここで図8を参照して、カテゴリの確信度チェック処理の流れについて説明する。図8の処理は、情報処理装置100のCPU201が、自機の備える機能部の機能を用いて実行する。   Here, with reference to FIG. 8, the flow of the category certainty check process will be described. The processing of FIG. 8 is executed by the CPU 201 of the information processing apparatus 100 using the function of the functional unit included in the own apparatus.

ステップS801で、カテゴリ確信度計算部106は、図9に示すルール900を参照し、確信度上位何位までを使って、後のステップS605の判定に用いるカテゴリの確信度を決定するか判定する。   In step S801, the category certainty factor calculation unit 106 refers to the rule 900 shown in FIG. 9 and uses the highest certainty factor to determine whether to determine the certainty factor of the category used for the subsequent determination in step S605. .

ルール900は、情報処理装置100の外部メモリ211に予め記憶されているものとする。   It is assumed that the rule 900 is stored in advance in the external memory 211 of the information processing apparatus 100.

本実施形態においては、「上位1位」又は「上位3位まで」のいずれかの確信度を用いるものとする。   In the present embodiment, the certainty factor of “upper first place” or “up to third place” is used.

設定内容901=カテゴリ判定上位件数の設定値902=1の場合には、上位1位の確信度を使って、後のステップS605の判定に用いるカテゴリの確信度を決定すると判定し、処理をステップS802に移行する。   When the setting content 901 = the number of category determination upper case setting value 902 = 1, it is determined that the reliability of the category used for the determination in the subsequent step S605 is determined by using the highest-ranking reliability. The process proceeds to S802.

ステップS802で、カテゴリ確信度計算部106は、RAM上のカテゴリ判定確信度400で1位の確信度の値を、後のステップS605の判定に用いるカテゴリの確信度とすることを決定し(カテゴリ確信度特定手段に該当)、RAM202に記憶する。   In step S <b> 802, the category certainty calculation unit 106 determines that the first certainty value in the category determination certainty 400 on the RAM is set as the certainty of the category used for the subsequent determination in step S <b> 605 (category Corresponding to certainty factor specifying means), stored in the RAM 202.

設定内容901=カテゴリ判定上位件数の設定値902=3の場合には、上位3位までの確信度を使って、後のステップS605の判定に用いるカテゴリの確信度を決定すると判定し、処理をステップS803に移行する。   When the setting content 901 = the setting number 902 of the category determination upper case number 902 = 3, it is determined that the confidence level of the category used for the determination in the subsequent step S605 is determined using the confidence levels up to the top three. The process proceeds to step S803.

ステップS803で、カテゴリ確信度計算部106は、RAM上のカテゴリ判定確信度400で1位〜3位の確信度の値を用いて、後のステップS605の判定に用いる確信度の値を決定する。   In step S803, the category certainty factor calculation unit 106 determines the certainty factor value used for the subsequent determination in step S605 using the first to third ranked certainty values in the category determination certainty factor 400 on the RAM. .

例えば、1位〜3位の確信度の平均値を算出して、(当該算出された値をステップS605の判定に用いるカテゴリの確信度として特定して/カテゴリ確信度特定手段に該当)、RAM202に記憶する。   For example, the average value of the 1st to 3rd certainty factors is calculated (the calculated value is specified as the certainty factor of the category used for the determination in step S605 / corresponds to the category certainty factor specifying means), and the RAM 202 To remember.

ステップS804で、カテゴリ確信度判定部107は、ステップS802又はS803でRAM202に記憶された確信度が、ルール900の設定内容901=カテゴリ判定閾値の設定値902以上か判定する。ここでは設定値902=0.90とする。   In step S804, the category certainty determination unit 107 determines whether the certainty stored in the RAM 202 in step S802 or S803 is equal to or greater than the setting content 901 of the rule 900 = the setting value 902 of the category determination threshold. Here, the setting value 902 = 0.90.

確信度が閾値以上の場合には処理をステップS805に移行し、確信度が閾値未満の場合には処理をステップS806に移行する。   If the certainty factor is greater than or equal to the threshold value, the process proceeds to step S805. If the certainty factor is less than the threshold value, the process proceeds to step S806.

ステップS805で、カテゴリ確信度判定部107は、当該確信度が閾値に達していた旨を示す値(classConfFlag=True)をRAM202に記憶し、図8の処理を終了する。   In step S805, the category certainty level determination unit 107 stores a value (classConfFlag = True) indicating that the certainty level has reached the threshold value in the RAM 202, and ends the process of FIG.

ステップS806で、カテゴリ確信度判定部107は、当該確信度が閾値に達していなかった旨を示す値(classConfFlag=False)をRAM202に記憶する。   In step S <b> 806, the category certainty determination unit 107 stores a value (classConfFlag = False) indicating that the certainty has not reached the threshold in the RAM 202.

その後ステップS807で、カテゴリ確信度判定部107は、ルール900の設定内容901=カテゴリ判定閾値減衰率の設定値902に従って、閾値の減衰を行い、図8の処理を終了する。以上が図8の説明である。   Thereafter, in step S807, the category certainty determination unit 107 attenuates the threshold according to the setting content 901 of the rule 900 = the setting value 902 of the category determination threshold attenuation rate, and ends the process of FIG. The above is the description of FIG.

図6の説明に戻る。ステップS605で、カテゴリ確信度判定部107は、RAM202上に記憶されたclassConfFlagの値を参照して、カテゴリの確信度が閾値以上か判定する。つまり、閾値に達しているか判定する。   Returning to the description of FIG. In step S <b> 605, the category certainty determination unit 107 refers to the value of classConfFlag stored in the RAM 202 and determines whether the certainty of the category is greater than or equal to a threshold value. That is, it is determined whether the threshold value has been reached.

カテゴリの確信度が閾値未満の場合には、検索条件の文字列が不適切である(今の検索文字列では確信度の高い検索結果が得られない)旨を表示部108に応答する。つまり、文字列を変更して検索するようユーザに通知する指示を表示部108に送信する。   When the certainty factor of the category is less than the threshold, the display unit 108 is responded that the character string of the search condition is inappropriate (a search result with a high certainty factor cannot be obtained with the current search character string). That is, an instruction for notifying the user to search by changing the character string is transmitted to the display unit 108.

表示部108は当該応答を受け付け、図5の500dに示すように、「検索条件を再入力してください」というメッセージを挿入した検索画面を表示し、文字列を再入力して再検索するよう通知する。   The display unit 108 accepts the response, and displays a search screen in which a message “Please re-enter search conditions” is inserted, and re-searches by re-entering the character string, as shown by 500d in FIG. Notice.

一方、カテゴリの確信度が閾値以上の場合には処理をステップS606に移行する。   On the other hand, if the certainty factor of the category is greater than or equal to the threshold value, the process proceeds to step S606.

ステップS606で、検索確信度計算部103は、文書検索結果確信度410を取得して、検索結果の文書があるか判定する。   In step S606, the search certainty calculation unit 103 acquires the document search result certainty 410, and determines whether there is a document as a search result.

検索結果が0の場合は、検索結果が0の旨を表示部108に応答し、処理をステップS600の前に戻して、新たな文字列を受け付けるまで待機する。表示部108は当該応答を受け付け、検索結果が0であることをチャット画面500aに表示する。   If the search result is 0, a response indicating that the search result is 0 is returned to the display unit 108, the process is returned to before step S600, and the process waits until a new character string is accepted. The display unit 108 accepts the response and displays that the search result is 0 on the chat screen 500a.

検索結果の文書がある場合は処理をステップS607に移行する。ステップS607で、検索確信度計算部103及び検索確信度判定部104は、検索結果の文書本文の確信度チェック処理を実行する。当該処理の詳細は図7の説明で後述する。   If there is a search result document, the process proceeds to step S607. In step S <b> 607, the search certainty calculation unit 103 and the search certainty determination unit 104 execute a certainty check process for the document text of the search result. Details of this processing will be described later with reference to FIG.

ここで図7を参照して、文書の確信度チェック処理の流れについて説明する。図7の処理は、情報処理装置100のCPU201が、自機の備える機能部の機能を用いて実行する。   Here, the flow of document reliability check processing will be described with reference to FIG. The processing in FIG. 7 is executed by the CPU 201 of the information processing apparatus 100 using the function of the functional unit included in the own apparatus.

ステップS701で、検索確信度計算部103は、図9に示すルール900を参照し、確信度上位何位までを使って、後のステップS605の判定に用いる、検索結果の文書(文書の本文)の確信度を決定するか判定する。   In step S701, the search certainty calculation unit 103 refers to the rule 900 shown in FIG. 9 and uses the highest certainty factor to determine the document of the search result (the text of the document) used in the subsequent determination in step S605. It is determined whether to determine the certainty level.

本実施形態においては、「上位1位」又は「上位3位まで」のいずれかの確信度を用いるものとする。   In the present embodiment, the certainty factor of “upper first place” or “up to third place” is used.

設定内容901=検索結果上位件数の設定値902=1の場合には、上位1位の確信度を使って、後のステップS608の判定に用いる、検索結果の文書の確信度を決定すると判定し、処理をステップS702に移行する。   When the setting content 901 = the setting number 902 of the search result upper rank number is 1, it is determined that the certainty degree of the search result document to be used for the determination in the subsequent step S608 is determined using the highest rank certainty degree. The process proceeds to step S702.

ステップS702で、検索確信度計算部103は、RAM上の文書検索結果確信度410で1位の確信度の値を、後のステップS608の判定に用いる、検索結果の文書の確信度とすることを決定し(文書確信度特定手段に該当)、RAM202に記憶する。   In step S <b> 702, the search certainty calculation unit 103 uses the value of the first certainty in the document search result certainty 410 on the RAM as the certainty of the document as the search result used for the subsequent determination in step S <b> 608. Is determined (corresponding to document certainty specifying means) and stored in the RAM 202.

設定内容901=検索結果上位件数の設定値902=3の場合には、上位3位までの確信度を使って、後のステップS608の判定に用いる、検索結果の文書の確信度を決定すると判定し、処理をステップS703に移行する。   When the setting content 901 = the setting number 902 = 3 of the search result upper rank number, it is determined that the certainty level of the search result document to be used for the determination in the subsequent step S608 is determined using the reliability levels up to the top three. Then, the process proceeds to step S703.

ステップS703で、検索確信度計算部103は、RAM上の文書検索結果確信度410で1位〜3位の確信度の値を用いて、後のステップS608の判定に用いる確信度の値を決定する。   In step S703, the search certainty calculation unit 103 determines the value of the certainty used in the subsequent determination in step S608 using the first to third ranked beliefs in the document search result certainty 410 on the RAM. To do.

例えば、1位〜3位の確信度の平均値を算出して(当該算出された値をステップS608の判定に用いる検索結果の文書の確信度として特定して/文書確信度特定手段に該当)、RAM202に記憶する。   For example, the average value of the 1st to 3rd certainty factors is calculated (the calculated value is specified as the certainty factor of the document of the search result used for the determination in step S608 / corresponds to the document certainty factor specifying means) And stored in the RAM 202.

ステップS704で、検索確信度判定部104は、ステップS702又はS703でRAM202に記憶された確信度が、ルール900の設定内容901=検索判定閾値の設定値902以上か判定する(文書確信度判定手段に該当)。ここでは設定値902=0.50とする。   In step S704, the search certainty determination unit 104 determines whether the certainty stored in the RAM 202 in step S702 or S703 is equal to or greater than the setting content 901 of the rule 900 = the set value 902 of the search determination threshold (document certainty determination unit) Fall under). Here, the setting value 902 = 0.50.

確信度が閾値以上の場合には処理をステップS705に移行し、確信度が閾値未満の場合には処理をステップS706に移行する。   If the certainty factor is greater than or equal to the threshold, the process proceeds to step S705. If the certainty factor is less than the threshold, the process proceeds to step S706.

ステップS705で、検索確信度判定部104は、当該確信度が閾値に達していた旨を示す値(searchConfFlag=True)をRAM202に記憶し、図7の処理を終了する。   In step S705, the search certainty determination unit 104 stores a value (searchConf Flag = True) indicating that the certainty has reached the threshold in the RAM 202, and ends the process of FIG.

ステップS706で、検索確信度判定部104は、当該確信度が閾値に達していなかった旨を示す値(searchConfFlag=False)をRAM202に記憶する。   In step S <b> 706, the search certainty determination unit 104 stores a value (searchConfFlag = False) indicating that the certainty has not reached the threshold in the RAM 202.

その後ステップS707で、検索確信度判定部104は、ルール900の設定内容901=検索判定閾値減衰率の設定値902に従って、閾値の減衰を行い、図7の処理を終了する。以上が図7の説明である。   Thereafter, in step S707, the search certainty determination unit 104 attenuates the threshold according to the setting content 901 of the rule 900 = the set value 902 of the search determination threshold attenuation rate, and ends the process of FIG. The above is the description of FIG.

図6の説明に戻る。ステップS608で、検索確信度判定部104は、RAM202上に記憶されたsearchConfFlagの値を参照して、検索結果の文書の確信度が閾値以上か判定する。つまり、閾値に達しているか判定する。   Returning to the description of FIG. In step S <b> 608, the search certainty determination unit 104 refers to the value of the searchconfflag stored in the RAM 202 and determines whether the certainty of the document as a search result is equal to or greater than a threshold value. That is, it is determined whether the threshold value has been reached.

検索結果の文書の確信度が閾値以上の場合には処理をステップS612に移行し、検索結果の文書の確信度が閾値未満の場合には処理をステップS609に移行する。   If the certainty factor of the search result document is greater than or equal to the threshold value, the process proceeds to step S612. If the certainty factor of the search result document is less than the threshold value, the process proceeds to step S609.

ステップS609で、カテゴリ確信度判定部107は、確信度の高いカテゴリ上位n個を、検索結果を絞り込むための候補カテゴリとして特定する。そして、表示部108に対して送信する。つまり、絞り込み用のカテゴリを画面に表示するよう表示部108に指示する。   In step S609, the category certainty determination unit 107 identifies the top n categories with the highest certainty as candidate categories for narrowing down the search results. And it transmits with respect to the display part 108. FIG. That is, the display unit 108 is instructed to display the narrowing-down category on the screen.

当該n個の値は予め外部メモリ211に記憶されており、ユーザ操作により任意に設定変更可能であるものとする。本実施形態においてはn=3として説明する。   The n values are stored in the external memory 211 in advance, and can be arbitrarily changed by user operation. In the present embodiment, description will be made assuming that n = 3.

当該指示を受け付けた表示部108は、当該指示に従って、図5の500bに示すような検索画面を表示する。実際には、表示済の検索画面をチャット画面500bに更新する。   The display unit 108 that has received the instruction displays a search screen as indicated by 500b in FIG. 5 in accordance with the instruction. Actually, the displayed search screen is updated to the chat screen 500b.

チャット画面500bは、絞り込み用のカテゴリを表示する表示領域503と、カテゴリ504を含む。チャット画面500bには、「パソコン」「社内システム」「ネットワーク接続」の3つのカテゴリが表示されている。   The chat screen 500b includes a display area 503 for displaying a narrowing category and a category 504. The chat screen 500b displays three categories: “PC”, “In-house system”, and “Network connection”.

ステップS610で、選択カテゴリ受付部109は、チャット画面500bにおいて選択を受け付けたカテゴリ504を表示部108から受け付ける。そして、文書検索部102に当該受け付けたカテゴリで再検索するよう指示する。   In step S610, the selected category receiving unit 109 receives from the display unit 108 the category 504 that has been selected on the chat screen 500b. Then, the document search unit 102 is instructed to search again with the accepted category.

ステップS611で、文書検索部102は、選択カテゴリ受付部109から選択されたカテゴリ504を受け付けると、ステップS600で受け付けた文字列(検索条件)で、文書記憶部121の文書を、当該カテゴリに絞り込んで検索する。そして処理をステップS603に移行する。   In step S611, when the document search unit 102 receives the category 504 selected from the selected category reception unit 109, the document search unit 102 narrows down the documents in the document storage unit 121 to the category by using the character string (search condition) received in step S600. Search by. Then, the process proceeds to step S603.

なお、再検索後のステップS605の判定に際しては、(ステップS707で閾値を減衰済の場合)減衰済の検索判定閾値減衰率を用いて判定を行う。また、再検索後のステップS608の判定に際しては、(ステップS807で閾値を減衰済の場合)減衰済のカテゴリ判定閾値減衰率を用いて判定を行う。   In the determination in step S605 after the re-search, the determination is performed using the attenuated search determination threshold attenuation rate (when the threshold is attenuated in step S707). In the determination in step S608 after the re-search, the determination is performed using the attenuated category determination threshold attenuation rate (when the threshold has been attenuated in step S807).

例えば、既に検索済の文書の確信度が閾値以下の場合、その文書をカテゴリで絞り込んだとしても文書自体の検索文字列に対する確信度は変わらないため、絞り込み後の文書を検索結果として表示できない。   For example, when the certainty factor of a document that has already been searched is equal to or less than a threshold value, the certainty factor for the search character string of the document itself does not change even if the document is narrowed down by category, so that the narrowed down document cannot be displayed as a search result.

当該減衰の処理により、既に入力されている検索文字列を用いて検索した結果の文書をカテゴリに基づいて絞り込んだ場合に、前回の検索では検索結果として表示されなかった文書を、検索結果として表示できる確率を向上させることができる。   When the search results using the search character string that has already been input are narrowed down based on the category, the documents that were not displayed as the search results in the previous search are displayed as the search results. Probability can be improved.

ステップS612で、検索確信度判定部104は、表示部108に、検索結果の文書の確信度上位n個を送信し、表示するよう指示する。   In step S <b> 612, the search certainty determination unit 104 transmits to the display unit 108 an instruction to transmit and display the top n certainty factors of the search result document.

当該n個の値は予め外部メモリ211に記憶されており、ユーザ操作により任意に設定変更可能であるものとする。本実施形態においてはn=3として説明する。   The n values are stored in the external memory 211 in advance, and can be arbitrarily changed by user operation. In the present embodiment, description will be made assuming that n = 3.

当該指示を受け付けた表示部108は、当該指示に従って、図5の500cや500eに示すような検索画面を表示する。実際には、表示済の検索画面をチャット画面500c又は500eに更新して、検索結果一覧を表示する。   The display unit 108 that has received the instruction displays a search screen as shown in 500c or 500e of FIG. 5 in accordance with the instruction. Actually, the displayed search screen is updated to the chat screen 500c or 500e, and the search result list is displayed.

チャット画面500c及び500eは、検索結果の文書の一覧(検索結果の文書を表示するためのハイパーリンクが埋め込まれた、当該文書本文の先頭の所定文字数の文字列の一覧)を表示する表示領域505と、文書506を含む。   The chat screens 500c and 500e display a display area 505 that displays a list of search result documents (a list of character strings of a predetermined number of characters at the beginning of the document body in which hyperlinks for displaying the search result documents are embedded). And a document 506.

チャット画面500c及び500eには、「1)HDDパスワードを忘れた場合・・・」「2)ドメインに参加しているパソコンのパスワードについて」「3)パソコンに新規アカウントを・・・」の3つの文書のリンクが表示されている。   There are three chat screens 500c and 500e: "1) If you forget the HDD password ..." "2) Password of the PC that is participating in the domain" "3) New account on the PC ..." The document link is displayed.

なお、チャット画面500eは、ステップS609により絞り込み用のカテゴリを表示することなく、ステップS608で文書の確信度が閾値以上であると判定された場合に表示する画面である。   The chat screen 500e is a screen that is displayed when it is determined in step S608 that the certainty factor of the document is equal to or greater than the threshold without displaying the narrowing-down category in step S609.

一方、チャット画面500cは、ステップS609により絞り込み用のカテゴリを表示した後、当該カテゴリの選択操作により再検索が実行され、再検索の検索結果の文書の確信度が減衰後の閾値に達していると判定されたことで、当該カテゴリに絞り込まれた検索結果の文書が表示されている。そのため、カテゴリの表示領域503及びカテゴリ504が表示されたままであり、その下に追加して、選択されたカテゴリ504で絞り込み検索された文書が表示領域505に表示されている。   On the other hand, in the chat screen 500c, after the narrowing-down category is displayed in step S609, a re-search is executed by selecting the category, and the certainty factor of the document as the search result of the re-search has reached the threshold after attenuation. As a result of the determination, the search result documents narrowed down to the category are displayed. For this reason, the category display area 503 and the category 504 are still displayed, and a document that is additionally searched under the selected category 504 is displayed in the display area 505.

文書のリンクの選択を受け付けた場合、情報処理装置100は当該文書をリンク先から取得して表示部108の機能を用いて表示画面に表示する。以上が図6の説明である。   When the document link selection is received, the information processing apparatus 100 acquires the document from the link destination and displays the document on the display screen using the function of the display unit 108. The above is the description of FIG.

以上説明したように、本発明によれば、文字列に対する検索結果の文書及びカテゴリの確信度を用いて、動的に検索結果の文書、カテゴリ、検索用の文字列の再入力の通知をユーザに提示することができる。   As described above, according to the present invention, the user is notified of re-entry of a search result document, a category, and a search character string dynamically using the certainty factor of the search result document and category for the character string. Can be presented.

また、例えば、先に検索結果の文書の確からしさを確認し、文書の確からしさが低い場合にカテゴリの確からしさを確認し、カテゴリの確からしさも低い場合に検索文字列が不適切であると判定し、検索文字列の再入力を通知する仕組みに比べて、検索文字列が不適切であると判定するまでの時間、及び、検索文字列の再入力を通知するまでの時間を短縮することが可能となる。   In addition, for example, the probability of the document of the search result is confirmed first, the probability of the category is confirmed when the probability of the document is low, and the search character string is inappropriate when the probability of the category is low. Compared to the mechanism for determining and notifying re-entry of the search character string, the time until determining that the search character string is inappropriate and the time for notifying the re-input of the search character string are reduced. Is possible.

また、検索文字列が不適切であると判定するまでの判定ステップの数を減らし、アルゴリズムを簡易化することが可能となる。   Further, the number of determination steps until it is determined that the search character string is inappropriate can be reduced, and the algorithm can be simplified.

よって、ユーザが効率的に検索文字列の再入力の画面に辿り着くことが可能となる。   Therefore, the user can efficiently reach the screen for re-inputting the search character string.

以上説明したように、本発明によれば、ユーザが効率的に所望の検索結果又は検索文字列の再入力に辿り着くことが可能となる。   As described above, according to the present invention, it is possible for the user to efficiently arrive at a desired search result or search character string re-input.

なお、本発明の説明例では、文書の本文とカテゴリが一体となった文書ファイルを使用しているが、文書と文書の属性情報としてのカテゴリが別のファイルとして記憶管理されていてもよい。   In the explanation example of the present invention, a document file in which the text of the document and the category are integrated is used. However, the category as the document and the attribute information of the document may be stored and managed as separate files.

また、文書の本文を、質問文と回答文の2つのフィールドに分けて記憶管理してもよい。   In addition, the text of the document may be stored and managed in two fields, a question sentence and an answer sentence.

検索条件の文字列を用いた検索は、当該質問文に対して行うようにしてもよい。   The search using the character string of the search condition may be performed on the question sentence.

検索対象とする文字列は、必ずしも当該文書のファイル自体の本文から抽出したものではなくともよい。例えば、当該文書中に記載された質問と回答をそれぞれ文書ファイルとは別の形態(例えば文書記憶部121に記憶された文書の質問一覧や、文書記憶部121に記憶された文書の回答一覧)でファイル化して文書記憶部121記憶し、そのいずれか一方又は両方を選択的に検索対象とするようにしてもよい。   The character string to be searched does not necessarily have to be extracted from the text of the document file itself. For example, the question and the answer described in the document are different from the document file (for example, a document question list stored in the document storage unit 121 and a document answer list stored in the document storage unit 121). The file may be stored in the document storage unit 121, and one or both of them may be selectively set as a search target.

また、本実施形態においては情報処理装置の表示部に表示する画面及び、当該画面における検索結果の文書の表示、カテゴリの表示、文字列の再入力を促す通知の表示を図5に示す画面を用いて説明したが、画面の構成や表示・通知の方法は必ずしもこれに限るものではない。例えばスマートフォン等の携帯端末用に画面を構成してもよい。   Further, in the present embodiment, the screen shown in FIG. 5 is a screen displayed on the display unit of the information processing apparatus and a display of a search result document, a category display, and a notification prompting re-input of a character string on the screen. As described above, the screen configuration and the display / notification method are not necessarily limited thereto. For example, you may comprise a screen for portable terminals, such as a smart phone.

また、文字列の再入力を促す通知を情報処理装置が備える不図示のスピーカを用いて音声再生にて行うようしてもよい。500a〜500eに示す各画面の構成は、必ずしもチャット画面に限るものではない。   Further, notification for prompting re-input of the character string may be performed by sound reproduction using a speaker (not shown) provided in the information processing apparatus. The structure of each screen shown to 500a-500e is not necessarily restricted to a chat screen.

また、文書検索及び文書ごとの確信度の計算・特定、検索条件の文字列の属するカテゴリの特定及びカテゴリごとの確信度の計算・特定方法は、上述した方法に限るものではない。例えば、検索条件の文字列の属するカテゴリの特定・分類技術は、例えば特開2003−141129等に記載されている技術を用いてもよい。   The document search and the calculation / specification of the certainty factor for each document, the specification of the category to which the character string of the search condition belongs, and the calculation / specification method of the certainty factor for each category are not limited to the methods described above. For example, as a technique for specifying / classifying a category to which a character string of a search condition belongs, for example, a technique described in Japanese Patent Application Laid-Open No. 2003-141129 may be used.

また、既に検索結果として得られている文書のカテゴリの特定処理を検索条件の文字列の特定処理とし、当該検索結果の文書のカテゴリについてのみ、カテゴリ別の確信度の計算・特定を行うようにしてもよい。   In addition, the process for specifying the category of a document already obtained as a search result is set as the process for specifying the character string of the search condition, and the reliability for each category is calculated and specified only for the document category of the search result. May be.

また、上述した実施形態のステップS703、ステップS803においては、それぞれ、1位〜3位の確信度の平均値を算出する例を記載したが、例えば1位〜3位の確信度の合計値を算出して特定するようにしてもよい。   Moreover, in step S703 and step S803 of the above-described embodiment, an example in which the average value of the first to third confidence levels is calculated has been described. For example, the total value of the first to third confidence levels is calculated. You may make it specify by calculating.

尚、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。   It should be noted that the present invention can be implemented as, for example, a system, apparatus, method, program, or storage medium, and can be applied to a system composed of a plurality of devices. You may apply to the apparatus which consists of one apparatus.

具体的には、表示部108を備えるクライアントPCと、文書記憶部121及び文書検索部102を備えるサーバ装置Aと、カテゴリ別確信度特定部105を備えるサーバ装置Bと、入力文字列受付部101、検索確信度計算部103、検索確信度判定部104、カテゴリ確信度計算部106、カテゴリ確信度判定部107、選択カテゴリ受付部109を備える情報処理装置100(サーバ装置C)とをネットワーク(ワイドエリアネットワーク等)を介して通信可能に接続し構成される情報処理システムとして、上述した実施形態の各処理を実行し、本発明を実施してもよい。   Specifically, the client PC including the display unit 108, the server device A including the document storage unit 121 and the document search unit 102, the server device B including the category-specific certainty level identifying unit 105, and the input character string receiving unit 101 The information processing device 100 (server device C) including the search certainty calculation unit 103, the search certainty determination unit 104, the category certainty calculation unit 106, the category certainty determination unit 107, and the selected category reception unit 109 is connected to a network (wide As an information processing system configured to be communicably connected via an area network or the like, the processes of the above-described embodiments may be executed to implement the present invention.

例えばクライアントPCは、ブラウザソフトにおいて、情報処理装置100から受信したチャット画面500aを表示し、チャット画面500aにおいて「検索」ボタンが押下されることで検索条件の文字列を情報処理装置100に送信する。情報処理装置100は当該文字列をステップS601で受信し、当該文字列をサーバAに送信して、文書の検索及び確信度の算出を依頼する。   For example, the client PC displays the chat screen 500a received from the information processing apparatus 100 in the browser software, and transmits a search condition character string to the information processing apparatus 100 when the “search” button is pressed on the chat screen 500a. . The information processing apparatus 100 receives the character string in step S601, transmits the character string to the server A, and requests a document search and a certainty factor calculation.

サーバAは文書の検索及び確信度の算出を行い、検索結果として図4の410のデータを情報処理装置100に返信する。情報処理装置100は当該検索結果を受信してRAM202に記憶し、ステップS604及びS605の処理を実行する。   The server A searches for a document and calculates a certainty factor, and returns data 410 in FIG. 4 to the information processing apparatus 100 as a search result. The information processing apparatus 100 receives the search result, stores it in the RAM 202, and executes the processes of steps S604 and S605.

ステップS603で、情報処理装置100はサーバBに検索条件の文字列を送信し、カテゴリの確信度の算出及び検索条件の文字列の属するカテゴリの特定を依頼する。   In step S603, the information processing apparatus 100 transmits the search condition character string to the server B, and requests the calculation of the certainty factor of the category and the specification of the category to which the search condition character string belongs.

当該依頼を受けたサーバBは、ステップS603のカテゴリの確信度の算出及び検索条件の文字列の属するカテゴリの特定処理を実行し、その結果を図4の410として生成して情報処理装置100に返信する。情報処理装置100は410の情報を受信して自機のRAM202に記憶し、ステップS605〜S608の処理を実行する。   The server B that has received the request executes the calculation of the certainty factor of the category and the identification process of the category to which the character string of the search condition belongs in step S603, generates the result as 410 in FIG. Send back. The information processing apparatus 100 receives the information 410 and stores the information in its own RAM 202, and executes the processes of steps S605 to S608.

ステップS605確信度が閾値未満であると判定された場合、情報処理装置100は図5の500dのhtmlを生成してクライアントPCに送信することで、クライアントPCのブラウザソフトで500dの画面を表示するよう指示する。当該htmlを受信したクライアントPCのブラウザは500dの画面を表示する。   If it is determined in step S605 that the certainty factor is less than the threshold value, the information processing apparatus 100 generates the 500d html in FIG. 5 and transmits it to the client PC, thereby displaying the 500d screen with the browser software of the client PC. Instruct. The browser of the client PC that has received the html displays a 500d screen.

情報処理装置100は、ステップS608で確信度が閾値以上であると判定された場合、図5の500c又は500eに示す画面のhtmlを生成してクライアントPCに送信することで、クライアントPCのブラウザソフトで500c又は500eの画面を表示するよう指示する。当該htmlを受信したクライアントPCのブラウザは、ステップS612で500c又は500eの画面を表示する。   When it is determined in step S608 that the certainty factor is greater than or equal to the threshold value, the information processing apparatus 100 generates the html of the screen illustrated in 500c or 500e in FIG. 5 and transmits the generated html to the client PC. Instruct to display the screen of 500c or 500e. The browser of the client PC that has received the html displays a 500c or 500e screen in step S612.

ステップS605で確信度が閾値未満であると判定された場合、情報処理装置100は図5の500bのhtmlを生成してクライアントPCに送信することで、クライアントPCのブラウザソフトで500bの画面を表示するよう指示する。当該htmlを受信したクライアントPCのブラウザは500bの画面を表示する。   If it is determined in step S605 that the certainty factor is less than the threshold, the information processing apparatus 100 generates the html of 500b in FIG. 5 and transmits it to the client PC, thereby displaying the screen of 500b with the browser software of the client PC. Instruct them to do so. The browser of the client PC that has received the html displays a 500b screen.

ステップS610で、500bにおいてカテゴリの選択を受け付けたクライアントPCは当該カテゴリの情報を情報処理装置100に送信する。当該カテゴリの情報を受信した情報処理装置100は、検索条件の文字列と当該カテゴリをサーバAに送信し、当該カテゴリに絞り込んで検索を行うよう(検索結果を当該カテゴリの文書に絞り込むよう)依頼する。   In step S610, the client PC that has received the category selection in 500b transmits information on the category to the information processing apparatus 100. The information processing apparatus 100 that has received the information of the category transmits a search condition character string and the category to the server A, and requests to narrow down the category and perform a search (to narrow down the search results to documents of the category). To do.

当該依頼を受けたサーバAは、ステップS611で依頼に応じた検索を行う。そして、検索結果を410として再生成し、情報処理装置100に返信する。   The server A that has received the request performs a search according to the request in step S611. Then, the search result is regenerated as 410 and returned to the information processing apparatus 100.

また、文書記憶部121及び文書検索部102を備えるサーバ装置Aと、カテゴリ別確信度特定部105を備えるサーバ装置Bと、入力文字列受付部101、検索確信度計算部103、検索確信度判定部104、カテゴリ確信度計算部106、カテゴリ確信度判定部107、表示部108、選択カテゴリ受付部109を備える情報処理装置100(クライアントPC)とをネットワーク(ワイドエリアネットワーク等)を介して通信可能に接続し構成される情報処理システムとして、上述した実施形態の各処理を実行し、本発明を実施してもよい。   In addition, the server device A including the document storage unit 121 and the document search unit 102, the server device B including the category-specific certainty factor identifying unit 105, the input character string receiving unit 101, the search certainty factor calculating unit 103, and the search certainty factor determination Unit 104, category certainty factor calculating unit 106, category certainty factor determining unit 107, display unit 108, and information processing apparatus 100 (client PC) including selected category receiving unit 109 can communicate via a network (such as a wide area network). As an information processing system connected and configured, each process of the embodiment described above may be executed to implement the present invention.

サーバAとサーバBは同一筐体であってもよい。   Server A and server B may be the same housing.

なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。   Note that the present invention includes a software program that implements the functions of the above-described embodiments directly or remotely from a system or apparatus. The present invention also includes a case where the system or the computer of the apparatus is achieved by reading and executing the supplied program code.

したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。   Accordingly, since the functions of the present invention are implemented by computer, the program code installed in the computer also implements the present invention. In other words, the present invention includes a computer program itself for realizing the functional processing of the present invention.

プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。   Examples of the recording medium for supplying the program include a flexible disk, hard disk, optical disk, magneto-optical disk, MO, CD-ROM, CD-R, and CD-RW. In addition, there are magnetic tape, nonvolatile memory card, ROM, DVD (DVD-ROM, DVD-R), and the like.

その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。   As another program supply method, a browser on a client computer is used to connect to an Internet home page. The computer program itself of the present invention or a compressed file including an automatic installation function can be downloaded from the homepage by downloading it to a recording medium such as a hard disk.

また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。   It can also be realized by dividing the program code constituting the program of the present invention into a plurality of files and downloading each file from a different homepage. That is, a WWW server that allows a plurality of users to download a program file for realizing the functional processing of the present invention on a computer is also included in the present invention.

また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。   In addition, the program of the present invention is encrypted, stored in a storage medium such as a CD-ROM, distributed to users, and key information for decryption is downloaded from a homepage via the Internet to users who have cleared predetermined conditions. Let It is also possible to execute the encrypted program by using the downloaded key information and install the program on a computer.

また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。   Further, the functions of the above-described embodiments are realized by the computer executing the read program. In addition, based on the instructions of the program, an OS or the like running on the computer performs part or all of the actual processing, and the functions of the above-described embodiments can also be realized by the processing.

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。   Further, the program read from the recording medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer. Thereafter, the CPU of the function expansion board or function expansion unit performs part or all of the actual processing based on the instructions of the program, and the functions of the above-described embodiments are realized by the processing.

尚、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。
即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
The above-described embodiments are merely examples of implementation in carrying out the present invention, and the technical scope of the present invention should not be construed as being limited thereto.
That is, the present invention can be implemented in various forms without departing from the technical idea or the main features thereof.

100 情報処理装置
101 入力文字列受付部
102 文書検索部
103 検索確信度計算部
104 検索確信度判定部
105 カテゴリ別確信度特定部
106 カテゴリ確信度計算部
107 カテゴリ確信度判定部
108 表示部
109 選択カテゴリ受付部
121 文書記憶部

DESCRIPTION OF SYMBOLS 100 Information processing apparatus 101 Input character string reception part 102 Document search part 103 Search reliability calculation part 104 Search reliability determination part 105 Certainty factor specific classification part 106 Category reliability calculation part 107 Category reliability determination part 108 Display part 109 Selection Category reception unit 121 Document storage unit

Claims (9)

カテゴリを特定可能な文書を記憶する記憶装置と情報処理装置とを含む情報処理システムであって、
検索条件とする文字列を受け付ける文字列受付手段と、
前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、
前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、
前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、
前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、
前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段と、
を備えることを特徴とする情報処理システム。
An information processing system including a storage device that stores a document whose category can be specified and an information processing device,
A character string receiving means for receiving a character string as a search condition;
Document certainty factor specifying means for specifying the certainty factor of the document searched by the character string with respect to the character string received by the character string receiving unit;
Category certainty specifying means for specifying the certainty of the category for the character string received by the character string receiving means;
Category certainty determining means for determining whether the certainty of the category specified by the category certainty specifying means has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor identifying unit has reached a threshold value when the category certainty factor determining unit determines that the certainty factor of the category has reached a threshold value Degree determination means;
When it is determined by the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the certainty of the category is determined by the category certainty determination means. A notification means for notifying the user to re-enter a character string as a search condition without performing the determination by the document certainty determination means;
An information processing system comprising:
前記通知手段は、前記文書の確信度が閾値に達していて、且つ、前記カテゴリの確信度が閾値に達している場合に、前記文字列により検索された複数の文書を検索結果として通知することを特徴とする請求項1に記載の情報処理システム。   The notifying means notifies a plurality of documents searched by the character string as a search result when the certainty factor of the document has reached a threshold value and the certainty factor of the category has reached the threshold value. The information processing system according to claim 1. 前記文字列受付手段により受け付けた文字列に基づいて、前記記憶装置の文書を検索する検索手段
を備え、
前記検索手段は、前記通知手段により通知された絞り込み条件としての前記カテゴリの選択を受け付けた場合に、選択を受け付けたカテゴリによって特定される文書を、前記文字列に基づいて検索することを特徴とする請求項1又は2に記載の情報処理システム。
Search means for searching for a document in the storage device based on the character string received by the character string receiving means,
The search unit, when receiving the selection of the category as a narrowing condition notified by the notification unit, searches for a document specified by the category that has received the selection based on the character string. The information processing system according to claim 1 or 2.
前記文書の確信度が閾値に達していない場合に、当該閾値を減衰し、前記カテゴリの確信度が閾値に達していない場合に、当該閾値を減衰する減衰手段と
を備えることを特徴とする請求項1乃至3のいずれか1項に記載の情報処理システム。
And attenuating means for attenuating the threshold when the certainty factor of the document does not reach the threshold value, and attenuating the threshold value when the certainty factor of the category does not reach the threshold value. Item 4. The information processing system according to any one of Items 1 to 3.
カテゴリを特定可能な文書を記憶する記憶装置と情報処理装置とを含む情報処理システムの制御方法であって、
検索条件とする文字列を受け付ける文字列受付工程と、
前記文字列受付工程により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定工程と、
前記文字列受付工程により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定工程と、
前記カテゴリ確信度特定工程により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定工程と、
前記カテゴリ確信度判定工程により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定工程により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定工程と、
前記文書確信度判定工程により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定工程により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定工程による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知工程と、
を含むことを特徴とする制御方法。
A control method for an information processing system including a storage device for storing a document whose category can be specified and an information processing device,
A character string accepting step for accepting a character string as a search condition;
A document certainty factor identifying step for identifying the certainty factor of the document searched by the character string with respect to the character string accepted by the character string accepting step;
A category certainty factor identifying step for identifying the certainty factor of the category for the character string accepted by the character string accepting step;
A category certainty determination step for determining whether the certainty of the category specified by the category certainty specifying step has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor specifying step has reached the threshold value when it is determined by the category certainty factor determining step that the certainty factor of the category has reached a threshold value Degree determination step,
When it is determined that the document certainty factor has not reached the threshold value by the document certainty factor determining step, the category is notified as a search narrowing condition, and the category certainty factor is determined by the category certainty factor determining step. A notification step for notifying the user to re-input a character string as a search condition without performing the determination by the document certainty determination step;
The control method characterized by including.
カテゴリを特定可能な文書を記憶する記憶装置と情報処理装置とを含む情報処理システムを制御するためのプログラムであって、
前記情報処理システムを、
検索条件とする文字列を受け付ける文字列受付手段と、
前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、
前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、
前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、
前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、
前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段として機能させるためのプログラム。
A program for controlling an information processing system including a storage device that stores a document whose category can be specified and an information processing device,
The information processing system;
A character string receiving means for receiving a character string as a search condition;
Document certainty factor specifying means for specifying the certainty factor of the document searched by the character string with respect to the character string received by the character string receiving unit;
Category certainty specifying means for specifying the certainty of the category for the character string received by the character string receiving means;
Category certainty determining means for determining whether the certainty of the category specified by the category certainty specifying means has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor identifying unit has reached a threshold value when the category certainty factor determining unit determines that the certainty factor of the category has reached a threshold value Degree determination means;
When it is determined by the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the certainty of the category is determined by the category certainty determination means. A program for functioning as notification means for notifying the user to re-input a character string as a search condition without making the determination by the document certainty determination means when it is determined that the document has not been reached.
カテゴリを特定可能な文書を記憶する記憶装置と接続が可能な情報処理装置であって、
検索条件とする文字列を受け付ける文字列受付手段と、
前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、
前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、
前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、
前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、
前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段と、
を備えることを特徴とする情報処理装置。
An information processing apparatus that can be connected to a storage device that stores a document that can specify a category,
A character string receiving means for receiving a character string as a search condition;
Document certainty factor specifying means for specifying the certainty factor of the document searched by the character string with respect to the character string received by the character string receiving unit;
Category certainty specifying means for specifying the certainty of the category for the character string received by the character string receiving means;
Category certainty determining means for determining whether the certainty of the category specified by the category certainty specifying means has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor identifying unit has reached a threshold value when the category certainty factor determining unit determines that the certainty factor of the category has reached a threshold value Degree determination means;
When it is determined by the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the certainty of the category is determined by the category certainty determination means. A notification means for notifying the user to re-enter a character string as a search condition without performing the determination by the document certainty determination means;
An information processing apparatus comprising:
カテゴリを特定可能な文書を記憶する記憶装置と接続が可能な情報処理装置の制御方法であって、
検索条件とする文字列を受け付ける文字列受付工程と、
前記文字列受付工程により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定工程と、
前記文字列受付工程により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定工程と、
前記カテゴリ確信度特定工程により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定工程と、
前記カテゴリ確信度判定工程により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定工程により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定工程と、
前記文書確信度判定工程により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定工程により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定工程による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知工程と、
を含むことを特徴とする制御方法。
A method of controlling an information processing apparatus that can be connected to a storage device that stores a document that can specify a category,
A character string accepting step for accepting a character string as a search condition;
A document certainty factor identifying step for identifying the certainty factor of the document searched by the character string with respect to the character string accepted by the character string accepting step;
A category certainty factor identifying step for identifying the certainty factor of the category for the character string accepted by the character string accepting step;
A category certainty determination step for determining whether the certainty of the category specified by the category certainty specifying step has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor specifying step has reached the threshold value when it is determined by the category certainty factor determining step that the certainty factor of the category has reached a threshold value Degree determination step,
When it is determined that the document certainty factor has not reached the threshold value by the document certainty factor determining step, the category is notified as a search narrowing condition, and the category certainty factor is determined by the category certainty factor determining step. A notification step for notifying the user to re-input a character string as a search condition without performing the determination by the document certainty determination step;
The control method characterized by including.
カテゴリを特定可能な文書を記憶する記憶装置と接続が可能な情報処理装置を制御するためのプログラムであって、
前記情報処理装置を、
検索条件とする文字列を受け付ける文字列受付手段と、
前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、
前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、
前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、
前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、
前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段として機能させるためのプログラム。
A program for controlling an information processing device that can be connected to a storage device that stores a document that can specify a category,
The information processing apparatus;
A character string receiving means for receiving a character string as a search condition;
Document certainty factor specifying means for specifying the certainty factor of the document searched by the character string with respect to the character string received by the character string receiving unit;
Category certainty specifying means for specifying the certainty of the category for the character string received by the character string receiving means;
Category certainty determining means for determining whether the certainty of the category specified by the category certainty specifying means has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor identifying unit has reached a threshold value when the category certainty factor determining unit determines that the certainty factor of the category has reached a threshold value Degree determination means;
When it is determined by the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the certainty of the category is determined by the category certainty determination means. A program for functioning as notification means for notifying the user to re-input a character string as a search condition without making the determination by the document certainty determination means when it is determined that the document has not been reached.
JP2017099820A 2017-05-19 2017-05-19 Information processing apparatus, information processing system, control method thereof, and program Pending JP2018195171A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017099820A JP2018195171A (en) 2017-05-19 2017-05-19 Information processing apparatus, information processing system, control method thereof, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017099820A JP2018195171A (en) 2017-05-19 2017-05-19 Information processing apparatus, information processing system, control method thereof, and program

Publications (1)

Publication Number Publication Date
JP2018195171A true JP2018195171A (en) 2018-12-06

Family

ID=64571621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017099820A Pending JP2018195171A (en) 2017-05-19 2017-05-19 Information processing apparatus, information processing system, control method thereof, and program

Country Status (1)

Country Link
JP (1) JP2018195171A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019171817A1 (en) 2018-03-06 2019-09-12 Ricoh Company, Ltd. Liquid composition, device for applying liquid composition, image forming device, and image forming method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019171817A1 (en) 2018-03-06 2019-09-12 Ricoh Company, Ltd. Liquid composition, device for applying liquid composition, image forming device, and image forming method

Similar Documents

Publication Publication Date Title
US7085761B2 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
US8407781B2 (en) Information providing support device and information providing support method
JP4856238B2 (en) SYSTEM AND METHOD FOR PROVIDING ADAPTIVE RECOMMENDED WORDS BY USER AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR EXECUTING THE METHOD
US20100262610A1 (en) Identifying Subject Matter Experts
US8639679B1 (en) Generating query suggestions
JP2017525026A (en) Generating a contextual search presentation
KR101665969B1 (en) Device, server and method for keyword retrieval via interaction
US10242033B2 (en) Extrapolative search techniques
CN112136127A (en) Action indicator for search operation output element
JP2013012012A (en) Dialogue rule alteration device, dialogue rule alteration method, and dialogue rule alteration program
CN114846463A (en) Identification and publication of repeatable queries
JP2010097461A (en) Document search apparatus, document search method, and document search program
CN111353086B (en) Retrieval device, storage medium and retrieval method
JP6162134B2 (en) Social page trigger
US12174865B2 (en) Information processing apparatus, information processing system, and information processing method
KR101747532B1 (en) Method and system for recommending course for travel related query
JP2018195171A (en) Information processing apparatus, information processing system, control method thereof, and program
JP6631587B2 (en) Information processing apparatus, information processing system, control method thereof, and program
JP7212655B2 (en) Information processing device, information processing method, and information processing program
JP2021107953A (en) Information processing apparatus, information processing system, method for controlling the same, and program
JP6751366B2 (en) Information management system, information management method, and information management program
JP2017207827A (en) Information processing device, information processing method, and program
JP6797618B2 (en) Search device, search method, program and search system
JP7566387B1 (en) Information processing device, method, and program
KR20210056668A (en) Method and system for providing related kewords with respect to keyword input by user for in order to deriving idea

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180703

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181031

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190109