JP2018195171A - Information processing apparatus, information processing system, control method thereof, and program - Google Patents
Information processing apparatus, information processing system, control method thereof, and program Download PDFInfo
- Publication number
- JP2018195171A JP2018195171A JP2017099820A JP2017099820A JP2018195171A JP 2018195171 A JP2018195171 A JP 2018195171A JP 2017099820 A JP2017099820 A JP 2017099820A JP 2017099820 A JP2017099820 A JP 2017099820A JP 2018195171 A JP2018195171 A JP 2018195171A
- Authority
- JP
- Japan
- Prior art keywords
- category
- certainty
- document
- character string
- certainty factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000008569 process Effects 0.000 description 35
- 238000004364 calculation method Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 18
- 230000002238 attenuated effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013549 information retrieval technique Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置、情報処理システム、その制御方法及びプログラムに関する。 The present invention relates to an information processing apparatus, an information processing system, a control method thereof, and a program.
従来から、大量の文書を検索するための情報検索技術が開発されている。しかしながら、質問応答システムにおいて、ユーザが入力した検索条件に対して尤もらしい回答となるデータ・文書を適切に応答するには、高精度に検索を行うことができる情報検索技術を有するだけでなく、そもそもユーザによって入力される検索条件が適切でなければならない。 Conventionally, an information retrieval technique for retrieving a large amount of documents has been developed. However, in the question answering system, in order to appropriately respond to data / documents that are plausible answers to the search conditions entered by the user, not only has an information search technology that can perform a search with high accuracy, In the first place, the search conditions entered by the user must be appropriate.
例えば文書検索に際して検索条件のキーワードが漠然としていると、いくら高精度な検索技術で検索を行ったとしても検索結果にノイズが混じったり、検索結果として文書が多数抽出・提示されたりする。こうなると、ユーザはさらに当該多数の文書の中から自身の所望する文書を探し出す作業を行わなければならない。 For example, if the search condition keyword is vague at the time of document search, no matter how high-precision search technology is used, the search result may contain noise, or many documents may be extracted and presented as the search result. In this case, the user must further perform an operation of searching for the desired document from the large number of documents.
また、そもそも入力された条件が、ユーザの所望する文書を得るための条件として不適切な場合、当該検索結果の文書群の中にユーザの所望する文書が含まれない可能性がある。つまり、適切な検索結果を抽出したり提示したりするためには、様々想定される検索条件の中から適切な検索条件を選定することについてユーザの習熟度が求められる。 Further, if the input condition is inappropriate as a condition for obtaining a document desired by the user, the document desired by the user may not be included in the document group of the search result. That is, in order to extract or present an appropriate search result, a user's skill level is required for selecting an appropriate search condition from various assumed search conditions.
例えば検索対象となる文書を分類し、ユーザの入力した検索条件に基づいて文書の検索と前記分類した情報を利用した処理を統合して、ユーザの習熟度が低くても、目的となる文書を提示するための技術が開発されている。 For example, a document to be searched is classified, and a document search and a process using the classified information are integrated based on a search condition input by the user. Techniques to present have been developed.
特許文献1においては、文書集合に事前に分類を付与し、あるいは検索時に動的に分類して、当該分類を話題の一覧としてユーザに提示し、ユーザは、自分が目的とする情報が含まれる話題を選択することで、ユーザが所望する情報を含む文書を絞り込んでいく技術が記載されている。
In
特許文献2においては、ユーザが入力した検索条件により検索結果として抽出された文書集合に対してクラスタリングを行い、分類された文書が最も多い最大クラスタを表すカテゴリ名をユーザに提示して、当該カテゴリが検索条件を検索したいカテゴリかユーザに選択させること。その選択結果に応じて、当該最大クラスタ内の文書集合又はそれ以外のクラスタ内の文書集合を検索結果として提示することが記載されている。
In
特許文献1および特許文献2における技術によれば、検索結果として応答・提示する文書をユーザにより選択された話題・カテゴリ等の分類で絞り込むことで、ユーザが所望する情報を的確に見つけることが可能となる。
According to the techniques in
しかしユーザは、検索結果を確認するために必ず分類を選択する操作をしなければならない。 However, the user must always perform an operation of selecting a classification in order to confirm the search result.
また、実行した検索の検索結果の精度が十分である場合であっても分類が提示されるため煩わしい。 Further, even if the accuracy of the search result of the executed search is sufficient, the classification is presented, which is troublesome.
また、そもそも検索条件が適切か不適切かの判断を行っておらず、不適切な検索条件が入力され検索結果の精度が十分でない場合であっても検索結果を提示するため、ユーザは、当該検索結果を確認しなければ検索結果の精度が十分でないことが分からない。精度が不十分で所望する検索結果が得られていない場合には、ユーザは別の検索条件を入力・選択して再検索しなければならない。 In addition, the user does not determine whether the search condition is appropriate or inappropriate in the first place, and since the search result is presented even when the inappropriate search condition is input and the accuracy of the search result is not sufficient, If the search result is not confirmed, it cannot be understood that the accuracy of the search result is not sufficient. If the desired search result is not obtained due to insufficient accuracy, the user must input / select another search condition and search again.
また、そもそも検索のための文字列が不適切な場合、ユーザはそのことを可能な限り早く知り、前回と異なる文字列で検索作業を行いたい。 If the character string for search is inappropriate in the first place, the user wants to know that as soon as possible and wants to search using a character string different from the previous one.
検索のための文字列が不適切なことの通知や再検索用の画面表示が遅くなれば、その分、ユーザが1度目の検索を行ってから次の検索を行うまでの時間が延びることになり、延びた時間は検索の試行回数が重なることで蓄積され、大きなタイムロスに繋がる可能性がある。 If the notification that the character string for search is inappropriate or the screen display for re-searching is delayed, the time from the user performing the first search until the next search is extended accordingly. Therefore, the extended time is accumulated by the number of search attempts overlapping, which may lead to a large time loss.
本発明は、ユーザが効率的に検索文字列の再入力に辿り着くことが可能な仕組みを提供することを目的とする。 An object of the present invention is to provide a mechanism that allows a user to efficiently arrive at re-input of a search character string.
本発明は、カテゴリを特定可能な文書を記憶する記憶装置と情報処理装置とを含む情報処理システムであって、検索条件とする文字列を受け付ける文字列受付手段と、前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段と、を備えることを特徴とする。 The present invention is an information processing system including a storage device that stores a document whose category can be specified and an information processing device, and accepts a character string accepting unit that accepts a character string as a search condition and the character string accepting unit. A certainty factor specifying means for specifying the certainty factor of the document searched for the character string, and a category specifying the certainty factor of the category for the character string received by the character string accepting unit. A certainty factor identifying unit; a category certainty factor determining unit that determines whether the certainty factor of the category specified by the category certainty factor identifying unit has reached a threshold; and a certainty factor of the category determined by the category certainty factor determining unit. Whether the certainty factor of the document specified by the document certainty factor specifying unit has reached a threshold when it is determined that When it is determined by the document certainty determination means to be determined and the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the category certainty determination When the means determines that the certainty factor of the category has not reached the threshold, the notification that prompts the user to re-enter the character string as the search condition without performing the determination by the document certainty factor determining unit And means.
本発明によれば、ユーザが効率的に検索文字列の再入力に辿り着くことが可能な仕組みを提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the mechanism in which a user can arrive at the re-input of a search character string efficiently can be provided.
なお、検索文字列に対するカテゴリの確からしさが低い場合、当該カテゴリよりも下位の、当該カテゴリに属する文書の確からしさも低いと考えられる。 Note that if the likelihood of a category for a search character string is low, it is considered that the probability of a document belonging to the category that is lower than the category is also low.
本発明によれば、先に検索対象の文書のカテゴリについて検索の確からしさを確信し、確からしさが低い場合に検索結果の文書の確からしさを確認することで、検索文字列が不適切であると判定するまでの時間、及び、検索文字列の再入力を通知するまでの時間を短縮することが可能となる。 According to the present invention, the search character string is inappropriate by confirming the certainty of the search with respect to the category of the document to be searched first and confirming the certainty of the document as the search result when the certainty is low. It is possible to shorten the time until the determination is made and the time until notification of re-input of the search character string.
また、先に検索対象の文書のカテゴリについて検索の確からしさを確信し、確からしさが低い場合に検索結果の文書の確からしさを確認することで、検索文字列が不適切であると判定するまでのアルゴリズムを簡易化することが可能となっている。 In addition, until it is determined that the search character string is inappropriate by confirming the certainty of the search for the category of the document to be searched first and confirming the certainty of the document as the search result when the probability is low. This algorithm can be simplified.
以下、図面を参照して、本発明の実施の形態の一例について説明する。 Hereinafter, an example of an embodiment of the present invention will be described with reference to the drawings.
まず図1を参照して、本発明の実施形態における、情報処理装置の機能構成の一例について説明する。 First, an example of a functional configuration of an information processing apparatus in the embodiment of the present invention will be described with reference to FIG.
入力文字列受付部101は、文書を検索するための検索条件となる入力文字列を受け付ける。
The input character
当該入力文字列は、本発明における情報処理装置がクライアント装置として機能するコンピュータである場合には、当該コンピュータを使用するユーザから直接入力を受け付ける機能部である。 When the information processing apparatus according to the present invention is a computer that functions as a client device, the input character string is a functional unit that directly receives an input from a user who uses the computer.
文書検索部102は、入力文字列受付部101で入力された入力文字列に基づいて文書記憶部121に記憶されている文書を検索して取得する。
The
文書記憶部121において、各文書には予め当該文書の属するカテゴリが対応付けて記憶されているものとする。
In the
また、文書検索部102は、文書検索部102により検索された文書の、検索条件である文字列に対する確信度(信頼度)を、文書ごとに計算する。つまり、文書別の確信度の特定部である。
In addition, the
確信度とは、入力された文字列に対して、検索結果である文書がどの程度尤もらしいか、つまり、検索条件と検索結果文書との適合度や、検索条件と検索結果の文書の属するカテゴリとの適合度を示す値(スコア)である。 The certainty factor is how likely the search result document is to the input character string, that is, the relevance between the search condition and the search result document, and the category to which the search condition and search result document belongs. This is a value (score) indicating the degree of fit.
確信度が高いほど、質問である検索条件に対して尤もらしい回答・カテゴリである。本実施形態の説明において、確信度の値は0.00〜1.00で算出、記憶される。値が1.00に近いほど確信度が高く、0.00に近いほど確信度が低い。確信度の値の表現や、高低の基準は上述した表現・基準に限定されるものではない。 The higher the certainty factor, the more likely the answer / category is to the search condition that is a question. In the description of the present embodiment, the certainty value is calculated and stored in the range of 0.00 to 1.00. The closer the value is to 1.00, the higher the certainty factor, and the closer the value is to 0.00, the lower the certainty factor. The expression of the certainty value and the high / low standard are not limited to the above-described expressions / standards.
当該文書の検索及び検索結果別の確信度の計算・特定は公知の技術を用いて行う。例えば、IBM(登録商標)のWATSON(登録商標)を用いた公知の検索およびランク付け(Retrieve and Rank)の技術を用いて行うことが可能である(https://retrieve-and-rank-demo.mybluemix.net/)。 The search of the document and the calculation / specification of the certainty factor for each search result are performed using a known technique. For example, it can be performed using a known search and ranking technique using IBM® WATSON® (https: // retrieve-and-rank-demo). .mybluemix.net /).
検索確信度計算部103は、文書検索部102により算出・特定された文書別の確信度の値から、検索確信度判定部104による判定に用いる確信度(検索結果文書の確信度の代表となる値)を計算・特定する。例えば、検索結果の文書のカテゴリの中で最も高い確信度の値を特定する。
The search certainty
検索確信度判定部104は、検索確信度計算部103で特定された検索条件に対する検索結果文書の確信度が閾値に達しているか判定する。
The search
カテゴリ別確信度特定部105は、検索条件である文字列の属するカテゴリの検索と、検索条件である文字列に対するカテゴリごとの確信度を計算して特定する。例えば、文書記憶部121に記憶されているカテゴリ大の一覧を記憶しておき、当該カテゴリ大の一覧において検索文字列に対する確信度をそれぞれ計算し、確信度が上位10位までのカテゴリを検索条件の文字列が属するカテゴリとして特定する。
The category-specific
文字列がどのカテゴリに属するかの判断・特定とカテゴリごとの当該確信度の計算・特定は公知の技術を用いて行う。例えば、IBM(登録商標)のWATSON(登録商標)を用いた公知の自然言語分類(Natural Language Classifier)の技術を用いて行うことが可能である(https://www.ibm.com/watson/developercloud/doc/nl-classifier/)。 The determination / specification of which category the character string belongs to and the calculation / specification of the certainty factor for each category are performed using a known technique. For example, it can be performed using a known natural language classifier technology using IBM® WATSON® (https://www.ibm.com/watson/ developercloud / doc / nl-classifier /).
ここでいうカテゴリは、文書記憶部121に記憶されている文書が属するカテゴリである。
The category here is a category to which the document stored in the
カテゴリ確信度計算部106は、カテゴリ別確信度特定部105により算出・特定されたカテゴリ別の確信度の値から、カテゴリ確信度判定部107による判定に用いる確信度(カテゴリの確信度の代表となる値)を計算・特定する。例えば、カテゴリの中で最も高い確信度の値を特定する。
The category certainty
カテゴリ確信度判定部107は、検索確信度判定部104において、文書の確信度が閾値に達していないと判定された場合に、カテゴリ確信度計算部106で特定された確信度の値が閾値に達しているか判定する。
When the search certainty
表示部108は、カテゴリ確信度判定部107において、カテゴリの確信度が閾値に達していない場合には検索条件である文字列が不適切と判断し、文字列を再入力するよう促す表示をしてユーザに再入力を通知する。
The
また、表示部108は、カテゴリ確信度判定部107において、カテゴリの確信度が閾値に達していると判定された場合で、且つ、検索確信度判定部104において文書の確信度が閾値に達していないと判定された場合に、カテゴリを確信度が高い順に表示する処理部である。
Further, the
また、検索確信度判定部104において、文書の確信度が閾値に達していると判定された場合、検索結果の文書を検索結果として画面に表示する処理部である。
In addition, when the search
選択カテゴリ受付部109は、表示部に表示されたカテゴリの中で選択されたカテゴリを受け付ける。文書検索部102は、選択カテゴリ受付部109でカテゴリを受け付けたカテゴリに属する文書を対象として、当該カテゴリの表示に用いられた検索条件(文書の検索に用いられた文字列)を用いた検索を行う。つまり、選択されたカテゴリに絞り込んで再検索する。以上が図1の説明である。
The selected
図2は、本発明の実施形態における、情報処理装置のハードウェア構成の一例を示すブロック図である。 FIG. 2 is a block diagram illustrating an example of a hardware configuration of the information processing apparatus according to the embodiment of this invention.
図2に示すように、情報処理装置100は、システムバス204を介してCPU(Central Processing Unit)201、RAM(Random Access Memory)202、ROM(Read Only Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、通信I/Fコントローラ208等が接続された構成を採る。
As illustrated in FIG. 2, the
CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。
The
また、ROM203あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、各サーバあるいは各PCが実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。また、本発明を実施するために必要な情報が記憶されている。なお外部メモリは外付けハードディスク等の記憶装置(その他、データベースサーバ等)であってもよい。
Further, the
RAM202は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードし、ロードしたプログラムを実行することで各種動作を実現する。
The
また、入力コントローラ205は、キーボード(KB)209や不図示のマウス等のポインティングデバイス等からの入力を制御する。
The
ビデオコントローラ206は、ディスプレイ210等の表示器への表示を制御する。尚、表示器は液晶ディスプレイ等の表示器でもよい。これらは、必要に応じて管理者が使用する。
The
メモリコントローラ207は、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、あるいは、PCMCIA(Personal Computer Memory Card International Association)カードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
The
通信I/Fコントローラ208は、ネットワークを介して外部機器と接続・通信し、ネットワークでの通信制御処理を実行する。例えば、TCP/IP(Transmission Control Protocol/Internet Protocol)を用いた通信等が可能である。
The communication I /
尚、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上に表示することが可能である。また、CPU201は、ディスプレイ210上のマウスカーソル(図示しない)等によるユーザ指示を可能とする。
Note that the
本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。以上が図2の説明である。
Various programs to be described later for realizing the present invention are recorded in the
図3は、本発明の実施形態における、検索対象の文書の一例を示す図である。301a〜301dが1つ1つの文書の例を表している。各文書はテキストファイルとして、外部メモリ211の文書記憶部121に記憶されている。
FIG. 3 is a diagram showing an example of a search target document in the embodiment of the present invention. 301a to 301d represent examples of individual documents. Each document is stored in the
各文書は、フィールドと呼ばれるいくつかの部分に分かれている。例えば、図3の文書は、「カテゴリ大」、「カテゴリ中」、「カテゴリ小」、「本文」に分かれている。つまり、カテゴリが特定可能な文書である。本例では「本文」を形態素(トークン)などの検索対象として使用する。 Each document is divided into several parts called fields. For example, the document of FIG. 3 is divided into “large category”, “medium category”, “small category”, and “text”. That is, it is a document whose category can be specified. In this example, “text” is used as a search target such as a morpheme (token).
フィールドは必ずしも上記の4つの部分だけではない。例えば、形態素解析され形態素(あるいはN−グラムのトークン)等として検索対象となる部分、1つの文字列、数値、日付等がある。以上が図3の説明である。 The field is not necessarily just the above four parts. For example, there are a part to be searched as a morpheme (or an N-gram token) analyzed by morpheme, a character string, a numerical value, a date, and the like. The above is the description of FIG.
次に図6を参照して、本発明の実施形態における処理の概要について説明する。 Next, an overview of processing in the embodiment of the present invention will be described with reference to FIG.
図6の処理は、情報処理装置100のCPU201が、自機の備える機能部の機能を用いて実行する。
The processing in FIG. 6 is executed by the
なお、ステップS601の開始時点においては、表示部108が既に図5の500aに示す検索画面を表示しているものとする。
Note that at the start of step S601, it is assumed that the
ステップS601で、入力文字列受付部101は、文書検索用のチャット画面500a(検索画面)の「検索」ボタン502の押下を受け付けることで、文字列入力部501に入力されている文字列を表示部108より受け付ける。
In step S <b> 601, the input character
ステップS602で、文書検索部102は、入力文字列受付部101が受け付けた文字列を検索条件(検索キー)として、文書記憶部121の文書の「本文」を検索し、検索結果として特定された文書を取得してRAM202に記憶する。
In step S602, the
また、ステップS602で、文書検索部102は、検索結果の各文書(文書の「本文」)の検索条件に対する確信度を計算して特定し、文書(文書の「本文」)と対応付けてRAM202に記憶する。また、確信度の高い順に文書をソートする。ソート後の一例を図4の410に示す。
In step S602, the
文書検索結果確信度410は、検索結果である文書の本文412と、各文書の本文の検索条件に対する確信度413、確信度の順位を示す順位411から構成される。
The document search result certainty factor 410 includes a
ステップS603で、情報処理装置100は、カテゴリ別の確信度を計算・特定するようカテゴリ別確信度特定部105に指示する。
In step S603, the
当該指示を受け付けたカテゴリ別確信度特定部105は、検索条件に対する各カテゴリの確信度を計算して特定、及び検索条件の文字列の属するカテゴリの特定を行う。また、各カテゴリと確信度を対応付けてRAM202に記憶する。また、確信度の高い順にカテゴリをソートする。ソート後の一例を図4の400に示す。
The category certainty
カテゴリ判定確信度400は、カテゴリ402と、検索条件に対する各カテゴリの確信度403、確信度の順位を示す順位401から構成される。
The category determination certainty factor 400 includes a
カテゴリ確信度計算部106は、当該カテゴリ判定確信度400を取得してRAM202に記憶し、ステップS604の処理を実行する。
The category
ステップS604で、カテゴリ確信度計算部106及びカテゴリ確信度判定部107は、カテゴリの確信度チェック処理を行う。当該処理の詳細は図8の説明で後述する。
In step S604, the category certainty
ここで図8を参照して、カテゴリの確信度チェック処理の流れについて説明する。図8の処理は、情報処理装置100のCPU201が、自機の備える機能部の機能を用いて実行する。
Here, with reference to FIG. 8, the flow of the category certainty check process will be described. The processing of FIG. 8 is executed by the
ステップS801で、カテゴリ確信度計算部106は、図9に示すルール900を参照し、確信度上位何位までを使って、後のステップS605の判定に用いるカテゴリの確信度を決定するか判定する。
In step S801, the category certainty
ルール900は、情報処理装置100の外部メモリ211に予め記憶されているものとする。
It is assumed that the
本実施形態においては、「上位1位」又は「上位3位まで」のいずれかの確信度を用いるものとする。 In the present embodiment, the certainty factor of “upper first place” or “up to third place” is used.
設定内容901=カテゴリ判定上位件数の設定値902=1の場合には、上位1位の確信度を使って、後のステップS605の判定に用いるカテゴリの確信度を決定すると判定し、処理をステップS802に移行する。
When the setting
ステップS802で、カテゴリ確信度計算部106は、RAM上のカテゴリ判定確信度400で1位の確信度の値を、後のステップS605の判定に用いるカテゴリの確信度とすることを決定し(カテゴリ確信度特定手段に該当)、RAM202に記憶する。
In step S <b> 802, the category
設定内容901=カテゴリ判定上位件数の設定値902=3の場合には、上位3位までの確信度を使って、後のステップS605の判定に用いるカテゴリの確信度を決定すると判定し、処理をステップS803に移行する。
When the setting
ステップS803で、カテゴリ確信度計算部106は、RAM上のカテゴリ判定確信度400で1位〜3位の確信度の値を用いて、後のステップS605の判定に用いる確信度の値を決定する。
In step S803, the category certainty
例えば、1位〜3位の確信度の平均値を算出して、(当該算出された値をステップS605の判定に用いるカテゴリの確信度として特定して/カテゴリ確信度特定手段に該当)、RAM202に記憶する。
For example, the average value of the 1st to 3rd certainty factors is calculated (the calculated value is specified as the certainty factor of the category used for the determination in step S605 / corresponds to the category certainty factor specifying means), and the
ステップS804で、カテゴリ確信度判定部107は、ステップS802又はS803でRAM202に記憶された確信度が、ルール900の設定内容901=カテゴリ判定閾値の設定値902以上か判定する。ここでは設定値902=0.90とする。
In step S804, the category
確信度が閾値以上の場合には処理をステップS805に移行し、確信度が閾値未満の場合には処理をステップS806に移行する。 If the certainty factor is greater than or equal to the threshold value, the process proceeds to step S805. If the certainty factor is less than the threshold value, the process proceeds to step S806.
ステップS805で、カテゴリ確信度判定部107は、当該確信度が閾値に達していた旨を示す値(classConfFlag=True)をRAM202に記憶し、図8の処理を終了する。
In step S805, the category certainty
ステップS806で、カテゴリ確信度判定部107は、当該確信度が閾値に達していなかった旨を示す値(classConfFlag=False)をRAM202に記憶する。
In step S <b> 806, the category
その後ステップS807で、カテゴリ確信度判定部107は、ルール900の設定内容901=カテゴリ判定閾値減衰率の設定値902に従って、閾値の減衰を行い、図8の処理を終了する。以上が図8の説明である。
Thereafter, in step S807, the category
図6の説明に戻る。ステップS605で、カテゴリ確信度判定部107は、RAM202上に記憶されたclassConfFlagの値を参照して、カテゴリの確信度が閾値以上か判定する。つまり、閾値に達しているか判定する。
Returning to the description of FIG. In step S <b> 605, the category
カテゴリの確信度が閾値未満の場合には、検索条件の文字列が不適切である(今の検索文字列では確信度の高い検索結果が得られない)旨を表示部108に応答する。つまり、文字列を変更して検索するようユーザに通知する指示を表示部108に送信する。
When the certainty factor of the category is less than the threshold, the
表示部108は当該応答を受け付け、図5の500dに示すように、「検索条件を再入力してください」というメッセージを挿入した検索画面を表示し、文字列を再入力して再検索するよう通知する。
The
一方、カテゴリの確信度が閾値以上の場合には処理をステップS606に移行する。 On the other hand, if the certainty factor of the category is greater than or equal to the threshold value, the process proceeds to step S606.
ステップS606で、検索確信度計算部103は、文書検索結果確信度410を取得して、検索結果の文書があるか判定する。
In step S606, the search
検索結果が0の場合は、検索結果が0の旨を表示部108に応答し、処理をステップS600の前に戻して、新たな文字列を受け付けるまで待機する。表示部108は当該応答を受け付け、検索結果が0であることをチャット画面500aに表示する。
If the search result is 0, a response indicating that the search result is 0 is returned to the
検索結果の文書がある場合は処理をステップS607に移行する。ステップS607で、検索確信度計算部103及び検索確信度判定部104は、検索結果の文書本文の確信度チェック処理を実行する。当該処理の詳細は図7の説明で後述する。
If there is a search result document, the process proceeds to step S607. In step S <b> 607, the search
ここで図7を参照して、文書の確信度チェック処理の流れについて説明する。図7の処理は、情報処理装置100のCPU201が、自機の備える機能部の機能を用いて実行する。
Here, the flow of document reliability check processing will be described with reference to FIG. The processing in FIG. 7 is executed by the
ステップS701で、検索確信度計算部103は、図9に示すルール900を参照し、確信度上位何位までを使って、後のステップS605の判定に用いる、検索結果の文書(文書の本文)の確信度を決定するか判定する。
In step S701, the search
本実施形態においては、「上位1位」又は「上位3位まで」のいずれかの確信度を用いるものとする。 In the present embodiment, the certainty factor of “upper first place” or “up to third place” is used.
設定内容901=検索結果上位件数の設定値902=1の場合には、上位1位の確信度を使って、後のステップS608の判定に用いる、検索結果の文書の確信度を決定すると判定し、処理をステップS702に移行する。
When the setting
ステップS702で、検索確信度計算部103は、RAM上の文書検索結果確信度410で1位の確信度の値を、後のステップS608の判定に用いる、検索結果の文書の確信度とすることを決定し(文書確信度特定手段に該当)、RAM202に記憶する。
In step S <b> 702, the search
設定内容901=検索結果上位件数の設定値902=3の場合には、上位3位までの確信度を使って、後のステップS608の判定に用いる、検索結果の文書の確信度を決定すると判定し、処理をステップS703に移行する。
When the setting
ステップS703で、検索確信度計算部103は、RAM上の文書検索結果確信度410で1位〜3位の確信度の値を用いて、後のステップS608の判定に用いる確信度の値を決定する。
In step S703, the search
例えば、1位〜3位の確信度の平均値を算出して(当該算出された値をステップS608の判定に用いる検索結果の文書の確信度として特定して/文書確信度特定手段に該当)、RAM202に記憶する。
For example, the average value of the 1st to 3rd certainty factors is calculated (the calculated value is specified as the certainty factor of the document of the search result used for the determination in step S608 / corresponds to the document certainty factor specifying means) And stored in the
ステップS704で、検索確信度判定部104は、ステップS702又はS703でRAM202に記憶された確信度が、ルール900の設定内容901=検索判定閾値の設定値902以上か判定する(文書確信度判定手段に該当)。ここでは設定値902=0.50とする。
In step S704, the search
確信度が閾値以上の場合には処理をステップS705に移行し、確信度が閾値未満の場合には処理をステップS706に移行する。 If the certainty factor is greater than or equal to the threshold, the process proceeds to step S705. If the certainty factor is less than the threshold, the process proceeds to step S706.
ステップS705で、検索確信度判定部104は、当該確信度が閾値に達していた旨を示す値(searchConfFlag=True)をRAM202に記憶し、図7の処理を終了する。
In step S705, the search
ステップS706で、検索確信度判定部104は、当該確信度が閾値に達していなかった旨を示す値(searchConfFlag=False)をRAM202に記憶する。
In step S <b> 706, the search
その後ステップS707で、検索確信度判定部104は、ルール900の設定内容901=検索判定閾値減衰率の設定値902に従って、閾値の減衰を行い、図7の処理を終了する。以上が図7の説明である。
Thereafter, in step S707, the search
図6の説明に戻る。ステップS608で、検索確信度判定部104は、RAM202上に記憶されたsearchConfFlagの値を参照して、検索結果の文書の確信度が閾値以上か判定する。つまり、閾値に達しているか判定する。
Returning to the description of FIG. In step S <b> 608, the search
検索結果の文書の確信度が閾値以上の場合には処理をステップS612に移行し、検索結果の文書の確信度が閾値未満の場合には処理をステップS609に移行する。 If the certainty factor of the search result document is greater than or equal to the threshold value, the process proceeds to step S612. If the certainty factor of the search result document is less than the threshold value, the process proceeds to step S609.
ステップS609で、カテゴリ確信度判定部107は、確信度の高いカテゴリ上位n個を、検索結果を絞り込むための候補カテゴリとして特定する。そして、表示部108に対して送信する。つまり、絞り込み用のカテゴリを画面に表示するよう表示部108に指示する。
In step S609, the category
当該n個の値は予め外部メモリ211に記憶されており、ユーザ操作により任意に設定変更可能であるものとする。本実施形態においてはn=3として説明する。
The n values are stored in the
当該指示を受け付けた表示部108は、当該指示に従って、図5の500bに示すような検索画面を表示する。実際には、表示済の検索画面をチャット画面500bに更新する。
The
チャット画面500bは、絞り込み用のカテゴリを表示する表示領域503と、カテゴリ504を含む。チャット画面500bには、「パソコン」「社内システム」「ネットワーク接続」の3つのカテゴリが表示されている。
The chat screen 500b includes a
ステップS610で、選択カテゴリ受付部109は、チャット画面500bにおいて選択を受け付けたカテゴリ504を表示部108から受け付ける。そして、文書検索部102に当該受け付けたカテゴリで再検索するよう指示する。
In step S610, the selected
ステップS611で、文書検索部102は、選択カテゴリ受付部109から選択されたカテゴリ504を受け付けると、ステップS600で受け付けた文字列(検索条件)で、文書記憶部121の文書を、当該カテゴリに絞り込んで検索する。そして処理をステップS603に移行する。
In step S611, when the
なお、再検索後のステップS605の判定に際しては、(ステップS707で閾値を減衰済の場合)減衰済の検索判定閾値減衰率を用いて判定を行う。また、再検索後のステップS608の判定に際しては、(ステップS807で閾値を減衰済の場合)減衰済のカテゴリ判定閾値減衰率を用いて判定を行う。 In the determination in step S605 after the re-search, the determination is performed using the attenuated search determination threshold attenuation rate (when the threshold is attenuated in step S707). In the determination in step S608 after the re-search, the determination is performed using the attenuated category determination threshold attenuation rate (when the threshold has been attenuated in step S807).
例えば、既に検索済の文書の確信度が閾値以下の場合、その文書をカテゴリで絞り込んだとしても文書自体の検索文字列に対する確信度は変わらないため、絞り込み後の文書を検索結果として表示できない。 For example, when the certainty factor of a document that has already been searched is equal to or less than a threshold value, the certainty factor for the search character string of the document itself does not change even if the document is narrowed down by category, so that the narrowed down document cannot be displayed as a search result.
当該減衰の処理により、既に入力されている検索文字列を用いて検索した結果の文書をカテゴリに基づいて絞り込んだ場合に、前回の検索では検索結果として表示されなかった文書を、検索結果として表示できる確率を向上させることができる。 When the search results using the search character string that has already been input are narrowed down based on the category, the documents that were not displayed as the search results in the previous search are displayed as the search results. Probability can be improved.
ステップS612で、検索確信度判定部104は、表示部108に、検索結果の文書の確信度上位n個を送信し、表示するよう指示する。
In step S <b> 612, the search
当該n個の値は予め外部メモリ211に記憶されており、ユーザ操作により任意に設定変更可能であるものとする。本実施形態においてはn=3として説明する。
The n values are stored in the
当該指示を受け付けた表示部108は、当該指示に従って、図5の500cや500eに示すような検索画面を表示する。実際には、表示済の検索画面をチャット画面500c又は500eに更新して、検索結果一覧を表示する。
The
チャット画面500c及び500eは、検索結果の文書の一覧(検索結果の文書を表示するためのハイパーリンクが埋め込まれた、当該文書本文の先頭の所定文字数の文字列の一覧)を表示する表示領域505と、文書506を含む。
The chat screens 500c and 500e display a
チャット画面500c及び500eには、「1)HDDパスワードを忘れた場合・・・」「2)ドメインに参加しているパソコンのパスワードについて」「3)パソコンに新規アカウントを・・・」の3つの文書のリンクが表示されている。
There are three
なお、チャット画面500eは、ステップS609により絞り込み用のカテゴリを表示することなく、ステップS608で文書の確信度が閾値以上であると判定された場合に表示する画面である。 The chat screen 500e is a screen that is displayed when it is determined in step S608 that the certainty factor of the document is equal to or greater than the threshold without displaying the narrowing-down category in step S609.
一方、チャット画面500cは、ステップS609により絞り込み用のカテゴリを表示した後、当該カテゴリの選択操作により再検索が実行され、再検索の検索結果の文書の確信度が減衰後の閾値に達していると判定されたことで、当該カテゴリに絞り込まれた検索結果の文書が表示されている。そのため、カテゴリの表示領域503及びカテゴリ504が表示されたままであり、その下に追加して、選択されたカテゴリ504で絞り込み検索された文書が表示領域505に表示されている。
On the other hand, in the
文書のリンクの選択を受け付けた場合、情報処理装置100は当該文書をリンク先から取得して表示部108の機能を用いて表示画面に表示する。以上が図6の説明である。
When the document link selection is received, the
以上説明したように、本発明によれば、文字列に対する検索結果の文書及びカテゴリの確信度を用いて、動的に検索結果の文書、カテゴリ、検索用の文字列の再入力の通知をユーザに提示することができる。 As described above, according to the present invention, the user is notified of re-entry of a search result document, a category, and a search character string dynamically using the certainty factor of the search result document and category for the character string. Can be presented.
また、例えば、先に検索結果の文書の確からしさを確認し、文書の確からしさが低い場合にカテゴリの確からしさを確認し、カテゴリの確からしさも低い場合に検索文字列が不適切であると判定し、検索文字列の再入力を通知する仕組みに比べて、検索文字列が不適切であると判定するまでの時間、及び、検索文字列の再入力を通知するまでの時間を短縮することが可能となる。 In addition, for example, the probability of the document of the search result is confirmed first, the probability of the category is confirmed when the probability of the document is low, and the search character string is inappropriate when the probability of the category is low. Compared to the mechanism for determining and notifying re-entry of the search character string, the time until determining that the search character string is inappropriate and the time for notifying the re-input of the search character string are reduced. Is possible.
また、検索文字列が不適切であると判定するまでの判定ステップの数を減らし、アルゴリズムを簡易化することが可能となる。 Further, the number of determination steps until it is determined that the search character string is inappropriate can be reduced, and the algorithm can be simplified.
よって、ユーザが効率的に検索文字列の再入力の画面に辿り着くことが可能となる。 Therefore, the user can efficiently reach the screen for re-inputting the search character string.
以上説明したように、本発明によれば、ユーザが効率的に所望の検索結果又は検索文字列の再入力に辿り着くことが可能となる。 As described above, according to the present invention, it is possible for the user to efficiently arrive at a desired search result or search character string re-input.
なお、本発明の説明例では、文書の本文とカテゴリが一体となった文書ファイルを使用しているが、文書と文書の属性情報としてのカテゴリが別のファイルとして記憶管理されていてもよい。 In the explanation example of the present invention, a document file in which the text of the document and the category are integrated is used. However, the category as the document and the attribute information of the document may be stored and managed as separate files.
また、文書の本文を、質問文と回答文の2つのフィールドに分けて記憶管理してもよい。 In addition, the text of the document may be stored and managed in two fields, a question sentence and an answer sentence.
検索条件の文字列を用いた検索は、当該質問文に対して行うようにしてもよい。 The search using the character string of the search condition may be performed on the question sentence.
検索対象とする文字列は、必ずしも当該文書のファイル自体の本文から抽出したものではなくともよい。例えば、当該文書中に記載された質問と回答をそれぞれ文書ファイルとは別の形態(例えば文書記憶部121に記憶された文書の質問一覧や、文書記憶部121に記憶された文書の回答一覧)でファイル化して文書記憶部121記憶し、そのいずれか一方又は両方を選択的に検索対象とするようにしてもよい。
The character string to be searched does not necessarily have to be extracted from the text of the document file itself. For example, the question and the answer described in the document are different from the document file (for example, a document question list stored in the
また、本実施形態においては情報処理装置の表示部に表示する画面及び、当該画面における検索結果の文書の表示、カテゴリの表示、文字列の再入力を促す通知の表示を図5に示す画面を用いて説明したが、画面の構成や表示・通知の方法は必ずしもこれに限るものではない。例えばスマートフォン等の携帯端末用に画面を構成してもよい。 Further, in the present embodiment, the screen shown in FIG. 5 is a screen displayed on the display unit of the information processing apparatus and a display of a search result document, a category display, and a notification prompting re-input of a character string on the screen. As described above, the screen configuration and the display / notification method are not necessarily limited thereto. For example, you may comprise a screen for portable terminals, such as a smart phone.
また、文字列の再入力を促す通知を情報処理装置が備える不図示のスピーカを用いて音声再生にて行うようしてもよい。500a〜500eに示す各画面の構成は、必ずしもチャット画面に限るものではない。 Further, notification for prompting re-input of the character string may be performed by sound reproduction using a speaker (not shown) provided in the information processing apparatus. The structure of each screen shown to 500a-500e is not necessarily restricted to a chat screen.
また、文書検索及び文書ごとの確信度の計算・特定、検索条件の文字列の属するカテゴリの特定及びカテゴリごとの確信度の計算・特定方法は、上述した方法に限るものではない。例えば、検索条件の文字列の属するカテゴリの特定・分類技術は、例えば特開2003−141129等に記載されている技術を用いてもよい。 The document search and the calculation / specification of the certainty factor for each document, the specification of the category to which the character string of the search condition belongs, and the calculation / specification method of the certainty factor for each category are not limited to the methods described above. For example, as a technique for specifying / classifying a category to which a character string of a search condition belongs, for example, a technique described in Japanese Patent Application Laid-Open No. 2003-141129 may be used.
また、既に検索結果として得られている文書のカテゴリの特定処理を検索条件の文字列の特定処理とし、当該検索結果の文書のカテゴリについてのみ、カテゴリ別の確信度の計算・特定を行うようにしてもよい。 In addition, the process for specifying the category of a document already obtained as a search result is set as the process for specifying the character string of the search condition, and the reliability for each category is calculated and specified only for the document category of the search result. May be.
また、上述した実施形態のステップS703、ステップS803においては、それぞれ、1位〜3位の確信度の平均値を算出する例を記載したが、例えば1位〜3位の確信度の合計値を算出して特定するようにしてもよい。 Moreover, in step S703 and step S803 of the above-described embodiment, an example in which the average value of the first to third confidence levels is calculated has been described. For example, the total value of the first to third confidence levels is calculated. You may make it specify by calculating.
尚、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。 It should be noted that the present invention can be implemented as, for example, a system, apparatus, method, program, or storage medium, and can be applied to a system composed of a plurality of devices. You may apply to the apparatus which consists of one apparatus.
具体的には、表示部108を備えるクライアントPCと、文書記憶部121及び文書検索部102を備えるサーバ装置Aと、カテゴリ別確信度特定部105を備えるサーバ装置Bと、入力文字列受付部101、検索確信度計算部103、検索確信度判定部104、カテゴリ確信度計算部106、カテゴリ確信度判定部107、選択カテゴリ受付部109を備える情報処理装置100(サーバ装置C)とをネットワーク(ワイドエリアネットワーク等)を介して通信可能に接続し構成される情報処理システムとして、上述した実施形態の各処理を実行し、本発明を実施してもよい。
Specifically, the client PC including the
例えばクライアントPCは、ブラウザソフトにおいて、情報処理装置100から受信したチャット画面500aを表示し、チャット画面500aにおいて「検索」ボタンが押下されることで検索条件の文字列を情報処理装置100に送信する。情報処理装置100は当該文字列をステップS601で受信し、当該文字列をサーバAに送信して、文書の検索及び確信度の算出を依頼する。
For example, the client PC displays the
サーバAは文書の検索及び確信度の算出を行い、検索結果として図4の410のデータを情報処理装置100に返信する。情報処理装置100は当該検索結果を受信してRAM202に記憶し、ステップS604及びS605の処理を実行する。
The server A searches for a document and calculates a certainty factor, and returns data 410 in FIG. 4 to the
ステップS603で、情報処理装置100はサーバBに検索条件の文字列を送信し、カテゴリの確信度の算出及び検索条件の文字列の属するカテゴリの特定を依頼する。
In step S603, the
当該依頼を受けたサーバBは、ステップS603のカテゴリの確信度の算出及び検索条件の文字列の属するカテゴリの特定処理を実行し、その結果を図4の410として生成して情報処理装置100に返信する。情報処理装置100は410の情報を受信して自機のRAM202に記憶し、ステップS605〜S608の処理を実行する。
The server B that has received the request executes the calculation of the certainty factor of the category and the identification process of the category to which the character string of the search condition belongs in step S603, generates the result as 410 in FIG. Send back. The
ステップS605確信度が閾値未満であると判定された場合、情報処理装置100は図5の500dのhtmlを生成してクライアントPCに送信することで、クライアントPCのブラウザソフトで500dの画面を表示するよう指示する。当該htmlを受信したクライアントPCのブラウザは500dの画面を表示する。
If it is determined in step S605 that the certainty factor is less than the threshold value, the
情報処理装置100は、ステップS608で確信度が閾値以上であると判定された場合、図5の500c又は500eに示す画面のhtmlを生成してクライアントPCに送信することで、クライアントPCのブラウザソフトで500c又は500eの画面を表示するよう指示する。当該htmlを受信したクライアントPCのブラウザは、ステップS612で500c又は500eの画面を表示する。
When it is determined in step S608 that the certainty factor is greater than or equal to the threshold value, the
ステップS605で確信度が閾値未満であると判定された場合、情報処理装置100は図5の500bのhtmlを生成してクライアントPCに送信することで、クライアントPCのブラウザソフトで500bの画面を表示するよう指示する。当該htmlを受信したクライアントPCのブラウザは500bの画面を表示する。
If it is determined in step S605 that the certainty factor is less than the threshold, the
ステップS610で、500bにおいてカテゴリの選択を受け付けたクライアントPCは当該カテゴリの情報を情報処理装置100に送信する。当該カテゴリの情報を受信した情報処理装置100は、検索条件の文字列と当該カテゴリをサーバAに送信し、当該カテゴリに絞り込んで検索を行うよう(検索結果を当該カテゴリの文書に絞り込むよう)依頼する。
In step S610, the client PC that has received the category selection in 500b transmits information on the category to the
当該依頼を受けたサーバAは、ステップS611で依頼に応じた検索を行う。そして、検索結果を410として再生成し、情報処理装置100に返信する。
The server A that has received the request performs a search according to the request in step S611. Then, the search result is regenerated as 410 and returned to the
また、文書記憶部121及び文書検索部102を備えるサーバ装置Aと、カテゴリ別確信度特定部105を備えるサーバ装置Bと、入力文字列受付部101、検索確信度計算部103、検索確信度判定部104、カテゴリ確信度計算部106、カテゴリ確信度判定部107、表示部108、選択カテゴリ受付部109を備える情報処理装置100(クライアントPC)とをネットワーク(ワイドエリアネットワーク等)を介して通信可能に接続し構成される情報処理システムとして、上述した実施形態の各処理を実行し、本発明を実施してもよい。
In addition, the server device A including the
サーバAとサーバBは同一筐体であってもよい。 Server A and server B may be the same housing.
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。 Note that the present invention includes a software program that implements the functions of the above-described embodiments directly or remotely from a system or apparatus. The present invention also includes a case where the system or the computer of the apparatus is achieved by reading and executing the supplied program code.
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。 Accordingly, since the functions of the present invention are implemented by computer, the program code installed in the computer also implements the present invention. In other words, the present invention includes a computer program itself for realizing the functional processing of the present invention.
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。 Examples of the recording medium for supplying the program include a flexible disk, hard disk, optical disk, magneto-optical disk, MO, CD-ROM, CD-R, and CD-RW. In addition, there are magnetic tape, nonvolatile memory card, ROM, DVD (DVD-ROM, DVD-R), and the like.
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。 As another program supply method, a browser on a client computer is used to connect to an Internet home page. The computer program itself of the present invention or a compressed file including an automatic installation function can be downloaded from the homepage by downloading it to a recording medium such as a hard disk.
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。 It can also be realized by dividing the program code constituting the program of the present invention into a plurality of files and downloading each file from a different homepage. That is, a WWW server that allows a plurality of users to download a program file for realizing the functional processing of the present invention on a computer is also included in the present invention.
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。 In addition, the program of the present invention is encrypted, stored in a storage medium such as a CD-ROM, distributed to users, and key information for decryption is downloaded from a homepage via the Internet to users who have cleared predetermined conditions. Let It is also possible to execute the encrypted program by using the downloaded key information and install the program on a computer.
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。 Further, the functions of the above-described embodiments are realized by the computer executing the read program. In addition, based on the instructions of the program, an OS or the like running on the computer performs part or all of the actual processing, and the functions of the above-described embodiments can also be realized by the processing.
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。 Further, the program read from the recording medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer. Thereafter, the CPU of the function expansion board or function expansion unit performs part or all of the actual processing based on the instructions of the program, and the functions of the above-described embodiments are realized by the processing.
尚、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。
即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
The above-described embodiments are merely examples of implementation in carrying out the present invention, and the technical scope of the present invention should not be construed as being limited thereto.
That is, the present invention can be implemented in various forms without departing from the technical idea or the main features thereof.
100 情報処理装置
101 入力文字列受付部
102 文書検索部
103 検索確信度計算部
104 検索確信度判定部
105 カテゴリ別確信度特定部
106 カテゴリ確信度計算部
107 カテゴリ確信度判定部
108 表示部
109 選択カテゴリ受付部
121 文書記憶部
DESCRIPTION OF
Claims (9)
検索条件とする文字列を受け付ける文字列受付手段と、
前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、
前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、
前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、
前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、
前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段と、
を備えることを特徴とする情報処理システム。 An information processing system including a storage device that stores a document whose category can be specified and an information processing device,
A character string receiving means for receiving a character string as a search condition;
Document certainty factor specifying means for specifying the certainty factor of the document searched by the character string with respect to the character string received by the character string receiving unit;
Category certainty specifying means for specifying the certainty of the category for the character string received by the character string receiving means;
Category certainty determining means for determining whether the certainty of the category specified by the category certainty specifying means has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor identifying unit has reached a threshold value when the category certainty factor determining unit determines that the certainty factor of the category has reached a threshold value Degree determination means;
When it is determined by the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the certainty of the category is determined by the category certainty determination means. A notification means for notifying the user to re-enter a character string as a search condition without performing the determination by the document certainty determination means;
An information processing system comprising:
を備え、
前記検索手段は、前記通知手段により通知された絞り込み条件としての前記カテゴリの選択を受け付けた場合に、選択を受け付けたカテゴリによって特定される文書を、前記文字列に基づいて検索することを特徴とする請求項1又は2に記載の情報処理システム。 Search means for searching for a document in the storage device based on the character string received by the character string receiving means,
The search unit, when receiving the selection of the category as a narrowing condition notified by the notification unit, searches for a document specified by the category that has received the selection based on the character string. The information processing system according to claim 1 or 2.
を備えることを特徴とする請求項1乃至3のいずれか1項に記載の情報処理システム。 And attenuating means for attenuating the threshold when the certainty factor of the document does not reach the threshold value, and attenuating the threshold value when the certainty factor of the category does not reach the threshold value. Item 4. The information processing system according to any one of Items 1 to 3.
検索条件とする文字列を受け付ける文字列受付工程と、
前記文字列受付工程により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定工程と、
前記文字列受付工程により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定工程と、
前記カテゴリ確信度特定工程により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定工程と、
前記カテゴリ確信度判定工程により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定工程により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定工程と、
前記文書確信度判定工程により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定工程により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定工程による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知工程と、
を含むことを特徴とする制御方法。 A control method for an information processing system including a storage device for storing a document whose category can be specified and an information processing device,
A character string accepting step for accepting a character string as a search condition;
A document certainty factor identifying step for identifying the certainty factor of the document searched by the character string with respect to the character string accepted by the character string accepting step;
A category certainty factor identifying step for identifying the certainty factor of the category for the character string accepted by the character string accepting step;
A category certainty determination step for determining whether the certainty of the category specified by the category certainty specifying step has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor specifying step has reached the threshold value when it is determined by the category certainty factor determining step that the certainty factor of the category has reached a threshold value Degree determination step,
When it is determined that the document certainty factor has not reached the threshold value by the document certainty factor determining step, the category is notified as a search narrowing condition, and the category certainty factor is determined by the category certainty factor determining step. A notification step for notifying the user to re-input a character string as a search condition without performing the determination by the document certainty determination step;
The control method characterized by including.
前記情報処理システムを、
検索条件とする文字列を受け付ける文字列受付手段と、
前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、
前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、
前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、
前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、
前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段として機能させるためのプログラム。 A program for controlling an information processing system including a storage device that stores a document whose category can be specified and an information processing device,
The information processing system;
A character string receiving means for receiving a character string as a search condition;
Document certainty factor specifying means for specifying the certainty factor of the document searched by the character string with respect to the character string received by the character string receiving unit;
Category certainty specifying means for specifying the certainty of the category for the character string received by the character string receiving means;
Category certainty determining means for determining whether the certainty of the category specified by the category certainty specifying means has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor identifying unit has reached a threshold value when the category certainty factor determining unit determines that the certainty factor of the category has reached a threshold value Degree determination means;
When it is determined by the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the certainty of the category is determined by the category certainty determination means. A program for functioning as notification means for notifying the user to re-input a character string as a search condition without making the determination by the document certainty determination means when it is determined that the document has not been reached.
検索条件とする文字列を受け付ける文字列受付手段と、
前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、
前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、
前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、
前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、
前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段と、
を備えることを特徴とする情報処理装置。 An information processing apparatus that can be connected to a storage device that stores a document that can specify a category,
A character string receiving means for receiving a character string as a search condition;
Document certainty factor specifying means for specifying the certainty factor of the document searched by the character string with respect to the character string received by the character string receiving unit;
Category certainty specifying means for specifying the certainty of the category for the character string received by the character string receiving means;
Category certainty determining means for determining whether the certainty of the category specified by the category certainty specifying means has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor identifying unit has reached a threshold value when the category certainty factor determining unit determines that the certainty factor of the category has reached a threshold value Degree determination means;
When it is determined by the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the certainty of the category is determined by the category certainty determination means. A notification means for notifying the user to re-enter a character string as a search condition without performing the determination by the document certainty determination means;
An information processing apparatus comprising:
検索条件とする文字列を受け付ける文字列受付工程と、
前記文字列受付工程により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定工程と、
前記文字列受付工程により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定工程と、
前記カテゴリ確信度特定工程により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定工程と、
前記カテゴリ確信度判定工程により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定工程により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定工程と、
前記文書確信度判定工程により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定工程により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定工程による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知工程と、
を含むことを特徴とする制御方法。 A method of controlling an information processing apparatus that can be connected to a storage device that stores a document that can specify a category,
A character string accepting step for accepting a character string as a search condition;
A document certainty factor identifying step for identifying the certainty factor of the document searched by the character string with respect to the character string accepted by the character string accepting step;
A category certainty factor identifying step for identifying the certainty factor of the category for the character string accepted by the character string accepting step;
A category certainty determination step for determining whether the certainty of the category specified by the category certainty specifying step has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor specifying step has reached the threshold value when it is determined by the category certainty factor determining step that the certainty factor of the category has reached a threshold value Degree determination step,
When it is determined that the document certainty factor has not reached the threshold value by the document certainty factor determining step, the category is notified as a search narrowing condition, and the category certainty factor is determined by the category certainty factor determining step. A notification step for notifying the user to re-input a character string as a search condition without performing the determination by the document certainty determination step;
The control method characterized by including.
前記情報処理装置を、
検索条件とする文字列を受け付ける文字列受付手段と、
前記文字列受付手段により受け付けられた前記文字列に対する、前記文字列で検索された文書の確信度を特定する文書確信度特定手段と、
前記文字列受付手段により受け付けられた前記文字列に対する前記カテゴリの確信度を特定するカテゴリ確信度特定手段と、
前記カテゴリ確信度特定手段により特定された前記カテゴリの確信度が閾値に達しているか判定するカテゴリ確信度判定手段と、
前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していると判定された場合に、前記文書確信度特定手段により特定された前記文書の確信度が閾値に達しているか判定する文書確信度判定手段と、
前記文書確信度判定手段により前記文書の確信度が閾値に達していないと判定された場合には、カテゴリを検索の絞り込み条件として通知し、前記カテゴリ確信度判定手段により前記カテゴリの確信度が閾値に達していないと判定された場合には、前記文書確信度判定手段による前記判定を行うことなく、検索条件とする文字列の再入力を促す通知をする通知手段として機能させるためのプログラム。 A program for controlling an information processing device that can be connected to a storage device that stores a document that can specify a category,
The information processing apparatus;
A character string receiving means for receiving a character string as a search condition;
Document certainty factor specifying means for specifying the certainty factor of the document searched by the character string with respect to the character string received by the character string receiving unit;
Category certainty specifying means for specifying the certainty of the category for the character string received by the character string receiving means;
Category certainty determining means for determining whether the certainty of the category specified by the category certainty specifying means has reached a threshold;
Document belief for determining whether the certainty factor of the document specified by the document certainty factor identifying unit has reached a threshold value when the category certainty factor determining unit determines that the certainty factor of the category has reached a threshold value Degree determination means;
When it is determined by the document certainty determination means that the certainty of the document has not reached the threshold, the category is notified as a search narrowing condition, and the certainty of the category is determined by the category certainty determination means. A program for functioning as notification means for notifying the user to re-input a character string as a search condition without making the determination by the document certainty determination means when it is determined that the document has not been reached.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017099820A JP2018195171A (en) | 2017-05-19 | 2017-05-19 | Information processing apparatus, information processing system, control method thereof, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017099820A JP2018195171A (en) | 2017-05-19 | 2017-05-19 | Information processing apparatus, information processing system, control method thereof, and program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2018195171A true JP2018195171A (en) | 2018-12-06 |
Family
ID=64571621
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017099820A Pending JP2018195171A (en) | 2017-05-19 | 2017-05-19 | Information processing apparatus, information processing system, control method thereof, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2018195171A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019171817A1 (en) | 2018-03-06 | 2019-09-12 | Ricoh Company, Ltd. | Liquid composition, device for applying liquid composition, image forming device, and image forming method |
-
2017
- 2017-05-19 JP JP2017099820A patent/JP2018195171A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019171817A1 (en) | 2018-03-06 | 2019-09-12 | Ricoh Company, Ltd. | Liquid composition, device for applying liquid composition, image forming device, and image forming method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7085761B2 (en) | Program for changing search results rank, recording medium for recording such a program, and content search processing method | |
| US8407781B2 (en) | Information providing support device and information providing support method | |
| JP4856238B2 (en) | SYSTEM AND METHOD FOR PROVIDING ADAPTIVE RECOMMENDED WORDS BY USER AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR EXECUTING THE METHOD | |
| US20100262610A1 (en) | Identifying Subject Matter Experts | |
| US8639679B1 (en) | Generating query suggestions | |
| JP2017525026A (en) | Generating a contextual search presentation | |
| KR101665969B1 (en) | Device, server and method for keyword retrieval via interaction | |
| US10242033B2 (en) | Extrapolative search techniques | |
| CN112136127A (en) | Action indicator for search operation output element | |
| JP2013012012A (en) | Dialogue rule alteration device, dialogue rule alteration method, and dialogue rule alteration program | |
| CN114846463A (en) | Identification and publication of repeatable queries | |
| JP2010097461A (en) | Document search apparatus, document search method, and document search program | |
| CN111353086B (en) | Retrieval device, storage medium and retrieval method | |
| JP6162134B2 (en) | Social page trigger | |
| US12174865B2 (en) | Information processing apparatus, information processing system, and information processing method | |
| KR101747532B1 (en) | Method and system for recommending course for travel related query | |
| JP2018195171A (en) | Information processing apparatus, information processing system, control method thereof, and program | |
| JP6631587B2 (en) | Information processing apparatus, information processing system, control method thereof, and program | |
| JP7212655B2 (en) | Information processing device, information processing method, and information processing program | |
| JP2021107953A (en) | Information processing apparatus, information processing system, method for controlling the same, and program | |
| JP6751366B2 (en) | Information management system, information management method, and information management program | |
| JP2017207827A (en) | Information processing device, information processing method, and program | |
| JP6797618B2 (en) | Search device, search method, program and search system | |
| JP7566387B1 (en) | Information processing device, method, and program | |
| KR20210056668A (en) | Method and system for providing related kewords with respect to keyword input by user for in order to deriving idea |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180703 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20181031 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190109 |