JPH08287088A - Information retrieval method and device - Google Patents
Information retrieval method and deviceInfo
- Publication number
- JPH08287088A JPH08287088A JP7090593A JP9059395A JPH08287088A JP H08287088 A JPH08287088 A JP H08287088A JP 7090593 A JP7090593 A JP 7090593A JP 9059395 A JP9059395 A JP 9059395A JP H08287088 A JPH08287088 A JP H08287088A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- term
- document
- search word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 検索語の説明や解説などの付随情報を自動的
に得ることができる情報検索方法及びその装置を提供す
ることを目的とする。
【構成】 検索語が入力されて文字列バッファに記憶さ
れると、検索処理部3は、その検索語に基づいて文書デ
ータベース2を検索し、その検索語を含む文書データを
抽出する。用語付随情報表現ベース5に記憶されてい
る、その検索語に付随する付随情報の表現方式に関する
書式情報を読み出し、その書式情報に該当する文書をそ
の文書データより取り出し、その検索された検索語を含
む文書データと、その書式情報に該当する文書とを表示
する。
(57) [Summary] [Purpose] It is an object of the present invention to provide an information retrieval method and an apparatus therefor capable of automatically obtaining incidental information such as explanations and explanations of retrieval terms. [Configuration] When a search word is input and stored in a character string buffer, the search processing unit 3 searches the document database 2 based on the search word, and extracts document data including the search word. The format information relating to the expression method of the associated information attached to the search word stored in the term accompanying information expression base 5 is read out, the document corresponding to the format information is extracted from the document data, and the searched search word is extracted. The included document data and the document corresponding to the format information are displayed.
Description
【0001】[0001]
【産業上の利用分野】本発明は、データファイルを検索
し、ユーザが所望するデータを抽出する情報検索方法及
びその装置に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information retrieval method and apparatus for retrieving a data file and extracting data desired by a user.
【0002】[0002]
【従来の技術】一般に、データベースを検索して所望の
データを読み出す情報検索装置では、ユーザが指定した
語を(又はその関連語とともに)検索して、指定した語
が含まれている文書名(またはファイル名や記事名やテ
キスト名)や、その文書(またはファイルや記事やテキ
スト)中での位置情報、或はその文書データそのものを
提示していた。2. Description of the Related Art Generally, in an information retrieval apparatus for retrieving desired data by retrieving a database, a word designated by a user (or a related word thereof) is retrieved, and a document name containing the designated word ( Alternatively, the file name, article name, text name), position information in the document (or file, article, text), or the document data itself is presented.
【0003】[0003]
【発明が解決しようとする課題】しかしながら従来のこ
の種の装置では、基本的には、検索した語が文書データ
に含まれるか否か、或はその語が含まれているときは、
その位置情報を示すデータしか表示されない。そして、
ユーザが、その検索語に関する何らかの付随情報(例え
ば、その語の説明・解説や定義など)を得たい場合に
は、その検索された文書データをユーザ自身が読むこと
により、抽出するしか方法がなかった。However, in the conventional apparatus of this type, basically, it is determined whether or not the searched word is included in the document data, or when the word is included,
Only data indicating the position information is displayed. And
If the user wants to obtain some additional information about the search term (for example, explanation, explanation, definition, etc. of the term), there is no choice but to extract by reading the retrieved document data by the user himself. It was
【0004】本発明は上記従来例に鑑みてなされたもの
で、検索語の説明や解説などの付随情報を自動的に得る
ことができる情報検索方法及びその装置を提供すること
を目的とする。The present invention has been made in view of the above-mentioned conventional example, and an object of the present invention is to provide an information retrieval method and an apparatus therefor capable of automatically obtaining incidental information such as explanation and explanation of a retrieval word.
【0005】本発明の他の目的は、検索に使用した検索
語の持つ意味を容易に理解できる情報検索方法及びその
装置を提供することにある。Another object of the present invention is to provide an information retrieval method and an apparatus therefor which can easily understand the meaning of a retrieval word used for retrieval.
【0006】[0006]
【課題を解決するための手段】上記目的を達成するため
に本発明の情報検索装置は以下のような構成を備える。
即ち、指示された検索語に基づいてデータベースを検索
する情報検索装置であって、検索語に付随する付随情報
の表現方式に関する書式情報を記憶する記憶手段と、前
記検索語に基づいてデータベースを検索し、前記検索語
を含む文書データを抽出する検索手段と、前記検索語を
含む文書データより前記記憶手段に記憶されている書式
情報に該当する文書を取り出す付随情報抽出手段と、前
記検索手段により抽出された文書データと前記付随情報
抽出手段により抽出された文書を表示する表示手段とを
有する。In order to achieve the above object, the information retrieval apparatus of the present invention has the following configuration.
That is, an information retrieval device for retrieving a database based on an instructed retrieval word, a storage means for storing format information regarding an expression method of incidental information accompanying the retrieval word, and retrieving the database based on the retrieval word. The search means for extracting the document data containing the search word, the additional information extracting means for extracting the document corresponding to the format information stored in the storage means from the document data containing the search word, and the search means. It has the extracted document data and display means for displaying the document extracted by the incidental information extraction means.
【0007】上記目的を達成するために本発明の情報検
索方法は以下のような工程を備える。即ち、指示された
検索語に基づいてデータベースを検索する情報検索方法
であって、検索語を入力する工程と、前記検索語に基づ
いてデータベースを検索し、前記検索語を含む文書デー
タを抽出する工程と、前記文書データより、記憶されて
いる前記検索語に付随する付随情報の表現方式に関する
書式情報に該当する文書を取り出す工程と、前記検索語
を含む文書データと前記書式情報に該当する文書とを表
示する表示工程とを有する。In order to achieve the above object, the information retrieval method of the present invention comprises the following steps. That is, an information search method for searching a database based on a designated search word, the step of inputting a search word, searching the database based on the search word, and extracting document data including the search word. A step of retrieving, from the document data, a document corresponding to format information related to a stored expression of accompanying information associated with the search term, document data including the search term, and a document corresponding to the format information And a display step of displaying.
【0008】[0008]
【作用】以上の構成において、検索語を入力すると、そ
の検索語に基づいてデータベースを検索し、その検索語
を含む文書データを抽出する。この検索された文書デー
タより、記憶されている検索語に付随する付随情報の表
現方式に関する書式情報に該当する文書を取り出し、そ
の検索語を含む文書データと、その書式情報に該当する
文書とを表示するように動作する。In the above structure, when a search word is input, the database is searched based on the search word and the document data including the search word is extracted. From the retrieved document data, a document corresponding to the format information relating to the expression method of the incidental information attached to the stored search word is extracted, and the document data including the search word and the document corresponding to the format information are extracted. Works to display.
【0009】[0009]
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT A preferred embodiment of the present invention will now be described in detail with reference to the accompanying drawings.
【0010】図1は、本発明の一実施例に係る情報検索
装置の機能構成を示す機能ブロック図である。FIG. 1 is a functional block diagram showing the functional structure of an information search apparatus according to an embodiment of the present invention.
【0011】図1において、1は文字列バッファで、検
索語(検索対象語)を示す文字列が記憶されている。2
は文書データベース(文書DB)で、検索対象となる複
数の文書データが記憶されている。3は文字列バッファ
1に保持されている文字列を検索語として、文書DB2
を検索する検索処理部である。4は検索結果保持部で、
検索処理部3による文書データベース2に対する検索処
理の結果を保持している。5は用語付随情報表現ベース
で、用語の付随情報の表現方法に関する様々な情報を記
憶している。6は用語付随情報抽出部で、検索結果保持
部4に格納されている情報に基づいて、検索語に関する
用語付随情報を抽出する。7は用語付随情報抽出部6に
よって抽出された用語付随情報を提示する用語付随情報
提示部である。尚、検索処理部3、用語付随情報抽出部
6及び用語付随情報提示部7は、例えば図2のCPU1
01及びプログラムメモリ102に記憶されているプロ
グラムにより実現されている。In FIG. 1, a character string buffer 1 stores a character string indicating a search word (search target word). Two
Is a document database (document DB) in which a plurality of document data to be searched are stored. 3 is the document DB 2 with the character string held in the character string buffer 1 as a search word.
Is a search processing unit for searching for. 4 is a search result holding unit,
The search processing unit 3 holds the result of the search processing on the document database 2. Reference numeral 5 is a term incidental information expression base, which stores various information regarding a method of expressing the incidental information of a term. Reference numeral 6 is a term incidental information extraction unit that extracts term incidental information related to the search word based on the information stored in the search result holding unit 4. Reference numeral 7 is a term incidental information presenting unit that presents the term incidental information extracted by the term incidental information extracting unit 6. The search processing unit 3, the term accompanying information extracting unit 6, and the term accompanying information presenting unit 7 are, for example, the CPU 1 of FIG.
01 and the program stored in the program memory 102.
【0012】図2は本実施例の情報検索装置の基本構成
を示すブロック図である。FIG. 2 is a block diagram showing the basic configuration of the information retrieval apparatus of this embodiment.
【0013】101はCPUで、プログラムメモリ10
2に記憶された制御プログラム(図3のフローチャート
参照)に従って装置全体の動作を制御している。103
はキーボードで、ユーザが検索したい検索語などの文字
列や検索指示のコマンド等を入力するのに使用される。
104はマウス等のポインティングデバイスで、このマ
ウス104を用いてもキーボード103と同様のコマン
ドやデータを入力することができる。105はRAM
で、各種データを一時的に保持するとともに、CPU1
01による制御の実行時、ワークエリアとして使用さ
れ、後述する検索語や検索された文書データ、更にはそ
の検索後の付随情報などが記憶される。106はCRT
や液晶等の表示部、107は表示部106に表示するデ
ータを保持するビデオメモリ(VRAM)、108は表
示部106への表示を制御するコントローラ(CRT
C)である。109はハードディスク(HDD)110
へのリード・ライトを制御するコントローラ(HDC)
である。このハードディスク110には、前述の文書デ
ータベース(文書DB)2、用語付随情報表現ベース5
が記憶されている。111は上記各部を接続するシステ
ムバスである。Reference numeral 101 is a CPU, which is a program memory 10
The operation of the entire apparatus is controlled according to the control program (see the flowchart of FIG. 3) stored in No. 2. 103
Is a keyboard used by the user to input a character string such as a search term or a command for a search instruction.
Reference numeral 104 is a pointing device such as a mouse. Even when the mouse 104 is used, commands and data similar to those of the keyboard 103 can be input. 105 is RAM
Then, while temporarily holding various data, the CPU 1
When the control by 01 is executed, it is used as a work area, and stores a search word to be described later, searched document data, and additional information after the search. 106 is a CRT
A display unit such as a liquid crystal display, 107 is a video memory (VRAM) that holds data to be displayed on the display unit 106, and 108 is a controller (CRT) that controls the display on the display unit 106.
C). 109 is a hard disk (HDD) 110
Controller (HDC) that controls read / write to / from
Is. The hard disk 110 includes the above-mentioned document database (document DB) 2 and term-related information representation base 5
Is remembered. A system bus 111 connects the above-mentioned units.
【0014】尚、図2では、用語付随情報表現ベース5
が文書DB2と同じ記憶装置に記憶されているように説
明したが、本発明はこれに限定されるものでなく、例え
ばシステムバス111に接続されたROM等に記憶され
ていても良く、HDD110よりRAM105にロード
されたものであっても良い。In addition, in FIG. 2, the term accompanying information expression base 5 is used.
Is stored in the same storage device as the document DB 2, but the present invention is not limited to this, and may be stored in, for example, a ROM connected to the system bus 111. It may be loaded in the RAM 105.
【0015】図3は、本実施例の情報検索装置における
動作の処理手順を示すフローチャートで、この処理を実
行する制御プログラムはプログラムメモリ102に記憶
されている。以下、この図3及び図5を参照して動作手
順を説明する。FIG. 3 is a flow chart showing the processing procedure of the operation in the information retrieval apparatus of this embodiment. The control program for executing this processing is stored in the program memory 102. The operation procedure will be described below with reference to FIGS. 3 and 5.
【0016】まずステップS1で、文字列バッファ1
(RAM105に設けられている)に文字列(検索語)
が保持されているかを調べる。もし、文字列バッファ1
が空であれば、例えばキーボード103より文字列バッ
ファ1に文字列が入力されて保持されるまで待機し、文
字列バッファ1に文字列が入力されて保持されるとステ
ップS2に進む。ステップS2では、文字列バッファ1
に格納されている文字列データ(図5の例では「構文解
析」)を読み出して、検索処理部3により、ハードディ
スク110に記憶されている文書DB2に対して検索処
理を行なう。この検索処理のアルゴリズムとしては、一
般に使用されているキーワードインデックスを用いた方
法や、フルテキストサーチなどの方法を用いて行なう。
その結果を検索結果保持部4(RAM105)に保持し
てステップS3に進む。First, in step S1, the character string buffer 1
Character string (search word) in (provided in RAM 105)
Check if is held. If the character string buffer 1
If is empty, for example, wait until a character string is input and held in the character string buffer 1 from the keyboard 103, and if a character string is input and held in the character string buffer 1, the process proceeds to step S2. In step S2, the character string buffer 1
The character string data (“syntax analysis” in the example of FIG. 5) stored in is read, and the search processing unit 3 searches the document DB 2 stored in the hard disk 110. As an algorithm for this search processing, a method using a generally used keyword index or a method such as full-text search is used.
The result is held in the search result holding unit 4 (RAM 105) and the process proceeds to step S3.
【0017】ステップS3では、検索結果保持部4に保
持されている内容を調べ、検索された文書があれるかど
うかをみる。検索された文書がある時はステップS4の
用語付随情報抽出処理に移るが、検索された文書がなけ
ればステップS5に進む。In step S3, the contents held in the search result holding unit 4 are checked to see if there is a searched document. If there is a retrieved document, the process goes to step S4 for extracting the term accompanying information, but if there is no retrieved document, the process proceeds to step S5.
【0018】ステップS4では、用語付随情報抽出部6
において、検索結果保持部4に保持されている検索結果
の情報に基づいて、検索された文書中で、その検索後に
該当する文字列の周囲を調べる。そして用語付随情報表
現ベース5を参照して、用語付随情報の表現方法に関す
る情報を抽出する。これら工程をより具体的に説明する
と、例えば、通常、用語の説明や定義などの表現方法に
は、その記述方法の例として、 ・文章中で、用語の直後に、括弧“(”“)”を用いて
説明する。In step S4, the term accompanying information extraction unit 6
At, in the searched document, the surroundings of the corresponding character string after the search are checked based on the search result information held in the search result holding unit 4. Then, with reference to the term-related information expression base 5, information on the expression method of the term-related information is extracted. More specifically describing these steps, for example, in the expression method such as the explanation or definition of a term, an example of the description method is as follows: -In the text, immediately after the term, parentheses "("")" Will be explained.
【0019】・文章中で、いくつかの決まり文句や語を
用いた典型的な文で説明する。In a sentence, a typical sentence using some formulas and words will be explained.
【0020】・文書中の或る箇所に、先頭に記号などを
付与して、典型的なフォーマットで複数の用語をまとめ
て説明する。などがある。上記の例を具体的にあげる
と、それぞれ、 ・<用語>(=<説明文>) ・<用語>(<説明文>) ・<用語>とは<説明文>である。A plurality of terms will be collectively described in a typical format by adding a symbol or the like to the beginning at a certain place in the document. and so on. Specific examples of the above are: <Term> (= <Explanation>) • <Term>(<Explanation>) • <Term> is <Explanation>.
【0021】・<用語>と言うのは<説明文>である。<Terms> are <descriptions>.
【0022】・☆<用語>:<説明文> ・○<用語>=<説明文> といったパターンなどに形式化(例えば、上記パターン
中で、<…>は任意の文字列を意味する)できる(図4
参照)。* <Term>: <Explanation> • ○ <Term> = <Explanation> can be formalized into a pattern (for example, <...> means any character string in the above pattern) (Fig. 4
reference).
【0023】従って、例えばUNIXコマンドgrep等で
使用されている正規表現を用いた文字列のパターンマッ
チングや、さらに必要に応じて、任意の制限事項(例え
ば、上記のような正規表現の場合、パターンと一致する
最も長いものを見つける、又は一致する最も短いものを
見つける等の制御)を考慮したアルゴリズムを利用し
て、上記のパターンと一致するものがあるか否かを調べ
る。こうして、その検索語(文字列)に該当する用語付
随情報を見つけることができる。Therefore, for example, pattern matching of a character string using a regular expression used in the UNIX command grep and the like, and if necessary, arbitrary restrictions (for example, in the case of the regular expression as described above, the pattern It is checked whether or not there is a match with the above pattern by using an algorithm that takes into consideration the control such as finding the longest match with or finding the shortest match. In this way, the term accompanying information corresponding to the search word (character string) can be found.
【0024】例えば図5の例では、検索された文書デー
タ中に「構文解析」という文字列が2箇所あり、このう
ち、『構文解析(=文中の文節間の係受け関係等を抽出
する処理)』という箇所が、上述の用語付随情報表現ベ
ース5のデータ中の『<用語>(=(説明文)>』とい
うパターンと一致していることが分かる。これにより、
その文書データの括弧“(”“)”で囲まれた文書デー
タを、その用語(検索語)「構文解析」の用語付随情報
として抽出できる。For example, in the example of FIG. 5, there are two character strings "syntax analysis" in the retrieved document data. Of these, "syntax analysis (= process for extracting the dependency relation between clauses in a sentence, etc. ) ”Matches the pattern of“ <term> (= (description)> ”in the data of the term accompanying information expression base 5 described above.
The document data enclosed by parentheses "("")" of the document data can be extracted as the term accompanying information of the term (search term) "syntax analysis".
【0025】最後に、ステップS5において、用語付随
情報抽出部6により抽出された結果を基に、用語付随情
報提示部7において、その用語(検索語)及び用語付随
情報を表示部106に表示して処理を終了する。Finally, in step S5, based on the result extracted by the term accompanying information extracting section 6, the term accompanying information presenting section 7 displays the term (search word) and term accompanying information on the display section 106. Ends the process.
【0026】図5は、用語付随情報表現ベース5の内容
の一例を示す図で、用語の説明などの表現方法に関する
ルールのパターンデータの一例を示したものである。FIG. 5 is a diagram showing an example of the contents of the term accompanying information expression base 5, showing an example of pattern data of a rule relating to an expression method such as explanation of terms.
【0027】図5は、本実施例の情報検索装置におい
て、入力文字列(検索語)が「構文解析」である場合の
処理の具体例を示す図である。FIG. 5 is a diagram showing a specific example of processing in the information search apparatus of this embodiment when the input character string (search word) is "syntax analysis".
【0028】図5では、検索語として文字列「構文解
析」が入力されると、この検索語に基づいて文書DB2
の文書データを検索する。これにより、「構文解析」を
含む文書データが、例えば同図(b)のように得られ
る。ここで、検索されれた文書中に検索語「構文解析」
が2箇所含まれていることがわかる。さらに、図5に示
す用語付随情報表現ベース5を参照して、この検索語
(「構文解析」)の周囲を調べて、その検索後の用語付
随情報を抽出する。その結果、用語付随情報表現ベース
5に記憶されている用語説明表現パターン(この場合、
ルールNo.1)と一致するデータ構成の文書データが
発見され、それに基づいて、その検索後の用語付随情報
の内容が抽出される。これを図5(c)に示す。そして
最後に、その検索毎と、その検索後の付随情報が図5
(d)で示すように表示される。In FIG. 5, when the character string "syntax analysis" is input as a search word, the document DB 2 is searched based on this search word.
Search the document data of. As a result, document data including “syntax analysis” is obtained, for example, as shown in FIG. Here, the search term "syntactic analysis" is used in the searched documents.
It can be seen that is included in two places. Further, referring to the term accompanying information expression base 5 shown in FIG. 5, the surroundings of this search word (“syntax analysis”) are examined, and the term accompanying information after the search is extracted. As a result, the term explanation expression pattern stored in the term accompanying information expression base 5 (in this case,
Rule No. Document data having a data structure matching 1) is found, and the content of the term-accompanying information after the search is extracted based on the document data. This is shown in FIG. And finally, each search and accompanying information after the search are shown in FIG.
It is displayed as shown in (d).
【0029】上記実施例では、日本語を例に上げて説明
したが、本発明はこれに限定されるものではなく、英語
やドイツ語など、用語付随情報を適用できる言語であれ
ば、どのような言語の文書についても適用される。In the above embodiment, Japanese has been described as an example, but the present invention is not limited to this, and any language such as English or German can be used as long as the term accompanying information can be applied. It also applies to documents in different languages.
【0030】また上記実施例では、用語付随情報表現ベ
ース5に個々の用語付随情報の表現パターンを予め記憶
しているように説明したが、ユーザが個々の用語付随情
報の表現パターンを更新或は追加できるようにしてもよ
い。Further, in the above-mentioned embodiment, the expression pattern of each term incidental information is stored in the term incidental information expression base 5 in advance, but the user may update or express the expression pattern of each term incidental information. You may be able to add.
【0031】更に上記実施例では、ユーザが入力した文
字列を検索語として検索し、検索された語の周囲を調べ
て用語付随情報を抽出する場合で説明したが、対象文書
DB中の任意の用語と、その用語付随情報が存在してい
る文書の該当箇所を抽出し、その結果を整理して、いわ
ゆる用語集や索引等を作成・表示できるようにしてもよ
い。Further, in the above-described embodiment, the case where the character string input by the user is searched as a search word and the surroundings of the searched word are searched to extract the term accompanying information has been described. It is also possible to extract the relevant part of the document in which the term and the information associated with the term are present, sort the results, and create and display a so-called terminology list or index.
【0032】また、上記実施例では、用語付随情報抽出
結果を提示する際に、検索された文書を表示した画面上
に、その用語と用語付随情報(の箇所)を反転表示して
提示する場合について説明したが、本発明はこれに限定
するものではなく、下線や色表示やフォントなど、ユー
ザが視覚的に識別可能なあらゆる方法を用いて提示でき
る形式にしてもよい。In the above embodiment, when presenting the extraction result of the term incidental information, the term and the term incidental information (the place thereof) are displayed in reverse video on the screen displaying the retrieved document. However, the present invention is not limited to this, and may be in a format that can be presented using any method that allows the user to visually identify such as underlining, color display, and font.
【0033】また上記実施例では、ユーザが入力した文
字列をそのまま検索する形について説明したが、ユーザ
が入力した文字列、即ち、検索の対象となる検索語に関
して、同義語や類義語などの辞書データなどを用いて、
その検索後の同義語や類義語や類似語などに展開するこ
とにより、複数の語による検索を可能にし、できるだけ
検出漏れがないように、より幅広い検索をできるように
してもよい。Further, in the above embodiment, the form in which the character string input by the user is retrieved as it is has been described. Using data etc.,
The search may be expanded into synonyms, synonyms, or similar words to enable a search using a plurality of words, and to allow a wider search so as to eliminate omission of detection as much as possible.
【0034】また上記実施例では、ユーザが入力した文
字列をそのまま検索語とする場合で説明したが、ユーザ
が入力した文字列(検索語)が、例えば複合語等の場合
に、その構成語に分解したりして複数の語により検索を
行なうようにしても良い。In the above embodiment, the case where the character string input by the user is directly used as the search word has been described. However, when the character string (search word) input by the user is, for example, a compound word, its constituent words Alternatively, the search may be performed using a plurality of words.
【0035】更に本実施例では、用語付随情報の一例と
して、用語の説明・解読や定義として、その表現方法の
パターンを例に説明したが、本発明はこれに限定される
わけではなく、用語の略語や訳語など、用語の付随情報
として形式化できるものであれば、その表現方法のパタ
ーンを用語付随情報表現ベース5に用意して適用しても
よい。Further, in the present embodiment, as an example of the term accompanying information, the explanation and decoding of the term and the definition of the pattern of the expression method are explained as an example, but the present invention is not limited to this, and the term As long as it can be formalized as associated information of a term such as an abbreviation or a translated word, a pattern of the expression method may be prepared and applied to the term accompanying information expression base 5.
【0036】更に上記実施例では、用語付随情報抽出処
理として、文書中の文字列と用語付随情報表現ベース5
上のルールパターンとで、文字列のパターンマッチング
により抽出する例について説明したが、文書中の検索後
の周囲の文字列を、辞書と文法を用いた文解析により分
析し、これに更に用語付随情報表現ベース5上のルール
のパターンを参照して、より詳細にこれらを比較して、
その用語付随情報を抽出するようにしてもよい。Further, in the above-described embodiment, the character string in the document and the term-related information expression base 5 are used as the term-related information extraction processing.
With the above rule pattern, an example of extracting by pattern matching of a character string was explained, but the surrounding character string after the search in the document is analyzed by sentence analysis using a dictionary and grammar, and the term Refer to the pattern of rules on the information representation base 5, compare these in more detail,
The term incidental information may be extracted.
【0037】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置に本発明
を実施するプログラムを供給することによって達成され
る場合にも適用できる。The present invention may be applied to a system composed of a plurality of devices or an apparatus composed of a single device. The present invention can also be applied to the case where it is achieved by supplying a program for implementing the present invention to a system or an apparatus.
【0038】以上説明したように本実施例によれば、検
索された用語とともに、その用語の説明や解説などの付
随情報を自動的に得ることができるため、個々のユーザ
にとって、関心や興味がある情報をも抽出できるという
効果がある。As described above, according to this embodiment, it is possible to automatically obtain, together with the retrieved term, accompanying information such as the explanation and explanation of the term, so that individual users are not interested or interested. There is an effect that even certain information can be extracted.
【0039】[0039]
【発明の効果】以上説明したように本発明によれば、検
索語の説明や解説などの付随情報を自動的に得ることが
できる。As described above, according to the present invention, it is possible to automatically obtain accompanying information such as explanations and explanations of search terms.
【0040】また本発明によれば、検索に使用した検索
語の持つ意味を容易に理解できる効果がある。Further, according to the present invention, it is possible to easily understand the meaning of the search word used for the search.
【0041】[0041]
【図1】本発明の一実施例に係る情報検索装置の機能ブ
ロック図である。FIG. 1 is a functional block diagram of an information search device according to an embodiment of the present invention.
【図2】本実施例の情報検索装置の基本構成を示すブロ
ック図である。FIG. 2 is a block diagram showing a basic configuration of an information search device of this embodiment.
【図3】本実施例の情報検索装置における検索処理手順
を示すフローチャートである。FIG. 3 is a flowchart showing a search processing procedure in the information search device according to the present embodiment.
【図4】本実施例の用語付随情報表現ベースに記憶され
ているデータの一例を示す図である。FIG. 4 is a diagram showing an example of data stored in a term accompanying information expression base according to the present embodiment.
【図5】本実施例の情報検索装置における具体的な検索
処理を説明するための図である。FIG. 5 is a diagram for explaining a specific search process in the information search device according to the present embodiment.
1 文字列バッファ 2 文書DB(文書データベース) 3 検索処理部 4 検索結果保持部 5 用語付随情報表現ベース 6 用語付随情報抽出部 7 用語付随情報提示部 101 CPU 102 プログラムメモリ 103 キーボード 105 RAM 106 表示部 110 ハードディスク 1 character string buffer 2 document DB (document database) 3 search processing unit 4 search result holding unit 5 term incidental information expression base 6 term incidental information extraction unit 7 term incidental information presentation unit 101 CPU 102 program memory 103 keyboard 105 RAM 106 display unit 110 hard disk
───────────────────────────────────────────────────── フロントページの続き (72)発明者 廣田 誠 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 柴田 昇吾 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 池田 裕治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Makoto Hirota 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Shogo Shibata 3-30-2 Shimomaruko, Ota-ku, Tokyo Non-Incorporated (72) Inventor Yuji Ikeda 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Minoru Fujita 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc.
Claims (10)
スを検索する情報検索装置であって、 検索語に付随する付随情報の表現方式に関する書式情報
を記憶する記憶手段と、 前記検索語に基づいてデータベースを検索し、前記検索
語を含む文書データを抽出する検索手段と、 前記検索語を含む文書データより前記記憶手段に記憶さ
れている書式情報に該当する文書を取り出す付随情報抽
出手段と、 前記検索手段により抽出された文書データと前記付随情
報抽出手段により抽出された文書を表示する表示手段
と、を有することを特徴とする情報検索装置。1. An information retrieval device for retrieving a database based on an instructed search word, comprising: storage means for storing format information relating to an expression method of incidental information accompanying the search word; and based on the search word. Search means for searching a database and extracting document data including the search word; and associated information extracting means for extracting a document corresponding to the format information stored in the storage means from the document data including the search word, An information retrieval device comprising: document data extracted by the retrieval means; and display means for displaying the document extracted by the incidental information extraction means.
の説明や定義等に関する書式情報を記憶し、前記付随情
報抽出手段は、前記文書データ中に存在する検索語の近
傍に位置している用語の説明や定義に相当する文書を付
随情報として抽出することを特徴とする請求項1に記載
の情報検索装置。2. The storage means stores format information relating to a description or definition of a term corresponding to a search word, and the accompanying information extracting means is located near the search word existing in the document data. The information retrieval apparatus according to claim 1, wherein a document corresponding to the explanation or definition of the term is extracted as the incidental information.
タ中に存在する全ての検索語の近傍の用語の説明や定義
に相当する文書を抽出することを特徴とする請求項1記
載の情報検索装置。3. The information search according to claim 1, wherein the incidental information extracting means extracts a document corresponding to a description or definition of terms near all search words existing in the document data. apparatus.
を、当該用語に続く括弧或は区切り記号で表わされてい
ることを特徴とする請求項1〜3のいずれか1項に記載
の情報検索装置。4. The format information according to claim 1, wherein incidental information of a term is represented by parentheses or delimiters following the term. Information retrieval device.
随情報を識別可能に表示することを特徴とする請求項1
〜4のいずれか1項に記載の情報検索装置。5. The display means displays the search term and the associated information in a distinguishable manner.
The information search device according to any one of items 1 to 4.
スを検索する情報検索方法であって、 検索語を入力する工程と、 前記検索語に基づいてデータベースを検索し、前記検索
語を含む文書データを抽出する工程と、 前記文書データより、記憶されている前記検索語に付随
する付随情報の表現方式に関する書式情報に該当する文
書を取り出す工程と、 前記検索語を含む文書データと前記書式情報に該当する
文書とを表示する表示工程と、を有することを特徴とす
る情報検索方法。6. An information search method for searching a database based on an instructed search word, the step of inputting a search word, and searching the database based on the search word, and document data including the search word. Extracting the document corresponding to the format information relating to the expression method of the accompanying information associated with the stored search word from the document data, and extracting the document data including the search word and the format information. And a display step of displaying the corresponding document, and an information search method.
の説明や定義に関する情報で、前記文書データ中に存在
する検索語の近傍に位置している用語の説明や定義に相
当する文書を付随情報として抽出することを特徴とする
請求項6に記載の情報検索方法。7. The format information is information about a description or definition of a term corresponding to a search term, and is a document corresponding to an explanation or definition of a term located near the search term existing in the document data. The information search method according to claim 6, wherein the information is extracted as accompanying information.
在する全ての検索語の近傍の用語の説明や定義に相当す
る文書として抽出されることを特徴とする請求項6記載
の情報検索方法。8. The information search method according to claim 6, wherein the incidental information is extracted as a document corresponding to an explanation or definition of terms near all search words existing in the document data. .
を、当該用語に続く括弧或は区切り記号で表わされてい
ることを特徴とする請求項6〜8のいずれか1項に記載
の情報検索方法。9. The format information according to any one of claims 6 to 8, wherein incidental information of a certain term is represented by parentheses or delimiters following the term. Information retrieval method.
記付随情報が識別可能に表示されることを特徴とする請
求項6〜9のいずれか1項に記載の情報検索方法。10. The information search method according to claim 6, wherein in the display step, the search word and the accompanying information are displayed in a distinguishable manner.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7090593A JPH08287088A (en) | 1995-04-17 | 1995-04-17 | Information retrieval method and device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7090593A JPH08287088A (en) | 1995-04-17 | 1995-04-17 | Information retrieval method and device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08287088A true JPH08287088A (en) | 1996-11-01 |
Family
ID=14002771
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7090593A Withdrawn JPH08287088A (en) | 1995-04-17 | 1995-04-17 | Information retrieval method and device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08287088A (en) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007535766A (en) * | 2004-04-28 | 2007-12-06 | ボゴーク,サミュエル | System and method for identifying complex patterns of amino acids |
| WO2011033609A1 (en) * | 2009-09-15 | 2011-03-24 | 株式会社 東芝 | Content retrieving apparatus, method and program |
| JP2012027567A (en) * | 2010-07-21 | 2012-02-09 | National Institute Of Information & Communication Technology | Paraphrase relationship set acquisition device, paraphrase relationship set acquisition method, and program |
| US8417462B2 (en) | 2001-10-26 | 2013-04-09 | Samuel Bogoch | System and method for identifying complex patterns of amino acids |
| US8494781B2 (en) | 2003-06-06 | 2013-07-23 | Samuel Bogoch | Systems and methods for identifying replikin scaffolds and uses of said replikin scaffolds |
| US9233148B2 (en) | 2009-01-09 | 2016-01-12 | Samuel Bogoch | Replikin-based compounds for prevention and treatment of influenza and methods of differentiating infectivity and lethality in influenza |
| US9254315B2 (en) | 2004-04-28 | 2016-02-09 | Samuel Bogoch | Systems and methods for identifying replikin scaffolds and uses of said replikin scaffolds |
| US9408902B2 (en) | 2007-05-30 | 2016-08-09 | Samuel Bogoch | Synthetic replikin peptides against pathogenic infection of invertebrates in aquaculture |
-
1995
- 1995-04-17 JP JP7090593A patent/JPH08287088A/en not_active Withdrawn
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8417462B2 (en) | 2001-10-26 | 2013-04-09 | Samuel Bogoch | System and method for identifying complex patterns of amino acids |
| US8494781B2 (en) | 2003-06-06 | 2013-07-23 | Samuel Bogoch | Systems and methods for identifying replikin scaffolds and uses of said replikin scaffolds |
| US9388234B2 (en) | 2003-06-06 | 2016-07-12 | Samuel Bogoch | Systems and methods for identifying Replikin Scaffolds and uses of said Replikin Scaffolds |
| JP2007535766A (en) * | 2004-04-28 | 2007-12-06 | ボゴーク,サミュエル | System and method for identifying complex patterns of amino acids |
| US9254315B2 (en) | 2004-04-28 | 2016-02-09 | Samuel Bogoch | Systems and methods for identifying replikin scaffolds and uses of said replikin scaffolds |
| US9408902B2 (en) | 2007-05-30 | 2016-08-09 | Samuel Bogoch | Synthetic replikin peptides against pathogenic infection of invertebrates in aquaculture |
| US9233148B2 (en) | 2009-01-09 | 2016-01-12 | Samuel Bogoch | Replikin-based compounds for prevention and treatment of influenza and methods of differentiating infectivity and lethality in influenza |
| WO2011033609A1 (en) * | 2009-09-15 | 2011-03-24 | 株式会社 東芝 | Content retrieving apparatus, method and program |
| JP5284478B2 (en) * | 2009-09-15 | 2013-09-11 | 株式会社東芝 | Content search apparatus, method and program |
| JP2012027567A (en) * | 2010-07-21 | 2012-02-09 | National Institute Of Information & Communication Technology | Paraphrase relationship set acquisition device, paraphrase relationship set acquisition method, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3691844B2 (en) | Document processing method | |
| JPH09114860A (en) | Method and device for data retrieval | |
| JP2003223437A (en) | Method of displaying candidate for correct word, method of checking spelling, computer device, and program | |
| JPH04229364A (en) | Method and system for changing emphasizing characteristic | |
| JPH1125098A (en) | Information processor and method for obtaining link destination file and storage medium | |
| JP3143345B2 (en) | String search device | |
| JP2937520B2 (en) | Document search device | |
| JP2000200281A (en) | Information retrieval apparatus, information retrieval method, and recording medium recording information retrieval program | |
| JPH08287088A (en) | Information retrieval method and device | |
| US20050102280A1 (en) | Search system, search program, and personal computer | |
| JPH1097541A (en) | Document browsing support system and document processing system | |
| JPH07182373A (en) | Document information retrieval device and document retrieval result display method | |
| JPH0395673A (en) | Inter-sentence link setting method and device | |
| JPH09114852A (en) | Information retrieval device | |
| JP2004157965A (en) | Search support apparatus, search support method, program, and recording medium | |
| JP2785692B2 (en) | Dictionary search and display device | |
| JP3056810B2 (en) | Document search method and apparatus | |
| JP3714723B2 (en) | Document display system | |
| JP3710463B2 (en) | Translation support dictionary device | |
| JPH07134720A (en) | Method and device for presenting relative information in sentence preparing system | |
| JP3693734B2 (en) | Information retrieval apparatus and information retrieval method thereof | |
| JPH10340271A (en) | Document abstract preparation device, and storage medium where document abstract generation program is recorded | |
| JP2001022782A (en) | How to search and display detailed explanation of messages without guide ID | |
| JP3498635B2 (en) | Information retrieval method and apparatus, and computer-readable recording medium | |
| JPH08137892A (en) | Document search method and document search device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020702 |