JP5161891B2 - 辞書システム - Google Patents
辞書システム Download PDFInfo
- Publication number
- JP5161891B2 JP5161891B2 JP2009546971A JP2009546971A JP5161891B2 JP 5161891 B2 JP5161891 B2 JP 5161891B2 JP 2009546971 A JP2009546971 A JP 2009546971A JP 2009546971 A JP2009546971 A JP 2009546971A JP 5161891 B2 JP5161891 B2 JP 5161891B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- unit
- compound
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
少なくとも1の単純語又は未成語文字配列を含んで構成する単純語辞書単位と、
前記単純語辞書単位を構成する単純語又は未成語文字配列の1を含んで構成する複合語を示す複合語辞書単位と、
を記憶する記憶部を備え、
前記複合語を構成するそれぞれの単純語又は未成語文字配列は、前記単純語辞書単位へのポインタ(単位識別子)、及び前記単純語又は未成語文字配列へのポインタ(語識別子)を介して参照される辞書システム。
受け付けた検索要求語から、前記複合語に一致する部分を抽出する手段と、
その余の部分から、前記単純語に一致する部分を抽出する手段と、
一致した前記複合語を構成する単純語及び一致した単純語がそれぞれ含まれる単純語辞書単位に含まれる全ての単純語を組み合わせて検索候補語を生成する手段と、
生成された検索候補語の属する前記複合語を構成する前記単純語辞書単位へのポインタ(単位識別子)及び、その余の部分の単純語を構成する単純語又は未成語文字配列へのポインタ(語識別子)を正規化して登録する手段と、
を備える(1)に記載の辞書システム。
前記新たな関連付けを示された単純語又は複合語が互いに別々の辞書単位を構成している場合に、同じ単純語辞書単位へのポインタ(単位識別子)を付与して前記別々の辞書単位を統合する手段と、
前記新たな関連付けを示された単純語又は複合語が互いに同じ辞書単位を構成している場合に、関連付けのない単純語又は複合語とすべく、前記単純語辞書単位へのポインタ(単位識別子)を削除し、未成語文字配列へのポインタ(語識別子)を付与する手段と、
を更に備える(1)又は(2)に記載の辞書システム。
前記新たな関連付けを示された複合語の一部が同一の辞書単位を構成している場合に、その余の部分を構成する単純語又は複合語同士が関連するものとして類推して、前記その余の部分を構成する単純語又は複合語を含むように、同一の単純語辞書単位へのポインタ(単位識別子)で構成して新たな辞書単位を生成する手段と、を更に備える(1)から(3)のいずれか1項に記載の辞書システム。
受け付けた分割を示すデータに基づいて前記辞書単位を分割する手段と、
受け付けた分割を示すデータに、分割可能な単純語が含まれていない場合には、当該単純語に対して、前記単純語又は未成語文字配列へのポインタ(語識別子)を付与する手段と、
を更に備える(1)から(4)のいずれか1項に記載の辞書システム。
のいずれか1項に記載の辞書システム。
前記辞書システムは、少なくとも1の単純語又は未成語文字配列を含んで構成する単純語辞書単位と、
前記単純語辞書単位を構成する単純語又は未成語文字配列の1を含んで構成する複合語を示す複合語辞書単位と、を記憶する記憶部を備え、
前記辞書システムに、前記複合語を構成するそれぞれの単純語を、前記単純語辞書単位へのポインタ(単位識別子)、及び前記単純語又は未成語文字配列へのポインタ(語識別子)を介して参照させるステップを実行させるプログラム。
10 サーバ
20、20a、20b、20c 端末
30 通信ネットワーク
60 Webサイト
[サーバ10のハードウェア構成]
[端末20のハードウェア構成]
E02+D01+G04 → 「A0011+G04」、「E02+B0022」
末梢神経障害、末梢神経系障害、末梢神経疾患
Claims (9)
- 文書を検索するための、或いは、文書を構成する語の正規化のための、辞書システムであって、
少なくとも1の単純語又は未成語文字配列を含んで構成する単純語辞書単位と、
前記単純語辞書単位を構成する単純語又は未成語文字配列の1を含んで構成する複合語を示す複合語辞書単位と、
を記憶する記憶部を備え、
前記複合語を構成するそれぞれの単純語又は未成語文字配列は、前記単純語辞書単位へのポインタ(単位識別子)、及び前記単純語又は未成語文字配列へのポインタ(語識別子)を介して参照される辞書システム。 - 検索要求語の入力を受け付ける手段と、
受け付けた検索要求語から、前記複合語に一致する部分を抽出する手段と、
その余の部分から、前記単純語に一致する部分を抽出する手段と、
一致した前記複合語を構成する単純語及び一致した単純語がそれぞれ含まれる単純語辞書単位に含まれる全ての単純語を組み合わせて検索候補語を生成する手段と、
生成された検索候補語の属する前記複合語を構成する前記単純語辞書単位へのポインタ(単位識別子)及び、その余の部分の単純語を構成する単純語又は未成語文字配列へのポインタ(語識別子)を正規化して登録する手段と、
を備える請求項1に記載の辞書システム。 - 単純語又は複合語の新たな関連付けを示すデータの入力を受け付ける手段と、
前記新たな関連付けを示された単純語又は複合語が互いに別々の辞書単位を構成している場合に、同じ単純語辞書単位へのポインタ(単位識別子)を付与して前記別々の辞書単位を統合する手段と、
前記新たな関連付けを示された単純語又は複合語が互いに同じ辞書単位を構成している場合に、関連付けのない単純語又は複合語とすべく、前記単純語辞書単位へのポインタ(単位識別子)を削除し、未成語文字配列へのポインタ(語識別子)を付与する手段と、
を更に備える請求項1又は請求項2に記載の辞書システム。 - 複合語同士の新たな関連付けを示すデータの入力を受け付ける手段と、
前記新たな関連付けを示された複合語の一部が同一の辞書単位を構成している場合に、その余の部分を構成する単純語又は複合語同士が関連するものとして類推して、前記その余の部分を構成する単純語又は複合語を含むように、同一の単純語辞書単位へのポインタ(単位識別子)で構成して新たな辞書単位を生成する手段と、を更に備える請求項1から請求項3のいずれか1項に記載の辞書システム。 - 複数の単純語又は複合語を含んで構成する辞書単位に対する分割を示すデータの入力を受け付ける手段と、
受け付けた分割を示すデータに基づいて前記辞書単位を分割する手段と、
受け付けた分割を示すデータに、分割可能な単純語が含まれていない場合には、当該単純語に対して、前記単純語又は未成語文字配列へのポインタ(語識別子)を付与する手段と、
を更に備える請求項1から請求項4のいずれか1項に記載の辞書システム。 - 前記記憶部に記憶した単純語辞書単位を構成する単純語が、その他の単純語辞書単位を構成する単純語又は複合語辞書単位を構成する複合語を構成する単純語を含んでいる場合に、当該含んでいる単純語を含んで構成する複合語として単純語辞書単位へのポインタ(単位識別子)、及び前記単純語又は未成語文字配列へのポインタ(語識別子)を付して記憶する手段を更に備える請求項1から請求項5のいずれか1項に記載の辞書システム。
- 前記検索要求語に含まれる複合語又は単純語が構成する辞書単位に含まれる単純語辞書単位へのポインタ(単位識別子)により特定される単純語の語群が検索対象文書に含まれている場合に一致したと見なす請求項2に記載の辞書システム。
- 辞書システムに、文書の検索、或いは、文書を構成する語の正規化を実行させるプログラムであって、
前記辞書システムは、少なくとも1の単純語又は未成語文字配列を含んで構成する単純語辞書単位と、
前記単純語辞書単位を構成する単純語又は未成語文字配列の1を含んで構成する複合語を示す複合語辞書単位と、を記憶する記憶部を備え、
前記辞書システムに、前記複合語を構成するそれぞれの単純語を、前記単純語辞書単位へのポインタ(単位識別子)、及び前記単純語又は未成語文字配列へのポインタ(語識別子)を介して参照させるステップを実行させるプログラム。 - 請求項1に記載の辞書システムを含み、管理対象となる文書を構成する語の正規化を行う文書管理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009546971A JP5161891B2 (ja) | 2007-12-26 | 2008-08-22 | 辞書システム |
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007334013 | 2007-12-26 | ||
| JP2007334013 | 2007-12-26 | ||
| PCT/JP2008/065013 WO2009081620A1 (ja) | 2007-12-26 | 2008-08-22 | 辞書システム |
| JP2009546971A JP5161891B2 (ja) | 2007-12-26 | 2008-08-22 | 辞書システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2009081620A1 JPWO2009081620A1 (ja) | 2011-05-06 |
| JP5161891B2 true JP5161891B2 (ja) | 2013-03-13 |
Family
ID=40800937
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009546971A Active JP5161891B2 (ja) | 2007-12-26 | 2008-08-22 | 辞書システム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20120191746A1 (ja) |
| JP (1) | JP5161891B2 (ja) |
| WO (1) | WO2009081620A1 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015146169A (ja) * | 2014-02-04 | 2015-08-13 | 有限会社ティ辞書企画 | 検索装置、検索方法、及びプログラム |
| JP2015146171A (ja) * | 2014-02-04 | 2015-08-13 | 有限会社ティ辞書企画 | 検索装置、検索方法、及びプログラム |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR3041794B1 (fr) * | 2015-09-30 | 2017-10-27 | Commissariat Energie Atomique | Procede et systeme de recherche d'images similaires quasi-independant de l'echelle de la collection d'images |
| US12093265B2 (en) * | 2021-08-02 | 2024-09-17 | Sap Se | Semantics based data and metadata mapping |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02165276A (ja) * | 1988-12-20 | 1990-06-26 | Fujitsu Ltd | 知識ベース検索方式 |
| JPH0350669A (ja) * | 1989-07-19 | 1991-03-05 | Ricoh Co Ltd | 情報処理装置 |
| JPH03189870A (ja) * | 1989-12-20 | 1991-08-19 | Hitachi Ltd | データベースのマッチング方法 |
| JPH04111063A (ja) * | 1990-08-31 | 1992-04-13 | Hitachi Ltd | 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム |
| JPH06162098A (ja) * | 1992-11-24 | 1994-06-10 | Fujitsu Ltd | 類義語生成処理方法 |
| JPH10254882A (ja) * | 1997-03-11 | 1998-09-25 | Mitsubishi Electric Corp | 複合語情報抽出装置および複合語情報抽出方法 |
| JP2002288175A (ja) * | 2001-03-28 | 2002-10-04 | Seiko Epson Corp | 文書の標準化 |
| JP2003167894A (ja) * | 2001-11-30 | 2003-06-13 | Mitsubishi Space Software Kk | 関連語自動抽出方法、関連語自動抽出装置、複数重要語抽出プログラムおよび重要語上下階層関係抽出プログラム |
| US20070088695A1 (en) * | 2005-10-14 | 2007-04-19 | Uptodate Inc. | Method and apparatus for identifying documents relevant to a search query in a medical information resource |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5210868A (en) * | 1989-12-20 | 1993-05-11 | Hitachi Ltd. | Database system and matching method between databases |
| US6915254B1 (en) * | 1998-07-30 | 2005-07-05 | A-Life Medical, Inc. | Automatically assigning medical codes using natural language processing |
| US7761286B1 (en) * | 2005-04-29 | 2010-07-20 | The United States Of America As Represented By The Director, National Security Agency | Natural language database searching using morphological query term expansion |
| US7912864B2 (en) * | 2007-09-25 | 2011-03-22 | Oracle International Corp. | Retrieving collected data mapped to a base dictionary |
-
2008
- 2008-08-22 WO PCT/JP2008/065013 patent/WO2009081620A1/ja not_active Ceased
- 2008-08-22 JP JP2009546971A patent/JP5161891B2/ja active Active
- 2008-08-22 US US12/810,684 patent/US20120191746A1/en not_active Abandoned
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02165276A (ja) * | 1988-12-20 | 1990-06-26 | Fujitsu Ltd | 知識ベース検索方式 |
| JPH0350669A (ja) * | 1989-07-19 | 1991-03-05 | Ricoh Co Ltd | 情報処理装置 |
| JPH03189870A (ja) * | 1989-12-20 | 1991-08-19 | Hitachi Ltd | データベースのマッチング方法 |
| JPH04111063A (ja) * | 1990-08-31 | 1992-04-13 | Hitachi Ltd | 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム |
| JPH06162098A (ja) * | 1992-11-24 | 1994-06-10 | Fujitsu Ltd | 類義語生成処理方法 |
| JPH10254882A (ja) * | 1997-03-11 | 1998-09-25 | Mitsubishi Electric Corp | 複合語情報抽出装置および複合語情報抽出方法 |
| JP2002288175A (ja) * | 2001-03-28 | 2002-10-04 | Seiko Epson Corp | 文書の標準化 |
| JP2003167894A (ja) * | 2001-11-30 | 2003-06-13 | Mitsubishi Space Software Kk | 関連語自動抽出方法、関連語自動抽出装置、複数重要語抽出プログラムおよび重要語上下階層関係抽出プログラム |
| US20070088695A1 (en) * | 2005-10-14 | 2007-04-19 | Uptodate Inc. | Method and apparatus for identifying documents relevant to a search query in a medical information resource |
Non-Patent Citations (2)
| Title |
|---|
| CSNG200501179003; 田代朋子: '医薬系シソーラス辞書「T辞書」の構造と特徴' オンライン検索 第25巻,第3/4号, 2004, p.197-205, 日本端末研究会 * |
| JPN6012043641; 田代朋子: '医薬系シソーラス辞書「T辞書」の構造と特徴' オンライン検索 第25巻,第3/4号, 2004, p.197-205, 日本端末研究会 * |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015146169A (ja) * | 2014-02-04 | 2015-08-13 | 有限会社ティ辞書企画 | 検索装置、検索方法、及びプログラム |
| JP2015146171A (ja) * | 2014-02-04 | 2015-08-13 | 有限会社ティ辞書企画 | 検索装置、検索方法、及びプログラム |
| WO2015119171A1 (ja) * | 2014-02-04 | 2015-08-13 | 有限会社ティ辞書企画 | 検索装置、検索方法、及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2009081620A1 (ja) | 2011-05-06 |
| WO2009081620A1 (ja) | 2009-07-02 |
| US20120191746A1 (en) | 2012-07-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7593927B2 (en) | Unstructured data in a mining model language | |
| US7584188B2 (en) | System and method for searching and matching data having ideogrammatic content | |
| CN112860727B (zh) | 基于大数据查询引擎的数据查询方法、装置、设备及介质 | |
| EP1473639A1 (en) | Document knowledge management apparatus and method | |
| US20020173986A1 (en) | Automatic categorization of financial transactions | |
| EP2891075A1 (en) | Contextually blind data conversion using indexed string matching | |
| KR20130108503A (ko) | 퍼스널 아이덴티티를 기술하는 데이터에 대한 액셔너블 속성의 애스클라이빙 | |
| CN111858567A (zh) | 一种通过标准数据元进行政务数据清洗的方法和系统 | |
| CN1815477A (zh) | 用于提供基于标记语言的限定词的方法和系统 | |
| US6219664B1 (en) | Search method and system using syntactic information | |
| JP5161891B2 (ja) | 辞書システム | |
| US20090210787A1 (en) | Document data managing method, managing system, and computer software | |
| JPWO2020245887A1 (ja) | 文章生成装置、文章生成方法、および文章生成プログラム | |
| KR100797041B1 (ko) | 분류된 웹 사이트 검색 시스템 및 방법 | |
| CN110309214B (zh) | 一种指令执行方法及其设备、存储介质、服务器 | |
| US20210295031A1 (en) | Automated classification and interpretation of life science documents | |
| CN104298676A (zh) | 主题挖掘方法和设备、以及查询扩展方法和设备 | |
| KR20040048548A (ko) | 지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템 | |
| JP7685921B2 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
| JP4362492B2 (ja) | 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム | |
| JP2022190845A (ja) | エンティティとインテントとコーパスの自動生成装置及びプログラム | |
| US20220254449A1 (en) | Biological information handling | |
| CN113519029A (zh) | 生物测序 | |
| US20250363310A1 (en) | Techniques for training and validating an optimized machine learning model | |
| US20240152522A1 (en) | Data set semantic similarity clustering |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120821 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121018 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121214 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5161891 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |