CN116303873A - Patent Retrieval System and Its Method - Google Patents
Patent Retrieval System and Its Method Download PDFInfo
- Publication number
- CN116303873A CN116303873A CN202111484652.3A CN202111484652A CN116303873A CN 116303873 A CN116303873 A CN 116303873A CN 202111484652 A CN202111484652 A CN 202111484652A CN 116303873 A CN116303873 A CN 116303873A
- Authority
- CN
- China
- Prior art keywords
- data
- patent document
- document data
- keyword
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
技术领域technical field
本发明涉及一种专利检索系统及其方法,特别涉及一种可根据选择指令以 辅助专利检索的专利检索系统及其方法。The present invention relates to a patent retrieval system and its method, in particular to a patent retrieval system and its method which can assist patent retrieval according to selection instructions.
背景技术Background technique
专利检索系统为一种针对专利文件进行检索的检索系统,而因专利文件的 记载内容属于专业知识,且专利撰写方式及格式并不同于一般文件的撰写方式, 因此若非对于专利有相当了解,且对目标专利(即使用者欲检索的专利群)所 记载的技术领域有相当了解的使用者,则往往不知道如何进行专利检索,或是 无法准确检索到目标专利群。此外,如同前述,因专利文件的内容、撰写方式 及格式并不同于一般文件,因此,一般检索系统(例如Google等)并不适用于 专利检索。有鉴于此,将需要一种可辅助一般使用者(例如不具备专利知识的 使用者)进行专利检索的专利检索系统及其方法。The patent search system is a search system for patent documents. Since the content of patent documents is professional knowledge, and the way and format of patent writing are different from the way of writing general documents, if you do not have a good understanding of patents, and Users who have a good understanding of the technical field recorded in the target patent (that is, the patent group that the user wants to search for) often do not know how to perform a patent search, or cannot accurately search for the target patent group. In addition, as mentioned above, because the content, writing method and format of patent documents are different from ordinary documents, general search systems (such as Google, etc.) are not suitable for patent search. In view of this, there will be a need for a patent retrieval system and method thereof that can assist general users (such as users without patent knowledge) to perform patent retrieval.
发明内容Contents of the invention
为了解决上述问题,本发明的构想在于提供一种可辅助专利检索的专利检 索系统及其方法。本发明的另一构想在于提供一种可根据选择指令以辅助专利 检索的专利检索系统及其方法。In order to solve the above problems, the idea of the present invention is to provide a patent retrieval system and method thereof that can assist patent retrieval. Another idea of the present invention is to provide a patent retrieval system and its method that can assist patent retrieval according to selection instructions.
基于前揭构想,本发明提供一种专利检索系统,包含:数据库,储存复数 个第一专利文件数据;以及伺服器,存取该数据库,该伺服器接收第一检索条 件指令,并根据该第一检索条件指令以自该复数个第一专利文件数据中,检索 出复数个第二专利文件数据;其中该伺服器接收第一选择指令,该第一选择指 令关联于该复数个第二专利文件数据中的第一选取专利文件数据,该伺服器根 据该第一选择指令以自该第一选取专利文件数据中获得第一关键字数据,该伺 服器并至少根据该第一检索条件指令以及该第一关键字数据产生第二检索条件 指令,且该第二检索条件指令包含该第一关键字数据;其中该伺服器根据该第 二检索条件指令以自该复数个第一专利文件数据中,检索出复数个第三专利文 件数据;其中该第一检索条件指令指示出第一检索条件,该伺服器系基于该复 数个第二专利文件数据均符合该第一检索条件,而自该复数个第一专利文件数 据中,检索出该复数个第二专利文件数据;其中该第二检索条件指令指示出第 二检索条件,该伺服器系基于该复数个第三专利文件数据均符合该第二检索条 件,而自该复数个第一专利文件数据中,检索出该复数个第三专利文件数据。Based on the idea disclosed above, the present invention provides a patent retrieval system, including: a database storing a plurality of first patent document data; A search condition command to retrieve a plurality of second patent document data from the plurality of first patent document data; wherein the server receives a first selection command, and the first selection command is associated with the plurality of second patent document data The first selected patent document data in the data, the server obtains the first keyword data from the first selected patent document data according to the first selection instruction, and the server at least according to the first retrieval condition instruction and the The first keyword data generates a second retrieval condition instruction, and the second retrieval condition instruction includes the first keyword data; wherein the server selects from the plurality of first patent document data according to the second retrieval condition instruction, A plurality of third patent document data is retrieved; wherein the first retrieval condition instruction indicates the first retrieval condition, and the server is based on the plurality of second patent document data meeting the first retrieval condition, and from the plurality of In the first patent document data, the plurality of second patent document data is retrieved; wherein the second retrieval condition instruction indicates a second retrieval condition, and the server is based on the plurality of third patent document data meeting the second search conditions, and retrieve the plurality of third patent document data from the plurality of first patent document data.
在本发明的较佳实施例中,该第一检索条件指令包含初始关键字数据,该 伺服器根据该第一检索条件指令以自该复数个第一专利文件数据中,检索出该 复数个第二专利文件数据以及复数个第四专利文件数据;其中各该复数个第二 专利文件数据分别包含发明名称数据、摘要数据以及权利要求书数据,各该复 数个第二专利文件数据所对应的该发明名称数据、该摘要数据以及该权利要求 书数据其中一者具有该初始关键字数据;其中各该复数个第四专利文件数据均 具有该初始关键字数据。In a preferred embodiment of the present invention, the first retrieval condition command includes initial keyword data, and the server retrieves the plurality of first patent document data from the plurality of first patent document data according to the first retrieval condition command Two patent document data and a plurality of fourth patent document data; wherein each of the plurality of second patent document data respectively includes invention title data, abstract data and claim data, and each of the plurality of second patent document data corresponds to the One of the title of invention data, the abstract data and the claims data has the initial keyword data; wherein each of the plurality of fourth patent document data has the initial keyword data.
在本发明的较佳实施例中,该第一选择指令关联于相关标签数据,且其中 各该复数个第三专利文件数据均具有该第一关键字数据。In a preferred embodiment of the present invention, the first selection instruction is associated with relevant tag data, and each of the plurality of third patent document data has the first keyword data.
在本发明的较佳实施例中,该第一选取专利文件数据具有专利分类号数据, 且该第一选择指令关联于相关标签数据;其中该伺服器至少系根据该第一检索 条件指令、该第一关键字数据以及该专利分类号数据以产生第二检索条件指令, 且该第二检索条件指令包含该专利分类号数据;其中该复数个第三专利文件数 据均具有该第一关键字数据以及该专利分类号数据。In a preferred embodiment of the present invention, the first selected patent document data has patent classification number data, and the first selection command is associated with related label data; wherein the server is at least based on the first retrieval condition command, the The first keyword data and the patent classification number data to generate a second retrieval condition instruction, and the second retrieval condition instruction includes the patent classification number data; wherein the plurality of third patent document data all have the first keyword data And the patent classification number data.
在本发明的较佳实施例中,在该伺服器检索出该复数个第三专利文件数据 之前,该伺服器根据删除指令以将该第一关键字数据自该第二检索条件指令中 删除。In a preferred embodiment of the present invention, before the server retrieves the plurality of third patent document data, the server deletes the first keyword data from the second retrieval condition instruction according to the deletion instruction.
在本发明的较佳实施例中,该伺服器接收第二选择指令,该第二选择指令 关联于该复数个第二专利文件数据中的第二选取专利文件数据,该伺服器根据 该第二选择指令以自该第二选取专利文件数据中获得第二关键字数据,该第一 关键字数据相同于该第二关键字数据;其中该伺服器至少系根据该第一检索条 件指令、该第一关键字数据以及该第二关键字数据以产生该第二检索条件指令, 且该伺服器至少系基于该第一关键字数据相同于该第二关键字数据以产生该第 二检索条件指令;其中该第一选择指令以及该第二选择指令均关联于相关标签 数据,且其中该复数个第三专利文件数据均具有该第一关键字数据。In a preferred embodiment of the present invention, the server receives a second selection instruction, the second selection instruction is associated with the second selected patent document data among the plurality of second patent document data, and the server receives the second selection instruction according to the second Selecting an instruction to obtain second keyword data from the second selected patent document data, the first keyword data being the same as the second keyword data; wherein the server is at least based on the first retrieval condition instruction, the second keyword data a keyword data and the second keyword data to generate the second retrieval condition instruction, and the server generates the second retrieval condition instruction based at least on the basis that the first keyword data is the same as the second keyword data; Wherein the first selection instruction and the second selection instruction are both associated with relevant label data, and wherein the plurality of third patent document data all have the first keyword data.
在本发明的较佳实施例中,该伺服器接收第三选择指令,该第三选择指令 关联于该复数个第二专利文件数据中的第三选取专利文件数据,且该第三选取 专利文件数据不具有该第一关键字数据;其中该第一选择指令关联于非相关标 签数据,该第三选择指令关联于相关标签数据;其中该伺服器至少系基于该第 一选择指令关联于该非相关标签数据,该第三选择指令关联于该相关标签数据, 且该第三选取专利文件数据不具有该第一关键字数据而产生该第二检索条件指 令;其中该复数个第三专利文件数据均不具有该第一关键字数据。In a preferred embodiment of the present invention, the server receives a third selection command, the third selection command is associated with the third selected patent document data among the plurality of second patent document data, and the third selected patent document data does not have the first key data; wherein the first selection command is associated with non-related tag data, and the third selection command is associated with related tag data; wherein the server is associated with the non-related tag data based at least on the first selection command Related label data, the third selection instruction is associated with the relevant label data, and the third selected patent document data does not have the first keyword data to generate the second retrieval condition instruction; wherein the plurality of third patent document data Neither has the first keyword data.
在本发明的较佳实施例中,该伺服器接收第三选择指令,该第三选择指令 关联于该复数个第二专利文件数据中的第三选取专利文件数据,且该第三选取 专利文件数据不具有该第一关键字数据;其中该第一选择指令关联于非相关标 签数据,该第三选择指令关联于相关标签数据;其中该伺服器至少系基于该第 一选择指令关联于该非相关标签数据,该第三选择指令关联于该相关标签数据, 且该第三选取专利文件数据不具有该第一关键字数据而产生该第二检索条件指 令;其中该复数个第三专利文件数据均不具有该第一关键字数据;其中该伺服 器接收第四选择指令,该第四选择指令关联于该复数个第二专利文件数据中的 第四选取专利文件数据,该伺服器根据该第四选择指令以自该第四选取专利文 件数据中获得第四关键字数据,该第四关键字数据相同于该第一关键字数据; 其中该第四选择指令关联于该非相关标签数据;其中该伺服器至少系基于该第 四选择指令关联于该非相关标签数据,且该第四关键字数据相同于该第一关键 字数据而产生该第二检索条件指令。In a preferred embodiment of the present invention, the server receives a third selection command, the third selection command is associated with the third selected patent document data among the plurality of second patent document data, and the third selected patent document data does not have the first key data; wherein the first selection command is associated with non-related tag data, and the third selection command is associated with related tag data; wherein the server is associated with the non-related tag data based at least on the first selection command Related label data, the third selection instruction is associated with the relevant label data, and the third selected patent document data does not have the first keyword data to generate the second retrieval condition instruction; wherein the plurality of third patent document data Neither has the first keyword data; wherein the server receives a fourth selection instruction, the fourth selection instruction is associated with the fourth selected patent document data among the plurality of second patent document data, and the server receives the fourth selection instruction according to the second patent document data Four selection instructions to obtain fourth keyword data from the fourth selected patent document data, the fourth keyword data being the same as the first keyword data; wherein the fourth selection instruction is associated with the non-related tag data; wherein The server generates the second retrieval condition instruction based at least on the basis that the fourth selection instruction is associated with the irrelevant tag data, and the fourth keyword data is the same as the first keyword data.
在本发明的较佳实施例中,该伺服器接收第三选择指令,该第三选择指令 关联于该复数个第二专利文件数据中的第三选取专利文件数据,且该第三选取 专利文件数据不具有该第一关键字数据;其中该第一选择指令关联于非相关标 签数据,该第三选择指令关联于相关标签数据;其中该伺服器至少系基于该第 一选择指令关联于该非相关标签数据,该第三选择指令关联于该相关标签数据, 且该第三选取专利文件数据不具有该第一关键字数据而产生该第二检索条件指 令;其中该复数个第三专利文件数据均不具有该第一关键字数据;其中该伺服 器接收第四选择指令,该第四选择指令关联于该复数个第二专利文件数据中的 第四选取专利文件数据,该伺服器根据该第四选择指令以自该第四选取专利文 件数据中获得第四关键字数据,该第四关键字数据相同于该第一关键字数据; 其中该第四选择指令关联于该非相关标签数据;其中该伺服器至少系基于该第 四选择指令关联于该非相关标签数据,且该第四关键字数据相同于该第一关键 字数据而产生该第二检索条件指令;其中该伺服器接收第五选择指令,该第五 选择指令关联于该复数个第二专利文件数据中的第五选取专利文件数据,且该 第五选取专利文件数据不具有该第一关键字数据;其中该第五选择指令关联于 该相关标签数据;其中该伺服器至少系基于该第五选择指令关联于该相关标签 数据,且该第五选取专利文件数据不具有该第一关键字数据而产生该第二检索 条件指令。In a preferred embodiment of the present invention, the server receives a third selection command, the third selection command is associated with the third selected patent document data among the plurality of second patent document data, and the third selected patent document data does not have the first key data; wherein the first selection command is associated with non-related tag data, and the third selection command is associated with related tag data; wherein the server is associated with the non-related tag data based at least on the first selection command Related label data, the third selection instruction is associated with the relevant label data, and the third selected patent document data does not have the first keyword data to generate the second retrieval condition instruction; wherein the plurality of third patent document data Neither has the first keyword data; wherein the server receives a fourth selection instruction, the fourth selection instruction is associated with the fourth selected patent document data among the plurality of second patent document data, and the server receives the fourth selection instruction according to the second patent document data Four selection instructions to obtain fourth keyword data from the fourth selected patent document data, the fourth keyword data being the same as the first keyword data; wherein the fourth selection instruction is associated with the non-related tag data; wherein The server generates the second retrieval condition instruction based at least on the basis that the fourth selection instruction is associated with the irrelevant tag data, and the fourth keyword data is the same as the first keyword data; wherein the server receives the fifth A selection instruction, the fifth selection instruction is associated with the fifth selected patent document data among the plurality of second patent document data, and the fifth selected patent document data does not have the first keyword data; wherein the fifth selection instruction associated with the relevant tag data; wherein the server generates the second retrieval condition instruction based on at least the fifth selected instruction associated with the associated tag data, and the fifth selected patent document data does not have the first keyword data .
根据本发明的目的,再提供一种专利检索方法,应用于专利检索系统,该 专利检索系统包含数据库以及伺服器,该数据库储存复数个第一专利文件数据, 该伺服器存取该数据库,其中该专利检所方法包含以下步骤:由该伺服器接收 第一检索条件指令,并根据该第一检索条件指令以自该复数个第一专利文件数 据中,检索出复数个第二专利文件数据;由该伺服器接收第一选择指令,该第 一选择指令关联于该复数个第二专利文件数据中的第一选取专利文件数据;由 该伺服器根据该第一选择指令以自该第一选取专利文件数据中获得第一关键字 数据;由该伺服器至少根据该第一检索条件指令以及该第一关键字数据产生第 二检索条件指令,其中该第二检索条件指令包含该第一关键字数据;以及由该伺服器根据该第二检索条件指令以自该复数个第一专利文件数据中,检索出复 数个第三专利文件数据;其中该第一检索条件指令指示出第一检索条件,该伺 服器系基于该复数个第二专利文件数据均符合该第一检索条件,而自该复数个 第一专利文件数据中,检索出该复数个第二专利文件数据;其中该第二检索条 件指令指示出第二检索条件,该伺服器系基于该复数个第三专利文件数据均符 合该第二检索条件,而自该复数个第一专利文件数据中,检索出该复数个第三 专利文件数据。According to the purpose of the present invention, a patent retrieval method is further provided, which is applied to a patent retrieval system. The patent retrieval system includes a database and a server. The database stores a plurality of first patent document data. The server accesses the database, wherein The patent retrieval method includes the following steps: the server receives a first retrieval condition instruction, and retrieves a plurality of second patent document data from the plurality of first patent document data according to the first retrieval condition instruction; The server receives a first selection instruction, the first selection instruction is associated with the first selected patent document data among the plurality of second patent document data; the server selects from the first selection according to the first selection instruction obtaining the first keyword data from the patent document data; generating a second retrieval condition instruction according to at least the first retrieval condition instruction and the first keyword data by the server, wherein the second retrieval condition instruction includes the first keyword data; and the server retrieves a plurality of third patent document data from the plurality of first patent document data according to the second retrieval condition instruction; wherein the first retrieval condition instruction indicates a first retrieval condition, The server retrieves the plurality of second patent document data from the plurality of first patent document data based on the plurality of second patent document data meeting the first retrieval condition; wherein the second retrieval condition The instruction indicates a second retrieval condition, and the server retrieves the plurality of third patent documents from the plurality of first patent document data based on the plurality of third patent document data meeting the second retrieval condition data.
在本发明的较佳实施例中,该第一检索条件指令包含初始关键字数据,该 伺服器根据该第一检索条件指令以自该复数个第一专利文件数据中,检索出该 复数个第二专利文件数据以及复数个第四专利文件数据;其中各该复数个第二 专利文件数据分别包含发明名称数据、摘要数据以及权利要求书数据,各该复 数个第二专利文件数据所对应的该发明名称数据、该摘要数据以及该权利要求 书数据其中一者具有该初始关键字数据;其中各该复数个第四专利文件数据均 具有该初始关键字数据。In a preferred embodiment of the present invention, the first retrieval condition command includes initial keyword data, and the server retrieves the plurality of first patent document data from the plurality of first patent document data according to the first retrieval condition command Two patent document data and a plurality of fourth patent document data; wherein each of the plurality of second patent document data respectively includes invention title data, abstract data and claim data, and each of the plurality of second patent document data corresponds to the One of the title of invention data, the abstract data and the claims data has the initial keyword data; wherein each of the plurality of fourth patent document data has the initial keyword data.
在本发明的较佳实施例中,该第一选择指令关联于相关标签数据,且其中 各该复数个第三专利文件数据均具有该第一关键字数据。In a preferred embodiment of the present invention, the first selection instruction is associated with relevant tag data, and each of the plurality of third patent document data has the first keyword data.
在本发明的较佳实施例中,该第一选取专利文件数据具有专利分类号数据, 且该第一选择指令关联于相关标签数据;其中该伺服器至少系根据该第一检索 条件指令、该第一关键字数据以及该专利分类号数据以产生第二检索条件指令, 且该第二检索条件指令包含该专利分类号数据;其中该复数个第三专利文件数 据均具有该第一关键字数据以及该专利分类号数据。In a preferred embodiment of the present invention, the first selected patent document data has patent classification number data, and the first selection command is associated with related label data; wherein the server is at least based on the first retrieval condition command, the The first keyword data and the patent classification number data to generate a second retrieval condition instruction, and the second retrieval condition instruction includes the patent classification number data; wherein the plurality of third patent document data all have the first keyword data And the patent classification number data.
在本发明的较佳实施例中,该专利检索方法进一步包含:在该伺服器检索 出该复数个第三专利文件数据之前,由该伺服器根据删除指令以将该第一关键 字数据自该第二检索条件指令中删除。In a preferred embodiment of the present invention, the patent retrieval method further includes: before the server retrieves the plurality of third patent document data, the server deletes the first keyword data from the Deleted in the second search condition instruction.
在本发明的较佳实施例中,该专利检索方法进一步包含:由该伺服器接收 第二选择指令,该第二选择指令关联于该复数个第二专利文件数据中的第二选 取专利文件数据;以及由该伺服器根据该第二选择指令以自该第二选取专利文 件数据中获得第二关键字数据,该第一关键字数据相同于该第二关键字数据; 其中该伺服器至少系根据该第一检索条件指令、该第一关键字数据以及该第二 关键字数据以产生该第二检索条件指令,且该伺服器至少系基于该第一关键字 数据相同于该第二关键字数据以产生该第二检索条件指令;其中该第一选择指 令以及该第二选择指令均关联于相关标签数据,且其中该复数个第三专利文件 数据均具有该第一关键字数据。In a preferred embodiment of the present invention, the patent retrieval method further includes: receiving a second selection instruction by the server, and the second selection instruction is associated with the second selected patent document data among the plurality of second patent document data ; and obtaining second keyword data from the second selected patent document data by the server according to the second selection instruction, the first keyword data being the same as the second keyword data; wherein the server is at least Generate the second retrieval condition instruction according to the first retrieval condition instruction, the first keyword data and the second keyword data, and the server is based at least on the basis that the first keyword data is the same as the second keyword data to generate the second retrieval condition instruction; wherein both the first selection instruction and the second selection instruction are associated with relevant label data, and wherein the plurality of third patent document data all have the first keyword data.
在本发明的较佳实施例中,该专利检索方法进一步包含:由该伺服器接收 第三选择指令,该第三选择指令关联于该复数个第二专利文件数据中的第三选 取专利文件数据,且该第三选取专利文件数据不具有该第一关键字数据;其中 该第一选择指令关联于非相关标签数据,该第三选择指令关联于相关标签数据; 其中该伺服器至少系基于该第一选择指令关联于该非相关标签数据,该第三选 择指令关联于该相关标签数据,且该第三选取专利文件数据不具有该第一关键 字数据而产生该第二检索条件指令;其中该复数个第三专利文件数据均不具有 该第一关键字数据。In a preferred embodiment of the present invention, the patent retrieval method further includes: the server receives a third selection command, the third selection command is associated with the third selected patent document data among the plurality of second patent document data , and the third selected patent document data does not have the first keyword data; wherein the first selection command is associated with non-related tag data, and the third selection command is associated with relevant tag data; wherein the server is at least based on the The first selection instruction is associated with the non-related tag data, the third selection instruction is associated with the relevant tag data, and the third selected patent document data does not have the first keyword data to generate the second retrieval condition instruction; wherein None of the plurality of third patent document data has the first keyword data.
在本发明的较佳实施例中,该专利检索方法进一步包含:由该伺服器接收 第三选择指令,该第三选择指令关联于该复数个第二专利文件数据中的第三选 取专利文件数据,且该第三选取专利文件数据不具有该第一关键字数据;由该 伺服器接收第四选择指令,该第四选择指令关联于该复数个第二专利文件数据 中的第四选取专利文件数据;以及由该伺服器根据该第四选择指令以自该第四 选取专利文件数据中获得第四关键字数据,该第四关键字数据相同于该第一关 键字数据;其中该第一选择指令关联于非相关标签数据,该第三选择指令关联 于相关标签数据;其中该第四选择指令关联于该非相关标签数据;其中该伺服 器至少系基于该第一选择指令关联于该非相关标签数据,该第三选择指令关联 于该相关标签数据,且该第三选取专利文件数据不具有该第一关键字数据而产 生该第二检索条件指令;其中该伺服器至少系基于该第四选择指令关联于该非 相关标签数据,且该第四关键字数据相同于该第一关键字数据而产生该第二检 索条件指令;其中该复数个第三专利文件数据均不具有该第一关键字数据。In a preferred embodiment of the present invention, the patent retrieval method further includes: the server receives a third selection command, the third selection command is associated with the third selected patent document data among the plurality of second patent document data , and the third selected patent document data does not have the first keyword data; a fourth selection instruction is received by the server, and the fourth selection instruction is associated with the fourth selected patent document among the plurality of second patent document data data; and the server obtains fourth keyword data from the fourth selected patent document data according to the fourth selection instruction, the fourth keyword data is the same as the first keyword data; wherein the first selection The command is associated with non-related tag data, the third selection command is associated with relevant tag data; wherein the fourth selection command is associated with the non-related tag data; wherein the server is associated with the non-related tag data based at least on the first selection command tag data, the third selection instruction is associated with the related tag data, and the third selected patent document data does not have the first keyword data to generate the second retrieval condition instruction; wherein the server is at least based on the fourth A selection instruction is associated with the non-related tag data, and the fourth keyword data is the same as the first keyword data to generate the second retrieval condition instruction; wherein none of the plurality of third patent document data has the first key word data.
在本发明的较佳实施例中,该专利检索方法进一步包含:由该伺服器接收 第三选择指令,该第三选择指令关联于该复数个第二专利文件数据中的第三选 取专利文件数据,且该第三选取专利文件数据不具有该第一关键字数据;由该 伺服器接收第四选择指令,该第四选择指令关联于该复数个第二专利文件数据 中的第四选取专利文件数据;由该伺服器根据该第四选择指令以自该第四选取 专利文件数据中获得第四关键字数据,该第四关键字数据相同于该第一关键字 数据;以及由该伺服器接收第五选择指令,该第五选择指令关联于该复数个第 二专利文件数据中的第五选取专利文件数据,且该第五选取专利文件数据不具 有该第一关键字数据;其中该第一选择指令关联于非相关标签数据,该第三选择指令关联于相关标签数据;其中该第四选择指令关联于该非相关标签数据; 其中该第五选择指令关联于该相关标签数据;其中该伺服器至少系基于该第一 选择指令关联于该非相关标签数据,该第三选择指令关联于该相关标签数据, 且该第三选取专利文件数据不具有该第一关键字数据而产生该第二检索条件指 令;其中该伺服器至少系基于该第四选择指令关联于该非相关标签数据,且该 第四关键字数据相同于该第一关键字数据而产生该第二检索条件指令;其中该 伺服器至少系基于该第五选择指令关联于该相关标签数据,且该第五选取专利 文件数据不具有该第一关键字数据而产生该第二检索条件指令;其中该复数个 第三专利文件数据均不具有该第一关键字数据。In a preferred embodiment of the present invention, the patent retrieval method further includes: the server receives a third selection command, the third selection command is associated with the third selected patent document data among the plurality of second patent document data , and the third selected patent document data does not have the first keyword data; a fourth selection instruction is received by the server, and the fourth selection instruction is associated with the fourth selected patent document among the plurality of second patent document data data; the server obtains fourth keyword data from the fourth selected patent document data according to the fourth selection command, the fourth keyword data is the same as the first keyword data; and is received by the server a fifth selection instruction, the fifth selection instruction is associated with the fifth selected patent document data among the plurality of second patent document data, and the fifth selected patent document data does not have the first keyword data; wherein the first The selection command is associated with non-related tag data, the third selection command is associated with relevant tag data; wherein the fourth selection command is associated with the non-related tag data; wherein the fifth selection command is associated with the relevant tag data; wherein the servo The processor generates the second based at least on the basis that the first selection command is associated with the non-relevant tag data, the third selection command is associated with the relevant tag data, and the third selected patent document data does not have the first keyword data. A retrieval condition instruction; wherein the server generates the second retrieval condition instruction based at least on the basis that the fourth selection instruction is associated with the irrelevant tag data, and the fourth keyword data is the same as the first keyword data; wherein the The server generates the second retrieval condition instruction based at least on the basis that the fifth selection instruction is associated with the relevant tag data, and the fifth selected patent document data does not have the first keyword data; wherein the plurality of third patent documents None of the data has the first key data.
本发明前述各方面及其它方面依据下述的非限制性具体实施例详细说明 以及参照附随的说明书附图将更趋于明了。The foregoing and other aspects of the invention will become more apparent from the following detailed description of the non-limiting specific examples and with reference to the accompanying drawings.
附图说明Description of drawings
图1为本发明专利检索系统一具体实施例的系统架构图。FIG. 1 is a system architecture diagram of a specific embodiment of the patent retrieval system of the present invention.
图2A为本发明专利检索系统的检索页面一具体实施例的示意图。Fig. 2A is a schematic diagram of a specific embodiment of the search page of the patent search system of the present invention.
图2B为本发明专利检索系统的检索页面一具体实施例的示意图。Fig. 2B is a schematic diagram of a specific embodiment of the search page of the patent search system of the present invention.
图3为伺服器的关键字撷取部一具体实施例的示意图。FIG. 3 is a schematic diagram of a specific embodiment of a keyword extraction unit of a server.
图4为选取专利文件数据一具体实施例的示意图。FIG. 4 is a schematic diagram of a specific embodiment of selecting patent document data.
图5为本发明专利检索方法一具体实施例的流程图。Fig. 5 is a flowchart of a specific embodiment of the patent retrieval method of the present invention.
图6A为伺服器自选取专利文件数据中获得关键字数据的示意图。FIG. 6A is a schematic diagram of the server obtaining keyword data from selected patent document data.
图6B为伺服器自选取专利文件数据中获得关键字数据的示意图。FIG. 6B is a schematic diagram of the server obtaining keyword data from the selected patent document data.
其中,附图标记:Among them, reference signs:
100 专利检索系统100 patent search system
110 数据库110 database
120 伺服器120 servers
122 内部处理装置122 Internal processing unit
124 通讯装置124 communication device
200A 第二专利文件数据群200A Second patent document data group
200B 第三专利文件数据群200B The third patent document data group
210、220、230、240、250、260 选取专利文件数据210, 220, 230, 240, 250, 260 Select patent file data
211、212、213、215 关键字数据211, 212, 213, 215 Keyword data
222、232、242、252、262 关键字数据222, 232, 242, 252, 262 Keyword data
214、224、234、244、254、264 选择指令214, 224, 234, 244, 254, 264 selection commands
272、274 关键字数据272, 274 Keyword data
282 第一检索条件指令282 First search condition command
284 第二检索条件指令284 Second search condition command
300 伺服器300 servers
310 关键字撷取部310 Keyword Extraction Department
311 分词模组311 word segmentation module
312 词性标注模组312 Part of speech tagging module
313 依存句法剖析模组313 Dependency syntax analysis module
314 词形还原模组314 Lemmatization Module
315 命名实体识别模组315 named entity recognition module
316 分词重要性解析模组316 word segmentation importance analysis module
317 关键字排序模组317 Keyword sorting module
410 选取专利文件数据410 Select patent document data
412 专利分类号数据412 patent classification number data
500 专利检索方法500 Patent Search Methods
510、520、530、540、550 步骤510, 520, 530, 540, 550 steps
610 选取专利文件数据610 Select patent document data
620 选取专利文件数据620 Select patent document data
900 使用者装置900 user devices
具体实施方式Detailed ways
请参阅图1,其例示说明了根据本发明专利检索系统一具体实施例的系统 架构图。如图1所示实施例,专利检索系统100包含数据库110以及伺服器120, 伺服器120存取(或通讯连接)数据库110,且伺服器120可通讯连接一至多 个使用者装置900。其中,使用者装置900可例如为电脑、平板电脑、行动装 置等,但不以此为限,且使用者装置900可具有显示部(例如显示荧幕)。如此, 伺服器120即可通过使用者装置900的显示部,以将各种数据或指令显示予使 用者观看。在一具体实施例中,伺服器120系通过网路(例如有线网路或无线 网路等)以通讯连接使用者装置900。在一具体实施例中,本发明的专利检索 系统100包含一个或多个处理器,专利检索系统100并系以硬体与软体协同运 作的方式实施数据库110及/或伺服器120。在一具体实施例中,使用者装置900 可包含一个或多个处理器,使用者装置900并系以硬体与软体协同运作的方式 以传送、接收以及处理各种数据或指令。Referring to Fig. 1, it illustrates a system architecture diagram according to a specific embodiment of the patent retrieval system of the present invention. In the embodiment shown in FIG. 1 , the
在一具体实施例中,伺服器120可包含内部处理装置122以及通讯装置 124,内部处理装置122通讯连接通讯装置124以及数据库110,数据库110通 讯连接通讯装置124,伺服器120可通过通讯装置124以通讯连接使用者装置900。其中,伺服器120系通过通讯装置124以自使用者装置900接收各种数据 或指令,伺服器120并系通过通讯装置124以传送各种数据或指令至使用者装 置900。此外,伺服器120系通过内部处理装置122以对各种数据或指令进行 处理。较佳地,伺服器120包含一个或多个处理器,伺服器120并系以硬体与 软体协同运作的方式实施内部处理装置122及/或通讯装置124。In a specific embodiment, the
在图1所示实施例中,数据库110储存复数个第一专利文件数据(可称为 第一专利文件数据群)。较佳地,该复数个第一专利文件数据可包含不同国别或 不同领域的专利文件,且不以此为限。伺服器120可接收使用者所提供的第一 检索条件指令,并可进一步根据第一检索条件指令,以自复数个第一专利文件 数据中,检索(retrieve)出复数个第二专利文件数据(可称为第二专利文件数 据群)。其中,第一检索条件指令指示出第一检索条件,伺服器120系基于该复 数个第二专利文件数据均符合第一检索条件,而自该复数个第一专利文件数据 中,检索出该复数个第二专利文件数据。接着,伺服器120可将检索结果(即 该复数个第二专利文件数据)传送至使用者装置900,而通过使用者装置900 的显示部,即可将检索结果显示予使用者观看。使用者可阅读复数个第二专利 文件数据中的一至多篇专利文件数据(此可称为一至多篇选取专利文件数据), 并分别给予该一至多篇选取专利文件数据对应的选择指令。其中,该些选择指 令分别指示出其所对应的选取专利文件数据为相关专利(即使用者需要的专利) 或非相关专利(即使用者不需要的专利)。在一具体实施例中,与选取专利文件 数据相关连的选择指令可关联于相关标签数据或非相关标签数据。其中,相关 标签数据指示出选取专利文件数据为使用者需要的专利或使用者认为相关的专 利,而非相关标签数据指示出选取专利文件数据为使用者不需要或使用者认为 无关的专利。In the embodiment shown in FIG. 1 , the
伺服器120可根据该一至多篇选取专利文件数据以及其分别对应的选择指 令,以自该一至多篇选取专利文件数据中获得关键字数据。且伺服器120可至 少根据第一检索条件指令以及所获得的该关键字数据产生第二检索条件指令。 其中,该第二检索条件指令包含所获得的该关键字数据。接着,伺服器120可 根据第二检索条件指令以自复数个第一专利文件数据中,检索出复数个第三专 利文件数据(可称为第三专利文件数据群)。较佳地,第二检索条件指令指示出 第二检索条件,伺服器120系基于该复数个第三专利文件数据均符合该第二检 索条件,而自复数个第一专利文件数据中,检索出该复数个第三专利文件数据。 较佳地,第二检索条件包含第一检索条件。在一具体实施例中,第二检索条件 指令中的关键字数据系用于自复数个第一专利文件数据中检索出具有该关键字 数据的复数个专利文件数据(此处所称具有该关键字数据的专利文件数据,系 指该专利文件中,记载了与该关键字相同的字词)。在一具体实施例中,第二检 索条件指令中的关键字数据系用于自复数个第一专利文件数据中检索出不具有 该关键字数据的复数个专利文件数据。The
在一具体实施例中,第一检索条件指令包含使用者提供的初始关键字数据, 伺服器120根据第一检索条件指令以自复数个第一专利文件数据中,检索出复 数个第二专利文件数据。其中,该复数个第二专利文件数据均具有初始关键字 数据。在一具体实施例中,第一检索条件指令包含使用者提供的初始关键字数 据,伺服器120根据第一检索条件指令以自复数个第一专利文件数据中,检索 出复数个第二专利文件数据以及复数个第四专利文件数据(可称为第四专利文 件数据群)。其中,各复数个第二专利文件数据分别包含发明名称(title)数据、 摘要(abstract)数据、说明书(description)数据以及权利要求书(claim)数 据,各该复数个第二专利文件数据所对应的该发明名称数据、该摘要数据以及该权利要求书数据其中一者具有该初始关键字数据。而该复数个第四专利文件 数据均具有该初始关键字数据。亦即,若专利文件数据的发明名称数据、摘要 数据以及权利要求书数据其中一者具有初始关键字数据,则伺服器120将其列 为第二专利文件数据。而若专利文件数据具有初始关键字数据,但该专利文件 数据的发明名称数据、摘要数据以及权利要求书数据均不具有初始关键字数据, 则伺服器120将其列为第四专利文件数据。应了解,由于各个第二专利文件数 据为相关专利(即使用者需要的专利)的可能性较高,因此,在将第一检索条 件指令的检索结果(即该复数个第二专利文件数据以及该复数个第四专利文件数据)显示予使用者观看时,伺服器120可将该复数个第二专利文件数据显示 在较明显的地方,例如该复数个第二专利文件数据可排在前段,而该复数个第 四专利文件数据可排在后段,但不以此种显示方式为限。较佳地,可根据不同 的情况,提供不同的检索结果以供使用者观看及勾选。在一具体实施例中,当 使用者欲进行检准时,伺服器可根据第一检索条件指令,以将复数个第二专利 文件数据提供予使用者观看及勾选。而当使用者欲进行检全时,伺服器可根据 第一检索条件指令,以将复数个第二专利文件数据以及复数个第四专利文件数 据提供予使用者观看及勾选。In a specific embodiment, the first retrieval condition instruction includes initial keyword data provided by the user, and the
在一具体实施例中,伺服器120接收使用者提供的第一选择指令,该第一 选择指令关联于该复数个第二专利文件数据中的第一选取专利文件数据。伺服 器120并根据第一选择指令以自第一选取专利文件数据中获得第一关键字数 据。接着,伺服器120可至少根据第一检索条件指令以及第一关键字数据产生 第二检索条件指令,且第二检索条件指令包含第一关键字数据。伺服器120并 根据第二检索条件指令以自复数个第一专利文件数据中,检索出复数个第三专 利文件数据。在一具体实施例中,第一选择指令关联于相关标签数据(例如第 一选择指令可具有相关标签数据),而伺服器120检索出的各该复数个第三专利 文件数据均具有第一关键字数据。在一具体实施例中,在伺服器120检索出复 数个第三专利文件数据之前,伺服器120可将第二检索条件指令提供给使用者 观看并确认,并由使用者决定是否需保留第二检索条件指令中的各个关键字。 如此,当伺服器120根据选取专利文件以及对应的选择指令而获得多个关键字 数据时,即可由使用者进一步确认哪些关键字适合做为检索条件指令中的关键 字,并依此进行下一轮的检索。例如,使用者可在伺服器120检索出复数个第 三专利文件数据之前,提供删除指令予伺服器120,伺服器120可根据删除指 令以将第一关键字数据自该第二检索条件指令中删除。In a specific embodiment, the
在一具体实施例中,伺服器120接收使用者提供的第一选择指令,该第一 选择指令关联于该复数个第二专利文件数据中的第一选取专利文件数据,且第 一选择指令关联于相关标签数据。其中,该第一选取专利文件数据具有专利分 类号数据。伺服器120可根据第一选择指令以自第一选取专利文件数据中获得 第一关键字数据,且伺服器120可至少根据第一检索条件指令、第一关键字数 据以及专利分类号数据产生第二检索条件指令。其中,第二检索条件指令包含 第一关键字数据以及专利分类号数据。伺服器120并可根据第二检索条件指令 以自复数个第一专利文件数据中,检索出复数个第三专利文件数据。其中,伺 服器120检索出的各该复数个第三专利文件数据均具有第一关键字数据以及第 一选取专利文件数据的专利分类号数据。上述的专利分类号数据可例如为国际 专利分类号(International Patent Classification,IPC)、合作专利分类号 (ClassificationPatent Classification,CPC)或美国专利分类号(United States PatentClassification,UPC)等,但不以此为限。较佳地,专利分类号数据为阶 层式的专利分类号数据(亦即,专利分类号数据系采用阶层式分类以对各个专 利文件数据进行分类)。在不同具体实施例中,专利分类号数据至少包含第一阶 专利分类数据、第二阶专利分类数据、第三阶专利分类数据以及第四阶专利分 类数据,在不同具体实施例中,专利分类号数据至少包含第一阶专利分类数据、 第二阶专利分类数据、第三阶专利分类数据、第四阶专利分类数据以及第五阶 专利分类数据。在不同具体实施例中,第一选取专利文件数据的专利分类号数 据系指第二阶专利分类数据、第三阶专利分类数据、第四阶专利分类数据以及 第五阶专利分类数据其中一者。In a specific embodiment, the
在一具体实施例中,伺服器120接收使用者提供的第一选择指令与第二选 择指令。该第一选择指令关联于复数个第二专利文件数据中的第一选取专利文 件数据,该第二选择指令关联于复数个第二专利文件数据中的第二选取专利文 件数据。其中,第一选择指令以及该第二选择指令均关联于相关标签数据。伺 服器120可根据该第一选择指令以自第一选取专利文件数据中获得第一关键字 数据,且伺服器120可根据第二选择指令以自第二选取专利文件数据中获得第 二关键字数据。其中,第二关键字数据相同于第一关键字数据。伺服器120可 至少根据第一检索条件指令、第一关键字数据以及第二关键字数据以产生第二 检索条件指令,且伺服器120至少系基于第一关键字数据相同于第二关键字数 据而产生第二检索条件指令。伺服器120根据第二检索条件指令而检索出的复 数个第三专利文件数据均具有第一关键字数据。In a specific embodiment, the
在一具体实施例中,伺服器120接收使用者提供的第一选择指令与第三选 择指令,第一选择指令关联于非相关标签数据,而第三选择指令关联于相关标 签数据,该第一选择指令关联于复数个第二专利文件数据中的第一选取专利文 件数据,该第三选择指令关联于复数个第二专利文件数据中的第三选取专利文 件数据。伺服器120可根据该第一选择指令以自第一选取专利文件数据中获得 第一关键字数据。其中,第三选取专利文件数据不具有该第一关键字数据。伺 服器120可至少根据第一检索条件指令以及第一关键字数据产生第二检索条件 指令,且伺服器120至少系基于第一选择指令关联于非相关标签数据,第三选 择指令关联于相关标签数据,且第三选取专利文件数据不具有第一关键字数据 而产生该第二检索条件指令。伺服器120根据第二检索条件指令而检索出的复 数个第三专利文件数据均不具有第一关键字数据。In a specific embodiment, the
接续于前述具体实施例,在另一具体实施例中,伺服器120接收使用者提 供的第四选择指令,第四选择指令关联于复数个第二专利文件数据中的第四选 取专利文件数据,且第四选择指令关联于非相关标签数据。伺服器120根据第 四选择指令以自第四选取专利文件数据中获得第四关键字数据,该第四关键字 数据相同于第一关键字数据。其中,伺服器120至少系基于第四选择指令关联 于非相关标签数据,且第四关键字数据相同于第一关键字数据而产生该第二检 索条件指令。伺服器120根据第二检索条件指令而检索出的复数个第三专利文 件数据均不具有第一关键字数据。Continuing from the aforementioned specific embodiment, in another specific embodiment, the
接续于前述具体实施例,在又一具体实施例中,伺服器120接收使用者提 供的第五选择指令。第五选择指令关联于复数个第二专利文件数据中的第五选 取专利文件数据,且第五选取专利文件数据不具有第一关键字数据。其中,第 五选择指令关联于相关标签数据,且伺服器120至少系基于第五选择指令关联 于相关标签数据,且第五选取专利文件数据不具有第一关键字数据而产生第二 检索条件指令。此外,在另一具体实施例中,伺服器120可根据第三选择指令 以自第三选取专利文件数据中获得第三关键字数据,且伺服器120可根据第五 选择指令以自第五选取专利文件数据中获得第五关键字数据。其中,第三关键 字数据相同于第五关键字数据,伺服器120至少系根据第一检索条件指令、第 三关键字数据以及该第五关键字数据以产生第二检索条件指令,且伺服器至少 系基于第三关键字数据相同于第五关键字数据而产生该第二检索条件指令,该 第二检索条件指令包含该第三关键字数据。其中,伺服器120根据第二检索条 件指令而检索出的复数个第三专利文件数据均具有第三关键字数据(此处所描 述的复数个第三专利文件数据均具有第三关键字数据,系指该复数个第三专利 文件数据均具有与第三关键字数据相同的关键字数据)。Continuing from the foregoing embodiments, in yet another embodiment, the
在一具体实施例中,伺服器120系以语意分析的方式,以自选取专利文件 数据中获得(或撷取)关键字数据。其中所述的语意分析方式可为已知的语意 分析方式,在此不另赘述。在一具体实施例中,数据库110储存了各个专利文 件数据所对应的关键字数据(各个专利文件数据均可具有一至多个对应的关键 字数据),伺服器120可直接自数据库110抓取特定选取专利文件数据所对应的 关键字数据。在一具体实施例中,若所有关联于相关标签数据的选取专利文件 数据中均具有特定关键字数据,则专利检索系统100的伺服器120可将该特定 关键字数据列为建议用于限缩(即与逻辑运算子“and”合并使用)的关键字数据。而若所有关联于非相关标签数据的选取专利文件数据中均具有特定关键字 数据,且所有关联于相关标签数据的选取专利文件数据中均不具有该特定关键 字数据,则伺服器120可将该特定关键字数据列为建议用于排除(即与逻辑运 算子“not”合并使用)的关键字数据。In a specific embodiment, the
前述所述的关键字可为关键字(key word)或关键词(key phrase)。此外, 第一检索条件指令可包含关键字及/或专利国别及/或专利分类号,但不以此为 限。应了解,本发明的专利检索系统100在辅助使用者进行检索的过程中,系 可通过一至多轮的检索以逐步缩小目标专利群的数量。例如使用者可针对第一 轮的检索结果,将一至多个选择指令(各个的选择指令可包含相关标签数据或 非相关标签数据)分别关联于检索结果中的一至多个选取专利文件数据,并由 伺服器依据该一至多个选择指令以及对应的该一至多个选取专利文件数据,产 生下一轮的检索条件指令(第二检索条件指令)以及对应的检索结果(第二检 索结果)。接着,使用者可针对第二检索结果重复前述流程以得到第三检索结果, 并可针对第三检索结果重复前述流程以得到第四检索结果,依此类推。直至使 用者认为当前的目标专利文件数据的总数已可满足使用者的需求为止。The aforementioned keyword can be a keyword (key word) or a keyword (key phrase). In addition, the first search condition instruction may include keywords and/or patent country and/or patent classification number, but is not limited thereto. It should be understood that the
请参阅图2A以及图2B,其例示说明了根据本发明专利检索系统的检索页 面一具体实施例的示意图。如图2A所示实施例,本发明的专利检索系统的检 索页面可显示出专利检索系统根据第一检索条件指令282而检索出的第二专利 文件数据群200A(第二专利文件数据群200A即为复数个第二专利文件数据), 第二专利文件数据群200A包含了选取专利文件数据210、220、230、240、250、 260。其中,选取专利文件数据210具有关键字数据212,选取专利文件数据220 具有关键字数据222,选取专利文件数据230具有关键字数据232,选取专利文 件数据240具有关键字数据242,选取专利文件数据250具有关键字数据252, 选取专利文件数据260具有关键字数据262。选取专利文件数据220、230、260 分别具有关联于相关标签数据的选择指令224、234、264,选取专利文件数据 210、240、250分别具有关联于非相关标签数据的选择指令214、244、254。其 中,关键字数据222、232、262为相同的关键字数据(即关键字数据“skin”), 关键字数据212、242、252为相同的关键字数据(即关键字数据“cancer”), 且选取专利文件数据220、230、260、均不具有关键字数据“cancer”。此外, 选取专利文件数据210、220、230、240、250、260并非仅分别具有一个关键字 数据,而系分别具有一至多个关键字数据,例如选取专利文件数据210另具有 关键字数据211、213、215等。Please refer to Fig. 2A and Fig. 2B, which illustrates a schematic diagram of a specific embodiment of the search page of the patent search system according to the present invention. In the embodiment shown in FIG. 2A , the search page of the patent retrieval system of the present invention can display the second patent
如图2B所示实施例,本发明的专利检索系统可基于选取专利文件数据 220、230、260均具有关键字数据“skin”,而将关键字数据272列为建议用于 限缩的关键字数据(即建议将关键字数据“skin”与逻辑运算子“and”合并使 用)。此外,本发明的专利检索系统可基于选取专利文件数据210、240、250 均具有关键字数据“cancer”,且选取专利文件数据220、230、260均不具有关 键字数据“cancer”,而将关键字数据274列为建议用于排除的关键字数据(即 建议将关键字数据“cancer”与逻辑运算子“not”合并使用)。本发明的专利检 索系统可根据第一检索条件指令282、关键字数据“cancer”以及关键字数据 “skin”以产生第二检索条件指令284,本发明的专利检索系统并可根据第二检 索条件指令284以检索出第三专利文件数据群200B(第三专利文件数据群200B 即为复数个第三专利文件数据)。其中,第三专利文件数据群200B中的各个专 利文件数据均具有关键字数据“skin”,且第三专利文件数据群200B中的各个 专利文件数据均不具有关键字数据“cancer”In the embodiment shown in FIG. 2B , the patent retrieval system of the present invention can list the
请参阅图3,其例示说明了伺服器的关键字撷取部一具体实施例的示意图。 如图3所示实施例,本发明的专利检索系统的伺服器300包含关键字撷取部 310,关键字撷取部310包含分词模组(tokenizer module)311、词性标注模组 (tagger module)312、依存句法剖析模组(parser module)313、词形还原模组 (lemmatizer module)314、命名实体识别模组(entity recognizer module)315、 分词重要性解析模组(token scorer module)316以及关键字排序模组(keyword ranker module)317。其中,分词模组311通讯连接词性标注模组312,词性标 注模组312通讯连接依存句法剖析模组313,依存句法剖析模组313通讯连接词形还原模组314,词形还原模组314通讯连接命名实体识别模组315,命名实 体识别模组315通讯连接分词重要性解析模组316,分词重要性解析模组316 通讯连接关键字排序模组317。在一具体实施例中,分词模组311、词性标注模 组312、依存句法剖析模组313、词形还原模组314、命名实体识别模组315、 分词重要性解析模组316以及关键字排序模组317也可互相通讯连接。在一具 体实施例中,本发明的专利检索系统的伺服器300包含一个或多个处理器,伺 服器300并系以硬体与软体协同运作的方式实施分词模组311、词性标注模组312、依存句法剖析模组313、词形还原模组314、命名实体识别模组315、分 词重要性解析模组316以及关键字排序模组317。Please refer to FIG. 3 , which illustrates a schematic diagram of a specific embodiment of a keyword extraction unit of the server. In the embodiment shown in FIG. 3 , the
分词模组311可自专利文件数据中切分出分词(token),该分词可为单字 (word)或片语(phrase)。词性标注模组312可分析并标注分词的词性(例如 名词、动词等)。依存句法剖析模组313可对分词以及该分词对应的语句进行分 析,并标注各分词之间的句法依存相关性(dependency)。词形还原模组314可 将分词还原至基本型态(例如将“closed”还原为“close”)。命名实体识别模 组315可辨识出特定命名实体(例如辨识出“ApplicationProgramming Interface” 为特定命名实体)。分词重要性解析模组316可使用解析演算法,以针对各分词 在专利文件数据中的重要性进行评分或给予对应权重。其中,解析演算法可例 如为词语频率-逆文本频率(Term frequency-Inverse Document Frequency, TD-IDF)或TextRank等演算法,但不以此为限。关键字排序模组317可根据 各分词的重要性分数(例如权重)及/或特定条件,以对各分词进行排序,借以 挑选出专利文件数据中重要的关键字。其中,特定条件可例如为额外的模型预 测(model prediction),或是专利分类(patentcategory)等,但不以此为限。The
请参阅图4,其例示说明了选取专利文件数据一具体实施例的示意图。如 图4所示实施例,选取专利文件数据410可具有专利分类号数据412。其中, 专利分类号数据412具有第一阶专利分类数据(见专利分类号数据412的“B”)、 第二阶专利分类数据(见专利分类号数据412的“B27”)、第三阶专利分类数 据(见专利分类号数据412的“B27L”)、第四阶专利分类数据(见专利分类号 数据412的“B27L11”)以及第五阶专利分类数据(见专利分类号数据412的 “B27L11/005”)。Please refer to FIG. 4 , which illustrates a schematic diagram of a specific embodiment of selecting patent document data. As in the embodiment shown in FIG. 4 , the selected
请参阅图5,其例示说明了本发明专利检索方法一具体实施例的流程图。 如图5所示实施例,专利检索方法500应用于专利检索系统,该专利检索系统 包含数据库以及伺服器,该数据库储存复数个第一专利文件数据,该伺服器存 取该数据库。专利检索方法500开始于步骤510,由专利检索系统的伺服器接 收第一检索条件指令,并根据该第一检索条件指令以自该复数个第一专利文件 数据中,检索出复数个第二专利文件数据。其中,第一检索条件指令指示出第 一检索条件,该伺服器系基于该复数个第二专利文件数据均符合该第一检索条 件,而自该复数个第一专利文件数据中,检索出该复数个第二专利文件数据。接着,执行步骤520,由伺服器接收使用者提供的第一选择指令,该第一选择 指令关联于该复数个第二专利文件数据中的第一选取专利文件数据。接着,执 行步骤530,由伺服器根据第一选择指令以自第一选取专利文件数据中获得第 一关键字数据。接着,执行步骤540,由伺服器至少根据第一检索条件指令以 及第一关键字数据产生第二检索条件指令。其中,第二检索条件指令包含该第 一关键字数据。接着,执行步骤550,由伺服器根据第二检索条件指令以自该 复数个第一专利文件数据中,检索出复数个第三专利文件数据。其中,第二检索条件指令指示出第二检索条件,伺服器系基于该复数个第三专利文件数据均 符合第二检索条件,而自该复数个第一专利文件数据中,检索出该复数个第三 专利文件数据。在一具体实施例中,第一选择指令关联于相关标签数据,且该 复数个第三专利文件数据中的每一者均具有第一关键字数据。Please refer to FIG. 5 , which illustrates a flow chart of a specific embodiment of the patent retrieval method of the present invention. In the embodiment shown in Figure 5, the
在一具体实施例中,专利检索方法500进一步包含:在伺服器检索出复数 个第三专利文件数据之前,由伺服器根据使用者提供的删除指令以将第一关键 字数据自第二检索条件指令中删除。在一具体实施例中,第一检索条件指令包 含初始关键字数据,该伺服器根据第一检索条件指令以自该复数个第一专利文 件数据中,检索出复数个第二专利文件数据以及复数个第四专利文件数据。其 中,该复数个第二专利文件数据中的每一者分别包含发明名称数据、摘要数据 以及权利要求书数据,该复数个第二专利文件数据中的每一者所对应的该发明 名称数据、该摘要数据以及该权利要求书数据其中一者具有该初始关键字数据。 并且,复数个第四专利文件数据中的每一者均具有该初始关键字数据。In a specific embodiment, the
在一具体实施例中,第一选取专利文件数据具有专利分类号数据,且第一 选择指令关联于相关标签数据。伺服器至少系根据第一检索条件指令、第一关 键字数据以及第一选取专利文件数据的专利分类号数据以产生第二检索条件指 令,且第二检索条件指令包含第一关键字数据以及该专利分类号数据。其中, 伺服器根据第二检索条件指令所检索出的该复数个第三专利文件数据均具有该 第一关键字数据以及该专利分类号数据。In one embodiment, the first selected patent document data has patent classification number data, and the first selection command is associated with the associated tag data. The server at least generates a second retrieval condition instruction according to the first retrieval condition instruction, the first keyword data and the patent classification number data of the first selected patent document data, and the second retrieval condition instruction includes the first keyword data and the Patent classification number data. Wherein, the plurality of third patent document data retrieved by the server according to the second retrieval condition command all have the first keyword data and the patent classification number data.
在一具体实施例中,专利检索方法500进一步包含:由伺服器接收使用者 提供的第二选择指令,该第二选择指令关联于该复数个第二专利文件数据中的 第二选取专利文件数据。其中,第一选择指令以及该第二选择指令均关联于相 关标签数据。专利检索方法500并进一步包含:由伺服器根据第二选择指令以 自第二选取专利文件数据中获得第二关键字数据,该第一关键字数据相同于该 第二关键字数据。其中,该伺服器至少系根据第一检索条件指令、第一关键字 数据以及第二关键字数据以产生第二检索条件指令,且该伺服器至少系基于第 一关键字数据相同于第二关键字数据以产生该第二检索条件指令。同时,该伺 服器检索出的该复数个第三专利文件数据均具有该第一关键字数据。In a specific embodiment, the
在一具体实施例中,专利检索方法500进一步包含:由伺服器接收使用者 提供的第三选择指令,该第三选择指令关联于该复数个第二专利文件数据中的 第三选取专利文件数据,且该第三选取专利文件数据不具有该第一关键字数据。 其中,第一选择指令关联于非相关标签数据,第三选择指令关联于相关标签数 据。伺服器至少系基于第一选择指令关联于非相关标签数据,第三选择指令关 联于相关标签数据,且第三选取专利文件数据不具有该第一关键字数据而产生 该第二检索条件指令。此外,该复数个第三专利文件数据均不具有第一关键字 数据。In a specific embodiment, the
接续于前述具体实施例,在另一具体实施例中,专利检索方法500进一步 包含:由伺服器接收使用者提供的第四选择指令,该第四选择指令关联于该复 数个第二专利文件数据中的第四选取专利文件数据。专利检索方法500并进一 步包含:由伺服器根据第四选择指令以自第四选取专利文件数据中获得第四关 键字数据,该第四关键字数据相同于该第一关键字数据。其中,第四选择指令 关联于非相关标签数据,伺服器至少系基于第四选择指令关联于非相关标签数 据,且第四关键字数据相同于第一关键字数据而产生该第二检索条件指令。Continuing from the foregoing specific embodiment, in another specific embodiment, the
接续于前述具体实施例,在又一具体实施例中,专利检索方法500进一步 包含:由伺服器接收使用者提供的第五选择指令,该第五选择指令关联于该复 数个第二专利文件数据中的第五选取专利文件数据,且第五选取专利文件数据 不具有第一关键字数据。其中,第五选择指令关联于相关标签数据,伺服器至 少系基于第五选择指令关联于相关标签数据,且第五选取专利文件数据不具有 第一关键字数据而产生第二检索条件指令。Continuing from the foregoing specific embodiments, in yet another specific embodiment, the
请参阅图6A以及图6B,其分别例示说明了伺服器自选取专利文件数据中 获得关键字数据的不同具体实施例的示意图。如图6A所示实施例,本发明的 专利检索系统的伺服器可自选取专利文件数据610中获得(或撷取)多个关键 字数据。如图6B所示实施例,本发明的专利检索系统的伺服器可自选取专利 文件数据620中获得(或撷取)多个关键字数据。应了解,图6A以及图6B仅 为范例,伺服器所撷取的关键字可不只为图中所示。另外,在一具体实施例中, 伺服器并非仅可撷取选取专利文件数据中的关键字,而系可视需求撷取各个专 利文件数据中的关键字。在另一具体实施例中,伺服器可先撷取各个专利文件 数据中的关键字数据,并将各篇专利文件数据中的关键字数据储存至数据库中。 如此,伺服器即可在接收选择指令(该选择指令关联于特定的选取专利文件数 据)时,根据选择指令以至数据库中获取对应的关键字数据。Please refer to FIG. 6A and FIG. 6B , which respectively illustrate schematic diagrams of different specific embodiments for the server to obtain keyword data from the selected patent document data. In the embodiment shown in FIG. 6A, the server of the patent retrieval system of the present invention can obtain (or extract) multiple keyword data from the selected
至此,本发明的专利检索系统及其方法已经由上述说明及说明书附图加以 说明。然应了解,本发明的各个具体实施例仅是做为说明之用,在不脱离本发 明权利要求书与精神下可进行各种改变,且均应包含于本发明的范围中。因此, 本说明书所描述的各具体实施例并非用以限制本发明,本发明的真实范围与精 神公开于以下权利要求书。So far, the patent retrieval system and its method of the present invention have been described by the above description and accompanying drawings. However, it should be understood that the various specific embodiments of the present invention are only used for illustration, and various changes can be made without departing from the claims and spirit of the present invention, and all should be included in the scope of the present invention. Therefore, the specific embodiments described in the specification are not intended to limit the present invention, and the true scope and spirit of the present invention are disclosed in the following claims.
Claims (18)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111484652.3A CN116303873A (en) | 2021-12-07 | 2021-12-07 | Patent Retrieval System and Its Method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111484652.3A CN116303873A (en) | 2021-12-07 | 2021-12-07 | Patent Retrieval System and Its Method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN116303873A true CN116303873A (en) | 2023-06-23 |
Family
ID=86794655
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202111484652.3A Pending CN116303873A (en) | 2021-12-07 | 2021-12-07 | Patent Retrieval System and Its Method |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN116303873A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116483851A (en) * | 2022-01-14 | 2023-07-25 | 科科实验股份有限公司 | Patent retrieval system and method thereof |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1497479A (en) * | 2002-10-17 | 2004-05-19 | ���µ�����ҵ��ʽ���� | Data retrieval device capable of searching with higher precision than before |
| JP2004158002A (en) * | 2002-10-17 | 2004-06-03 | Matsushita Electric Ind Co Ltd | Data retrieval device |
| TWI605355B (en) * | 2016-05-25 | 2017-11-11 | Rakuten Inc | Search devices, retrieval methods, programs, and non-transitory computer-readable information recording media |
| CN111339243A (en) * | 2020-02-29 | 2020-06-26 | 江苏润桐数据服务有限公司 | Method and device for denoising and checking retrieval data based on competitive product information |
| CN111353023A (en) * | 2020-03-02 | 2020-06-30 | 江苏润桐数据服务有限公司 | Target database optimization method and device based on keyword retrieval |
-
2021
- 2021-12-07 CN CN202111484652.3A patent/CN116303873A/en active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1497479A (en) * | 2002-10-17 | 2004-05-19 | ���µ�����ҵ��ʽ���� | Data retrieval device capable of searching with higher precision than before |
| JP2004158002A (en) * | 2002-10-17 | 2004-06-03 | Matsushita Electric Ind Co Ltd | Data retrieval device |
| TWI605355B (en) * | 2016-05-25 | 2017-11-11 | Rakuten Inc | Search devices, retrieval methods, programs, and non-transitory computer-readable information recording media |
| CN111339243A (en) * | 2020-02-29 | 2020-06-26 | 江苏润桐数据服务有限公司 | Method and device for denoising and checking retrieval data based on competitive product information |
| CN111353023A (en) * | 2020-03-02 | 2020-06-30 | 江苏润桐数据服务有限公司 | Target database optimization method and device based on keyword retrieval |
Non-Patent Citations (1)
| Title |
|---|
| 傅立云: "国内外三大专利检索系统比较研究", CNKI, 31 December 2010 (2010-12-31) * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116483851A (en) * | 2022-01-14 | 2023-07-25 | 科科实验股份有限公司 | Patent retrieval system and method thereof |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7739258B1 (en) | Facilitating searches through content which is accessible through web-based forms | |
| US9558264B2 (en) | Identifying and displaying relationships between candidate answers | |
| CA2774278C (en) | Methods and systems for extracting keyphrases from natural text for search engine indexing | |
| US7567906B1 (en) | Systems and methods for generating an annotation guide | |
| US10552467B2 (en) | System and method for language sensitive contextual searching | |
| CN110888990A (en) | Text recommending methods, devices, equipment and media | |
| CN107958014B (en) | Search engine | |
| US20090070322A1 (en) | Browsing knowledge on the basis of semantic relations | |
| US20100191740A1 (en) | System and method for ranking web searches with quantified semantic features | |
| CN107085583B (en) | Electronic document management method and device based on content | |
| US10592571B1 (en) | Query modification based on non-textual resource context | |
| CN107967290A (en) | A kind of knowledge mapping network establishing method and system, medium based on magnanimity scientific research data | |
| WO2016179938A1 (en) | Method and device for question recommendation | |
| EP2577521A2 (en) | Detection of junk in search result ranking | |
| US20150206101A1 (en) | System for determining infringement of copyright based on the text reference point and method thereof | |
| CA2853627A1 (en) | Automatic creation of clinical study reports | |
| CN102521321A (en) | Video search method based on search term ambiguity and user preferences | |
| US20250061139A1 (en) | Systems and methods for semantic search scoping | |
| US20120317125A1 (en) | Method and apparatus for identifier retrieval | |
| CN103942232B (en) | For excavating the method and apparatus being intended to | |
| Blanco et al. | Overview of NTCIR-13 Actionable Knowledge Graph (AKG) Task. | |
| CN116303873A (en) | Patent Retrieval System and Its Method | |
| TW202316291A (en) | Patent search system and method thereof | |
| CN112269852A (en) | Method, system and storage medium for generating public opinion topic | |
| CN107818092B (en) | Document processing method and device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |