[go: up one dir, main page]

WO2013008978A1 - Object identification result searching system and method - Google Patents

Object identification result searching system and method Download PDF

Info

Publication number
WO2013008978A1
WO2013008978A1 PCT/KR2011/007357 KR2011007357W WO2013008978A1 WO 2013008978 A1 WO2013008978 A1 WO 2013008978A1 KR 2011007357 W KR2011007357 W KR 2011007357W WO 2013008978 A1 WO2013008978 A1 WO 2013008978A1
Authority
WO
WIPO (PCT)
Prior art keywords
entity
identification result
group
identifier
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/KR2011/007357
Other languages
French (fr)
Korean (ko)
Inventor
김평
정한민
이미경
이승우
서동민
김진형
성원경
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Korea Institute of Science and Technology KIST
Korea Institute of Science and Technology Information KISTI
Original Assignee
Korea Institute of Science and Technology KIST
Korea Institute of Science and Technology Information KISTI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Korea Institute of Science and Technology KIST, Korea Institute of Science and Technology Information KISTI filed Critical Korea Institute of Science and Technology KIST
Publication of WO2013008978A1 publication Critical patent/WO2013008978A1/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Definitions

  • the present invention relates to an object identification result retrieval system and method, and more particularly, when a query is input, the identification result of the query is obtained from a triple storage module, and the obtained identification result is obtained from the multiple ontology database. It is determined whether the object identification is necessary by comparing with the identification result of the query, and when the object identification is required, the object of the query is identified by acquiring and comparing the attribute information of the object to be identified, and the result information according to the object identification.
  • the present invention has been made to solve the above problems, and an object of the present invention is a system and method for retrieving an entity identification result that can gradually identify various types of entities using attribute information of multiple ontology included in linked data. To provide.
  • Another object of the present invention is to group the ontology into the same type and object by using the attribute information of multiple ontologies, and to improve the accuracy of the same object identification by identifying the object through the comparison of the main property of each group, as well as compared to the external service
  • An object identification result retrieval system and method capable of supporting a gradual entity identification function targeting only URIs added through the present invention is provided.
  • Another object of the present invention is to identify an entity that a user can identify the entity-URI grant status and related attributes of the linked data by searching for the entity name or URI, and recommend the entity name or URI for linkage with the retained data. To provide a result retrieval system and method.
  • Another object of the present invention is to be able to edit dynamically identified entity identification results, and to use the edit results to identify added URIs, enabling fast, accurate identification of incrementally increasing URIs, and allowing users to identify entities.
  • the present invention provides a system and method for identifying an object identification result that can visually confirm a result, correct a result, and provide a management service in which the modified result is immediately reflected in the object identification.
  • the identification result of the query is obtained from the triple storage module.
  • the identification result is compared with the identification result of the query word obtained from the multiple ontology database to determine whether individual identification is required, and if individual identification is required, the attribute information of the object to be identified is acquired and compared from the multiple ontology database.
  • An entity identification result retrieval system including an entity identification result retrieval apparatus for identifying entities for a query and providing result information according to the entity identification is provided.
  • the triple storage module stores object identification results for each entity in triple format.
  • the entity identification result retrieval apparatus compares the entity identifier list based on the identification result from the triple storage module with the entity identifier list based on the identification result from the multiple ontology database, and compares the entity identifier obtained from the multiple ontology database. If a new entity identifier is included in the list, it is determined that the entity identification is necessary and the new entity identifier is used as the entity to be identified.
  • the object identification result retrieval apparatus is grouped according to the object type using the attribute indicating the type in the attribute information of the object to be identified obtained from the multiple ontology database, and according to the object type based on the representative attribute of each object
  • the property values of the entities for each of the regrouped groups are obtained and compared from the multiple ontology database, and the groups are divided into subgroups based on the comparison result. Create an entity identifier group for the.
  • the entity identification result retrieval apparatus selects a representative entity identifier or a representative entity name for each entity identifier group for the query, and includes at least one of the number of entities, entity type, representative entity name, and representative entity identifier for each entity identifier group. Provides the entity identifier group summary information including the result information according to the entity identification.
  • the object identification result search apparatus may store and update the edited information as the object identification result in the triple storage module when the editing by at least one of the modification, deletion, and movement of the object identification result is performed, and the update is performed.
  • the identified individual identification result is used later for identifying the query.
  • An entity identifier list comparison module for comparing the entity identifier list according to the identification result of the query word obtained from the multi- ontology database with the entity identifier list comparison module, the result obtained from the multiple ontology database
  • the entity identification for the query is performed by obtaining and comparing attribute information on the new entity identifier, and the entity identifier group for the query is determined by the entity identification.
  • An object identification result retrieval apparatus including a visualization module obtained from a module and visualized is provided.
  • the entity identification result retrieval apparatus stores and updates the edit result as the entity identification result in the triple storage module when the editing by at least one of the visible, individual identification result is performed by the modification, deletion, and movement.
  • the updated entity identification result may further include an editing module for later use in entity identification for the query.
  • the entity identifier list comparison module collects the identification result of the query word from the multiple ontology database and makes it visible through the visualization module when the identification result of the query word does not exist in the triple storage module.
  • the triple storage module stores entity identifier group summary information and edited entity identifier group summary information for each entity.
  • the query is in the form of an entity name or URI.
  • the entity identification module obtains the attribute information of the new entity identifier from the multiple ontology database, groups the entity based on the entity type, regroups the entity based on the representative attribute of each entity for each group according to the entity type, and then regroups the entity.
  • An association attribute value of the entities for each grouped group is obtained and compared from the multiple ontology database, and the individual identifier group for the query is determined by dividing each group into subgroups based on the comparison result.
  • the representative name selection module selects a representative identifier or a representative entity name for each group by using the generated entity identifier and the statistical value of the entity name for each generated entity identifier group.
  • the information on the entity identification result includes entity identifier group summary information including at least one of entity number, entity type, representative entity name, and representative entity identifier for each entity identifier group.
  • the visualization module may include an object identification result providing screen including at least one of a query input area, an ontology database association command, an object identifier group summary list, an object identifier group summary graph, a detailed object identifier list for each group, an identification command, and an editing command.
  • the identification command is selected on the object identification result providing screen
  • information about the updated object identification result is output to the triple storage module, and when one object identifier list is selected from the object identifier list for each group, The verification result is output in a predetermined area of the object identification result providing screen.
  • Editing of at least one of the representative entity name or representative entity identifier of the entity identifier group merging different groups, dividing one group into different groups, and moving an entity identifier belonging to a specific group to another group by the editing command To perform.
  • a method for providing an individual identification result for a query by the object identification result retrieval apparatus (a) when a query is input, it is determined whether the identification result for the query exists in the triple storage module. (B) comparing the identification result of the query word obtained from the triple storage module with the identification result of the query word obtained from a multiple ontology database, if the determination result exists; When the comparison result includes the new entity identifier included in the identification result obtained from the multiple ontology database, the entity identification for the query is performed by acquiring and comparing attribute information on the new entity identifier, and by the entity identification Generating an entity identifier group for the query, (d) the generated entity expression Now select and apply the representative name for each group and the individual identifying how to search results were applied to the representative object identification result storing and updating in the triple storage module is provided.
  • the individual identification result searching method may further include obtaining and visualizing the information on the individual identification result from the triple storage module.
  • the object identification result retrieval method may further include storing and updating the edited result as an object identification result in the triple storage module when editing by at least one of the modified, deleted, and moved of the visualized object identification result is performed. It may further include.
  • the identification result of the query word is collected and visualized from the multiple ontology database.
  • Step (b) compares the entity identifier list based on the identification result from the triple storage module and the entity identifier list based on the identification result from the multiple ontology database.
  • the query may be in the form of an entity name or a URI.
  • the attribute information of the new entity identifier is obtained from the multiple ontology database and grouped based on the entity type, and grouped again based on the representative attribute of each entity for each group according to the entity type. Relevant attribute values of entities for each regrouped group are obtained and compared from the multiple ontology database, and each group is divided into subgroups based on the comparison result to determine an entity identifier group for the query. .
  • the representative identifier or representative entity name for each group is selected by using the generated entity identifier and the statistical value of the entity name for each entity group.
  • the information on the entity identification result includes entity identifier group summary information including at least one of entity number, entity type, representative entity name, and representative entity identifier for each entity identifier group.
  • various types of entities may be gradually identified by using attribute information of multiple ontologies included in linked data.
  • the ontology is grouped into the same type and object by using the property information of multiple ontology, and the object is identified through the comparison of the main property of each group to improve the accuracy of identifying the same object and added by comparing with the external service. Only URIs can be supported for progressive object identification.
  • a user can check the object-URI grant status and related attributes of linked data by searching for an object name or a URI, and recommend an object name or URI for linkage with retained data.
  • the URI management service allows you to dynamically modify and delete object-URI relationships, as well as select representative URIs and representative object names, and identify object identification results by applying object identification algorithms. By increasing the consistency, you can maximize the efficiency of the semantic web.
  • FIG. 1 is a diagram showing an object identification result retrieval system according to the present invention.
  • Figure 2 is a block diagram schematically showing the configuration of the object identification result search apparatus according to the present invention.
  • FIG. 3 is a block diagram specifically illustrating the entity identification module shown in FIG. 2;
  • FIG. 4 is a flowchart illustrating a method for retrieving and providing an entity identification result by the entity identification result retrieval apparatus according to the present invention.
  • FIG. 5 is a flowchart illustrating a method for identifying an object by the object identification result retrieval apparatus according to the present invention.
  • FIG. 6 is an exemplary view showing an object identification result search screen according to the present invention.
  • Linked Data is a movement and code of conduct for the data network at the heart of the next generation of the Web. The goal is to open and connect data freely on the web, and to enable these data to collaborate again to realize a true data web. Therefore, HTTP (hypertext transfer protocol) is used for data distribution on the web, and Resource Description Framework (RDF) and Simple Protocol and RDF Query Language (SPARQL) are used to ensure connectivity and accessibility, which is included in the ontology.
  • RDF Resource Description Framework
  • SPARQL Simple Protocol and RDF Query Language
  • This is a standard query language used for querying collected information. It performs functions similar to the structured query language (SQL) of the database management system (DBMS).
  • Linked Data names specific concepts as Uniform Resource Identifiers (URIs), allows access to resources named as URIs over HTTP, and provides detailed information contained by RDF-based URIs when accessed. It provides access to other relevant concepts contained in RDF.
  • URIs Uniform Resource Identifiers
  • URIs are identifiers of classes, properties, and entities that are mapped to unique addresses on the Web to share information resources over the Web. In other words, it is an internet address and identifier used to access information of a class, property, or object through a URL.
  • the URI is used in the term entity identifier.
  • Ontology is constructed by defining concepts and attributes and establishing the relationship between concepts and concepts by obtaining knowledge about the components of ontology that is to be constructed in ontology from related documents of specific field, namely concept, property of concept, connection relation between concepts.
  • concepts are represented by URIs.
  • the "Person" class is represented in the ontology as a URI such as "http://www.etri.re.kr/example#Person".
  • the "Person” class has properties such as name, age, birthplace, and so on.
  • the "name” attribute can have a string as its value
  • the "age” attribute can have an integer as its value
  • the "birthplace” attribute can have an instance of "Location” as its value. have.
  • Entity identification refers to the explicit establishment of a relationship to a URI in order to ensure that the classes, properties, and entities that make up the ontology are interrelated. For example, if the A-1 entity of ontology A is the same as the B-1 entity of ontology B, you can merge A-1 and B-1 related properties by specifying that the A-1 and B-1 entities have the same relationship. To be able.
  • FIG. 1 is a diagram illustrating an object identification result retrieval system according to the present invention.
  • an object identification result retrieval system includes a plurality of ontology databases 300a, 300n, hereinafter referred to as 300, and attribute URIs associated with a specific URI. And an entity identification result retrieval apparatus (100) for performing entity identification to establish a relationship with each other and providing the result.
  • the multiple ontology database 300 may be a server that provides services such as Sindice.com service, sameAs.org service, and the like.
  • the Sindice.com service is a semantic web search engine, which continuously collects various types of ontology in real time and, when an object name is input, provides a URI and an associated ontology with the corresponding object name as a search result.
  • the sameAs.org service refers to a service that collects URIs representing the same entity relationships collected from various ontologies and provides a group of previously identified results when searching for entity names or URIs.
  • the entity identification result retrieval apparatus 100 obtains an identification result for the query word from a triple storage module when a query word based on an entity name or a URI is input, and obtains the obtained identification result from the multiple ontology database.
  • the object identification is determined by comparison with the identification result of the query, and when the object identification is required, the object information associated with the query is identified by obtaining and comparing attribute information of the object to be identified from the multiple ontology database, Provide result information accordingly.
  • the object identification result for each individual is stored in the triple form. Identifying entities associated with the query term refers to acquiring entities associated with the query term and establishing a relationship of synonyms, synonyms, etc. between the query term and the acquired entities.
  • the entity identification result retrieval apparatus 100 gradually identifies various types of entities by using attribute information from the multiple ontology database 300 included in the linked data.
  • the entity identification result retrieval apparatus 100 compares the entity identifier list based on the identification result from the triple storage module and the entity identifier list based on the identification result from the multiple ontology database, and compares the multiple ontology database. If a new entity identifier is included in the list of entity identifiers obtained from the entity, it is determined that the entity identification is required, and the new entity identifier is designated as the entity to be identified.
  • the entity identification result retrieval apparatus 100 collects attribute information of the new entity identifier from the multiple ontology database 300 through a SPARQL endpoint, and obtains attribute information of the new entity identifier and the triple storage module. Individual identification is performed using the identification result.
  • the SPARQL endpoint refers to a service point of contact that allows access to the multiple ontology database 300, and provides the ontology information in RDF or various other formats through a web service.
  • the entity identification result retrieval apparatus 100 stores and updates the edited information as the entity identification result in the triple storage module when editing by at least one of the modification, deletion, and movement of the entity identification result is performed.
  • the updated entity identification result is later used for entity identification of the query.
  • FIG. 2 is a block diagram schematically showing the configuration of an apparatus for recognizing an object identification result according to the present invention
  • FIG. 3 is a block diagram specifically showing the object identification module shown in FIG.
  • the object identification result retrieval apparatus 100 may include a communication module 110 for communicating with a multiple ontology database, a user interface module 120 for receiving a query from a user, a triple storage module 130, and an entity.
  • the identifier list comparison module 140, the object identification module 150, the representative name selection module 160, the visualization module 170, and the editing module 180 are included.
  • the triple storage module 130 stores entity identification results for each entity in triple form. That is, the triple storage module 130 stores entity identifier group summary information and edited entity identifier group summary information for each entity.
  • the entity identifier group summary information includes the entity number, entity type, representative entity name, representative entity identifier, etc. for each entity identifier group.
  • the triple storage module 130 stores information about the object type, representative attribute values for each type, and lower attributes to be considered together in an ontology form. That is, the triple storage module 130 stores only the information necessary for identifying the individual and the identification result among the multiple ontology information, and other information is obtained by accessing the multiple ontology database in real time.
  • the entity identifier list comparison module 140 determines whether an identification result for a query received through the communication module 110 or input through the user interface module 120 exists in the triple storage module. If present, the identification result of the query word obtained from the triple storage module is compared with the identification result of the query word obtained from the multiple ontology database.
  • the query term may be in the form of an entity name or a URI, and the identification result of the query term may be an entity identifier list generated by identification of entities associated with the query term.
  • the entity identifier list comparison module 140 obtains an identification result of the query word from the multiple ontology database when the identification result of the query word does not exist in the triple storage module 130. 170) to make it visible.
  • the identification result visualized through the visualization module 170 may be entity identifier group summary information in which relationships of entities related to the query word are set, such as identity relations and similarity relations.
  • the entity identification module 150 obtains attribute information on the new entity identifier when the entity identifier list is included in the entity identifier list obtained from the multiple ontology database as a result of the comparison of the entity identifier list comparison module 140. And compare and perform entity identification and generate an entity identifier group for the query by the entity identification. That is, the entity identification module 150 determines that the entity identification for the new entity identifier is necessary when the entity identifier list is included in the entity identifier list obtained from the multiple ontology database. Perform entity identification.
  • the object identification module 150 as described above will be described in more detail with reference to FIG. 3.
  • the entity identification module 150 includes an attribute information collecting unit 151, a first grouping unit 152, a second grouping unit 153, an entity identifier group determining unit 154, and a verification unit 155. ).
  • the attribute information collecting unit 151 collects attribute information of the new entity identifier from the multiple ontology database. For example, when the new entity identifier is a URI for "Hong Gil-dong", the attribution information collecting unit 151 collects attribution information such as age, occupation, place of birth, e-mail address, etc. for Hong Gil-dong from the multiple ontology database. do.
  • the first grouping unit 152 groups the new entity identifier according to the entity type by using the attribute representing the type among the attribute information collected by the attribute information collecting unit 151. That is, the first grouping unit 152 determines the entity type of the new entity identifier by using an attribute representing a type among the collected attribute information, and determines the entity type of the entity identifier group from the entity identifier group for the query. A corresponding group is selected and assigned to the group of the new entity identifier.
  • the second grouping unit 153 loads the same property mapping information and the representative property for each group according to the object type from the previously stored property information table, and regroups the groups according to the object type based on the representative property of each object. do. That is, the second grouping unit 153 calculates the similarity of the string corresponding to the attribute value based on the representative attribute name of the entity identifier for each object type, and sets the entity identifiers having the predetermined similarity or more to a same group as the same group. Group. For example, in the case of a person, since the representative attribute is a human name, the similarity of the string corresponding to the human name is calculated, and the individual identifiers whose calculated similarity has a predetermined threshold or more are made into the same group.
  • the entity identifier group determiner 154 obtains and compares an associated attribute value for each group of entities grouped by the second grouper 153 from the multiple ontology database, and based on the comparison result, The group is divided into subgroups to determine an entity identifier group for the query. That is, the entity identifier group determiner 154 obtains the association attribute values of the entities in each group from the multiple ontology database, checks whether there is an entity identifier having the same attribute value among the association attribute values of all entities, If there is an object identifier with a value, group the object identifiers with the same attribute value into a subgroup. In this case, when there is no entity identifier having the same attribute value, the second grouping unit 153 maintains the grouped group.
  • the entity identifier group determination unit 154 may determine "work”, “association attribute values of" Hong Gil-dong “from the multiple ontology database. e-mail address "is obtained, and Hong Gil-dong having the same” attribute "and” e-mail address "as the related attribute values is made into the same group.
  • the entity identifier group determiner 154 may group entity identifiers having the same attribute value into subgroups.
  • the verification unit 155 repeats the process of determining the entity identifier group for the new entity identifier and verifies the entity identifier group determined by the entity identifier group determiner 154.
  • the representative name selection module 160 selects and applies a representative name for each entity identifier group generated by the entity identification module 150, and applies the entity identification result to which the representative name is applied to the triple storage module. Save to 130 and update. In this case, the representative name selection module 160 selects the representative identifier or representative entity name for each group by using the generated entity identifier and the statistical value of the entity name for each generated entity identifier group.
  • the visualization module 170 obtains and visualizes information on the entity identification result updated by the representative name selection module 160 from the triple storage module 130.
  • the information on the object identification result may refer to entity identifier group summary information including the number of entities, entity type, representative entity name, representative entity identifier, etc. for each entity identifier group.
  • the visualization module 170 may identify an object including a query input area, an ontology database association command, an object identifier group summary list, an object identifier group summary graph, a detailed object identifier list for each group, an identification command, an editing command, and the like. Print the results provided screen.
  • the verification result for the entity identification is output to a predetermined area of the entity identification result providing screen.
  • the object identifier such as the representative object name or representative object identifier of the object identifier group, merging different groups or dividing one group into different groups by the editing command, and moving an object identifier belonging to a specific group to another group You can edit the information about the group.
  • the editing module 180 stores and updates the editing result in the triple storage module 130 when the editing of the object identifier summary information is performed on the object identification result providing screen visualized by the visualization module 170. do.
  • FIG. 4 is a flowchart illustrating a method of searching for and providing an object identification result by an object identification result search apparatus according to the present invention
  • FIG. 6 is an exemplary view showing an object identification result search screen according to the present invention.
  • the apparatus for recognizing the entity identification result determines whether an identification result for the input query word exists in the triple storage module. (S404).
  • the triple storage module stores the entity identification result expressed in ontology, and the entity identification result retrieval apparatus uses a new entity name or a new entity identifier (ID) based on whether an identification result of the query word exists in the triple storage module. Determine whether or not URI) is input.
  • the entity identification result retrieval device obtains the identification result for the query word from the multiple ontology database (S406). That is, the individual identification result retrieval apparatus obtains the identification result for the query using Sindice.com, sameAs.org, and the like.
  • the identification result for the query word refers to a list of entity identifiers of entities related to the query word.
  • the object identification result retrieval apparatus compares the identification result of the query word obtained from the triple storage module with the identification result of the query word obtained from the multiple ontology database (S408). It is determined whether the list of identifiers is the same (S410). That is, the entity identification result retrieval apparatus compares the entity identifier list according to the identification result from the triple storage module with the entity identifier list according to the identification result from the multiple ontology database, and compares the entity identifier list to the entity identifier list from the multiple ontology database. Determine whether a new entity identifier is included.
  • the entity identification result search apparatus visualizes the identification result for the query word obtained from the triple storage module (S412).
  • the identification result of the query word is entity identifier group summary information indicating summary information of all groups in which the query word is used, and the entity identifier group summary information includes the number of entity identifiers, entity types, representative entity names and representative entity identifiers of the group.
  • the entity identification result retrieval apparatus includes at least one of a query input region, an external database association command, an entity identifier group summary list, an entity identifier group summary graph, a detailed entity identifier list for each group, an identification command, and an editing command. Outputs the screen for providing the object identification result.
  • the entity identification result search apparatus stores the edit result in the triple storage module (S416). That is, when the user edits at least one of the modification, deletion, and movement of the entity identification result, the entity identification result search apparatus stores and updates the edit result as the entity identification result in the triple storage module. do.
  • the entity identification result providing screen includes a query entry area for inputting an entity identifier or a query name of an entity, an entity in which entity identifier group summary information for the query is displayed in a list and a graph.
  • the entity identifier group summary information providing area includes an identification command selected when the entity identification using the updated information is desired in the triple storage module and an editing command for editing the entity identifier group information.
  • Select the edit command to edit the representative entity name or representative entity identifier of the entity identifier group merge different groups or divide one group into different groups, and move entity identifiers belonging to a specific group to another group. Can be performed.
  • the entity identification result retrieval apparatus maintains the representative entity identifier and the representative entity name modified by the user even if the statistics of the group are subsequently adjusted. This adjusted result is also used later in the identification process.
  • the user may move or delete an object identifier belonging to a specific group to another group by using an editing command.
  • the edited result as described above is stored in the triple storage module again and later reflected in the entity identification process.
  • the object identification result retrieving device When a specific object identifier list is selected in the detailed object identifier list providing area, the object identification result retrieving device outputs a verification result for the object identification to a predetermined area of the object identification result providing screen. That is, the verification result shows a correlation between the various attributes used to identify the object in a graph, and the user can confirm the object identification result through the graph.
  • the entity identification result retrieval device when the individual entity identifier is selected in the detailed entity identifier list providing area, the entity identification result retrieval device also provides a function of identifying related attributes through the SPARQL endpoint service provided by the ontology.
  • the entity identification result retrieval apparatus identifies the entity by acquiring and comparing the attribute information of the entity identifier with the new entity identifier as an object of identification, and by the entity identification, An entity identifier group for the query is generated (S418). That is, when a new entity name or a new entity identifier exists, the entity identification apparatus acquires attribute information of the new entity identifier for the multiple ontology database, and identifies the entity using the acquired attribute information.
  • entity identifier groups containing new entity identifiers are created.
  • the above object identification process is not performed on every object identifier every time, but on an object identifier that includes an updated object identifier from a list of object identifiers collected through a user's query or which has not been previously identified. do.
  • a detailed description of how the entity identification result retrieval apparatus identifies the entity will be described with reference to FIG. 5.
  • the entity identification result search apparatus updates the triple storage module by selecting a representative entity identifier or a representative entity name for each entity identifier group generated through the entity identification (S420). That is, the entity identification result retrieval apparatus selects a representative entity identifier and a representative entity name of each group by using an entity identifier belonging to each group and a statistical value of the entity name for the entity identifier group on which the entity identification is completed.
  • the object identification result search apparatus After performing the S420, the object identification result search apparatus obtains and visualizes the information on the updated object identification result from the triple storage module (S422), and performs the S414.
  • the entity identification result retrieval apparatus obtains and visualizes the identification result of the query word from the multiple ontology database (S424). .
  • FIG. 5 is a flowchart illustrating a method for identifying an entity by the entity identification result retrieval apparatus according to the present invention.
  • the apparatus for recognizing an entity identification result acquires attribute information of a new entity identifier to be identified from a multiple ontology database (S502), and uses the attribute representing a type in the acquired attribute information according to the entity type.
  • a group is assigned to the entity identifier (S504). That is, the object identification result retrieval apparatus checks the property that can distinguish the type of the object through the parent-child relationship between the rdf: type or the explicit type class among the property information of the new object identifier, and checks the identified object type. Assign the new entity identifier.
  • the subclass can be determined to be a class meaning a lifespan. That is, if kisti: person, class 1 belonging to Ontology A, is a subclass of foaf: person, the entity identification result retrieval device determines the type of the entity later by identifying and storing kisti: person as the entity type corresponding to the person. Used for
  • the entity identification result retrieval apparatus loads the same attribute mapping information and the representative attribute for each group grouped according to the entity type in the attribute information table (S506). That is, the object identification result retrieval apparatus may use the same attribute mapping information (e.g., kisti: hasCreator and foaf: maker are the same attribute) and representative attributes (e.g., person) between attributes of multiple ontologies to be used for identification according to the type of object to be identified.
  • the representative attribute of is loaded with “foaf: name” attribute in foaf ontology.
  • the entity identification result retrieval apparatus regroups the groups grouped by the entity type based on the representative attribute (S508). That is, the entity identification result retrieval device calculates the similarity of the string corresponding to the attribute value based on the representative attribute name of the entity identifier for each entity type, and groups the entity identifiers having the predetermined similarity greater than or equal to a predetermined threshold value into the same group. .
  • the similarity is calculated for the human name and in the case of the company, and grouped using the calculated result.
  • the entity identification result retrieval apparatus forms the representative attribute names in a predetermined format according to a predetermined rule, and then groups them through similarity calculation. For example, in the case of human names, the similarity is calculated through string comparison considering the First Name, Middle Name, and Last Name.
  • the entity identification result retrieval apparatus obtains and compares the associated attribute values of the entity identifiers belonging to each group from the multiple ontology database and divides each group into subgroups based on the comparison result.
  • the entity identifier group for the is determined (S510).
  • the entity identification result retrieval apparatus obtains an association attribute value for an entity identifier belonging to each group from the multiple ontology database and checks whether entity identifiers having the same association attribute value exist. If there are entity identifiers having the same attribute value as the result of the checking, the entity identification result retrieval apparatus determines the entity identifier group for the query by dividing the entity identifiers having the same attribute value into subgroups.
  • the entity identification result retrieval device may identify entity identifiers classified into different groups or entity identifiers classified into different groups or entity identifiers having the same group but no mapping property in the process of grouping the entity identifiers based on the previous entity type or entity name. .
  • the entity identification result retrieval device obtains the association attribute value of A so that the entity identifiers 1 and 2 are both Check if it is included as an association property.
  • the individual identification result retrieval apparatus collects the association attributes of the A paper, and the individual identifiers 1 and 2 are all the author relationship. Check that it is connected.
  • the object identification result retrieval apparatus repeats the steps S502 to S510 to verify the object identification result and finalizes the object identifier group (S512).
  • the object identification result retrieval system and method of the present invention is suitable for a high necessity of gradually identifying various types of entities using attribute information of multiple ontologies included in linked data.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to an object identification result searching system and method. The object identification result searching system obtains an identification result on a query from a triple storage module when the query is inputted to a multiple ontology database where attribute information on objects is stored as an ontology; compares the obtained identification with the identification result on the query obtained from the multiple ontology database in order to determine whether an object identification is necessary; when the object identification is necessary, obtains and compares attribute information on an identification target object from the multiple ontology database in order to identify objects; and provides result information according to the object identification. Therefore, according to the present invention, various types of objects are gradually identified using attribute information on multiple ontology included in Linked Data.

Description

개체 식별 결과 검색 시스템 및 방법Object identification result retrieval system and method

본 발명은 개체 식별 결과 검색 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 질의어가 입력된 경우, 상기 질의어에 대한 식별결과를 트리플 저장모듈로부터 획득하고, 상기 획득된 식별결과를 상기 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하여 개체식별 필요 여부를 판단하고, 개체식별이 필요한 경우 식별대상 개체의 속성정보를 획득 및 비교하여 상기 질의어에 대한 개체들을 식별하고, 상기 개체식별에 따른 결과정보를 제공하는 개체 식별 결과 검색 시스템 및 방법에 관한 것이다. The present invention relates to an object identification result retrieval system and method, and more particularly, when a query is input, the identification result of the query is obtained from a triple storage module, and the obtained identification result is obtained from the multiple ontology database. It is determined whether the object identification is necessary by comparing with the identification result of the query, and when the object identification is required, the object of the query is identified by acquiring and comparing the attribute information of the object to be identified, and the result information according to the object identification. An object identification result retrieval system and method for providing the same.

정보의 공유 및 연계의 중요성이 부각되면서 온톨로지를 지식 표현 모델로 사용하는 웹 서비스들이 증가하고 있고, 최근 시멘틱 웹(Semantic Web)의 연구와 관련하여 온톨로지(Ontology)를 이용한 데이터 모델이 주목받고 있다. As the importance of information sharing and linking is highlighted, web services using ontology as a knowledge expression model are increasing. Recently, data model using ontology has been attracting attention in connection with research of semantic web.

시맨틱 웹을 이용한 응용에는 에이전트간의 자동화된 통신, 웹 서비스 자동화, 유비쿼터스 환경에서의 의미기반 검색 서비스, 이종 멀티미디어 데이터베이스로부터의 정보검색 등이 있다. 그러나, 이러한 응용들은 기본적으로 모든 에이전트들이 공통된 온톨로지를 참조한다는 것을 가정하고 있다. 만약, 이들 에이전트들이 공통의 온톨로지를 참조하고 있지 않은 상황이라면 그러한 응용은 불가능하게 된다. 즉, 시맨틱 웹은 기존의 웹과 마찬가지로 분산되어 있고 이질적인 특징을 가지기 때문에 모든 에이전트들이 공통의 온톨로지를 참조한다고 가정하기가 어렵다.Applications using the semantic web include automated communication between agents, web service automation, semantic-based search services in ubiquitous environments, and information retrieval from heterogeneous multimedia databases. However, these applications basically assume that all agents reference a common ontology. If these agents do not refer to a common ontology, such an application would be impossible. That is, since the semantic web is distributed and heterogeneous like the existing web, it is difficult to assume that all agents refer to a common ontology.

예를 들어, 한 에이전트는 사람이 사는 집의 주소를 “address”라고 기술한 온톨로지를 참조하고 있고, 다른 에이전트는 그것을 “postal_address”라고 기술한 온톨로지를 참고하고 있다면 동일한 것을 서로 다르게 표현하게 되어 두 에이전트간에 통신이 불가능하게 된다.For example, if one agent refers to an ontology that describes the address of a person's home as "address", the other agent refers to an ontology that describes it as a "postal_address". Communication between them becomes impossible.

또한, 시맨틱 웹 데이터의 연계·활용을 위해서 필요한 URI(Uniform Resource Identifier)의 정합성을 확보하기 위한 기존 연구들은 개체 식별의 유형이 제한적이고, 점진적으로 추가되는 온톨로지의 실시간 개체 식별을 효과적으로 지원하지 못하며, 개체 식별 관계에 포함된 오류를 그대로 활용하는 등의 한계를 가지고 있다. In addition, existing studies to ensure the uniformity of URI (Uniform Resource Identifier) required for linkage and utilization of semantic web data have limited types of entity identification, and do not effectively support real-time entity identification of ontology, which is gradually added. It has limitations such as using the error included in the entity identification relationship as it is.

또한, 개체 식별 결과를 시각적으로 확인하고, 동적으로 수정하며, 수정된 결과를 개체 식별에 바로 활용할 수 있는 관리 서비스를 제공하지 못하고 있다. In addition, it does not provide a management service that can visually check the object identification results, dynamically modify them, and immediately use the modified results for object identification.

본 발명은 상기한 문제점을 해결하기 위하여 안출된 것으로, 본 발명의 목적은 Linked Data에 포함된 다중 온톨로지의 속성 정보를 이용하여 다양한 유형의 개체들을 점진적으로 식별할 수 있는 개체 식별 결과 검색 시스템 및 방법을 제공하는데 있다. SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and an object of the present invention is a system and method for retrieving an entity identification result that can gradually identify various types of entities using attribute information of multiple ontology included in linked data. To provide.

본 발명의 다른 목적은 다중 온톨로지의 속성 정보를 이용하여 온톨로지들을 동일 유형과 개체로 그룹화하고, 그룹별 주요 속성 비교를 통해 개체를 식별함으로써 동일 개체 식별의 정확도를 향상하는 것은 물론, 외부 서비스와 비교를 통해 추가된 URI만을 대상으로 점진적 개체 식별 기능을 지원할 수 있는 개체 식별 결과 검색 시스템 및 방법을 제공하는데 있다. Another object of the present invention is to group the ontology into the same type and object by using the attribute information of multiple ontologies, and to improve the accuracy of the same object identification by identifying the object through the comparison of the main property of each group, as well as compared to the external service An object identification result retrieval system and method capable of supporting a gradual entity identification function targeting only URIs added through the present invention is provided.

본 발명의 또 다른 목적은 한 사용자가 개체명이나 URI 검색을 통해 Linked Data의 개체-URI 부여 현황과 관련 속성을 확인하고, 보유 데이터와의 연계를 위한 개체명 또는 URI를 추천받을 수 있는 개체 식별 결과 검색 시스템 및 방법을 제공하는데 있다. Another object of the present invention is to identify an entity that a user can identify the entity-URI grant status and related attributes of the linked data by searching for the entity name or URI, and recommend the entity name or URI for linkage with the retained data. To provide a result retrieval system and method.

본 발명의 또 다른 목적은 동적으로 식별된 개체 식별 결과를 편집할 수 있고, 편집 결과를 추가된 URI를 식별하는데 사용함으로써 점진적으로 증가하는 URI에 대한 빠르고, 정확한 식별이 가능하며, 사용자가 개체 식별의 결과를 가시적으로 확인하고, 결과를 수정하며, 수정된 결과가 바로 개체 식별에 반영되는 관리 서비스를 제공할 수 있는 개체 식별 결과 검색 시스템 및 방법을 제공하는데 있다.Another object of the present invention is to be able to edit dynamically identified entity identification results, and to use the edit results to identify added URIs, enabling fast, accurate identification of incrementally increasing URIs, and allowing users to identify entities. The present invention provides a system and method for identifying an object identification result that can visually confirm a result, correct a result, and provide a management service in which the modified result is immediately reflected in the object identification.

상기 목적들을 달성하기 위하여 본 발명의 일 측면에 따르면, 개체들에 대한 속성정보가 온톨로지로 저장된 다중 온톨로지 데이터베이스, 질의어가 입력된 경우, 상기 질의어에 대한 식별결과를 트리플 저장모듈로부터 획득하고, 상기 획득된 식별결과를 상기 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하여 개체식별 필요 여부를 판단하고, 개체식별이 필요한 경우 상기 다중 온톨로지 데이터베이스로부터 식별대상 개체의 속성정보를 획득 및 비교하여 상기 질의어에 대한 개체들을 식별하고, 상기 개체식별에 따른 결과정보를 제공하는 개체식별결과 검색장치를 포함하는 개체 식별 결과 검색 시스템이 제공된다. According to an aspect of the present invention, in order to achieve the above objects, if multiple ontologies database in which attribute information about objects is stored as an ontology, and a query is input, the identification result of the query is obtained from the triple storage module. The identification result is compared with the identification result of the query word obtained from the multiple ontology database to determine whether individual identification is required, and if individual identification is required, the attribute information of the object to be identified is acquired and compared from the multiple ontology database. An entity identification result retrieval system including an entity identification result retrieval apparatus for identifying entities for a query and providing result information according to the entity identification is provided.

상기 트리플 저장모듈에는 각 개체에 대한 개체식별결과가 트리플 형태로 저장되어 있다. The triple storage module stores object identification results for each entity in triple format.

상기 개체식별결과 검색장치는 상기 트리플 저장모듈로부터의 식별결과에 의한 개체 식별자 목록과 상기 다중 온톨로지 데이터베이스로부터의 식별결과에 의한 개체 식별자 목록을 비교하고, 상기 비교결과 상기 다중 온톨로지 데이터베이스로부터 획득된 개체 식별자 목록에 신규 개체 식별자가 포함되어 있는 경우, 개체식별이 필요하다고 판단하고 그 신규 개체 식별자를 식별대상 개체로 한다. The entity identification result retrieval apparatus compares the entity identifier list based on the identification result from the triple storage module with the entity identifier list based on the identification result from the multiple ontology database, and compares the entity identifier obtained from the multiple ontology database. If a new entity identifier is included in the list, it is determined that the entity identification is necessary and the new entity identifier is used as the entity to be identified.

또한, 상기 개체식별결과 검색장치는 상기 다중 온톨로지 데이터베이스로부터 획득된 식별대상 개체들의 속성정보에서 유형을 나타내는 속성을 이용하여 개체 유형에 따라 그룹화하고, 각 개체들의 대표 속성을 기준으로 상기 개체 유형에 따라 그룹화된 각 그룹들을 다시 그룹화한 후, 상기 재그룹화된 각 그룹별로 개체들의 연관 속성값을 상기 다중 온톨로지 데이터베이스로부터 획득하여 비교하고, 상기 비교결과를 근거로 상기 각 그룹을 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 생성한다. In addition, the object identification result retrieval apparatus is grouped according to the object type using the attribute indicating the type in the attribute information of the object to be identified obtained from the multiple ontology database, and according to the object type based on the representative attribute of each object After regrouping the grouped groups, the property values of the entities for each of the regrouped groups are obtained and compared from the multiple ontology database, and the groups are divided into subgroups based on the comparison result. Create an entity identifier group for the.

또한, 상기 개체식별결과 검색 장치는 상기 질의어에 대한 개체 식별자 그룹별로 대표 개체 식별자 또는 대표 개체명을 선정하고, 각 개체 식별자 그룹에 대한 개체 개수, 개체 유형, 대표 개체명, 대표 개체 식별자 중 적어도 하나를 포함하는 개체 식별자 그룹 요약 정보를 개체 식별에 따른 결과정보로 제공한다. In addition, the entity identification result retrieval apparatus selects a representative entity identifier or a representative entity name for each entity identifier group for the query, and includes at least one of the number of entities, entity type, representative entity name, and representative entity identifier for each entity identifier group. Provides the entity identifier group summary information including the result information according to the entity identification.

또한, 상기 개체식별결과 검색장치는 개체식별결과의 수정, 삭제, 이동 중 적어도 하나에 의한 편집이 수행된 경우, 상기 편집된 정보를 상기 트리플 저장모듈에 개체 식별결과로 저장 및 업데이트하고, 상기 업데이트된 개체식별결과는 추후 상기 질의어에 대한 개체식별에 이용된다. The object identification result search apparatus may store and update the edited information as the object identification result in the triple storage module when the editing by at least one of the modification, deletion, and movement of the object identification result is performed, and the update is performed. The identified individual identification result is used later for identifying the query.

본 발명의 다른 측면에 따르면, 각 개체에 대한 개체 식별결과가 트리플 형태로 저장된 트리플 저장모듈, 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하는지의 여부를 판단하고, 존재하는 경우 상기 트리플 저장모듈로부터 획득된 상기 질의어에 대한 식별결과에 의한 개체 식별자 목록과 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과에 의한 개체 식별자 목록을 비교하는 개체 식별자 목록 비교 모듈, 상기 비교결과 상기 다중 온톨로지 데이터베이스로부터 획득된 개체 식별자 목록에 신규 개체 식별자가 포함되어 있는 경우, 상기 신규 개체 식별자에 대한 속성정보를 획득 및 비교하여 상기 질의어에 대한 개체 식별을 수행하고, 상기 개체 식별에 의해 상기 질의어에 대한 개체 식별자 그룹을 생성하는 개체 식별모듈, 상기 생성된 개체 식별자 그룹별로 대표명을 선정 및 적용하고, 상기 대표명이 적용된 개체식별결과를 상기 트리플 저장모듈에 저장 및 업데이트하는 대표명 선정 모듈, 상기 개체식별결과에 대한 정보를 상기 트리플 저장모듈로부터 획득하여 가시화하는 가시화 모듈을 포함하는 개체식별결과 검색 장치가 제공된다.According to another aspect of the present invention, it is determined whether the triple storage module for which the entity identification result for each entity is stored in the triple form and whether the identification result for the query word exists in the triple storage module and, if present, the triple storage module. An entity identifier list comparison module for comparing the entity identifier list according to the identification result of the query word obtained from the multi- ontology database with the entity identifier list comparison module, the result obtained from the multiple ontology database When a new entity identifier is included in the list of the entity identifiers, the entity identification for the query is performed by obtaining and comparing attribute information on the new entity identifier, and the entity identifier group for the query is determined by the entity identification. Object expression you create And a representative name selection module for selecting and applying a representative name for each generated entity identifier group, and storing and updating the entity identification result to which the representative name is applied to the triple storage module, and storing the triple information for the entity identification result. An object identification result retrieval apparatus including a visualization module obtained from a module and visualized is provided.

상기 개체식별결과 검색 장치는 상기 가시화된 개체식별결과에 대한 수정, 삭제, 이동 중 적어도 하나에 의한 편집이 수행된 경우, 그 편집 결과를 상기 트리플 저장모듈에 개체 식별결과로 저장 및 업데이트하고, 상기 업데이트된 개체식별결과는 추후 상기 질의어에 대한 개체식별에 이용되도록 하는 편집 모듈을 더 포함할 수 있다.The entity identification result retrieval apparatus stores and updates the edit result as the entity identification result in the triple storage module when the editing by at least one of the visible, individual identification result is performed by the modification, deletion, and movement. The updated entity identification result may further include an editing module for later use in entity identification for the query.

상기 개체 식별자 목록 비교 모듈은 상기 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하지 않은 경우, 상기 다중 온톨로지 데이터베이스로부터 상기 질의어에 대한 식별결과를 수집하여 상기 가시화 모듈을 통해 가시화되도록 한다. The entity identifier list comparison module collects the identification result of the query word from the multiple ontology database and makes it visible through the visualization module when the identification result of the query word does not exist in the triple storage module.

상기 트리플 저장모듈에는 각 개체에 대한 개체 식별자 그룹 요약 정보, 편집된 개체 식별자 그룹 요약 정보가 저장되어 있다. The triple storage module stores entity identifier group summary information and edited entity identifier group summary information for each entity.

상기 질의어는 개체명 또는 URI의 형태이다. The query is in the form of an entity name or URI.

상기 개체 식별모듈은 상기 신규 개체 식별자의 속성정보를 상기 다중 온톨로지 데이터베이스로부터 획득하여 개체 유형을 기준으로 그룹화하고, 상기 개체 유형에 따른 그룹별로 각 개체들의 대표 속성을 기준으로 다시 그룹화 한 후, 상기 재그룹화된 각 그룹별로 개체들에 대한 연관 속성값을 상기 다중 온톨로지 데이터베이스로부터 획득 및 비교하고, 상기 비교 결과를 근거로 상기 각 그룹을 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 결정한다. The entity identification module obtains the attribute information of the new entity identifier from the multiple ontology database, groups the entity based on the entity type, regroups the entity based on the representative attribute of each entity for each group according to the entity type, and then regroups the entity. An association attribute value of the entities for each grouped group is obtained and compared from the multiple ontology database, and the individual identifier group for the query is determined by dividing each group into subgroups based on the comparison result.

상기 대표명 선정 모듈은 상기 생성된 개체 식별자 그룹별로 각 그룹에 속한 개체 식별자와 개체명의 통계 값을 이용하여 각 그룹에 대한 대표 식별자 또는 대표 개체명을 선정한다. The representative name selection module selects a representative identifier or a representative entity name for each group by using the generated entity identifier and the statistical value of the entity name for each generated entity identifier group.

상기 개체식별결과에 대한 정보는 각 개체 식별자 그룹에 대한 개체 개수, 개체 유형, 대표 개체명, 대표 개체 식별자 중 적어도 하나를 포함하는 개체 식별자 그룹 요약 정보를 포함한다.The information on the entity identification result includes entity identifier group summary information including at least one of entity number, entity type, representative entity name, and representative entity identifier for each entity identifier group.

상기 가시화 모듈은 질의어 입력 영역, 온톨로지 데이터베이스 연계 명령, 개체 식별자 그룹 요약 목록, 개체 식별자 그룹 요약 그래프, 각 그룹에 대한 상세 개체 식별자 목록, 식별 명령, 편집 명령 중 적어도 하나를 포함하는 개체식별결과 제공 화면을 출력한다. The visualization module may include an object identification result providing screen including at least one of a query input area, an ontology database association command, an object identifier group summary list, an object identifier group summary graph, a detailed object identifier list for each group, an identification command, and an editing command. Outputs

상기 개체식별결과 제공화면에서 식별 명령이 선택된 경우, 트리플 저장모듈에 업데이트된 개체식별결과에 대한 정보가 출력되고, 상기 각 그룹에 대한 개체 식별자 목록 중에서 하나의 개체 식별자 목록이 선택되면, 개체 식별에 대한 검증 결과가 상기 개체식별결과 제공 화면의 일정 영역에 출력된다. When the identification command is selected on the object identification result providing screen, information about the updated object identification result is output to the triple storage module, and when one object identifier list is selected from the object identifier list for each group, The verification result is output in a predetermined area of the object identification result providing screen.

상기 편집 명령에 의해 개체 식별자 그룹의 대표 개체명 또는 대표 개체 식별자, 서로 다른 그룹을 합병 또는 하나의 그룹을 서로 다른 그룹으로 분할, 특정 그룹에 속한 개체 식별자를 다른 그룹으로 이동 중 적어도 하나의 편집을 수행한다. Editing of at least one of the representative entity name or representative entity identifier of the entity identifier group, merging different groups, dividing one group into different groups, and moving an entity identifier belonging to a specific group to another group by the editing command To perform.

본 발명의 다른 측면에 따르면, 개체식별결과 검색장치가 질의어에 대한 개체식별결과를 제공하는 방법에 있어서, (a)질의어가 입력된 경우, 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하는지의 여부를 판단하는 단계, (b) 상기 판단결과 존재하는 경우, 상기 트리플 저장모듈로부터 획득된 상기 질의어에 대한 식별결과를 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하는 단계, (c)상기 비교결과 상기 다중 온톨로지 데이터베이스로부터 획득된 식별결과에 신규 개체 식별자가 포함되어 있는 경우, 상기 신규 개체 식별자에 대한 속성정보를 획득 및 비교하여 상기 질의어에 대한 개체 식별을 수행하고, 상기 개체 식별에 의해 상기 질의어에 대한 개체 식별자 그룹을 생성하는 단계, (d)상기 생성된 개체 식별자 그룹별로 대표명을 선정 및 적용하고, 상기 대표명이 적용된 개체식별결과를 상기 트리플 저장모듈에 저장 및 업데이트하는 단계를 포함하는 개체식별결과 검색 방법이 제공된다. According to another aspect of the present invention, in a method for providing an individual identification result for a query by the object identification result retrieval apparatus, (a) when a query is input, it is determined whether the identification result for the query exists in the triple storage module. (B) comparing the identification result of the query word obtained from the triple storage module with the identification result of the query word obtained from a multiple ontology database, if the determination result exists; When the comparison result includes the new entity identifier included in the identification result obtained from the multiple ontology database, the entity identification for the query is performed by acquiring and comparing attribute information on the new entity identifier, and by the entity identification Generating an entity identifier group for the query, (d) the generated entity expression Now select and apply the representative name for each group and the individual identifying how to search results were applied to the representative object identification result storing and updating in the triple storage module is provided.

상기 개체식별결과검색 방법은 상기 개체식별결과에 대한 정보를 상기 트리플 저장모듈로부터 획득하여 가시화하는 단계를 더 포함할 수 있다. The individual identification result searching method may further include obtaining and visualizing the information on the individual identification result from the triple storage module.

또한, 개체식별결과 검색 방법은 상기 가시화된 개체식별결과에 대한 수정, 삭제, 이동 중 적어도 하나에 의한 편집이 수행된 경우, 그 편집 결과를 상기 트리플 저장모듈에 개체 식별결과로 저장 및 업데이트하는 단계를 더 포함할 수 있다. The object identification result retrieval method may further include storing and updating the edited result as an object identification result in the triple storage module when editing by at least one of the modified, deleted, and moved of the visualized object identification result is performed. It may further include.

상기 (b) 단계에서 상기 (a)단계의 판단결과, 상기 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하지 않은 경우, 상기 다중 온톨로지 데이터베이스로부터 상기 질의어에 대한 식별결과를 수집하여 가시화한다. In the step (b), if the identification result of the query word does not exist in the triple storage module, the identification result of the query word is collected and visualized from the multiple ontology database.

상기 (b) 단계는 상기 트리플 저장모듈로부터의 식별결과에 의한 개체 식별자 목록과 상기 다중 온톨로지 데이터베이스로부터의 식별결과에 의한 개체 식별자 목록을 비교한다. Step (b) compares the entity identifier list based on the identification result from the triple storage module and the entity identifier list based on the identification result from the multiple ontology database.

상기 질의어는 개체명 또는 URI의 형태일 수 있다. The query may be in the form of an entity name or a URI.

상기 (c)단계는 상기 신규 개체 식별자의 속성정보를 상기 다중 온톨로지 데이터베이스로부터 획득하여 개체 유형을 기준으로 그룹화하고, 상기 개체 유형에 따른 그룹별로 각 개체들의 대표 속성을 기준으로 다시 그룹화 한 후, 상기 재그룹화된 각 그룹별로 개체들에 대한 연관 속성값을 상기 다중 온톨로지 데이터베이스로부터 획득 및 비교하고, 상기 비교 결과를 근거로 상기 각 그룹을 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 결정하는 것을 말한다. In the step (c), the attribute information of the new entity identifier is obtained from the multiple ontology database and grouped based on the entity type, and grouped again based on the representative attribute of each entity for each group according to the entity type. Relevant attribute values of entities for each regrouped group are obtained and compared from the multiple ontology database, and each group is divided into subgroups based on the comparison result to determine an entity identifier group for the query. .

상기 (d)단계는 상기 생성된 개체 식별자 그룹별로 각 그룹에 속한 개체 식별자와 개체명의 통계 값을 이용하여 각 그룹에 대한 대표 식별자 또는 대표 개체명을 선정한다. In the step (d), the representative identifier or representative entity name for each group is selected by using the generated entity identifier and the statistical value of the entity name for each entity group.

상기 개체식별결과에 대한 정보는 각 개체 식별자 그룹에 대한 개체 개수, 개체 유형, 대표 개체명, 대표 개체 식별자 중 적어도 하나를 포함하는 개체 식별자 그룹 요약 정보를 포함한다. The information on the entity identification result includes entity identifier group summary information including at least one of entity number, entity type, representative entity name, and representative entity identifier for each entity identifier group.

상술한 바와 같이 본 발명에 따르면, Linked Data에 포함된 다중 온톨로지의 속성 정보를 이용하여 다양한 유형의 개체들을 점진적으로 식별할 수 있다. As described above, according to the present invention, various types of entities may be gradually identified by using attribute information of multiple ontologies included in linked data.

또한, 다중 온톨로지의 속성 정보를 이용하여 온톨로지들을 동일 유형과 개체로 그룹화하고, 그룹별 주요 속성 비교를 통해 개체를 식별함으로써 동일 개체 식별의 정확도를 향상하는 것은 물론, 외부 서비스와 비교를 통해 추가된 URI만을 대상으로 점진적 개체 식별 기능을 지원할 수 있다. In addition, the ontology is grouped into the same type and object by using the property information of multiple ontology, and the object is identified through the comparison of the main property of each group to improve the accuracy of identifying the same object and added by comparing with the external service. Only URIs can be supported for progressive object identification.

또한, 한 사용자가 개체명이나 URI 검색을 통해 Linked Data의 개체-URI 부여 현황과 관련 속성을 확인하고, 보유 데이터와의 연계를 위한 개체명 또는 URI를 추천받을 수 있다. In addition, a user can check the object-URI grant status and related attributes of linked data by searching for an object name or a URI, and recommend an object name or URI for linkage with retained data.

또한, 동적으로 식별된 개체 식별 결과를 편집할 수 있고, 편집 결과를 추가된 URI를 식별하는데 사용함으로써 점진적으로 증가하는 URI에 대한 빠르고, 정확한 식별이 가능하며, 사용자가 개체 식별의 결과를 가시적으로 확인하고, 결과를 수정하며, 수정된 결과가 바로 개체 식별에 반영되는 관리 서비스를 제공할 수 있다. In addition, you can edit the results of dynamically identified entity identification, and use the edit results to identify additional URIs, enabling fast, accurate identification of incrementally increasing URIs, and allowing users to visually It can provide a management service that checks, modifies the results, and reflects the modified results directly on the object identification.

또한, URI 관리 서비스를 통해 개체-URI 관계를 동적으로 수정하고 삭제하는 것은 물론, 대표 URI·대표 개체명의 선정, 개체 식별 알고리즘을 적용한 개체 식별 결과를 확인할 수 있으며, 이를 통해 보유 데이터와 Linked Data 연계 정합성을 높임으로써, 시맨틱 웹의 효율성을 극대화할 수 있다.In addition, the URI management service allows you to dynamically modify and delete object-URI relationships, as well as select representative URIs and representative object names, and identify object identification results by applying object identification algorithms. By increasing the consistency, you can maximize the efficiency of the semantic web.

또한, 개체 식별 결과와 사용자의 편집 결과를 추가된 URI를 식별하는데 사용함으로써 점진적으로 증가하는 URI에 대한 빠르고 정확한 식별이 가능하고, 사용자가 개체 식별의 결과를 가시적으로 확인하여 결과를 수정하며, 수정된 결과를 바로 개체 식별에 반영할 수 있다. In addition, by using the object identification result and the user's edit result to identify the added URI, it is possible to quickly and accurately identify the incrementally increasing URI, and the user visually confirms the result of the object identification and corrects the result. Results can be directly reflected in object identification.

도 1은 본 발명에 따른 개체 식별 결과 검색 시스템을 나타낸 도면.1 is a diagram showing an object identification result retrieval system according to the present invention;

도 2는 본 발명에 따른 개체식별결과 검색 장치의 구성을 개략적으로 나타낸 블럭도.Figure 2 is a block diagram schematically showing the configuration of the object identification result search apparatus according to the present invention.

도 3은 도 2에 도시된 개체 식별 모듈을 구체적으로 나타낸 블럭도.3 is a block diagram specifically illustrating the entity identification module shown in FIG. 2;

도 4는 본 발명에 따른 개체식별결과 검색 장치가 개체 식별 결과를 검색 및 제공하는 방법을 나타낸 흐름도.4 is a flowchart illustrating a method for retrieving and providing an entity identification result by the entity identification result retrieval apparatus according to the present invention.

도 5는 본 발명에 따른 개체식별결과 검색 장치가 개체를 식별하는 방법을 나타낸 흐름도. 5 is a flowchart illustrating a method for identifying an object by the object identification result retrieval apparatus according to the present invention.

도 6은 본 발명에 따른 개체 식별결과 검색 화면을 나타낸 예시도.6 is an exemplary view showing an object identification result search screen according to the present invention.

본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.Details of the above-described objects and technical configurations of the present invention and the effects thereof according to the present invention will be more clearly understood by the following detailed description based on the accompanying drawings.

먼저 본 발명에서 이용되는 용어에 대하여 살펴보기로 한다. First, the terms used in the present invention will be described.

Linked Data는 차세대 웹의 가장 핵심이 되는 데이터 네트워크를 위한 운동이며, 실천강령이다. 웹에서 자유롭게 데이터를 개방하여 연계할 수 있도록 하고, 이들 데이터가 다시 협업할 수 있게 하여 진정한 데이터 웹을 실현하고자 하는 것이다. 때문에 웹에서의 데이터 유통을 위한 HTTP(hypertext transfer protocol)를 사용하고, 연계 및 접근성을 보장하기 위한 RDF(Resource Description Framework와 SPARQL(Simple Protocol and RDF Query Language)를 사용한다. 상기 SPARQL은 온톨로지에 포함된 정보를 질의하기 위해 사용되는 표준 질의 언어로 DBMS(database management system)의 SQL(structured query language)와 유사한 기능을 수행한다.Linked Data is a movement and code of conduct for the data network at the heart of the next generation of the Web. The goal is to open and connect data freely on the web, and to enable these data to collaborate again to realize a true data web. Therefore, HTTP (hypertext transfer protocol) is used for data distribution on the web, and Resource Description Framework (RDF) and Simple Protocol and RDF Query Language (SPARQL) are used to ensure connectivity and accessibility, which is included in the ontology. This is a standard query language used for querying collected information. It performs functions similar to the structured query language (SQL) of the database management system (DBMS).

또한, Linked Data는 특정 개념을 URI(Uniform Resource Identifier)로 명명하고, HTTP를 통해 URI로 명명된 리소스에 접근할 수 있으며, URI에 접근했을 때 RDF 기반의 URI가 포함하고 있는 상세 정보를 제공하고, RDF에 포함되어 있는 또 다른 관련 있는 개념으로 접근할 수 있도록 한다. In addition, Linked Data names specific concepts as Uniform Resource Identifiers (URIs), allows access to resources named as URIs over HTTP, and provides detailed information contained by RDF-based URIs when accessed. It provides access to other relevant concepts contained in RDF.

URI는 클래스와 속성, 개체들에 대한 식별자로서 웹을 통해 정보자원을 공유하기 위해서 웹 상의 유일한 주소로 매핑되어 사용된다. 즉, URL를 통해 클래스나 속성, 개체의 정보에 접근하기 위해 사용되는 인터넷 주소이자 식별자를 말한다. 상기 URI는 개체 식별자라는 용어로 이용된다. URIs are identifiers of classes, properties, and entities that are mapped to unique addresses on the Web to share information resources over the Web. In other words, it is an internet address and identifier used to access information of a class, property, or object through a URL. The URI is used in the term entity identifier.

온톨로지는 특정 분야의 관련된 문서로부터 온톨로지에 구축할 온톨로지의 구성 요소 즉, 개념, 개념의 속성, 개념 간 연결 관계 등에 관한 지식을 얻어 개념과 속성을 정의하고 개념과 개념의 관계를 설정하여 구축된다. 시맨틱 웹에서는 개념이 URI로 표현된다. 예를 들어, "Person" 클래스의 경우 온톨로지에서는 "http://www.etri.re.kr/example#Person"과 같은 URI로 표현된다. Ontology is constructed by defining concepts and attributes and establishing the relationship between concepts and concepts by obtaining knowledge about the components of ontology that is to be constructed in ontology from related documents of specific field, namely concept, property of concept, connection relation between concepts. In the semantic web, concepts are represented by URIs. For example, the "Person" class is represented in the ontology as a URI such as "http://www.etri.re.kr/example#Person".

"Person" 클래스는 name, age, birthplace 등의 속성을 가진다. "name" 속성은 그 값으로 문자열(string)을 가질 수 있고, "age" 속성은 그 값으로 정수 (integer)를 가질 수 있고, "birthplace" 속성은 그 값으로 "Location"의 인스턴스를 가질 수 있다.The "Person" class has properties such as name, age, birthplace, and so on. The "name" attribute can have a string as its value, the "age" attribute can have an integer as its value, and the "birthplace" attribute can have an instance of "Location" as its value. have.

개체 식별은 온톨로지를 구성하는 클래스, 속성, 개체들이 상호 연계되도록 하기 위해 URI에 대한 관계를 명확하게 설정하는 것을 말한다. 예를 들어, A 온톨로지의 A-1 개체가 B 온톨로지의 B-1개체와 동일한 경우 A-1 개체와 B-1 개체가 동일한 관계임을 명시함으로써 A-1과 B-1을 관련 속성들을 병합할 수 있도록 한다.Entity identification refers to the explicit establishment of a relationship to a URI in order to ensure that the classes, properties, and entities that make up the ontology are interrelated. For example, if the A-1 entity of ontology A is the same as the B-1 entity of ontology B, you can merge A-1 and B-1 related properties by specifying that the A-1 and B-1 entities have the same relationship. To be able.

도 1은 본 발명에 따른 개체 식별 결과 검색 시스템을 나타낸 도면이다.1 is a diagram illustrating an object identification result retrieval system according to the present invention.

도 1을 참조하면, 개체 식별 결과 검색 시스템은 각 개체에 대한 속성정보가 온톨로지로 저장된 다중 온톨로지 데이터베이스(300a,..., 300n, 이하 300이라 칭함), 특정 URI와 연관된 개체(URI)들에 대한 관계를 설정하는 개체식별을 수행하여 그 결과를 제공하는 개체식별결과 검색 장치(100)를 포함한다.Referring to FIG. 1, an object identification result retrieval system includes a plurality of ontology databases 300a, 300n, hereinafter referred to as 300, and attribute URIs associated with a specific URI. And an entity identification result retrieval apparatus (100) for performing entity identification to establish a relationship with each other and providing the result.

상기 다중 온톨로지 데이터베이스(300)는 Sindice.com 서비스, sameAs.org 서비스 등과 같은 서비스를 제공하는 서버일 수 있다. 여기서, 상기 Sindice.com 서비스는 시맨틱 웹 검색엔진으로 다양한 형식의 온톨로지를 실시간으로 계속 수집한 후, 개체명이 입력되면 해당 개체명이 나타난 URI와 관련 온톨로지를 검색 결과로 제공하는 서비스를 말한다.The multiple ontology database 300 may be a server that provides services such as Sindice.com service, sameAs.org service, and the like. Here, the Sindice.com service is a semantic web search engine, which continuously collects various types of ontology in real time and, when an object name is input, provides a URI and an associated ontology with the corresponding object name as a search result.

상기 sameAs.org 서비스는 다양한 온톨로지에서 수집된 동일 개체 관계를 표현하는 URI들을 수집해서 개체명이나 URI를 검색하는 경우 미리 식별된 결과를 그룹화해서 제공하는 서비스를 말한다. The sameAs.org service refers to a service that collects URIs representing the same entity relationships collected from various ontologies and provides a group of previously identified results when searching for entity names or URIs.

상기 개체식별결과 검색 장치(100)는 개체명 또는 URI에 의한 질의어가 입력된 경우, 상기 질의어에 대한 식별결과를 트리플 저장모듈로부터 획득하고, 상기 획득된 식별결과를 상기 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하여 개체식별 필요 여부를 판단하고, 개체식별이 필요한 경우 상기 다중 온톨로지 데이터베이스로부터 식별대상 개체의 속성정보를 획득 및 비교하여 상기 질의어와 연관된 개체들을 식별하고, 상기 개체식별에 따른 결과정보를 제공한다. 여기서, 상기 트리플 저장모듈에는 각 개체에 대한 개체식별결과가 트리플 형태로 저장되어 있다. 상기 질의어와 연관된 개체들을 식별한다는 것은 상기 질의어와 연관된 개체들을 획득하여 상기 질의어와 상기 획득된 개체들간에 동의어, 유의어 등의 관계를 설정하는 것을 말한다. The entity identification result retrieval apparatus 100 obtains an identification result for the query word from a triple storage module when a query word based on an entity name or a URI is input, and obtains the obtained identification result from the multiple ontology database. The object identification is determined by comparison with the identification result of the query, and when the object identification is required, the object information associated with the query is identified by obtaining and comparing attribute information of the object to be identified from the multiple ontology database, Provide result information accordingly. Here, in the triple storage module, the object identification result for each individual is stored in the triple form. Identifying entities associated with the query term refers to acquiring entities associated with the query term and establishing a relationship of synonyms, synonyms, etc. between the query term and the acquired entities.

상기 개체식별결과 검색 장치(100)는 Linked Data에 포함된 다중 온톨로지 데이터베이스(300)로부터의 속성 정보를 이용하여 다양한 유형의 개체들을 점진적으로 식별한다.The entity identification result retrieval apparatus 100 gradually identifies various types of entities by using attribute information from the multiple ontology database 300 included in the linked data.

또한, 상기 개체식별결과 검색장치(100)는 상기 트리플 저장모듈로부터의 식별결과에 의한 개체 식별자 목록과 상기 다중 온톨로지 데이터베이스로부터의 식별결과에 의한 개체 식별자 목록을 비교하고, 상기 비교결과 상기 다중 온톨로지 데이터베이스로부터 획득된 개체 식별자 목록에 신규 개체 식별자가 포함되어 있는 경우, 개체식별이 필요하다고 판단하고 그 신규 개체 식별자를 식별대상 개체로 정한다. In addition, the entity identification result retrieval apparatus 100 compares the entity identifier list based on the identification result from the triple storage module and the entity identifier list based on the identification result from the multiple ontology database, and compares the multiple ontology database. If a new entity identifier is included in the list of entity identifiers obtained from the entity, it is determined that the entity identification is required, and the new entity identifier is designated as the entity to be identified.

그런 다음 상기 개체 식별결과 검색 장치(100)는 SPARQL endpoint를 통해서 상기 다중 온톨로지 데이터베이스(300)로부터 상기 신규 개체 식별자의 속성정보를 수집하고, 상기 신규 개체 식별자의 속성정보와 상기 트리플 저장모듈로부터 획득된 식별결과를 이용하여 개체 식별을 수행한다. 여기서, 상기 SPARQL endpoint는 상기 다중 온톨로지 데이터베이스(300)에 접근할 수 있도록 하는 서비스 접점을 말하고, 웹서비스를 통해 해당 온톨로지 정보를 RDF나 기타 다양한 형식으로 제공한다. Then, the entity identification result retrieval apparatus 100 collects attribute information of the new entity identifier from the multiple ontology database 300 through a SPARQL endpoint, and obtains attribute information of the new entity identifier and the triple storage module. Individual identification is performed using the identification result. Here, the SPARQL endpoint refers to a service point of contact that allows access to the multiple ontology database 300, and provides the ontology information in RDF or various other formats through a web service.

또한, 상기 개체식별결과 검색 장치(100)는 개체식별결과의 수정, 삭제, 이동 중 적어도 하나에 의한 편집이 수행된 경우, 상기 편집된 정보를 상기 트리플 저장모듈에 개체 식별결과로 저장 및 업데이트하고, 상기 업데이트된 개체식별결과는 추후 상기 질의어에 대한 개체식별에 활용된다. In addition, the entity identification result retrieval apparatus 100 stores and updates the edited information as the entity identification result in the triple storage module when editing by at least one of the modification, deletion, and movement of the entity identification result is performed. The updated entity identification result is later used for entity identification of the query.

상기와 같은 역할을 수행하는 개체식별결과 검색 장치(100)에 대한 상세한 설명은 도 2를 참조하기로 한다. A detailed description of the apparatus 100 for identifying an individual identification result performing the above role will be described with reference to FIG. 2.

도 2는 본 발명에 따른 개체식별결과 검색 장치의 구성을 개략적으로 나타낸 블럭도, 도 3은 도 2에 도시된 개체 식별 모듈을 구체적으로 나타낸 블럭도이다.FIG. 2 is a block diagram schematically showing the configuration of an apparatus for recognizing an object identification result according to the present invention, and FIG. 3 is a block diagram specifically showing the object identification module shown in FIG.

도 2를 참조하면, 개체식별결과 검색 장치(100)는 다중 온톨로지 데이터베이스와의 통신을 위한 통신 모듈(110), 사용자로부터 질의어를 입력받는 사용자 인터페이스 모듈(120), 트리플 저장모듈(130), 개체 식별자 목록 비교 모듈(140), 개체 식별 모듈(150), 대표명 선정 모듈(160), 가시화 모듈(170), 편집 모듈(180)을 포함한다.Referring to FIG. 2, the object identification result retrieval apparatus 100 may include a communication module 110 for communicating with a multiple ontology database, a user interface module 120 for receiving a query from a user, a triple storage module 130, and an entity. The identifier list comparison module 140, the object identification module 150, the representative name selection module 160, the visualization module 170, and the editing module 180 are included.

상기 트리플 저장모듈(130)에는 각 개체에 대한 개체 식별결과가 트리플 형태로 저장되어 있다. 즉, 상기 트리플 저장모듈(130)에는 각 개체에 대한 개체 식별자 그룹 요약 정보, 편집된 개체 식별자 그룹 요약 정보가 저장되어 있다. 상기 개체 식별자 그룹 요약 정보는 각 개체 식별자 그룹에 대한 개체 개수, 개체 유형, 대표 개체명, 대표 개체 식별자 등을 포함한다. The triple storage module 130 stores entity identification results for each entity in triple form. That is, the triple storage module 130 stores entity identifier group summary information and edited entity identifier group summary information for each entity. The entity identifier group summary information includes the entity number, entity type, representative entity name, representative entity identifier, etc. for each entity identifier group.

또한, 상기 트리플 저장 모듈(130)에는 개체 유형에 대한 정보와 유형별 대표 속성값, 함께 고려해야 할 하부 속성이 온톨로지 형태로 저장되어 있다. 즉, 트리플 저장모듈(130)에는 다중 온톨로지 정보 중 개체 식별에 필요한 정보와 식별결과만 저장되고, 다른 정보들은 다중 온톨로지 데이터베이스에 실시간으로 접근해서 획득하게 된다.In addition, the triple storage module 130 stores information about the object type, representative attribute values for each type, and lower attributes to be considered together in an ontology form. That is, the triple storage module 130 stores only the information necessary for identifying the individual and the identification result among the multiple ontology information, and other information is obtained by accessing the multiple ontology database in real time.

상기 개체 식별자 목록 비교모듈(140)은 상기 통신모듈(110)을 통해 수신 또는 상기 사용자 인터페이스 모듈(120)를 통해 입력된 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하는지의 여부를 판단하고, 존재하는 경우 상기 트리플 저장모듈로부터 획득된 상기 질의어에 대한 식별결과와 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과를 비교한다. 여기서 상기 질의어는 개체명 또는 URI의 형태이고, 상기 질의어에 대한 식별결과는 상기 질의어와 관계를 가진 개체들의 식별에 의해 생성된 개체 식별자 목록일 수 있다.The entity identifier list comparison module 140 determines whether an identification result for a query received through the communication module 110 or input through the user interface module 120 exists in the triple storage module. If present, the identification result of the query word obtained from the triple storage module is compared with the identification result of the query word obtained from the multiple ontology database. The query term may be in the form of an entity name or a URI, and the identification result of the query term may be an entity identifier list generated by identification of entities associated with the query term.

또한, 상기 개체 식별자 목록 비교 모듈(140)은 상기 질의어에 대한 식별결과가 상기 트리플 저장모듈(130)에 존재하지 않은 경우, 상기 다중 온톨로지 데이터베이스로부터 상기 질의어에 대한 식별결과를 획득하여 상기 가시화 모듈(170)을 통해 가시화되도록 한다. 이때, 상기 가시화 모듈(170)을 통해 가시화된 식별결과는 동일관계, 유사관계 등과 같이 상기 질의어와 연관된 개체들의 관계가 설정된 개체 식별자 그룹 요약 정보일 수 있다.In addition, the entity identifier list comparison module 140 obtains an identification result of the query word from the multiple ontology database when the identification result of the query word does not exist in the triple storage module 130. 170) to make it visible. In this case, the identification result visualized through the visualization module 170 may be entity identifier group summary information in which relationships of entities related to the query word are set, such as identity relations and similarity relations.

상기 개체 식별 모듈(150)은 상기 개체 식별자 목록 비교 모듈(140)의 비교결과 상기 다중 온톨로지 데이터베이스로부터 획득된 개체 식별자 목록에 신규 개체 식별자가 포함되어 있는 경우, 상기 신규 개체 식별자에 대한 속성정보를 획득 및 비교하여 개체 식별을 수행하고, 상기 개체 식별에 의해 상기 질의어에 대한 개체 식별자 그룹을 생성한다. 즉, 상기 개체 식별 모듈(150)은 상기 다중 온톨로지 데이터베이스로부터 획득된 개체 식별자 목록에 신규 개체 식별자 목록이 포함되어 있는 경우, 상기 신규 개체 식별자에 대한 개체 식별이 필요하다고 판단하여 상기 신규 개체 식별자에 대한 개체 식별을 수행하게 된다. The entity identification module 150 obtains attribute information on the new entity identifier when the entity identifier list is included in the entity identifier list obtained from the multiple ontology database as a result of the comparison of the entity identifier list comparison module 140. And compare and perform entity identification and generate an entity identifier group for the query by the entity identification. That is, the entity identification module 150 determines that the entity identification for the new entity identifier is necessary when the entity identifier list is included in the entity identifier list obtained from the multiple ontology database. Perform entity identification.

상기와 같은 개체 식별 모듈(150)에 대해 도 3을 참조하여 좀더 상세히 설명하기로 한다. The object identification module 150 as described above will be described in more detail with reference to FIG. 3.

도 3을 참조하면, 개체 식별 모듈(150)은 속성정보 수집부(151), 제1 그룹화부(152), 제2 그룹화부(153), 개체 식별자 그룹 결정부(154), 검증부(155)를 포함한다. Referring to FIG. 3, the entity identification module 150 includes an attribute information collecting unit 151, a first grouping unit 152, a second grouping unit 153, an entity identifier group determining unit 154, and a verification unit 155. ).

상기 속성정보 수집부(151)는 상기 신규 개체 식별자의 속성정보를 상기 다중 온톨로지 데이터베이스로부터 수집한다. 예를 들면, 신규 개체 식별자가 "홍길동"에 대한 URI인 경우, 상기 속성정보 수집부(151)는 상기 다중 온톨로지 데이터베이스로부터 홍길동에 대한 나이, 직업, 출생지, e-mail 주소 등의 속성정보를 수집한다.The attribute information collecting unit 151 collects attribute information of the new entity identifier from the multiple ontology database. For example, when the new entity identifier is a URI for "Hong Gil-dong", the attribution information collecting unit 151 collects attribution information such as age, occupation, place of birth, e-mail address, etc. for Hong Gil-dong from the multiple ontology database. do.

상기 제1 그룹화부(152)는 상기 속성정보 수집부(151)에서 수집된 속성정보 중에서 유형을 나타내는 속성을 이용하여 개체 유형에 따라 상기 신규 개체 식별자를 그룹화한다. 즉, 상기 제1 그룹화부(152)는 상기 수집된 속성정보 중에서 유형을 나타내는 속성을 이용하여 상기 신규 개체 식별자의 개체 유형을 판단하고, 상기 질의어에 대한 개체 식별자 그룹 중에서 상기 신규 개체 식별자의 유형에 해당하는 그룹을 선택하여 상기 신규 개체 식별자의 그룹으로 할당한다. The first grouping unit 152 groups the new entity identifier according to the entity type by using the attribute representing the type among the attribute information collected by the attribute information collecting unit 151. That is, the first grouping unit 152 determines the entity type of the new entity identifier by using an attribute representing a type among the collected attribute information, and determines the entity type of the entity identifier group from the entity identifier group for the query. A corresponding group is selected and assigned to the group of the new entity identifier.

상기 제2 그룹화부(153)는 기 저장된 속성정보 테이블에서 상기 개체 유형에 따른 그룹별로 동일 속성 매핑 정보와 대표 속성을 로딩하고, 각 개체들의 대표 속성을 기준으로 상기 개체 유형에 따른 그룹들을 다시 그룹핑한다. 즉, 상기 제2 그룹화부(153)는 개체 유형별 개체 식별자의 대표 속성명을 기준으로 속성값에 해당하는 문자열의 유사도를 계산하고, 상기 구해진 유사도가 일정 임계값 이상을 가지는 개체 식별자들을 동일 그룹으로 그룹핑한다. 예를 들면, 사람의 경우 대표 속성은 인명이므로, 인명에 해당하는 문자열의 유사도를 계산하고, 그 계산된 유사도가 일정 임계값 이상을 가지는 개체 식별자들을 동일 그룹으로 만든다.The second grouping unit 153 loads the same property mapping information and the representative property for each group according to the object type from the previously stored property information table, and regroups the groups according to the object type based on the representative property of each object. do. That is, the second grouping unit 153 calculates the similarity of the string corresponding to the attribute value based on the representative attribute name of the entity identifier for each object type, and sets the entity identifiers having the predetermined similarity or more to a same group as the same group. Group. For example, in the case of a person, since the representative attribute is a human name, the similarity of the string corresponding to the human name is calculated, and the individual identifiers whose calculated similarity has a predetermined threshold or more are made into the same group.

상기 개체 식별자 그룹 결정부(154)는 상기 제2 그룹화부(153)에서 그룹핑된 각 그룹의 개체들에 대한 연관 속성값을 상기 다중 온톨로지 데이터베이스로부터 획득 및 비교하고, 상기 비교 결과를 근거로 상기 각 그룹을 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 결정한다. 즉, 상기 개체 식별자 그룹 결정부(154)는 각 그룹내 개체들의 연관 속성값을 상기 다중 온톨로지 데이터베이스에서 획득하고, 모든 개체들의 연관 속성값 중에서 같은 속성값을 가지는 개체 식별자가 있는지 확인하여, 같은 속성값을 가지는 개체 식별자가 있는 경우, 같은 속성값을 가지는 개체 식별자들을 묶어서 서브 그룹으로 만든다. 이때, 같은 속성값을 가지는 개체 식별자가 없는 경우에는 상기 제2 그룹화부(153)에서 그룹핑된 그룹을 유지한다. The entity identifier group determiner 154 obtains and compares an associated attribute value for each group of entities grouped by the second grouper 153 from the multiple ontology database, and based on the comparison result, The group is divided into subgroups to determine an entity identifier group for the query. That is, the entity identifier group determiner 154 obtains the association attribute values of the entities in each group from the multiple ontology database, checks whether there is an entity identifier having the same attribute value among the association attribute values of all entities, If there is an object identifier with a value, group the object identifiers with the same attribute value into a subgroup. In this case, when there is no entity identifier having the same attribute value, the second grouping unit 153 maintains the grouped group.

예를 들어, "홍길동"이라는 대표 속성값을 가지는 개체 식별자(URI)의 경우, 상기 개체 식별자 그룹 결정부(154)는 상기 다중 온톨로지 데이터베이스로부터 "홍길동"에 대한 연관 속성값인 "직장", "e-mail 주소"를 획득하고, 상기 연관 속성값인 "직장" 및 "e-mail 주소"가 같은 홍길동은 같은 그룹으로 만든다. 상기와 같은 방법에 의해 상기 개체 식별자 그룹 결정부(154)는 같은 속성값을 가지는 개체 식별자들을 묶어서 서브 그룹으로 만들 수 있다.For example, in the case of an entity identifier (URI) having a representative attribute value of "Hong Gil-dong", the entity identifier group determination unit 154 may determine "work", "association attribute values of" Hong Gil-dong "from the multiple ontology database. e-mail address "is obtained, and Hong Gil-dong having the same" attribute "and" e-mail address "as the related attribute values is made into the same group. By the above method, the entity identifier group determiner 154 may group entity identifiers having the same attribute value into subgroups.

상기 검증부(155)는 신규 개체 식별자에 대한 개체 식별자 그룹을 결정하는 과정을 반복하여 상기 개체 식별자 그룹 결정부(154)에서 결정된 개체 식별자 그룹에 대한 검증을 수행한다. The verification unit 155 repeats the process of determining the entity identifier group for the new entity identifier and verifies the entity identifier group determined by the entity identifier group determiner 154.

다시 도 2를 참조하면, 상기 대표명 선정 모듈(160)은 상기 개체 식별 모듈(150)에서 생성된 개체 식별자 그룹별로 대표명을 선정 및 적용하고, 상기 대표명이 적용된 개체식별결과를 상기 트리플 저장모듈(130)에 저장 및 업데이트한다. 이때, 상기 대표명 선정 모듈(160)은 상기 생성된 개체 식별자 그룹별로 각 그룹에 속한 개체 식별자와 개체명의 통계 값을 이용하여 각 그룹에 대한 대표 식별자 또는 대표 개체명을 선정한다. Referring back to FIG. 2, the representative name selection module 160 selects and applies a representative name for each entity identifier group generated by the entity identification module 150, and applies the entity identification result to which the representative name is applied to the triple storage module. Save to 130 and update. In this case, the representative name selection module 160 selects the representative identifier or representative entity name for each group by using the generated entity identifier and the statistical value of the entity name for each generated entity identifier group.

상기 가시화 모듈(170)은 상기 대표명 선정 모듈(160)을 통해 업데이트된 개체식별결과에 대한 정보를 상기 트리플 저장모듈(130)로부터 획득하여 가시화한다. 여기서, 상기 개체식별결과에 대한 정보는 각 개체 식별자 그룹에 대한 개체 개수, 개체 유형, 대표 개체명, 대표 개체 식별자 등을 포함하는 개체 식별자 그룹 요약 정보를 말할 수 있다. The visualization module 170 obtains and visualizes information on the entity identification result updated by the representative name selection module 160 from the triple storage module 130. Here, the information on the object identification result may refer to entity identifier group summary information including the number of entities, entity type, representative entity name, representative entity identifier, etc. for each entity identifier group.

또한, 상기 가시화 모듈(170)은 질의어 입력 영역, 온톨로지 데이터베이스 연계 명령, 개체 식별자 그룹 요약 목록, 개체 식별자 그룹 요약 그래프, 각 그룹에 대한 상세 개체 식별자 목록, 식별 명령, 편집 명령 등을 포함하는 개체 식별결과 제공 화면을 출력한다.In addition, the visualization module 170 may identify an object including a query input area, an ontology database association command, an object identifier group summary list, an object identifier group summary graph, a detailed object identifier list for each group, an identification command, an editing command, and the like. Print the results provided screen.

상기 개체 식별결과 제공 화면에서 식별 명령이 선택된 경우, 트리플 저장모듈(130)에 업데이트된 개체식별결과에 대한 정보가 출력된다. When the identification command is selected on the entity identification result providing screen, information about the updated entity identification result is output to the triple storage module 130.

또한, 상기 각 그룹에 대한 개체 식별자 목록 중에서 하나의 개체 식별자 목록이 선택되면, 개체 식별에 대한 검증 결과가 상기 개체식별결과 제공 화면의 일정 영역에 출력된다. In addition, if one entity identifier list is selected from the entity identifier list for each group, the verification result for the entity identification is output to a predetermined area of the entity identification result providing screen.

또한, 상기 편집 명령에 의해 개체 식별자 그룹의 대표 개체명 또는 대표 개체 식별자, 서로 다른 그룹을 합병 또는 하나의 그룹을 서로 다른 그룹으로 분할, 특정 그룹에 속한 개체 식별자를 다른 그룹으로 이동 등의 개체 식별자 그룹에 대한 정보를 편집할 수 있다. In addition, the object identifier such as the representative object name or representative object identifier of the object identifier group, merging different groups or dividing one group into different groups by the editing command, and moving an object identifier belonging to a specific group to another group You can edit the information about the group.

상기 편집 모듈(180)은 상기 가시화 모듈(170)을 통해 가시화된 개체식별결과 제공 화면에서 개체 식별자 요약 정보에 대한 편집이 수행된 경우, 그 편집 결과를 상기 트리플 저장모듈(130)에 저장 및 업데이트한다. The editing module 180 stores and updates the editing result in the triple storage module 130 when the editing of the object identifier summary information is performed on the object identification result providing screen visualized by the visualization module 170. do.

도 4는 본 발명에 따른 개체식별결과 검색 장치가 개체 식별 결과를 검색 및 제공하는 방법을 나타낸 흐름도, 도 6은 본 발명에 따른 개체 식별결과 검색 화면을 나타낸 예시도이다.4 is a flowchart illustrating a method of searching for and providing an object identification result by an object identification result search apparatus according to the present invention, and FIG. 6 is an exemplary view showing an object identification result search screen according to the present invention.

도 4를 참조하면, 개체식별결과 검색 장치는 개체명 또는 개체 식별자(URI)에 의한 질의어가 입력되면(S402), 상기 입력된 질의어에 대한 식별결과가 트리플 저장모듈에 존재하는지의 여부를 판단한다(S404). 상기 트리플 저장모듈에는 온톨로지로 표현된 개체식별결과가 저장된 것으로서, 상기 개체식별결과 검색 장치는 상기 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하는지의 여부를 이용하여 신규 개체명 또는 신규 개체 식별자(URI)가 입력되는지의 여부를 판단한다.Referring to FIG. 4, when the query by the entity name or the entity identifier (URI) is input (S402), the apparatus for recognizing the entity identification result determines whether an identification result for the input query word exists in the triple storage module. (S404). The triple storage module stores the entity identification result expressed in ontology, and the entity identification result retrieval apparatus uses a new entity name or a new entity identifier (ID) based on whether an identification result of the query word exists in the triple storage module. Determine whether or not URI) is input.

상기 S404의 판단결과 상기 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하는 경우, 상기 개체식별결과 검색 장치는 다중 온톨로지 데이터베이스로부터 상기 질의어에 대한 식별결과를 획득한다(S406). 즉, 상기 개체식별결과 검색 장치는 Sindice.com, sameAs.org 등을 이용하여 상기 질의어에 대한 식별결과를 획득한다. 상기 질의어에 대한 식별결과는 상기 질의어와 관계를 가진 개체들의 개체 식별자 목록을 말한다. As a result of the determination in S404, when the identification result for the query word exists in the triple storage module, the entity identification result retrieval device obtains the identification result for the query word from the multiple ontology database (S406). That is, the individual identification result retrieval apparatus obtains the identification result for the query using Sindice.com, sameAs.org, and the like. The identification result for the query word refers to a list of entity identifiers of entities related to the query word.

상기 S406의 수행 후, 상기 개체식별결과 검색 장치는 상기 트리플 저장모듈로부터 획득한 상기 질의어에 대한 식별결과를 상기 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하여(S408), 두 식별결과에 의한 식별자 목록이 동일한지의 여부를 판단한다(S410). 즉, 상기 개체식별결과 검색 장치는 상기 트리플 저장모듈로부터의 식별결과에 의한 개체 식별자 목록과 상기 다중 온톨로지 데이터베이스로부터의 식별결과에 의한 개체 식별자 목록을 비교하여, 상기 다중 온톨로지 데이터베이스로부터의 개체 식별자 목록에 신규 개체 식별자가 포함되어 있는지의 여부를 판단한다.After performing S406, the object identification result retrieval apparatus compares the identification result of the query word obtained from the triple storage module with the identification result of the query word obtained from the multiple ontology database (S408). It is determined whether the list of identifiers is the same (S410). That is, the entity identification result retrieval apparatus compares the entity identifier list according to the identification result from the triple storage module with the entity identifier list according to the identification result from the multiple ontology database, and compares the entity identifier list to the entity identifier list from the multiple ontology database. Determine whether a new entity identifier is included.

상기 S410의 판단결과 두 목록이 동일한 경우, 상기 개체식별결과 검색 장치는 트리플 저장모듈로부터 획득된 상기 질의어에 대한 식별결과를 가시화한다(S412). 상기 질의어에 대한 식별결과는 상기 질의어가 사용되고 있는 전체 그룹의 요약 정보를 나타낸 개체 식별자 그룹 요약 정보로서, 상기 개체 식별자 그룹 요약 정보는 해당 그룹의 개체 식별자 개수, 개체 유형, 대표 개체명과 대표 개체 식별자를 포함한다. 즉, 상기 개체 식별결과 검색 장치는 질의어 입력 영역, 외부 데이터베이스 연계 명령, 개체 식별자 그룹 요약 목록, 개체 식별자 그룹 요약 그래프, 각 그룹에 대한 상세 개체 식별자 목록, 식별 명령, 편집 명령 중 적어도 하나를 포함하는 개체 식별결과 제공 화면을 출력한다.If the two lists are the same as the determination result of S410, the entity identification result search apparatus visualizes the identification result for the query word obtained from the triple storage module (S412). The identification result of the query word is entity identifier group summary information indicating summary information of all groups in which the query word is used, and the entity identifier group summary information includes the number of entity identifiers, entity types, representative entity names and representative entity identifiers of the group. Include. That is, the entity identification result retrieval apparatus includes at least one of a query input region, an external database association command, an entity identifier group summary list, an entity identifier group summary graph, a detailed entity identifier list for each group, an identification command, and an editing command. Outputs the screen for providing the object identification result.

상기 가시화된 개체식별결과를 사용자가 편집하는 경우(S414), 상기 개체식별결과 검색 장치는 그 편집 결과를 상기 트리플 저장모듈에 저장한다(S416). 즉, 상기 사용자가 상기 개체식별결과에 대한 수정, 삭제, 이동 중 적어도 하나에 의한 편집을 수행하는 경우, 상기 개체식별결과 검색장치는 그 편집 결과를 상기 트리플 저장모듈에 개체 식별결과로 저장 및 업데이트한다.When the user edits the visualized entity identification result (S414), the entity identification result search apparatus stores the edit result in the triple storage module (S416). That is, when the user edits at least one of the modification, deletion, and movement of the entity identification result, the entity identification result search apparatus stores and updates the edit result as the entity identification result in the triple storage module. do.

상기 개체 식별결과 제공 화면에 대해 도 6을 참조하면, 상기 개체 식별결과 제공 화면은 개체 식별자 또는 개체명의 질의어를 입력하기 위한 질의어 입력 영역, 질의어에 대한 개체 식별자 그룹 요약 정보가 목록 및 그래프로 표시된 개체 식별자 그룹 요약 정보 제공 영역, 각 개체 식별자 그룹에 대한 상세 개체 식별자 목록이 제공되는 상세 개체 식별자 목록 제공 영역을 포함한다.Referring to FIG. 6 for the entity identification result providing screen, the entity identification result providing screen includes a query entry area for inputting an entity identifier or a query name of an entity, an entity in which entity identifier group summary information for the query is displayed in a list and a graph. An identifier group summary information providing area, and a detailed entity identifier list providing area where a detailed entity identifier list for each entity identifier group is provided.

상기 질의어 입력 영역에는 외부 서비스와의 연계를 위한 명령이 존재한다. There is a command for linking with an external service in the query input region.

상기 개체 식별자 그룹 요약 정보 제공 영역에는 트리플 저장모듈에 업데이트된 정보를 이용한 개체식별을 원하는 경우에 선택되는 식별명령, 개체 식별자 그룹 정보의 편집을 위한 편집 명령이 포함되어 있다.The entity identifier group summary information providing area includes an identification command selected when the entity identification using the updated information is desired in the triple storage module and an editing command for editing the entity identifier group information.

상기 편집 명령을 선택하여 개체 식별자 그룹의 대표 개체명 또는 대표 개체 식별자의 편집, 서로 다른 그룹을 합병 또는 하나의 그룹을 서로 다른 그룹으로 분할, 특정 그룹에 속한 개체 식별자를 다른 그룹으로 이동 등의 편집을 수행할 수 있다. 상기 사용자가 개체 식별자 그룹의 대표 개체명과 대표 개체 식별자를 수정한 경우, 상기 개체식별결과 검색 장치는 추후 해당 그룹의 통계값이 조정되더라도 사용자가 수정한 대표 개체 식별자와 대표 개체명은 유지한다. 또한 이렇게 조정된 결과는 추후 개체 식별 과정에 사용된다.Select the edit command to edit the representative entity name or representative entity identifier of the entity identifier group, merge different groups or divide one group into different groups, and move entity identifiers belonging to a specific group to another group. Can be performed. When the user modifies the representative entity name and the representative entity identifier of the entity identifier group, the entity identification result retrieval apparatus maintains the representative entity identifier and the representative entity name modified by the user even if the statistics of the group are subsequently adjusted. This adjusted result is also used later in the identification process.

또한, 사용자는 편집 명령을 이용하여 특정 그룹에 속한 개체 식별자를 다른 그룹으로 이동하거나 삭제하는 것도 가능하다. 상기와 같이 편집된 결과는 다시 트리플 저장모듈에 저장되고, 추후 개체 식별 과정에 반영된다.In addition, the user may move or delete an object identifier belonging to a specific group to another group by using an editing command. The edited result as described above is stored in the triple storage module again and later reflected in the entity identification process.

상기 상세 개체 식별자 목록 제공 영역에서 특정 개체 식별자 목록을 선택한 경우, 상기 개체식별결과 검색 장치는 개체 식별에 대한 검증 결과를 개체 식별결과 제공 화면의 일정 영역에 출력되도록 한다. 즉, 상기 검증 결과는 개체 식별에 사용된 다양한 속성들의 상호 연관 관계를 그래프로 보여주며, 사용자는 그래프를 통해 개체 식별 결과를 확인할 수 있다. When a specific object identifier list is selected in the detailed object identifier list providing area, the object identification result retrieving device outputs a verification result for the object identification to a predetermined area of the object identification result providing screen. That is, the verification result shows a correlation between the various attributes used to identify the object in a graph, and the user can confirm the object identification result through the graph.

또한, 상기 상세 개체 식별자 목록 제공 영역에서 개별 개체 식별자를 선택하면, 상기 개체식별결과 검색 장치는 해당 온톨로지에서 제공하는 SPARQL endpoint 서비스를 통해 관련 속성들을 확인하는 기능도 제공한다.In addition, when the individual entity identifier is selected in the detailed entity identifier list providing area, the entity identification result retrieval device also provides a function of identifying related attributes through the SPARQL endpoint service provided by the ontology.

만약, 상기 S410의 판단결과 두 목록이 동일하지 않으면, 상기 개체식별결과 검색 장치는 신규 개체 식별자를 식별대상으로 그 개체 식별자의 속성정보를 획득 및 비교하여 개체를 식별하고, 상기 개체식별에 의해 상기 질의어에 대한 개체 식별자 그룹을 생성한다(S418). 즉, 상기 개체 식별 장치는 신규 개체명 또는 신규 개체 식별자가 존재하는 경우, 상기 다중 온톨로지 데이터베이스를 대상으로 신규 개체 식별자의 속성 정보를 획득하고, 상기 획득된 속성정보를 이용하여 개체를 식별한다. 상기와 같이 개체가 식별되면, 신규 개체 식별자를 포함하는 개체 식별자 그룹들이 생성된다. 상기의 개체 식별 과정은 매번 모든 개체 식별자를 대상으로 진행하는 것이 아니라 사용자의 질의를 통해 수집된 개체 식별자 목록 중에서 갱신된 개체 식별자가 포함되어 있거나 기존에 개체 식별 과정을 거치지 않은 개체 식별자를 대상으로 진행된다. 상기 개체식별결과 검색 장치가 개체를 식별하는 방법에 대한 상세한 설명은 도 5를 참조하기로 한다.If the two lists are not the same as the result of the determination in S410, the entity identification result retrieval apparatus identifies the entity by acquiring and comparing the attribute information of the entity identifier with the new entity identifier as an object of identification, and by the entity identification, An entity identifier group for the query is generated (S418). That is, when a new entity name or a new entity identifier exists, the entity identification apparatus acquires attribute information of the new entity identifier for the multiple ontology database, and identifies the entity using the acquired attribute information. When an entity is identified as above, entity identifier groups containing new entity identifiers are created. The above object identification process is not performed on every object identifier every time, but on an object identifier that includes an updated object identifier from a list of object identifiers collected through a user's query or which has not been previously identified. do. A detailed description of how the entity identification result retrieval apparatus identifies the entity will be described with reference to FIG. 5.

상기 S418이 수행되면, 상기 개체식별결과 검색 장치는 상기 개체 식별을 통해 생성된 개체 식별자 그룹별로 대표 개체 식별자 또는 대표 개체명을 선정하여 상기 트리플 저장모듈을 업데이트한다(S420). 즉, 상기 개체식별결과 검색 장치는 개체 식별이 완료된 개체 식별자 그룹을 대상으로 각 그룹에 속한 개체 식별자와 개체명의 통계 값을 이용하여 각 그룹의 대표 개체 식별자와 대표 개체명을 선정하게 된다.When S418 is performed, the entity identification result search apparatus updates the triple storage module by selecting a representative entity identifier or a representative entity name for each entity identifier group generated through the entity identification (S420). That is, the entity identification result retrieval apparatus selects a representative entity identifier and a representative entity name of each group by using an entity identifier belonging to each group and a statistical value of the entity name for the entity identifier group on which the entity identification is completed.

상기 S420의 수행 후 상기 개체식별결과 검색 장치는 상기 업데이트된 개체 식별결과에 대한 정보를 상기 트리플 저장모듈로부터 획득하여 가시화하고(S422), 상기 S414를 수행한다. After performing the S420, the object identification result search apparatus obtains and visualizes the information on the updated object identification result from the triple storage module (S422), and performs the S414.

만약, 상기 S404의 판단결과 상기 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하지 않은 경우, 상기 개체식별결과 검색 장치는 상기 다중 온톨로지 데이터베이스로부터 상기 질의어에 대한 식별결과를 획득하여 가시화한다(S424).If the identification result of the query word does not exist in the triple storage module as a result of the determination in S404, the entity identification result retrieval apparatus obtains and visualizes the identification result of the query word from the multiple ontology database (S424). .

도 5는 본 발명에 따른 개체식별결과 검색 장치가 개체를 식별하는 방법을 나타낸 흐름도이다. 5 is a flowchart illustrating a method for identifying an entity by the entity identification result retrieval apparatus according to the present invention.

도 5를 참조하면, 개체식별결과 검색 장치는 다중 온톨로지 데이터베이스로부터 식별 대상인 신규 개체 식별자의 속성정보를 획득하고(S502), 상기 획득된 속성정보에서 유형을 나타내는 속성을 이용하여 개체 유형에 따라 상기 신규 개체 식별자에 그룹을 할당한다(S504). 즉, 상기 개체식별결과 검색 장치는 상기 신규 개체 식별자의 속성 정보 중 rdf:type 또는 명시적 유형의 클래스와의 상하위 관계를 통해 개체의 유형을 구분할 수 있는 속성을 확인하고, 상기 확인된 개체 유형에 상기 신규 개체 식별자를 할당한다.Referring to FIG. 5, the apparatus for recognizing an entity identification result acquires attribute information of a new entity identifier to be identified from a multiple ontology database (S502), and uses the attribute representing a type in the acquired attribute information according to the entity type. A group is assigned to the entity identifier (S504). That is, the object identification result retrieval apparatus checks the property that can distinguish the type of the object through the parent-child relationship between the rdf: type or the explicit type class among the property information of the new object identifier, and checks the identified object type. Assign the new entity identifier.

예를 들어 표 1을 참조하면, foaf:person의 하위 클래스가 존재하는 경우, 해당 하위 클래스는 인명을 의미하는 클래스로 판단할 수 있다. 즉, A 온톨로지에 속한 1번 클래스인 kisti:person이 foaf:person의 하위 클래스인 경우, 상기 개체식별결과 검색 장치는 kisti:person이 사람에 해당하는 개체 유형임을 식별하고 저장함으로써 추후 개체의 유형 판단에 사용한다.For example, referring to Table 1, if a subclass of foaf: person exists, the subclass can be determined to be a class meaning a lifespan. That is, if kisti: person, class 1 belonging to Ontology A, is a subclass of foaf: person, the entity identification result retrieval device determines the type of the entity later by identifying and storing kisti: person as the entity type corresponding to the person. Used for

표 1 kisti:person rdf:type Identity:Person foaf:person rdf:type Identity:Person kisti:institution rdf:type Identity:Institution Table 1 kisti: person rdf: type Identity: Person foaf: person rdf: type Identity: Person kisti: institution rdf: type Identity: Institution

상기 S504가 수행되면, 상기 개체식별결과 검색 장치는 속성정보 테이블에서 상기 개체 유형에 따라 그룹핑된 각 그룹에 대한 동일 속성 매핑 정보와 대표 속성을 로딩한다(S506). 즉, 상기 개체식별결과 검색 장치는 식별 대상 개체의 유형에 따라 식별에 사용할 다중 온톨로지의 속성 간 동일 속성 매핑 정보(예, kisti:hasCreator와 foaf:maker는 동일 속성임)와 대표 속성(예: 사람의 대표 속성은 foaf 온톨로지에서는 “foaf:name" 속성임)을 로딩한다. When the S504 is performed, the entity identification result retrieval apparatus loads the same attribute mapping information and the representative attribute for each group grouped according to the entity type in the attribute information table (S506). That is, the object identification result retrieval apparatus may use the same attribute mapping information (e.g., kisti: hasCreator and foaf: maker are the same attribute) and representative attributes (e.g., person) between attributes of multiple ontologies to be used for identification according to the type of object to be identified. The representative attribute of is loaded with “foaf: name” attribute in foaf ontology.

상기 S506이 수행되면, 상기 개체식별결과 검색 장치는 상기 개체 유형별로 그룹화된 그룹들을 대표 속성을 기준으로 다시 그룹화한다(S508). 즉, 상기 개체식별결과 검색 장치는 개체 유형별 개체 식별자의 대표 속성명을 기준으로 속성값에 해당하는 문자열의 유사도를 계산하고, 상기 구해진 유사도가 일정 임계값 이상을 가지는 개체 식별자들을 동일 그룹으로 그룹핑한다. When S506 is performed, the entity identification result retrieval apparatus regroups the groups grouped by the entity type based on the representative attribute (S508). That is, the entity identification result retrieval device calculates the similarity of the string corresponding to the attribute value based on the representative attribute name of the entity identifier for each entity type, and groups the entity identifiers having the predetermined similarity greater than or equal to a predetermined threshold value into the same group. .

예를 들면, 사람의 경우 인명을, 회사의 경우 회사명을 대상으로 유사도를 계산하고, 그 계산 결과를 이용하여 그룹핑한다. 이 경우 비교적 단문의 문자열 비교에 적합한 Jaro Winkler Distance 문자열 비교 방법을 사용한다.For example, in the case of people, the similarity is calculated for the human name and in the case of the company, and grouped using the calculated result. In this case, we use the Jaro Winkler Distance string comparison method, which is suitable for relatively short string comparisons.

또한, 상기 개체식별결과 검색 장치는 대표 속성명을 미리 정해진 규칙에 따라 일정한 형식으로 만든 후, 유사도 계산을 통해 그룹핑하게 된다. 예를 들면, 인명의 경우, First Name, Middle Name, Last Name을 고려하여 문자열 비교를 통해 유사도를 계산한다.  In addition, the entity identification result retrieval apparatus forms the representative attribute names in a predetermined format according to a predetermined rule, and then groups them through similarity calculation. For example, in the case of human names, the similarity is calculated through string comparison considering the First Name, Middle Name, and Last Name.

또한, 기관명의 경우 ".inc", "co", "INC" 등의 표기명을 고려해서 문자열 비교를 통해 유사도를 계산한다.In addition, in the case of the institution name, similarity is calculated through string comparison considering the notation names ".inc", "co", and "INC".

상기 S508의 수행 후, 상기 개체식별결과 검색 장치는 각 그룹에 속하는 개체 식별자들의 연관 속성값을 상기 다중 온톨로지 데이터베이스로부터 획득하여 비교하고, 그 비교결과를 근거로 상기 각 그룹을 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 결정한다(S510).After performing the step S508, the entity identification result retrieval apparatus obtains and compares the associated attribute values of the entity identifiers belonging to each group from the multiple ontology database and divides each group into subgroups based on the comparison result. The entity identifier group for the is determined (S510).

즉, 상기 개체식별결과 검색 장치는 각 그룹에 속하는 개체 식별자에 대한 연관 속성값을 상기 다중 온톨로지 데이터베이스에서 획득하고, 같은 연관 속성값을 가지는 개체 식별자들이 존재하는지 확인한다. 상기 확인결과 같은 연관 속성값을 가지는 개체 식별자들이 존재하는 경우, 상기 개체식별결과 검색 장치는 같은 속성값을 가지는 개체 식별자들을 묶어 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 결정한다. That is, the entity identification result retrieval apparatus obtains an association attribute value for an entity identifier belonging to each group from the multiple ontology database and checks whether entity identifiers having the same association attribute value exist. If there are entity identifiers having the same attribute value as the result of the checking, the entity identification result retrieval apparatus determines the entity identifier group for the query by dividing the entity identifiers having the same attribute value into subgroups.

이 과정을 통해 상기 개체식별결과 검색 장치는 이전 개체 유형이나 개체명을 기준으로 개체 식별자를 그룹화하는 과정에서 다른 그룹으로 분류된 개체 식별자간 매핑이나 같은 그룹이지만 매핑 속성이 없는 개체 식별자들을 확인하게 된다. Through this process, the entity identification result retrieval device may identify entity identifiers classified into different groups or entity identifiers classified into different groups or entity identifiers having the same group but no mapping property in the process of grouping the entity identifiers based on the previous entity type or entity name. .

즉, 대표 속성이 다른 그룹에 속한 개체 식별자 1, 2가 같은 연관 속성값 A로 매핑되어 있을 경우, 상기 개체식별결과 검색 장치는 A의 연관 속성값을 획득하여 개체 식별자 1, 2가 모두 A의 연관 속성으로 포함되어 있는지를 확인한다.That is, when the representative attributes are mapped to the same association attribute value A of the entity identifiers 1 and 2 belonging to different groups, the entity identification result retrieval device obtains the association attribute value of A so that the entity identifiers 1 and 2 are both Check if it is included as an association property.

예를 들어, 개체 식별자 1, 2는 다른 저자명이지만, 모두 A논문의 저자 관계를 가지고 있을 경우, 상기 개체식별결과 검색 장치는 A논문의 연관속성을 수집하여 개체 식별자 1, 2가 모두 저자관계로 연결되어 있는지 확인한다.For example, if the individual identifiers 1 and 2 are different author names, but all have the author relationship of the A paper, the individual identification result retrieval apparatus collects the association attributes of the A paper, and the individual identifiers 1 and 2 are all the author relationship. Check that it is connected.

상기 S510이 수행되면, 상기 개체식별결과 검색장치는 상기 S502부터 상기 S510을 반복 수행하여 개체식별결과를 검증하고, 개체 식별자 그룹을 최종으로 확정한다(S512).When the S510 is performed, the object identification result retrieval apparatus repeats the steps S502 to S510 to verify the object identification result and finalizes the object identifier group (S512).

이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.As such, those skilled in the art will appreciate that the present invention can be implemented in other specific forms without changing the technical spirit or essential features thereof. Therefore, the above-described embodiments are to be understood as illustrative in all respects and not as restrictive. The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present invention. do.

이상과 같이 본 발명의 개체 식별 결과 검색 시스템 및 방법은 Linked Data에 포함된 다중 온톨로지의 속성 정보를 이용하여 다양한 유형의 개체들을 점진적으로 식별할 필요성이 높은 것에 적합하다.As described above, the object identification result retrieval system and method of the present invention is suitable for a high necessity of gradually identifying various types of entities using attribute information of multiple ontologies included in linked data.

Claims (28)

개체들에 대한 속성정보가 온톨로지로 저장된 다중 온톨로지 데이터베이스; 및A multiple ontology database in which attribute information of entities is stored as an ontology; And 질의어가 입력된 경우, 상기 질의어에 대한 식별결과를 트리플 저장모듈로부터 획득하고, 상기 획득된 식별결과를 상기 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하여 개체식별 필요 여부를 판단하고, 개체식별이 필요한 경우 상기 다중 온톨로지 데이터베이스로부터 식별대상 개체의 속성정보를 획득 및 비교하여 개체들을 식별하고, 상기 개체식별에 따른 결과정보를 제공하는 개체식별결과 검색장치;When a query is input, the identification result of the query is obtained from the triple storage module, and the obtained identification result is compared with the identification result of the query obtained from the multiple ontology database to determine whether individual identification is necessary. An object identification result retrieval apparatus for identifying individuals by obtaining and comparing attribute information of the object to be identified from the multiple ontology database and providing result information according to the object identification when the object identification is required; 를 포함하는 개체 식별 결과 검색 시스템.Object identification results retrieval system comprising a. 제1항에 있어서, The method of claim 1, 상기 트리플 저장모듈에는 각 개체에 대한 개체식별결과가 트리플 형태로 저장된 것을 특징으로 하는 개체 식별 결과 검색 시스템.The triple storage module, the object identification result retrieval system, characterized in that the object identification results for each object is stored in a triple form. 제1항에 있어서, The method of claim 1, 상기 개체식별결과 검색장치는 상기 트리플 저장모듈로부터의 식별결과에 의한 개체 식별자 목록과 상기 다중 온톨로지 데이터베이스로부터의 식별결과에 의한 개체 식별자 목록을 비교하고, 상기 비교결과 상기 다중 온톨로지 데이터베이스로부터 획득된 개체 식별자 목록에 신규 개체 식별자가 포함되어 있는 경우, 개체식별이 필요하다고 판단하고 그 신규 개체 식별자를 식별대상 개체로 하는 것을 특징으로 하는 개체 식별 결과 검색 시스템.The entity identification result retrieval apparatus compares the entity identifier list based on the identification result from the triple storage module with the entity identifier list based on the identification result from the multiple ontology database, and compares the entity identifier obtained from the multiple ontology database. If the list includes a new object identifier, the object identification result retrieval system, characterized in that it is determined that the object identification is necessary and the new object identifier as the object to be identified. 제1항에 있어서,The method of claim 1, 상기 개체식별결과 검색장치는 상기 다중 온톨로지 데이터베이스로부터 획득된 식별대상 개체들의 속성정보에서 유형을 나타내는 속성을 이용하여 개체 유형에 따라 그룹화하고, 각 개체들의 대표 속성을 기준으로 상기 개체 유형에 따라 그룹화된 각 그룹들을 다시 그룹화한 후, 상기 재그룹화된 각 그룹별로 개체들의 연관 속성값을 상기 다중 온톨로지 데이터베이스로부터 획득하여 비교하고, 상기 비교결과를 근거로 상기 각 그룹을 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 생성하는 것을 특징으로 하는 개체 식별 결과 검색 시스템.The object identification result retrieval apparatus is grouped according to the object type using an attribute indicating the type in the attribute information of the subjects to be identified obtained from the multiple ontology database, and grouped according to the object type based on the representative attributes of the respective entities. After regrouping the groups, the property values of the entities for each of the regrouped groups are obtained and compared from the multiple ontology database, and each group is divided into subgroups based on the comparison result. Generating a group of identifiers. 제4항에 있어서, The method of claim 4, wherein 상기 개체식별결과 검색 장치는, The object identification result search apparatus, 상기 질의어에 대한 개체 식별자 그룹별로 대표 개체 식별자 또는 대표 개체명을 선정하고, 각 개체 식별자 그룹에 대한 개체 개수, 개체 유형, 대표 개체명, 대표 개체 식별자 중 적어도 하나를 포함하는 개체 식별자 그룹 요약 정보를 개체 식별에 따른 결과정보로 제공하는 것을 특징으로 하는 개체 식별 결과 검색 시스템.Representative entity identifiers or representative entity names are selected for each entity identifier group for the query, and entity identifier group summary information including at least one of entity number, entity type, representative entity name, and representative entity identifier for each entity identifier group is obtained. An object identification result retrieval system, characterized in that provided as the result information according to the object identification. 제1항에 있어서, The method of claim 1, 상기 개체식별결과 검색장치는 개체식별결과의 수정, 삭제, 이동 중 적어도 하나에 의한 편집이 수행된 경우, 상기 편집된 정보를 상기 트리플 저장모듈에 개체 식별결과로 저장 및 업데이트하고, 상기 업데이트된 개체식별결과는 추후 상기 질의어에 대한 개체식별에 이용되는 것을 특징으로 하는 개체 식별 결과 검색 시스템.The object identification result retrieval apparatus stores and updates the edited information as the object identification result in the triple storage module when the editing by at least one of the modification, deletion, and movement of the object identification result is performed, and the updated entity. And the identification result is used later for identifying the query. 각 개체에 대한 개체 식별결과가 트리플 형태로 저장된 트리플 저장모듈;A triple storage module storing entity identification results for each entity in triple form; 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하는지의 여부를 판단하고, 존재하는 경우 상기 트리플 저장모듈로부터 획득된 상기 질의어에 대한 식별결과를 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하여 개체식별 필요 여부를 판단하는 개체 식별자 목록 비교 모듈;It is determined whether an identification result of the query word exists in the triple storage module, and if present, the identification result of the query word obtained from the triple storage module is compared with the identification result of the query word obtained from a multiple ontology database. An object identifier list comparison module for determining whether object identification is necessary; 상기 판단결과 개체식별이 필요한 경우, 신규 개체 식별자에 대한 속성정보를 획득 및 비교하여 개체 식별을 수행하고, 상기 개체 식별에 의해 상기 질의어에 대한 개체 식별자 그룹을 생성하는 개체 식별모듈; 및An entity identification module for performing entity identification by acquiring and comparing attribute information on a new entity identifier when the entity identification is necessary and generating an entity identifier group for the query by the entity identification; And 상기 생성된 개체 식별자 그룹별로 대표명을 선정 및 적용하고, 상기 대표명이 적용된 개체식별결과를 상기 트리플 저장모듈에 저장 및 업데이트하는 대표명 선정 모듈;A representative name selection module for selecting and applying a representative name for each generated entity identifier group, and storing and updating the entity identification result to which the representative name is applied to the triple storage module; 을 포함하는 개체식별결과 검색 장치.Object identification result search device comprising a. 제7항에 있어서, The method of claim 7, wherein 상기 개체식별결과에 대한 정보를 상기 트리플 저장모듈로부터 획득하여 가시화하는 가시화 모듈을 더 포함하는 개체식별결과 검색 장치.And a visualization module for obtaining and visualizing the information on the individual identification result from the triple storage module. 제8항에 있어서, The method of claim 8, 상기 가시화된 개체식별결과에 대한 수정, 삭제, 이동 중 적어도 하나에 의한 편집이 수행된 경우, 그 편집 결과를 상기 트리플 저장모듈에 개체 식별결과로 저장 및 업데이트하고, 상기 업데이트된 개체식별결과는 추후 상기 질의어에 대한 개체식별에 이용되도록 하는 편집 모듈을 더 포함하는 개체식별결과 검색장치.When editing by at least one of the modified, deleted, and moved of the visualized object identification result is performed, the edited result is stored and updated as the object identification result in the triple storage module, and the updated object identification result is later And an editing module for using the object identification for the query. 제7항에 있어서, The method of claim 7, wherein 상기 개체 식별자 목록 비교 모듈은 상기 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하지 않은 경우, 상기 다중 온톨로지 데이터베이스로부터 상기 질의어에 대한 식별결과를 획득하여 상기 가시화 모듈을 통해 가시화되도록 하는 것을 특징으로 하는 개체식별결과 검색 장치.The entity identifier list comparison module obtains an identification result of the query word from the multiple ontology database and makes it visible through the visualization module when the identification result of the query word does not exist in the triple storage module. Object identification result retrieval device. 제7항에 있어서, The method of claim 7, wherein 상기 개체 식별자 목록 비교 모듈은 상기 트리플 저장모듈로부터 획득된 상기 질의어에 대한 식별결과에 따른 개체 식별자 목록과 상기 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과에 따른 개체 식별자 목록을 비교하고, 상기 비교결과 상기 다중 온톨로지 데이터베이스로부터 획득된 개체 식별자 목록에 신규 개체 식별자가 포함되어 있는 경우, 개체식별이 필요하다고 판단하고 그 신규 개체 식별자를 식별대상 개체로 하는 것을 특징으로 하는 개체 식별 결과 검색 시스템.The entity identifier list comparison module compares the entity identifier list according to the identification result for the query word obtained from the triple storage module with the entity identifier list according to the identification result for the query word obtained from the multiple ontology database, and compares the entity identifier list. As a result, when the new object identifier is included in the list of the object identifiers obtained from the multiple ontology database, it is determined that the object identification is necessary, and the new object identifier is used as the object to be identified. 제7항에 있어서, The method of claim 7, wherein 상기 트리플 저장모듈에는 각 개체에 대한 개체 식별자 그룹 요약 정보, 편집된 개체 식별자 그룹 요약 정보가 저장된 것을 특징으로 하는 개체식별결과 검색 장치.And the triple storage module stores entity identifier group summary information and edited entity identifier group summary information for each entity. 제7항에 있어서,The method of claim 7, wherein 상기 질의어는 개체명 또는 URI의 형태인 것을 특징으로 하는 개체식별결과 검색 장치.And said query is in the form of an entity name or a URI. 제7항에 있어서, The method of claim 7, wherein 상기 개체 식별모듈은, The object identification module, 상기 신규 개체 식별자의 속성정보를 상기 다중 온톨로지 데이터베이스로부터 획득하여 개체 유형을 기준으로 그룹화하고, 상기 개체 유형에 따른 그룹별로 각 개체들의 대표 속성을 기준으로 다시 그룹화 한 후, 상기 재그룹화된 각 그룹별로 개체들에 대한 연관 속성값을 상기 다중 온톨로지 데이터베이스로부터 획득 및 비교하고, 상기 비교 결과를 근거로 상기 각 그룹을 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 결정하는 것을 특징으로 하는 개체식별결과 검색장치.The attribute information of the new entity identifier is obtained from the multiple ontology database, grouped by entity type, grouped again based on the representative attribute of each entity for each group according to the entity type, and then for each regrouped group. The object identification result retrieval method may include obtaining and comparing an associated attribute value for each entity from the multiple ontology database, and dividing each group into subgroups based on the comparison result to determine an entity identifier group for the query. Device. 제7항에 있어서,The method of claim 7, wherein 상기 대표명 선정 모듈은 The representative name selection module 상기 생성된 개체 식별자 그룹별로 각 그룹에 속한 개체 식별자와 개체명의 통계 값을 이용하여 각 그룹에 대한 대표 식별자 또는 대표 개체명을 선정하는 것을 특징으로 하는 개체식별결과 검색 장치.And a representative identifier or representative entity name for each group by using the generated entity identifier group and the statistical value of the entity name of each entity group. 제7항에 있어서,The method of claim 7, wherein 상기 개체식별결과에 대한 정보는 각 개체 식별자 그룹에 대한 개체 개수, 개체 유형, 대표 개체명, 대표 개체 식별자 중 적어도 하나를 포함하는 개체 식별자 그룹 요약 정보를 포함하는 것을 특징으로 하는 개체식별결과 검색 장치.The object identification result retrieval apparatus may include information on an object identifier group summary information including at least one of an object number, an object type, a representative entity name, and a representative entity identifier for each entity identifier group. . 제7항에 있어서,The method of claim 7, wherein 상기 가시화 모듈은 질의어 입력 영역, 온톨로지 데이터베이스 연계 명령, 개체 식별자 그룹 요약 목록, 개체 식별자 그룹 요약 그래프, 각 그룹에 대한 상세 개체 식별자 목록, 식별 명령, 편집 명령 중 적어도 하나를 포함하는 개체식별결과 제공 화면을 출력하는 것을 특징으로 하는 개체식별결과 검색 장치.The visualization module may include an object identification result providing screen including at least one of a query input area, an ontology database association command, an object identifier group summary list, an object identifier group summary graph, a detailed object identifier list for each group, an identification command, and an editing command. The object identification result search apparatus, characterized in that for outputting. 제17항에 있어서,The method of claim 17, 상기 개체식별결과 제공화면에서 식별 명령이 선택된 경우, 트리플 저장모듈에 업데이트된 개체식별결과에 대한 정보가 출력되고, When the identification command is selected on the object identification result providing screen, information about the updated entity identification result is output to the triple storage module. 상기 각 그룹에 대한 개체 식별자 목록 중에서 하나의 개체 식별자 목록이 선택되면, 개체 식별에 대한 검증 결과가 상기 개체식별결과 제공 화면의 일정 영역에 출력되는 것을 특징으로 하는 개체식별결과 검색 장치.And when a single entity identifier list is selected from the list of entity identifiers for each group, a verification result of the entity identification is output to a predetermined region of the object identification result providing screen. 제17항에 있어서,The method of claim 17, 상기 편집 명령에 의해 개체 식별자 그룹의 대표 개체명 또는 대표 개체 식별자, 서로 다른 그룹을 합병 또는 하나의 그룹을 서로 다른 그룹으로 분할, 특정 그룹에 속한 개체 식별자를 다른 그룹으로 이동 중 적어도 하나의 편집을 수행하는 것을 특징으로 하는 개체식별결과 검색 장치.Editing of at least one of the representative entity name or representative entity identifier of the entity identifier group, merging different groups, dividing one group into different groups, and moving an entity identifier belonging to a specific group to another group by the editing command Device identification result retrieval apparatus, characterized in that performing. 개체식별결과 검색장치가 질의어에 대한 개체식별결과를 제공하는 방법에 있어서,In the object identification result retrieval apparatus to provide the object identification results for the query, (a) 질의어가 입력된 경우, 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하는지의 여부를 판단하는 단계;(a) when a query is input, determining whether an identification result of the query exists in the triple storage module; (b) 상기 판단결과 존재하는 경우, 상기 트리플 저장모듈로부터 획득된 상기 질의어에 대한 식별결과를 다중 온톨로지 데이터베이스로부터 획득된 상기 질의어에 대한 식별결과와 비교하는 단계;(b) comparing the identification result of the query word obtained from the triple storage module with the identification result of the query word obtained from a multiple ontology database when the determination result exists; (c) 상기 비교결과 상기 다중 온톨로지 데이터베이스로부터 획득된 식별결과에 신규 개체 식별자가 포함되어 있는 경우, 상기 신규 개체 식별자에 대한 속성정보를 획득 및 비교하여 상기 질의어에 대한 개체 식별을 수행하고, 상기 개체 식별에 의해 상기 질의어에 대한 개체 식별자 그룹을 생성하는 단계; 및(c) when the comparison result includes a new entity identifier in the identification result obtained from the multiple ontology database, obtains and compares attribute information on the new entity identifier, and performs entity identification on the query; Creating an entity identifier group for the query by identification; And (d) 상기 생성된 개체 식별자 그룹별로 대표명을 선정 및 적용하고, 상기 대표명이 적용된 개체식별결과를 상기 트리플 저장모듈에 저장 및 업데이트하는 단계;(d) selecting and applying a representative name for each generated entity identifier group, and storing and updating the entity identification result to which the representative name is applied to the triple storage module; 를 포함하는 개체식별결과 검색 방법.Object identification result search method comprising a. 제20항에 있어서, The method of claim 20, 상기 개체식별결과에 대한 정보를 상기 트리플 저장모듈로부터 획득하여 가시화하는 단계를 더 포함하는 개체식별결과 검색 방법.And obtaining the information on the object identification result from the triple storage module and visualizing the object identification result. 제21항에 있어서, The method of claim 21, 상기 가시화된 개체식별결과에 대한 수정, 삭제, 이동 중 적어도 하나에 의한 편집이 수행된 경우, 그 편집 결과를 상기 트리플 저장모듈에 개체 식별결과로 저장 및 업데이트하는 단계를 더 포함하는 개체식별결과 검색 방법.Storing and updating the edited result as the object identification result in the triple storage module when the editing is performed by at least one of the modification, deletion, and movement of the visualized object identification result. Way. 제20항에 있어서,The method of claim 20, 상기 (b) 단계에서,In step (b), 상기 (a)단계의 판단결과, 상기 질의어에 대한 식별결과가 상기 트리플 저장모듈에 존재하지 않은 경우, 상기 다중 온톨로지 데이터베이스로부터 상기 질의어에 대한 식별결과를 수집하여 가시화하는 것을 특징으로 하는 개체식별결과 검색 방법.As a result of the determination in step (a), when the identification result for the query word does not exist in the triple storage module, the identification result search for the individual search word is collected and visualized from the multiple ontology database. Way. 제20항에 있어서, The method of claim 20, 상기 (b) 단계는, In step (b), 상기 트리플 저장모듈로부터의 식별결과에 의한 개체 식별자 목록과 상기 다중 온톨로지 데이터베이스로부터의 식별결과에 의한 개체 식별자 목록을 비교하는 것을 특징으로 하는 개체식별결과 검색 방법.And comparing the entity identifier list according to the identification result from the triple storage module with the entity identifier list according to the identification result from the multiple ontology database. 제20항에 있어서, The method of claim 20, 상기 질의어는 개체명 또는 URI의 형태인 것을 특징으로 하는 개체식별결과 검색 방법.And said query is in the form of an entity name or a URI. 제20항에 있어서,The method of claim 20, 상기 (c)단계는,Step (c) is, 상기 신규 개체 식별자의 속성정보를 상기 다중 온톨로지 데이터베이스로부터 획득하여 개체 유형을 기준으로 그룹화하고, 상기 개체 유형에 따른 그룹별로 각 개체들의 대표 속성을 기준으로 다시 그룹화 한 후, 상기 재그룹화된 각 그룹별로 개체들에 대한 연관 속성값을 상기 다중 온톨로지 데이터베이스로부터 획득 및 비교하고, 상기 비교 결과를 근거로 상기 각 그룹을 서브 그룹으로 나누어 상기 질의어에 대한 개체 식별자 그룹을 결정하는 것을 특징으로 하는 개체식별결과 검색 방법.The attribute information of the new entity identifier is obtained from the multiple ontology database, grouped by entity type, grouped again based on the representative attribute of each entity for each group according to the entity type, and then for each regrouped group. The object identification result retrieval method may include obtaining and comparing an associated attribute value for each entity from the multiple ontology database, and dividing each group into subgroups based on the comparison result to determine an entity identifier group for the query. Way. 제20항에 있어서,The method of claim 20, 상기 (d)단계는, In step (d), 상기 생성된 개체 식별자 그룹별로 각 그룹에 속한 개체 식별자와 개체명의 통계 값을 이용하여 각 그룹에 대한 대표 식별자 또는 대표 개체명을 선정하는 것을 특징으로 하는 개체식별결과 검색 방법.And a representative identifier or representative entity name for each group is selected for each generated entity identifier group using statistical values of entity identifiers and entity names belonging to each group. 제20항에 있어서,The method of claim 20, 상기 개체식별결과에 대한 정보는 각 개체 식별자 그룹에 대한 개체 개수, 개체 유형, 대표 개체명, 대표 개체 식별자 중 적어도 하나를 포함하는 개체 식별자 그룹 요약 정보를 포함하는 것을 특징으로 하는 개체식별결과 검색 방법.The object identification result retrieval method comprises the entity identifier group summary information including at least one of an entity number, an entity type, a representative entity name, and a representative entity identifier for each entity identifier group. .
PCT/KR2011/007357 2011-07-08 2011-10-05 Object identification result searching system and method Ceased WO2013008978A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2011-0067703 2011-07-08
KR1020110067703A KR101243056B1 (en) 2011-07-08 2011-07-08 System and Method for searching of entity identification result

Publications (1)

Publication Number Publication Date
WO2013008978A1 true WO2013008978A1 (en) 2013-01-17

Family

ID=47506243

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2011/007357 Ceased WO2013008978A1 (en) 2011-07-08 2011-10-05 Object identification result searching system and method

Country Status (2)

Country Link
KR (1) KR101243056B1 (en)
WO (1) WO2013008978A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11488645B2 (en) 2012-04-12 2022-11-01 Micron Technology, Inc. Methods for reading data from a storage buffer including delaying activation of a column select
US20240095105A1 (en) * 2022-09-20 2024-03-21 Sap Se Message query service and message generation for a social network

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10467235B2 (en) * 2013-04-11 2019-11-05 The Boeing Company Identifying contextual results within associative memories
KR101586258B1 (en) 2014-09-30 2016-01-18 경북대학교 산학협력단 Conflict resolution method of patterns for generating linked data, recording medium and device for performing the method
KR102309375B1 (en) * 2019-06-26 2021-10-06 주식회사 카카오 Apparatus and method for knowledge graph indexing

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090012467A (en) * 2007-07-30 2009-02-04 한국과학기술정보연구원 Integrated search system and method using JR database
KR20090107303A (en) * 2008-04-08 2009-10-13 한국과학기술정보연구원 Multiple object-oriented integrated search system and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090012467A (en) * 2007-07-30 2009-02-04 한국과학기술정보연구원 Integrated search system and method using JR database
KR20090107303A (en) * 2008-04-08 2009-10-13 한국과학기술정보연구원 Multiple object-oriented integrated search system and method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAEHONG KIM ET AL.: "Incremental Entity Identification using Properties in Multiple Ontologies", PROCEEDING OF 2011 SUMMER CONFERENCE IN KSII, vol. 12, no. 1, 30 June 2011 (2011-06-30), pages 101 - 102 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11488645B2 (en) 2012-04-12 2022-11-01 Micron Technology, Inc. Methods for reading data from a storage buffer including delaying activation of a column select
US20240095105A1 (en) * 2022-09-20 2024-03-21 Sap Se Message query service and message generation for a social network
US12159174B2 (en) * 2022-09-20 2024-12-03 Sap Se Message query service and message generation for a social network

Also Published As

Publication number Publication date
KR20130005967A (en) 2013-01-16
KR101243056B1 (en) 2013-03-13

Similar Documents

Publication Publication Date Title
WO2021051558A1 (en) Knowledge graph-based question and answer method and apparatus, and storage medium
RU2698423C2 (en) Filling user contact records
WO2018205373A1 (en) Method and apparatus for estimating injury claims settlement and loss adjustment expense, server and medium
WO2010095867A4 (en) Customized intellectual system for searching internet information using symbols and icons through a mobile communication terminal and an ip-based information terminal
JP2019532370A (en) User authority data search method and electronic device
WO2021003956A1 (en) Product information management method, apparatus and device, and storage medium
WO2020087981A1 (en) Method and apparatus for generating risk control audit model, device and readable storage medium
WO2013008978A1 (en) Object identification result searching system and method
WO2020242086A1 (en) Server, method, and computer program for inferring comparative advantage of multi-knowledge
WO2020130418A1 (en) Method for analyzing supply chain risk of suppliers
WO2011136425A1 (en) Device and method for resource description framework networking using an ontology schema having a combined named dictionary and combined mining rules
WO2011162446A1 (en) Module and method for deciding named entity of term using named entity dictionary combined with ontology schema and mining rule
WO2010123168A1 (en) Database management method and system
WO2020062640A1 (en) Method, server and storage medium for switching dynamic copywriting language of terminal application
WO2011162444A1 (en) Named entity dictionary combined with ontology schema and device and method for renewing named entity dictionary or mining rule database using mining rule
WO2017107367A1 (en) Method for user identifier processing, terminal and nonvolatile computer readable storage medium thereof
Manghi et al. The data model of the openaire scientific communication e-infrastructure
JP4661159B2 (en) Information providing system, metadata collection and analysis server, and computer program
WO2011090284A2 (en) Interworking system among a plurality of distributed virtual worlds using a universally unique distributed object id and method for same
WO2019198950A1 (en) Apparatus for providing content information and method therefor
WO2012046904A1 (en) Device and method for providing multi -resource based search information
WO2018090535A1 (en) Method and device for processing accumulative retrieval, terminal and storage medium
WO2012144683A1 (en) Method and device for assessing promising stage using promising technology life cycle
WO2012165708A1 (en) Ontology scheme-based instance path searching method and device
WO2013008979A1 (en) Entity-identifying device and method using multiple ontologies

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11869293

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11869293

Country of ref document: EP

Kind code of ref document: A1