[go: up one dir, main page]

WO2011065630A1 - 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체 - Google Patents

연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체 Download PDF

Info

Publication number
WO2011065630A1
WO2011065630A1 PCT/KR2010/001352 KR2010001352W WO2011065630A1 WO 2011065630 A1 WO2011065630 A1 WO 2011065630A1 KR 2010001352 W KR2010001352 W KR 2010001352W WO 2011065630 A1 WO2011065630 A1 WO 2011065630A1
Authority
WO
WIPO (PCT)
Prior art keywords
researcher
information
research
subject
year
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/KR2010/001352
Other languages
English (en)
French (fr)
Inventor
이미경
정한민
김평
이승우
류범종
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Korea Institute of Science and Technology KIST
Korea Institute of Science and Technology Information KISTI
Original Assignee
Korea Institute of Science and Technology KIST
Korea Institute of Science and Technology Information KISTI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Korea Institute of Science and Technology KIST, Korea Institute of Science and Technology Information KISTI filed Critical Korea Institute of Science and Technology KIST
Priority to EP10833443A priority Critical patent/EP2506152A1/en
Publication of WO2011065630A1 publication Critical patent/WO2011065630A1/ko
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Definitions

  • the present invention is a technique for providing researcher-related information through ontology-based bibliographic analysis, and in detail, the researcher uses analysis information related to the researcher-thesis title, author, institution, source information, year, abstract, and national information.
  • the present invention relates to a computer-readable recording medium having recorded thereon a program.
  • semantic web technology refers to the next-generation intelligent web that computers can understand information resources and even make logical inferences. It's a web that computers can understand, not a web where people use their mouse or keyboard to find, understand, and understand the information they want. In other words, it is an intelligent web that allows machines to communicate with each other by expressing it in a new language that can be understood by computers instead of the current web that is designed for human reading and interpretation.
  • the principle of the Semantic Web is to change the meanings connected between information resources into a language that can be understood by computers, unlike current web documents, which are mainly natural language for people to understand. This makes it possible for computers to interpret the meaning of information resources and to do things themselves while machines exchange information with each other.
  • the present invention displays statistics on a particular researcher's research trends or major research fields so that only the researcher can search for the necessary information at a time without performing multiple steps of searching and related information at a glance. Disclosure of Invention It is an object of the present invention to provide a computer-readable recording medium recording a computer-executable program relating to a research information analysis apparatus and method and method of a researcher for presenting the information.
  • the present invention performs knowledge processing based on a URI (Uniform Resource Identifier) and DBMS (database management system) based on the analysis information related to the researcher-paper title, author, institution, source information, year, abstract Research information analysis system for extracting researcher's analysis information from the academic information service system; And an information extraction module for extracting researcher information, subject information, and year information, and an analysis service module for analyzing and extracting information extracted from the information extraction module into data according to weight, similarity, and frequency.
  • Research information analysis system extracts the main words from the original text of the researcher's paper. By extracting the year information from the meta information of the paper and converting the data into a triple form by the ontology, the information extraction module inputs the researcher through the query SPARQL to infer the connection relations in the triples It is characterized by obtaining information.
  • the analysis service module displays all of the main research subjects of a specific year of the researcher by using the information extracted from the information extraction module, and visualizes the researcher's research trend by displaying a UI (User Interface) displaying the yearly trend of the corresponding keyword.
  • the service providing unit may be further included, and if a duplicate main word exists in the same year, the weight is displayed according to the frequency of the same year.
  • the analysis service module extracts a related topic using a researcher network composed of information extracted from the information extraction module and co-authors or citation relationships, and arranges the related keywords to visualize and display them in a UI (User Interface).
  • the subject service provider may be configured to further include, and in the case where the related subject words are duplicated and displayed, the subject service providers may be weighted and displayed according to the frequency of the same related subject.
  • the analysis service module visualizes and displays a list of researchers having a similarity level or higher set in comparison with other researchers 'main keywords based on the researchers' entire list of keywords based on the information extracted from the information extraction module. It is configured to further include a similar researcher service provider, wherein the similarity is calculated by summing the corresponding percentage according to the frequency of the matching key word by the percentage of the total number of the list of the main word of the researcher.
  • the analysis service module extracts a plurality of subjects with high frequency of research from all the research papers of the researcher using the information extracted from the information extraction module, and displays a list of researchers who have submitted a large number of papers by the corresponding subjects as a UI (User Interface). It may be configured to further include a related researcher recommendation service provider to visualize and display.
  • UI User Interface
  • Each visualized UI provided by the researcher research trend service provider, the research natural subject topic service provider, the similar researcher service provider, or the related researcher recommendation service provider is a semantic service component of an OntoFrame researcher page. It is more preferable to display more than one.
  • the present invention to solve this problem is to provide an analysis information related to the researcher-the title of the article, author, institution, source information, year, abstract, key words, national information-
  • the method for analyzing research information (a) extracting researcher information, subject information, and year information of the researcher from the research information analysis system, (b) inputting a researcher, (c) a researcher for the researcher And analyzing and providing the information, the subject information, and the year information with data according to weight, similarity, and frequency, and (d) visualizing and displaying the provided analysis data in a UI (user interface).
  • the main word is extracted from the original text of the corresponding article by the researcher by using the research information analysis system of the researcher, the year information is extracted from the meta information of the article, and the data are converted into triple forms by the ontology and stored.
  • the step (b) may be made by including the step of obtaining the desired information by inferring the connection relations in the triples through a query called SPARQL when the researcher inputs.
  • the step (c) is the step of extracting all the main research subject control by a specific year of the researcher with the information extracted in the step (b), and visualizing and displaying the UI (User Interface) displaying the yearly trend of the main word.
  • the method further includes the step of displaying the weighted value according to the frequency of the same year if the duplicate main word exists in the step and the same year.
  • the step (c) is the step of extracting the association principal control by using the information extracted in the step (b) and the researcher network co-author or citation relationship, and aligning the association main subject to visualize and display in the UI (User Interface) and If the related topics are displayed in duplicate, the method may further include assigning and displaying weights according to the frequency of the same related topics.
  • step c) is the information extracted in the step (b) to visualize and display a list of researchers with a similarity or more set in comparison with other researchers 'main subjects based on the researchers' entire subject list.
  • Comprising the step and the total number of the list of the main subject of the researcher is characterized in that it further comprises the step of calculating and displaying the sum of the corresponding percentage according to the frequency of the matching subject.
  • step (c) the information extracted in step (b) is used to extract a plurality of topics with high frequency of research from all the research papers of the researcher, and a list of researchers who have submitted a lot of papers for each topic. It may be made to further include the step of visualizing and displaying.
  • Each of the visualized UIs provided by the researcher's research trend service provider, research natural subject service provider, similar researcher service provider, or related researcher recommendation service provider is one or more semantic service components of the OntoFrame researcher page. It is more preferable to make it displayed.
  • FIG. 1 is a block diagram of an apparatus for analyzing research information of a researcher according to an embodiment of the present invention
  • FIG. 2 is a flow chart for explaining a researcher's research information analysis method according to an embodiment of the present invention
  • FIG. 3 is an exemplary diagram visualized with a UI (User Interface) to display the yearly trend of the corresponding main subject that can be displayed in the researcher research trend service provider of the present invention
  • FIG. 4 is an exemplary diagram visualizing in a UI (User Interface) by arranging the researchers of the related subjects that can be displayed in the research natural view subject service provider of the present invention
  • FIG. 5 is an exemplary diagram visualizing a list of similar researchers that can be displayed by a similar researcher service provider of the present invention with a UI (User Interface), FIG.
  • FIG. 6 is an exemplary diagram visualizing a list of researchers who submitted a lot of papers for each subject that can be displayed in a related researcher recommendation service provider of the present invention with a UI (User Interface),
  • FIG. 7 illustrates UI screens that can be displayed in the present invention as a semantic service component of an OntoFrame researcher page.
  • the researcher's research information analysis device 100 provides the researcher's analysis information in the existing academic information service system Researcher topic information extraction unit 120, and researcher topic information extraction to extract researcher information, key word information, and year information related to the researcher from the researcher information analysis system 110, the researcher analysis information of the research information analysis system 110
  • the researcher's research information analysis system 110 performs knowledge processing based on URI (Uniform Resource Identifier) and DBMS (database management system) based on the analysis information related to the researcher-thesis title, author, institution, source information, year, It is configured to extract the researcher's analytical information from the academic information service system provided with the knowledge information sharing service of abstracts, key words, and national information.
  • URI Uniform Resource Identifier
  • DBMS database management system
  • the researcher's research information analysis system 110 extracts the main words from the original text of the researcher's thesis and extracts the year information from the meta information of the article so that the data can be converted into triple forms by the ontology.
  • Triple represents data in the form of subject, predicate, object (Subject, Predicate, Object).
  • the information stored can be a myriad of triples as described above, and the query that is called SPARQL (Simple Protocol and RDF Query Language) is thrown when the query requesting the service to output the remaining related information by inputting the author (researcher) information. By inferring the connections from the triples to get the information you want. This operation is activated when the service is performed.
  • SPARQL Simple Protocol and RDF Query Language
  • SPARQL is an RDF query language created by the W3C.
  • the result (thesis) has the meta information and the original text, and the meta information has various information such as the author (researcher), co-author, publication information, publication year, and topic.
  • the meta information of the thesis includes the title, author, author's institution, source of thesis (academic journal, journal), year, abstract, and national information. Extract the information we want from the original text of the paper and the meta information of the paper (extracting key words from the original text, the title of the paper from the original text, author, institution, source information, year, abstract, country information) and processing it by ontology
  • the data is converted to triple format and used.
  • the main word if it is not registered in the meta information, it may be extracted directly from the original text.
  • the information required by the present invention is "researcher-keyword-year”. Link these pieces of information from your work to each other and always store the three pieces of information.
  • DBMS database management system
  • DBMS Database Management System
  • DBMS is to perform database configuration / access method / control role.
  • URI Uniform Resource Identifier
  • WWW (12) World Wide Web
  • the researcher's topic information extraction unit 120 operates as an information extraction module for extracting researcher information, subject information, and year information from the researcher's research information analysis system 110.
  • the query is called SPARQL, and it is operated to infer connection relations from triples to obtain desired information, thereby extracting the researcher, the main information, and the year information to create the connection relations.
  • the researcher research trend service provider 130 which operates as an analysis service module, analyzes the yearly trends of the main research subject control of a specific year by the researcher with information extracted from the research subject information extracting unit 120, which is an information extraction module. In this way, the analyzed data can be processed and visualized and displayed with a UI (User Interface) that shows the trend of each subject year.
  • UI User Interface
  • the weight may be displayed according to the frequency of the same year.
  • This service selects one researcher-researcher A- from data of “researcher-subject-year” extracted from the researcher's topic information extraction unit 120, and extracts “researcher A-subject-year” data belonging to researcher A. Sort by year.
  • topic A appeared five times in the same year and topic B appeared only once, set topic A to 5 points and B to 1 point, and count and calculate the topic (legend) according to the year in the visualization UI drawing.
  • the font size is adjusted by considering the weight.
  • the researcher research trend service provider 130 of FIG. 3 Referring to the example visualization visualized by the UI (User Interface) that displays the yearly trend of the corresponding main subject that can be displayed in the researcher research trend service provider of FIG. 3, the researcher research trend service provider 130 of FIG. In this case, the researcher has been conducting research every year, and thus the research trends are changing. Through this service, users can indirectly know when the researcher focused on what field of research and how the research tendency changed.
  • UI User Interface
  • the trend of the year-by-year research trends is displayed in a graph on the left side of the figure, and the tag cloud is displayed on the right side.
  • the X-axis shows the year and the Y-axis shows the number of research by sector, showing the top research areas each year and confirming the trend of the research field.
  • This service also selects one researcher, researcher A from the data of “researcher-subject-year” extracted from the researcher's topic information extraction unit 120, and extracts “researcher A-subject-year” data belonging to researcher A. Sorted by.
  • the display of the tag cloud in the right drawing is to display a weighted research topic in a larger font and a prominent color in the present invention in order to find the desired tag quickly. Since such tag cloud is a general matter, a detailed description thereof will be omitted.
  • the researcher's research trend service provider 130 can identify the major research areas through a UI (User Interface) displayed in a particular year, so that the researcher's research trends can be easily identified.
  • UI User Interface
  • the existing researcher trend shows the researcher's papers by year, shows the researcher's representative themes, and shows their trends by year.
  • all the topics of interest to the researcher are visualized every year.
  • the field is characterized by more detailed trends in the subject areas of interest, such as when the study was conducted, when it was most actively studied, when it disappeared, and when the field B appeared and when the research was carried out. .
  • the research natural subject topic service provider 140 which operates as an analysis service module, extracts a related topic using a researcher network composed of information extracted from the research subject topic information extracting unit 120, which is an information extraction module, and co-authors or citation relationships.
  • the analyzed data can be visualized and displayed in a UI (User Interface) by arranging researchers of related subjects.
  • the research natural view service providing unit 140 may display the weighted values according to the frequency of the same related topics.
  • Researcher 1 may answer “Subject A, Subject B, Subject C, Subject D, Subject E”, and Researcher 2 may respond to "Subject B, Subject C, Subject F, Subject G, Subject H”.
  • Topic A, Topic B, Topic H, Topic I, Topic J if researchers A, B, and C, who make up the current network, are studying the above topics, "Researcher related topics” that can come out of the network Subject A (2), Subject B (3), Subject C (2), Subject D (1), Subject E (1), Subject F (1), Subject G (1), Subject H (2), Subject I (1) and subject J (1).
  • the number in parentheses of the subject indicates the weight.
  • This service shows statistics on the main research areas of people formed when the existing researcher network was created.
  • This service also uses the "researcher-subject-year" information extracted by the researcher topic information extraction unit 120.
  • Visualizations can be provided through tag clouds or lists.
  • each subject is displayed in a tag cloud, but the font size or This is a visualized diagram that can be easily identified by using different colors, and is represented by each keyword and its weight.
  • the similar researcher service provider 150 which operates as an analysis service module, is extracted from the researcher's topic information extracting unit 120, which is an information extraction module, and compared with other researchers' entire keywords based on the entire subject list of the researcher.
  • the extracted list can be visualized and displayed by a UI (User Interface).
  • the similarity may be configured to calculate the sum of the corresponding percentages according to the frequency of the matching main words by the percentage of the number of the list of the main keywords of the researcher.
  • the similar researcher service provider 150 includes a researcher in which the corresponding researcher and the research field overlap. To provide them. This shows how similar the study is.
  • the similarity can be selected (0-100%).
  • Similarity is specified when the service is executed.
  • the similarity is calculated by considering the total number of keywords of the researcher.
  • Hong Gil-dong's total 10 subject areas are 10, 10 subjects and 1 match each other, and if there are 5 overlapping subjects comparing Hong Gil-dong and Hong Gil-soon, the similarity between them is 50%.
  • the related researcher recommendation service provider 160 which operates as an analysis service module, is extracted from the research topic information extracting unit 120, which is an information extraction module, and extracts a plurality of key words with high frequency of research from all the articles of the corresponding researcher. In this way, a list of researchers who submitted a lot of papers for each of the extracted keywords-that is, high-performing-can be visualized and displayed in the UI (User Interface).
  • the related researcher recommendation service provider 160 intends to recommend experts in the major research field of the researcher. This is similar to a related search term in a general search portal. However, in the present invention, by providing experts directly in the subject field of the researcher, it is possible to solve the hassle of having to search for the experts on the subject of the researcher separately.
  • the subject is extracted as Top N by extracting the researcher.
  • M experts The researchers (experts) who appear most frequently in the subject are referred to as M experts in the field and provided.
  • the main subjects are “neural network” and “cellular neural.
  • Network ",” global exponential “,” time delay “and” periodic solution "are listed on the X-axis and the Y-axis represents the number of experts in the field for that subject. That is, five major research areas of the representative researcher are selected and graphed, and each time the relevant research area is selected, the main experts in the field are shown. The link will take you to the researcher's page, allowing you to access the services listed above.
  • FIG. 6 when a word "neural network" is selected as a subject, five experts of the corresponding subject are displayed in order.
  • Similar researchers provided by the similar researcher service provider 150 refers to a researcher whose search and research areas overlap a lot.
  • the experts provided are experts in the subject 1 (A, B, C, D, E) of Hong Gil-dong, experts in the subject 2 (F, G, H, I), experts in the subject 3 (J, K, L, M, N%) etc. are mentioned.
  • each of the visualized UIs provided by the researcher research trend service provider 130, the research natural view subject service provider 140, the similar researcher service provider 150, or the related researcher recommendation service provider 150 may be onto.
  • OntoFrame You can have one or more semantic service components appear on the researcher's page.
  • a window displaying the related researcher's recommendation service is displayed ("related researches"), and on the right end, a number of icons are displayed vertically, but the researcher's information window (“RESEARCHER INFO”) on the top and the researcher's research trends
  • a service window (“RESEARCHER TRENDS”) is displayed at the bottom of the similar researcher recommendation service window (“SIMILAR RESEARCHER"). This is to allow the display of the associated UI screens.
  • FIG. 2 is a flowchart illustrating a researcher's research information analysis method according to an embodiment of the present invention.
  • the researcher's research information analysis system 110 is based on a Uniform Resource Identifier (URI) and DBMS (database management). It is possible to perform the knowledge processing based on the system, and from the academic information service system that provides the knowledge information sharing service of the analytical information related to the researcher (thesis title, author, institution, source information, year, abstract, key word, and national information). Extract the analysis information (S210).
  • URI Uniform Resource Identifier
  • DBMS database management
  • the researcher's research information analysis system 110 extracts the main word from the original text of the researcher's thesis and extracts the year information from the meta information of the article so that the data can be converted into a triple form by the ontology.
  • the desired information is derived by inferring the connection relations from the triples through a query language called SPARQL (Simple QL and RDF Query Language) (S220).
  • SPARQL Simple QL and RDF Query Language
  • the researcher's topic information extraction unit 120 extracts researcher information, subject information, and year information from the researcher's research information analysis system 110 (S230).
  • the query is called SPARQL to induce connection relations in triples to obtain desired information, thereby extracting the researcher, the subject information, and the year information to create the connection relations.
  • step S240 On the basis of the information extracted in step S240, it is determined whether there are duplicate main words (S242).
  • step S242 If it is determined in step S242 that there is a duplicate main word, a weight is assigned (S244).
  • This weight is assigned by setting the subject A to 5 points and the subject B to 1 point if topic A appears 5 times and topic B only 1 time in the same year.
  • step S244 If there is no weight in step S244 or there is no duplicate key word in step S242, the visualization is visualized using a UI (User Interface) that displays the trend of the corresponding year based on the analyzed data (S246).
  • UI User Interface
  • the subject (legend) can be counted and calculated according to the year, and when displaying the tag cloud next to the graph, the font size can be adjusted in consideration of the weight.
  • This visualization shows the trend of the subject over the year as a graph and the tag cloud on the right.
  • the research natural view subject service provider 140 analyzes the extracted topic using the information extracted from the research subject information extracting unit 120, which is the information extraction module, and the researcher network co-author or citation relationship (S250).
  • weights may be displayed according to the frequency of the same related topics.
  • step S252 it is determined whether the related topics overlap, and when there are duplicate related topics, weights are assigned according to the frequency of the related topics.
  • the weight of the researcher 1 is about "Subject A, Subject B, Subject C, Subject D, Subject E"
  • the researcher 2 is about "Subject B, Subject C, Subject F, Subject G, Subject H”
  • Related topics include topic A (2), topic B (3), topic C (2), topic D (1), topic E (1), topic F (1), topic G (1), and topic H (2).
  • the number in parentheses of the subject indicates the weight.
  • step S254 the researchers of the related subjects are sorted to be visualized and displayed in a UI (S256).
  • each subject is displayed in a tag cloud, but is visualized to be easily identified by varying the size or color of the font according to the weight.
  • the similar researcher service provider 150 which operates as an analysis service module, is extracted from the researcher's topic information extracting unit 120, which is an information extraction module, and compared with other researchers' entire keywords based on the entire subject list of the researcher. By extracting a list of researchers with a set similarity or more (S260).
  • step S260 allows the researcher and the research field to provide overlapping researchers, thereby finding out how similar the research is being done.
  • the researcher can make a similarity selection to select the closest similarity researcher.
  • step S262 when the similar researchers are extracted, the similarities can be selected (0 to 100%).
  • the similarity may be configured to calculate the sum of the corresponding percentages according to the frequency of the matching main words by the percentage of the number of the list of the main keywords of the researcher.
  • Similarity is specified when the service is executed.
  • the similarity is calculated by considering the total number of keywords of the researcher.
  • step S262 the similar researcher service provider 150 extracts a similarity list for the selected N keywords (S264).
  • Hong Gil-dong's total 10 subject areas are 10, 10 subjects and 1 match each other, and if there are 5 overlapping subjects comparing Hong Gil-dong and Hong Gil-soon, the similarity between them is 50%.
  • the similar researcher service providing unit 150 provides researchers who overlap with the researcher. This shows how similar the study is.
  • step S270 the extracted information from the information extracting unit 120 from the related researcher recommendation service provider unit 160 extracts a number of subjects with high frequency of research from all the articles of the corresponding researcher, and then extracts a number of articles for each extracted subject word. Analyze the list of experts who are submitting researchers.
  • the researchers are extracted as experts by subjects from Top1 to N in the information “researcher-subject-year” data extracted from the information extraction unit 120 (S274).
  • the M experts for each of the provided subject words are visualized and displayed in a UI (User Interface) (S278).
  • steps S246, S256, S266, and S278 may be displayed as one or more semantic service components of an OntoFrame researcher page.
  • Such methods according to the present invention can be embodied as computer readable codes on a computer readable recording medium for each step.
  • the computer-readable recording medium is a recording device that stores data that can be read by a computer system, and includes a ROM, a RAM, a cache, a hard disk, an optical disk, a floppy disk, and a magnetic tape.
  • the carrier wave may be implemented in the form of a carrier wave, for example, transmission through the Internet.
  • the computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
  • the present invention provides technology related to researcher-related information through ontology-based bibliography analysis, and provides information extracted from the analysis information related to the researcher at a glance so that the trend of the subject field can be viewed in more detail. It is possible to see the main research topics and the research topics that are of interest, at a glance, and to view other experts in the main research field at the same time.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

연구자의 연구정보 분석 장치 및 그 방법이 개시된다. 본 발명은 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 국가 정보-를 이용하여 연구자정보, 주제정보, 그리고 연도정보에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 UI로 제공함으로써, 연구자의 관심 주제 분야의 동향을 좀 더 자세하게 볼 수 있으며, 연구자네트워크를 구성하는 연구자들의 주요 연구 주제와 관심있게 다루고 있는 연구 주제들을 한눈에 볼 수 있을 뿐만 아니라, 여러 단계의 검색을 수행하지 않고 한번에 연구자만 검색함으로써 그 연구자의 주요 연구 분야의 다른 전문가까지 동시에 볼 수 있다는 효과가 있다.

Description

연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
본 발명은 온톨로지 기반 참고문헌 분석을 통한 연구자관련 정보 제공에 관한 기술로, 상세하게는 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 국가 정보-를 이용하여 연구자정보, 주제정보, 그리고 연도정보에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 한 눈으로 파악가능한 UI로 제공하기 위한 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
일반적으로 시맨틱 웹 기술은 컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는 차세대 지능형 웹을 말한다. 현재의 컴퓨터처럼 사람이 마우스나 키보드를 이용해 원하는 정보를 찾아 눈으로 보고 이해하는 웹이 아니라, 컴퓨터가 이해할 수 있는 웹을 말한다. 즉, 사람이 읽고 해석하기에 편리하게 설계되어 있는 현재의 웹 대신에 컴퓨터가 이해할 수 있는 형태의 새로운 언어로 표현해 기계들끼리 서로 의사소통을 할 수 있는 지능형 웹이다.
시맨틱 웹의 원리는 사람들이 이해할 수 있도록 자연어 위주로 되어 있는 현재의 웹 문서와 달리, 정보자원들 사이에 연결되어 있는 의미를 컴퓨터가 이해할 수 있는 형태의 언어로 바꾸는 것이다. 이렇게 되면 컴퓨터가 정보자원의 뜻을 해석하고, 기계들끼리 서로 정보를 주고받으면서 자체적으로 필요한 일을 처리하는 것이 가능해진다.
현재 시맨틱 웹과 관련된 연구는 RDF(Resource Description Framework)를 기반으로 한 온톨로지 기술과 국제표준화기구(International Organization for Standardization, ISO) 중심의 토픽 맵(Topic Map) 기술이 주류를 이루고 있다. 전자는 현재의 웹에 자원(주어)/속성(술어)/속성값(목적어) 등 자원을 기술하는 언어인 메타데이터를 부여해 정보의 의미를 이해하고 처리할 수 있게 하는 기술이다. 후자는 ISO의 XML(eXtensible Markup Language) 기반 표준 기술언어인 XTM(XML Topic Maps) 언어를 이용해 정보와 지식의 분산 관리를 지원하는 기술로, 지식층과 정보층의 이중 구조를 띤다.
이러한 시맨틱 웹이 실현되면 컴퓨터가 자동으로 정보를 처리할 수 있어 정보시스템의 생산성과 효율성이 극대화된다. 컴퓨터 혼자 전자상거래를 할 수 있고, 기업의 시스템 통합(System Integration, SI), 지능형 로봇 시스템, 의료 정보화 등 다양한 분야에 응용할 수 있다.
그러나 종래에는 이러한 시맨틱 웹을 적용한 분야가 적었을 뿐만 아니라, 연구기획에 필요한 연구동향을 효율적으로 파악할 수 있는 기술은 없었다.
즉, 그동안 연구자들은 연구기획, 협업 연구자 선정 및 연구방향을 등을 설정하는데 많은 시간과 노력을 들여야만 한다.
예를 들어, 연구자 A 씨는 '인공지능' 분야에 대한 연구를 기획하고 정보를 찾기 위해 검색 사이트를 뒤졌으나 시작부터 난감한 일을 겪게 된다. '인공지능'이란 단어가 들어 있는 엄청난 양이 정보들 사이에서 헤매는 바람에 쓸데없이 시간과 노력을 허비하고야 말았던 것이다.
또한 연구자 B 씨는 함께 연구를 수행할 전문가들을 찾으려 했다가 어려움을 겪었다. 일반 검색 사이트는 물론이고, 인맥을 동원해 전문가를 찾아 나섰지만 최적의 전문가를 찾기에는 정보 등이 부족했기 때문이다.
그리고 특정 연구자의 연구동향이나 주요 연구분야에 대한 통계를 확인할 수 있는 방법이 없기 때문에 이러한 관련 정보를 분석하여 한 눈에 파악할 수 있도록 제시해 주는 연구자의 연구정보 분석 시스템과 방법을 구축하여 연구기획에 필요한 연구동향 등을 효율적으로 파악할 수 있는 기술의 필요한 것이다.
이러한 문제점을 해결하기 위한 본 발명은 특정 연구자의 연구동향이나 주요 연구분야에 대한 통계를 UI로 표시하여 필요한 정보를 여러 단계의 검색을 수행하지 않고 한번에 연구자만 검색할 수 있도록 하고 관련 정보를 한 눈에 파악할 수 있도록 제시해 주는 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것을 본 발명의 목적으로 한다.
이러한 과제를 해결하기 위한 본 발명은 URI(Uniform Resource Identifier) 기반과 DBMS(database management system) 기반 하에 지식 처리를 수행하여 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-의 지식정보 공유 서비스가 제공될 수 있도록 처리하는 학술정보서비스시스템, 상기 학술정보서비스시스템에서 연구자의 분석정보를 추출하는 연구자의 연구정보분석시스템, 상기 연구자의 연구정보분석시스템에서 연구자정보, 주제정보, 그리고 연도정보를 추출하는 정보추출모듈 그리고 상기 정보추출모듈에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 분석서비스모듈을 포함하여 구성되고, 상기 연구자의 연구정보분석시스템은 상기 연구자의 해당 논문의 원문에서 주제어를 추출하고 상기 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 사용하며, 상기 정보추출모듈은 상기 연구자를 입력하면 SPARQL이라는 질의어를 통해, 상기 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오는 것을 특징으로 한다.
또한, 분석서비스모듈은 상기 정보추출모듈에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어를 모두 표시하고 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시하는 연구자연구동향서비스제공부를 더 포함하도록 하고 동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하는 것을 특징으로 한다.
또한, 상기 분석서비스모듈은 상기 정보추출모듈에서 추출된 정보와 공저자 또는 인용관계로 구성된 연구자 네트워크를 이용하여 연관 주제어를 추출하고 상기 연관 주제어들을 정렬하여 UI(User Interface)로 시각화하여 표시하는 연구자연관주제서비스제공부를 더 포함하도록 구성하고, 상기 연관 주제어가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하는 것을 특징으로 한다.
또, 상기 분석서비스모듈은 상기 정보추출모듈에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 유사연구자서비스제공부를 더 포함하도록 구성하고, 상기 유사도는 상기 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하는 것을 특징으로 한다.
그리고, 상기 분석서비스모듈은 상기 정보추출모듈에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하고 해당 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 연관연구자추천서비스제공부를 더 포함하도록 구성할 수 있다.
상기 연구자연구동향서비스제공부, 상기 연구자연관주제서비스제공부, 상기 유사연구자서비스제공부 또는 상기 연관연구자추천서비스제공부에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되도록 하는 것이 더욱 바람직하다.
한편, 이러한 문제점을 해결하기 위한 본 발명은 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-를 제공하는 연구자의 연구정보 분석시스템을 이용한 연구자의 연구 정보 분석 방법에 있어서, (a)상기 연구정보 분석시스템에서 해당 연구자의 연구자정보, 주제정보, 그리고 연도정보를 추출하는 단계, (b)연구자를 입력하는 단계, (c)해당 연구자에 대한 연구자정보, 주제정보, 그리고 연도정보를 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 단계 그리고 (d)상기 제공된 분석 데이터를 UI(User Interface)로 시각화하여 표시하는 단계를 포함하여 이루어지게 할 수 있다.
상기 (a)단계는 상기 연구자의 연구정보 분석시스템을 이용하여 연구자별 해당 논문의 원문에서 주제어를 추출하고 상기 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 저장하도록 하고 상기 (b)단계는 상기 연구자를 입력하면 SPARQL이라는 질의어를 통해, 상기 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오는 단계를 더 포함하여 이루어지게 할 수 있다.
상기 (c)단계는 상기 (b)단계에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어를 모두 추출하는 단계, 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시하는 단계 및 동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하는 단계를 더 포함하여 이루어지는 것을 특징으로 한다.
상기 (c)단계는 상기 (b)단계에서 추출된 정보와 연구자 네트워크 공저자 또는 인용관계를 이용하여 연관주제어를 추출하는 단계와 상기 연관 주제어를 정렬하여 UI(User Interface)로 시각화하여 표시하는 단계 및 상기 연관주제가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하는 단계를 더 포함하여 이루어지게 할 수 있다.
또한, c)단계는 상기 (b)단계에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 단계 및 상기 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하여 표시하는 단계를 더 포함하여 이루어지는 것을 특징으로 한다.
그리고 (c)단계는 상기 (b)단계에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하는 단계 및 해당 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 단계를 더 포함하여 이루어지게 할 수도 있다.
이러한 연구자연구동향서비스제공부, 연구자연관주제서비스제공부, 유사연구자서비스제공부 또는 연관연구자추천서비스제공부에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되게 하면 더욱 바람직하다.
기존의 연구자 동향은 연구자가 쓴 논문들을 연도별 보여 준다던지, 연구자의 대표 주제를 뽑아놓고 그것들의 연도별 추이를 보여주게 되지만, 본 발명의 연구자의 연구정보 분석 장치 및 그 방법에 의하면 매년 연구자가 관심을 가졌던 주제들을 모두 시각화하여 A분야는 언제부터 연구하게 되었고, 언제 가장 활발하게 연구했으며 언제 소멸됐는지, B분야는 언제 등장해서 언제 연구를 열심히 수행했는지 등의 연구자의 관심 주제 분야의 동향을 좀 더 자세하게 볼 수 있도록 하는 효과가 있다.
또한, 기존에는 이렇게 한번의 연관성을 통해 또 다른 정보를 제공해주는 서비스는 존재하지 않았지만 연구자네트워크(같이 공동연구를 수행했거나 연구를 함에 있어서 관련있는 사람들의 모임)를 구성하는 연구자들의 주요 연구 주제와 관심있게 다루고 있는 연구 주제들을 한눈에 볼 수 있는 효과가 있다.
그리고 기존의 서비스에서는 연구자(주요 토픽 정보만), 전문가 정보를 따로 추출하여 서비스하였기 때문에 연구자를 검색하고 거기서 발견한 토픽에 대해 다시 검색해서 전문가 정보를 찾아내야 하지만 본원 발명에 의하면 여러 단계의 검색을 수행하지 않고 한번에 연구자만 검색함으로써 그 연구자의 주요 연구 분야의 다른 전문가까지 동시에 볼 수 있다는 효과가 있다.
도 1은 본 발명의 일실시예에 의한 연구자의 연구정보 분석 장치의 구성도,
도 2는 본 발명의 일실시예에 의한 연구자의 연구정보 분석 방법을 설명하기 위한 흐름도,
도 3은 본 발명의 연구자연구동향서비스제공부에서 표시할 수 있는 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화한 예시 도면,
도 4는 본 발명의 연구자연관주제서비스제공부에서 표시할 수 있는 연관 주제의 연구자들을 정렬하여 UI(User Interface)로 시각화한 예시 도면,
도 5는 본 발명의 유사연구자서비스제공부에서 표시할 수 있는 유사 연구자들의 리스트를 UI(User Interface)로 시각화한 예시 도면,
도 6은 본 발명의 연관연구자추천서비스제공부에서 표시할 수 있는 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화한 예시 도면,
그리고,
도 7은 본 발명에서 표시할 수 있는 UI화면들을 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 예시한 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
110 : 연구정보분석시스템 120 : 연구자주제 정보추출부
130 : 연구자 연구동향 서비스제공부 140 :연구자 연관주제 서비스제공부150 : 유사연구자 서비스제공부 160 : 연관연구자추천서비스제공부
본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정 해석되지 아니하며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…시스템", "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
이하, 도면을 참조하여 본 발명의 일실시예에 대하여 설명한다.
도 1은 본 발명의 일실시예에 의한 연구자의 연구정보 분석 장치의 구성도로서, 도시된 바와 같이, 연구자의 연구정보 분석 장치(100)는 기존의 학술정보서비스시스템에서 연구자의 분석정보를 제공하는 연구정보분석시스템(110), 연구정보분석시스템(110)의 연구자 분석 정보로부터 연구자와 관련된 연구자정보, 주제어정보, 그리고 연도정보를 추출하는 연구자주제 정보추출부(120), 그리고 연구자주제 정보추출부(120)에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 분석서비스모듈로 동작되는 연구자 연구동향 서비스제공부(130), 연구자 연관주제 서비스제공부(140), 유사연구자 서비스제공부(150), 연관연구자추천서비스제공부(160)를 포함하여 구성된다.
연구자의 연구정보분석시스템(110)은 URI(Uniform Resource Identifier) 기반과 DBMS(database management system) 기반 하에 지식 처리를 수행하여 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-의 지식정보 공유 서비스가 제공되는 학술정보서비스시스템으로부터 연구자의 분석정보를 추출하도록 구성된다.
연구자의 연구정보분석시스템(110)의 경우, 연구자가 매년 어떤 분야의 연구를 수행해왔는지 그래서 연구 동향이 어떻게 변하고 있는지 확인할 수 있도록 구성되어 있다. 이 서비스를 통해 사용자는 해당 연구자가 시기별로 어떤 분야의 연구에 집중을 하였는지, 연구 성향은 어떻게 변했는지를 간접적으로 알 수 있게 된다.
이를 위하여 연구자의 연구정보분석시스템(110)은 연구자의 해당 논문의 원문에서 주제어를 추출하고 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 사용할 수 있도록 구성한다.
트리플 형태로 변환된 데이터는 온톨로지 추론 엔진에 저장된다. 트리플(Triple)이란 주제, 술부, 목적(Subject, Predicate, Object) 형태로 데이터를 표현하는 것이다.
예를 든다면, (논문A는, 가진다, 저자1을), (논문 A는, 가진다, 주제A를), (논문A는, 발간되었다, 2008년에) 이런 트리플이 저장되어 있다고 가정할 때-물론 실제로는 이렇게 간단하지 않고 각 저자나 주제들도 모두 URI라는 것으로 매칭되어 있어서 실제의 값은 또 다른 트리플로 연결되어 있어서 여러 단계를 거쳐서 답을 가져오게 된다- 그럼 논문 A를 중심으로, 저자와 주제와 연도는 연결이 될 수 있다.
저장되는 정보는 상술한 바와 같이 무수한 트리플들이 될 수 있으며, 서비스에서 저자(연구자) 정보를 입력으로 나머지 관련 정보를 출력하도록 요청하는 질의를 추론엔진으로 던지면 SPARQL(Simple Protocol and RDF Query Language)이라는 질의어를 통해, 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오는 것이다. 이러한 동작은 서비스 수행 시 작동된다.
SPARQL은 W3C에서 만든 RDF 질의 언어이다.
일반적으로 성과물(논문)의 경우, 메타정보와 원문을 가지며 메타정보에는 성과물의 저자(연구자), 공저자, 발간물 정보, 발행 연도, 주제어와 같은 여러 가지 정보들을 가지고 있다.
구체적으로 논문의 메타정보에는 Title, 저자, 저자의 소속기관, 논문 출처(학회, 학술지), 연도, 초록, 국가 정보 등이 포함되어 있다. 논문의 원문과 논문의 메타정보를 통해 우리가 원하는 정보들을 추출하고 (원문에서 주제어 추출, 메타정보에서 논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 국가 정보) 이를 가공하여 온톨로지에 의해 데이터들을 트리플 형태로 변환하여 사용하는 것이다.
주제어의 경우는 메타정보에 등록되지 않은 경우는 원문으로부터 직접 추출할 수도 있다.
본 발명에서 필요로 하는 정보는 “연구자 - 주제어 - 연도”이다. 성과물을 중심으로 추출한 이런 정보들을 서로 연결시켜 주고 연결된 3개의 정보는 항상 저장하도록 한다.
여기서 DBMS(database management system)는 일반적으로 중앙부서(관리부서)에서 통제하고 있는 데이타의 종합적인 집합을 데이타베이스(database)라고 하며, 데이타베이스 이외에 그 데이타가 저장된 하드웨어와 데이타의 저장과 검색을 통제하는 소프트웨어를 총칭하여 DBMS(데이타베이스 관리시스템)한다.
결국 모든 응용 프로그램들이 데이타베이스를 공유할 수 있도록 관리·지원하여 주는 소프트웨어를 말하며, 데이타베이스의 구성/접근방법/통제역할 등을 수행하는 것을 DBMS라 하는 것이다.
한편 URI(Uniform Resource Identifier)는 World Wide Web (WWW(12))상에서 접근하고자 하는 자원의 위치를 나타내기 위해서 사용한다. 자원은 "문서", "이미지", "동영상", "프로그램", "이메일" 등 모든 것이 될 수 있다
연구자주제 정보추출부(120)는 연구자의 연구정보분석시스템(110)에서 연구자정보, 주제정보, 그리고 연도정보를 추출하는 정보추출모듈로 동작된다. 즉, 연구자가 입력되면 SPARQL이라는 질의어를 통해, 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오도록 동작되어 연구자와 주제어 정보, 연도 정보를 추출하여 서로 연결 관계를 생성한다.
분석서비스모듈로 동작되는 연구자연구동향서비스제공부(130)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어에 대한 연도별 추이를 분석하고 이렇게 분석된 자료를 가공하여 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시할 수 있다.
또한, 동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하게 할 수 있다.
이 서비스는 연구자주제 정보추출부(120)에서 추출한 “연구자 - 주제 - 연도”의 데이터에서 한명의 연구자-연구자A-를 선택하고, 연구자 A에 속하는 “연구자A - 주제 - 연도” 데이터를 추출한 후, 연도별로 정렬을 시키는 것이다.
이때 같은 연도 상에 중복된 주제가 있는 경우는 가중치 값으로 가산한다. 이를 통해 특정 연도에 주요 연구 분야를 확인할 수 있어서 연구자의 연구 동향을 파악할 수 있다.
원래 서비스에서는 논문이 발간된 학회 또는 저널(출처정보)의 등급에 따라 가산점을 부여하고 여기에 건수로 (가산점 * 건수)로 가중치를 매기는 것이 바람직하지만, 본 발명에서는 출처 정보의 등급을 따로 나누지 않고 그냥 건수로 처리하는 것으로 설명한다.
구체적으로 동일 연도에서 주제 A가 5번 등장하고 주제 B는 1번만 등장했다면, 주제 A는 5점, B는 1점으로 설정하고, 시각화 UI도면에서는 연도에 따라 주제(범례)를 카운트하여 계산하면 되고, 그래프 옆 태그 클라우드 형태로 보여줄 때 역시 가중치를 고려하여 폰트의 크기를 조절하면 되는 것이다.
도 3의 연구자연구동향서비스제공부에서 표시할 수 있는 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화한 예시 도면을 참조하여 이를 설명하면, 연구자연구동향서비스제공부(130)의 경우 연구자가 매년 어떤 분야의 연구를 수행해왔는지 그래서 연구 동향이 어떻게 변하고 있는지를 확인할 수 있는 것이다. 이 서비스를 통해 사용자는 해당 연구자가 언제 어떤 분야의 연구에 집중을 하였는지, 연구 성향은 어떻게 변했는지를 간접적으로 알 수 있게 된다.
이를 위하여 도면의 좌측에는 연도별 연구동향을 연도에 따른 주제 동향을 그래프로 표시하고 우측에는 태그클라우드로 표시한 것이다.
좌측의 연도별 연구동향그래프에서 X축은 연도를 Y축은 분야별 연구 건수를 표시함으로써, 매년 상위 연구 분야를 보여주고, 연구 분야의 동향을 확인할 수 있는 것이다.
이 서비스 또한 연구자주제 정보추출부(120)에서 추출한 “연구자 - 주제 - 연도”의 데이터에서 한명의 연구자, 연구자A를 선택하고, 연구자 A에 속하는 “연구자A - 주제 - 연도” 데이터를 추출한 후, 연도별로 정렬을 시킨 것이다.
또한, 우측도면의 태그클라우드의 표시는 자신이 원하는 태그를 빨리 찾을 수 있도록 하기 위하여 본 발명에서는 가중치가 높은 연구 주제어를 좀더 큰 글꼴과 눈에 띄는 칼라로 표시하는 것이다. 이러한 태그클라우드는 일반적인 사항이므로 상세한 설명은 생략하기로 한다.
따라서, 연구자연구동향서비스제공부(130)에서 표시하는 UI(User Interface)를 통해 특정 연도에 주요 연구 분야를 확인할 수 있어서 연구자의 연구 동향을 손쉽게 파악할 수 있는 것이다.
즉, 기존의 연구자 동향은 연구자가 쓴 논문들을 연도별 보여준 다던지, 연구자의 대표 주제를 뽑아놓고 그것들의 연도별 추이를 보여주게 되지만, 본 발명에서는 매년 연구자가 관심을 가졌던 주제들을 모두 시각화하여 A분야는 언제부터 연구하게 되었고, 언제 가장 활발하게 연구했으며 언제 소멸됐는지, B분야는 언제 등장해서 언제 연구를 열심히 수행했는지 등의 연구자의 관심 주제 분야의 동향을 좀 더 자세하게 볼 수 있는 특징이 있는 것이다.
한편, 분석서비스모듈로 동작되는 연구자연관주제서비스제공부(140)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보와 공저자 또는 인용관계로 구성된 연구자 네트워크를 이용하여 연관 주제어를 추출하여 분석하고 이렇게 분석된 자료는 연관 주제어의 연구자들을 정렬하여 UI(User Interface)로 시각화하여 표시할 수 있다.
또한, 연구자연관주제서비스제공부(140)는 연관주제가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하게 할 수 있다.
예를 들어 연구자1이 "주제A, 주제B, 주제C, 주제D, 주제E"에 대하여, 연구자2가 "주제B, 주제C, 주제F, 주제G, 주제H"에 대하여, 연구자3이 "주제A, 주제B, 주제H, 주제I, 주제J"에 대하여 현재 네트워크를 구성하는 연구자A,B,C가 위와 같은 주제들을 연구하고 있다고 설정하면, 네트워크에서 나올 수 있는 “연구자 연관 주제”는 주제A(2), 주제B(3), 주제C(2), 주제D(1), 주제E(1), 주제F(1), 주제G(1), 주제H(2), 주제I(1), 주제J(1)가 된다. 이때 주제의 괄호안의 숫자는 가중치를 나타내는 것이다.
즉, 많은 사람들이 모이게 되면 같은 그룹에 해당되면서 공동으로 연구하는 주제의 가중치가 올라가게 된다.
본 서비스는 기존의 연구자 네트워크가 생성될 때 구성된 사람들의 주요 연구 분야에 대한 통계를 보여주는 서비스이다.
연구자 네트워크의 경우, 공저자나 인용 관계 등의 연구자들간의 연관 관계에 의해 구성된다. 연구자 네트워크는 이미 많이 사용되고 있지만 연구자 네트워크를 통해 나타나는 연구자들의 목록을 통해 연구자 연관 주제를 추출할 수 있다.
물론 연구자 네트워크 뿐만 아니라 모든 연구자들의 목록을 통해 해당 그룹의 연구 주제를 판단할 수 있다.
본 서비스에서도 연구자주제 정보추출부(120)에서 추출한 “연구자 - 주제 - 연도” 정보를 이용한다.
연구자를 추출할 때는 해당 그룹의 연구자들을 모두 포함시키고 연구자들의 정보를 추출하면 연구분야(주제)로 정렬을 시켜, 겹쳐지는 주제는 가중치를 부여하여 하나로 처리한다.
그렇게 되면 해당 연구자 그룹에서의 주요 공통 연구 주제들을 확인할 수 있다. 시각화는 태그 클라우드나 목록을 통해 제공할 수 있다.
도 4의 연구자연관주제서비스제공부에서 표시할 수 있는 연관 주제의 연구자들을 정렬하여 UI(User Interface)로 시각화한 예시 도면을 참고하면, 각 주제어별로 태그 클라우드로 표시하되 가중치에 따라 폰트의 크기나 색상을 달리해서 식별이 잘 되게 시각화한 도면으로 각 주제어와 이에 따른 가중치로 표시한 것이다.
또한, 분석서비스모듈로 동작되는 유사연구자서비스제공부(150)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 추출하고 이렇게 추출된 리스트는 UI(User Interface)로 시각화하여 표시하게 할 수 있다.
이때 유사도는 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하도록 구성할 수 있다.
도 5의 유사연구자서비스제공부에서 표시할 수 있는 유사 연구자들의 리스트를 UI(User Interface)로 시각화한 예시 도면을 참고하면, 유사연구자서비스제공부(150)는, 해당 연구자와 연구 분야가 겹치는 연구자들을 제공하는 것이다. 이를 통해 얼마나 유사한 연구를 하고 있는지를 알 수 있다.
즉, 연구자주제 정보추출부(120)에서 추출된 정보 중 “연구자 - 주제 - 연도” 정보를 이용하여 산출한다. 연도 값을 이용하게 되면 같은 시기에 유사한 연구를 하는 연구자를 찾을 수 있어 더욱 상세한 비교를 할 수 있기 때문이다.
유사 연구자를 추출할 때는, 유사도를 선택할 수 있게 한다(0~100%).
유사연구자의 경우, 연도별로 (예를 들어 2002~2004년까지) 같은 연구를 한 연구자들을 비교하는 것이 바람직하지만 본 발명에서는 연도는 고려하지 않고 연구자의 전체 주제어 리스트를 대상으로 연구자마다 전체 주제어와 비교를 시작한다.
유사도는 서비스 실행시 지정해 주는데, 연구자의 전체 주제어 개수를 고려하여 유사도를 계산한다.
예를 들어 홍길동의 전체 주제분야가 10개라면 10개의 주제와 1개가 매칭될때마다 10%가 되고, 홍길동과 홍길순을 비교해서 겹쳐지는 주제가 5개가 있다면, 이 둘의 유사도는 50%가 되는 것이다.
이런식으로 모두 연구자들과 주제어를 매칭시켜 원하는 유사도 이상의 연구자가 있으면 유사 연구자로 결과 값을 제공하는 것이다.
도 5는 유사도가 80%인 연구자들을 목록으로 표시한 것임을 알 수 있다.
또한, 분석서비스모듈로 동작되는 연관연구자추천서비스제공부(160)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하고 이렇게 추출된 주제어별로 논문을 많이 제출한 -즉, 성과가 많은-연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하게 할 수 있다.
연관연구자추천서비스제공부(160)는 해당 연구자의 주요 연구 분야의 전문가들을 추천해주고자 한다. 이는 일반 검색 포털에서 연관 검색어와 유사한 기능이다. 하지만, 본 발명에서는 해당 연구자의 주제 분야에서 전문가들을 바로 제공함으로써, 해당 연구자의 주제어에 대한 전문가를 따로 검색해야하는 번거로움을 해결할 수 있는 것이다.
우선, 해당 연구자를 추출하여 주제어를 Top N으로 추출한다.
이를 통해 Top N에 선택된 주제어를 이용하여, 앞에서 나온 “연구자 - 주제 - 연도” 데이터에서 Top1~N까지의 주제어 별로 연구자들을 추출한다.
해당 주제어에 가장 빈번히 나타난 연구자(전문가)를 M명을 해당 분야의 전문가로 칭하고, 이를 제공해 주는 것이다..
도 6의 연관연구자추천서비스제공부에서 표시할 수 있는 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화한 예시 도면을 참고하면, 주요 주제어를 "neural network", "cellular neural network", "global exponential", "time delay" 그리고 "periodic solution"에 대하여 X축으로 나열하고 Y축으로는 해당 주제어에 대한 분야의 전문가들의 수를 나타낸 것이다. 즉, 대표연구자의 주요 연구분야를 5개 선택하여 그래프로 나타내고 해당 연구 분야를 선택할때마다 그 분야의 주요 전문가들을 보여준다. 링크를 통해 해당 연구자 페이지로 이동이 가능하여, 위에서 나온 서비스들을 이용할 수 있게 된다.
도 6에서는 주제어로 "neural network"을 선택하면 해당 주제어에 대한 전문가 5명을 순위대로 표시해 주고 있는 것이다.
유사연구자서비스제공부(150)에서 제공하는 유사연구자와 연관연구자추천서비스제공부(150)에는 제공되는 전문가는 다음과 같이 구별된다.
유사연구자서비스제공부(150)에서 제공하는 유사연구자는 검색된 연구자와 연구 분야가 많이 겹치는 연구자를 말한다.
예를 들어, 내가 검색한 “홍길동”은 주제1, 주제2, 주제3, 주제4, 주제5를 연구하는데, 홍길동의 유사 연구자는 유사도가 높을수록 주제1, 주제2, 주제3, 주제4, 주제5 중에 겹치는 주제를 많이 연구하는 사람을 말한다.
연관연구자추천서비스제공부(150)에는 제공되는 전문가는 홍길동의 주제1의 전문가(A,B,C,D,E), 주제2의 전문가(F,G,H,I), 주제3의 전문가(J, K, L, M, N…) 등을 말한다.
한편, 연구자연구동향서비스제공부(130), 연구자연관주제서비스제공부(140), 유사연구자서비스제공부(150) 또는 연관연구자추천서비스제공부(150)에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되도록 하게 할 수 있다.
즉, 도 7의 본 발명에서 표시할 수 있는 UI화면들을 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 예시한 도면을 참고하면, OntoFrame2008의 기존 UI에 "Jinde cao"라는 연구자를 입력한 경우 화면 중앙에는 수평으로 다수 개의 아이콘으로 표시되는 창이 표시되며, 좌측에는 해당 연구자가 발표한 논문을 디스플레이시키는 창("PAPER")과, 중앙에는 관련 연구자 네트워크를 알려주는 창("RESEARCHERS")이 그리고 중앙 우측에는 연관연구자추천서비스를 표시하는 창("related RESEARCHERS")이 표시되어 있으며, 우측 단부에는 수직으로 다수 개의 아이콘을 표시하되 상단에는 연구자 정보 창("RESEARCHER INFO")과 그 하다에 연구자연구동향 서비스창("RESEARCHER TRENDS")을 그 하단에는 유사연구자추천서비스창("SIMILAR RESEARCHER")을 표시하도록 하고 해당 창을 클릭하면 관련된 UI화면들을 표시할 수 있도록 하는 것이다.
이하, 도면을 참조하여 연구자의 연구정보 분석 방법에 대하여 설명한다.
도 2는 본 발명의 일실시예에 의한 연구자의 연구정보 분석 방법을 설명하기 위한 흐름도로서, 도시된 바와 같이 연구자의 연구정보분석시스템(110)은 URI(Uniform Resource Identifier) 기반과 DBMS(database management system) 기반 하에 지식 처리를 수행하여 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-의 지식정보 공유 서비스가 제공되는 학술정보서비스시스템으로부터 연구자의 분석정보를 추출한다(S210).
이때 연구자의 연구정보분석시스템(110)은 연구자의 해당 논문의 원문에서 주제어를 추출하고 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 사용할 수 있도록 구성한다.
연구자 정보를 입력으로 나머지 정보를 출력하는 질의를 추론엔진으로 던지면 SPARQL(Simple Protocol and RDF Query Language)이라는 질의어를 통해, 트리플들에서 연결관계들을 추론해서 원하는 정보를 도출한다(S220).
연구자주제 정보추출부(120)는 연구자의 연구정보분석시스템(110)에서 연구자정보, 주제정보, 그리고 연도정보를 추출한다(S230). 즉, 연구자가 입력되면 SPARQL이라는 질의어를 통해, 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오도록 동작되어 연구자와 주제어 정보, 연도 정보를 추출하여 서로 연결 관계를 생성하는 것이다.
그리고 연구자주제 정보추출부(120)에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구 주제어에 대한 연도별 추이를 분석한다(S240).
연구자주제 정보추출부(120)에서 추출한 “연구자 - 주제 - 연도”의 데이터에서 한명의 연구자-연구자A-를 선택하고, 연구자 A에 속하는 “연구자A - 주제 - 연도” 데이터를 추출한 후, 연도별로 정렬을 시키는 것이다.
단계 S240에서 추출된 정보를 기준으로 하여 중복되는 주제어가 있는 지를 판단한다(S242).
이는 동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 특정 연도에 주요 연구 분야를 확인할 수 있어서 연구자의 연구 동향을 파악할 수 있도록 하기 위해서이다.
단계 S242에서 중복되는 주제어가 있는 것으로 판단되면 가중치를 부여하도록 한다(S244).
이러한 가중치는 동일 연도에서 주제 A가 5번 등장하고 주제 B는 1번만 등장했다면, 주제 A는 5점, B는 1점으로 설정하는 방식으로 부여하도록 한다.
단계 S244에서 가중치가 부여되거나 단계 S242에서 중복되는 주제어가 없는 경우에는 분석된 자료를 기준으로 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화한다(S246).
시각화 UI도면에서는 연도에 따라 주제(범례)를 카운트하여 계산하면 되고, 그래프 옆 태그 클라우드 형태로 보여줄 때 역시 가중치를 고려하여 폰트의 크기를 조절하면 되는 것이다.
도 3을 참고하면 연구자가 매년 어떤 분야의 연구를 수행해왔는지 그래서 연구 동향이 어떻게 변하고 있는지를 확인할 수 있을 뿐만 아니라 해당 연구자가 언제 어떤 분야의 연구에 집중을 하였는지, 연구 성향은 어떻게 변했는지를 간접적으로 알 수 있게 된다.
이러한 시각화는 연도에 따른 주제 동향을 그래프로 표시하고 우측에는 태그클라우드로 표시한 것이다.
또한 연구자연관주제서비스제공부(140)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보와 연구자 네트워크 공저자 또는 인용관계를 이용하여 연관주제를 추출하도록 분석한다(S250).
이는 기존의 연구자 네트워크가 생성될 때 구성된 사람들의 주요 연구 분야에 대한 통계를 보여주기 위해서이다.
그리고 연관주제가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하게 할 수 있다.
즉, 단계 S252에서 연관 주제가 중복되어 있는 가를 판단하여 중복된 연관주제가 있는 경우에는 연관주제의 빈도수에 따라 가중치를 부여하도록 한다.
가중치는 상술한 바와 같이 연구자1이 "주제A, 주제B, 주제C, 주제D, 주제E"에 대하여, 연구자2가 "주제B, 주제C, 주제F, 주제G, 주제H"에 대하여, 연구자3이 "주제A, 주제B, 주제H, 주제I, 주제J"에 대하여 현재 네트워크를 구성하는 연구자A,B,C가 위와 같은 주제들을 연구하고 있다고 설정하면, 네트워크에서 나올 수 있는 “연구자 연관 주제”는 주제A(2), 주제B(3), 주제C(2), 주제D(1), 주제E(1), 주제F(1), 주제G(1), 주제H(2), 주제I(1), 주제J(1)가 된다. 이때 주제의 괄호안의 숫자는 가중치를 나타내는 것이다.
즉, 많은 사람들이 모이게 되면 같은 그룹에 해당되면서 공동으로 연구하는 주제의 가중치가 올라가게 되는 것이다.
단계 S254에서 가중치가 부여되면 연관 주제의 연구자들을 정렬하여 UI(User Interface)로 시각화하여 표시하도록 한다(S256).
도 4의 시각화한 예시 도면을 참고하면, 각 주제어별로 태그 클라우드로 표시하되 가중치에 따라 폰트의 크기나 색상을 달리해서 식별이 잘 되게 시각화한 도면으로 각 주제어와 이에 따른 가중치로 표시한 것이다.
또한, 분석서비스모듈로 동작되는 유사연구자서비스제공부(150)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 추출하도록 한다(S260).
단계 S260은 해당 연구자와 연구 분야가 겹치는 연구자들을 제공하도록 함으로써, 얼마나 유사한 연구를 하고 있는지를 알 수 있기 때문이다.
연구자는 유사도 선택을 하여 가장 근접한 유사연구자를 선택하도록 할 수 있다.
즉, 단계 S262에서는 유사 연구자를 추출할 때는, 유사도를 선택할 수 있게 한다(0~100%).
이때 유사도는 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하도록 구성할 수 있다.
유사연구자의 경우, 연도별로 (예를 들어 2002~2004년까지) 같은 연구를 한 연구자들을 비교하는 것이 바람직하지만 본 발명에서는 연도는 고려하지 않고 연구자의 전체 주제어 리스트를 대상으로 연구자마다 전체 주제어와 비교를 시작한다.
유사도는 서비스 실행시 지정해 주는데, 연구자의 전체 주제어 개수를 고려하여 유사도를 계산한다.
단계 S262에서 유사도가 선택되면 유사연구자서비스제공부(150)는 선택된 주제어 N개에 대한 유사도 목록을 추출한다(S264).
예를 들어 홍길동의 전체 주제분야가 10개라면 10개의 주제와 1개가 매칭될때마다 10%가 되고, 홍길동과 홍길순을 비교해서 겹쳐지는 주제가 5개가 있다면, 이 둘의 유사도는 50%가 되는 것이다.
이런식으로 모두 연구자들과 주제어를 매칭시켜 원하는 유사도 이상의 연구자가 있으면 유사 연구자로 결과 값을 UI로 시각화한다(S266).
도 5의 시각화한 예시 도면을 참고하면, 유사연구자서비스제공부(150)는, 해당 연구자와 연구 분야가 겹치는 연구자들을 제공하는 것이다. 이를 통해 얼마나 유사한 연구를 하고 있는지를 알 수 있다.
즉, 연구자주제 정보추출부(120)에서 추출된 정보 중 “연구자 - 주제 - 연도” 정보를 이용하여 산출한다. 연도 값을 이용하게 되면 같은 시기에 유사한 연구를 하는 연구자를 찾을 수 있어 더욱 상세한 비교를 할 수 있기 때문이다.
도 5는 유사도가 80%인 연구자들을 목록으로 표시한 것임을 알 수 있다.
또한, 단계 S270에서는 연관연구자추천서비스제공부(160)에서 정보추출부(120)에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하고 이렇게 추출된 주제어별로 논문을 많이 제출한 연구자들인 전문가의 리스트를 분석하도록 한다.
이는 해당 연구자의 주제 분야에서 전문가들을 바로 제공함으로써, 해당 연구자의 주제어에 대한 전문가를 따로 검색해야하는 번거로움을 해결할 수 있도록 하기 위해서이다.
이렇게 추출된 해당 연구자들의 주제어를 Top N으로 추출한다(S272).
Top N에 선택된 주제어를 이용하여, 정보추출부(120)에서 추출된 정보 “연구자 - 주제 - 연도” 데이터에서 Top1~N까지의 주제어 별로 연구자들을 전문가로 추출한다(S274).
이후 추출된 전문가들 중에서 해당 주제어에 가장 빈번히 나타난 전문가를 M명을 해당 분야의 전문가로 칭하고, 이를 제공해 준다(S276).
이렇게 제공된 각 주제어별 M명의 전문가는 UI(User Interface)로 시각화하여 표시하도록 한다(S278).
도 6의 UI(User Interface)로 시각화한 예시 도면을 참고하면, 대표연구자의 주요 연구분야를 5개 선택하여 그래프로 나타내고 해당 연구 분야를 선택할 때마다 그 분야의 주요 전문가들을 보여준다. 링크를 통해 해당 연구자 페이지로 이동이 가능하여, 위에서 나온 서비스들을 이용할 수 있게 된다.
또한, 단계 S246, 단계 S256, 단계 S266 그리고 단계 S278에서 시각화한 도면은 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되도록 하게 할 수 있다.
즉, 도 7의 도면을 참고하면, 본 발명과 관련된 창들을 디스플레이시킴으로써, 연구자만 검색함으로써 그 연구자의 연구동향, 연관주제 연구자, 유사연구자와 주요 연구 분야의 다른 전문가까지 여러 단계의 검색을 수행하지 않고 한번에 표시가능하도록 할 수 있는 것이다.
이러한 본 발명에 의한 방법들은 각 단계별로 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 기록 장치로서, ROM, RAM, Cache, 하드 디스크, 광디스크, 플로피 디스크, 자기 테이프 등이 있다. 또한, 캐리어 웨이브의 형태로 구현되는 것도 포함하며, 예를 들어 인터넷을 통한 전송 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이상에서 본 발명은 기재된 구체예에 대하여 상세히 설명되었지만 본 발명의 기술사상 범위 내에서 다양한 변형 및 수정이 가능함은 당업자에게 있어서 명백한 것이며, 이러한 변형 및 수정이 첨부된 특허 청구범위에 속함은 당연한 것이다.
본 발명은 온톨로지 기반 참고문헌 분석을 통한 연구자관련 정보 제공에 관한 기술로 연구자와 관련된 분석 정보에서 추출된 정보들을 한 눈으로 파악가능한 UI로 제공하기 때문에 주제 분야의 동향을 좀 더 자세하게 볼 수 있으며, 주요 연구 주제와 관심있게 다루고 있는 연구 주제들을 한눈에 볼 수 있고 주요 연구 분야의 다른 전문가까지 동시에 볼 수 있는 효과가 있다.

Claims (19)

  1. URI(Uniform Resource Identifier) 기반과 DBMS(database management system) 기반 하에 지식 처리를 수행하여 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-의 지식정보 공유 서비스가 제공될 수 있도록 처리하는 학술정보서비스시스템;
    상기 학술정보서비스시스템에서 연구자의 분석정보를 추출하는 연구자의 연구정보분석시스템;
    상기 연구자의 연구정보분석시스템에서 연구자정보, 주제정보, 그리고 연도정보를 추출하는 정보추출모듈; 및
    상기 정보추출모듈에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 분석서비스모듈;
    을 포함하여 구성되는 연구자의 연구 정보 분석 장치.
  2. 제 1항에 있어서,
    상기 연구자의 연구정보분석시스템은
    상기 연구자의 해당 논문의 원문에서 주제어를 추출하고 상기 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 저장하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  3. 제 2항에 있어서,
    상기 정보추출모듈은
    상기 연구자를 입력하면 SPARQL이라는 질의어를 통해, 상기 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  4. 제 3항에 있어서,
    상기 분석서비스모듈은
    상기 정보추출모듈에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어를 모두 표시하고 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시하는 연구자연구동향서비스제공부;
    를 더 포함하도록 하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  5. 제 4항에 있어서,
    상기 연구자연구동향서비스제공부는
    동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  6. 제 3항에 있어서,
    상기 분석서비스모듈은
    상기 정보추출모듈에서 추출된 정보와 공저자 또는 인용관계로 구성된 연구자 네트워크를 이용하여 연관주제를 추출하고 상기 연관 주제어들을 정렬하여 UI(User Interface)로 시각화하여 표시하는 연구자연관주제서비스제공부;
    를 더 포함하도록 하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  7. 제 6항에 있어서,
    상기 연구자연관주제서비스제공부는
    상기 연관주제가 중복되어 표시되는 경우는 동일 연관주제어의 빈도수에 따라 가중치를 부여하여 표시하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  8. 제 3항에 있어서,
    상기 분석서비스모듈은
    상기 정보추출모듈에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 유사연구자서비스제공부;
    를 더 포함하도록 구성하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  9. 제 8항에 있어서,
    상기 유사도는
    상기 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  10. 제 3항에 있어서,
    상기 분석서비스모듈은
    상기 정보추출모듈에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하고 해당 주제어별로 성과가 많은 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 연관연구자추천서비스제공부;
    를 더 포함하도록 구성하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  11. 제 5항, 제 7항, 제 9항 또는 제 10항에 있어서,
    상기 연구자연구동향서비스제공부, 상기 연구자연관주제서비스제공부, 상기 유사연구자서비스제공부 또는 상기 연관연구자추천서비스제공부에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되도록 하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
  12. 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-를 제공하는 연구자의 연구정보 분석시스템을 이용한 연구자의 연구 정보 분석 방법에 있어서,
    (a)상기 연구정보 분석시스템에서 상기 연구자의 연구자정보, 주제정보, 그리고 연도정보를 추출하는 단계;
    (b)연구자를 입력하는 단계;
    (c)상기 연구자에 대한 연구자정보, 주제정보, 그리고 연도정보를 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 단계; 및
    (d)상기 제공된 분석 데이터를 UI(User Interface)로 시각화하여 표시하는 단계;
    를 포함하여 이루어지는 연구자의 연구 정보 분석 방법.
  13. 제 12항에 있어서,
    상기 (a)단계는
    상기 연구자의 연구정보 분석시스템을 이용하여 연구자별 해당 논문의 원문에서 주제어를 추출하고 상기 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 저장하도록 하는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
  14. 제 12항에 있어서,
    상기 (b)단계는
    상기 연구자를 입력하면 SPARQL이라는 질의어를 통해, 상기 트리플들에서 연결관계들을 추론해서 관련 정보를 추출하는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
  15. 제 12항에 있어서,
    상기 (c)단계는
    상기 (b)단계에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어를 모두 추출하는 단계;
    해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시하는 단계; 및
    동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
  16. 제 12항에 있어서,
    상기 (c)단계는
    상기 (b)단계에서 추출된 정보와 공저자 또는 인용관계로 구성된 연구자 네트워크를 이용하여 연관주제어를 추출하는 단계;
    상기 연관 주제어를 정렬하여 UI(User Interface)로 시각화하여 표시하는 단계; 및
    상기 연관주제가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
  17. 제 12항에 있어서,
    상기 (c)단계는
    상기 (b)단계에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 단계; 및
    상기 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하여 표시하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
  18. 제 12항에 있어서,
    상기 (c)단계는
    상기 (b)단계에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하는 단계; 및
    해당 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
  19. 제 15항, 제 16항, 제 17항 또는 제 18항에 있어서,
    상기 연구자연구동향서비스제공부, 상기 연구자연관주제서비스제공부, 상기 유사연구자서비스제공부 또는 상기 연관연구자추천서비스제공부에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
PCT/KR2010/001352 2009-11-24 2010-03-04 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체 Ceased WO2011065630A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP10833443A EP2506152A1 (en) 2009-11-24 2010-03-04 Apparatus and method for analyzing research information about a researcher, and computer-readable storage medium for storing computer-executable program for the method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2009-0114122 2009-11-24
KR1020090114122A KR101073385B1 (ko) 2009-11-24 2009-11-24 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체

Publications (1)

Publication Number Publication Date
WO2011065630A1 true WO2011065630A1 (ko) 2011-06-03

Family

ID=44066726

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2010/001352 Ceased WO2011065630A1 (ko) 2009-11-24 2010-03-04 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체

Country Status (3)

Country Link
EP (1) EP2506152A1 (ko)
KR (1) KR101073385B1 (ko)
WO (1) WO2011065630A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268580A (zh) * 2013-04-26 2013-08-28 苏州农业职业技术学院 在线论文管理系统及其方法
CN110941662A (zh) * 2019-06-24 2020-03-31 上海市研发公共服务平台管理中心 科研合作关系的图示化方法、系统、存储介质、及终端

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101415447B1 (ko) * 2013-05-24 2014-07-04 인하대학교 산학협력단 비디오 시청을 통한 소셜 네트워크 서비스 기반의 정보 공유 시스템 및 방법
CN104317857B (zh) * 2014-10-15 2019-03-22 深圳市易图资讯股份有限公司 一种房屋信息采集服务系统
KR101634583B1 (ko) 2014-12-17 2016-06-29 한국과학기술정보연구원 연구자 논문 분석을 통한 프로파일 생성 시스템 및 방법
KR101671892B1 (ko) * 2015-01-20 2016-11-02 한국과학기술원 Uri 정의문 및 부가정보 기반 텍스트에서 개체의 uri를 식별하는 장치, 토픽 분포 추정 방법 및 uri 선택 방법
KR102623996B1 (ko) 2016-11-10 2024-01-11 동우 화인켐 주식회사 식각액 조성물 및 이를 이용한 식각방법 및 이를 이용한 표시 장치용 어레이 기판의 제조방법
US10614136B2 (en) * 2017-03-02 2020-04-07 Innoplexus Ag Method and system for managing primary field-specific entity records required by user
KR101823463B1 (ko) * 2017-05-23 2018-01-31 한국과학기술정보연구원 연구자 검색 서비스 제공 장치 및 그 방법
EP3692485A4 (en) * 2017-10-06 2020-10-28 Elsevier Inc. SYSTEMS AND METHODS FOR PROVIDING RECOMMENDATIONS FOR UNIVERSITY AND RESEARCH ENTITIES
KR102045574B1 (ko) * 2018-02-13 2019-11-18 고려대학교 산학협력단 기술 문서 키워드를 도출하는 장치 및 방법
KR102753536B1 (ko) 2021-03-25 2025-01-13 (주)지플러스 인공지능 학습 모델을 이용한 저자 식별 시스템 및 그 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100882582B1 (ko) * 2006-12-20 2009-02-12 한국과학기술정보연구원 시맨틱 웹 기반 연구정보 서비스 시스템 및 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100882582B1 (ko) * 2006-12-20 2009-02-12 한국과학기술정보연구원 시맨틱 웹 기반 연구정보 서비스 시스템 및 그 방법

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHOI, SUNG-PIL ET AL.: "A Study on Developing an Adaptive R&D Information Service Portal", JOURNAL OF THE KOREAN LIBRARY AND INFORMATION SCIENCE SOCIETY, vol. 41, no. 4, 31 December 2007 (2007-12-31), pages 229 - 250 *
LEE, MIKYOUNG ET AL.: "Study on Web Services - based Inference Service", KOREAN INSTITUTE OF INFORMATION SCIENTISTS AND ENGINEERS, 2008 ANNUAL CONFERENCE, vol. 35, no. 2, 25 October 2008 (2008-10-25), pages 200 - 203 *
SEO, EUN-GYOUNG ET AL.: "Designing Researcher Information Retrieval Interface based on Ontological Analysis", JOURNAL OF THE KOREA SOCIETY FOR INFORMATION MANAGEMENT, vol. 26, no. 2, 30 June 2009 (2009-06-30), pages 173 - 194 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268580A (zh) * 2013-04-26 2013-08-28 苏州农业职业技术学院 在线论文管理系统及其方法
CN110941662A (zh) * 2019-06-24 2020-03-31 上海市研发公共服务平台管理中心 科研合作关系的图示化方法、系统、存储介质、及终端

Also Published As

Publication number Publication date
EP2506152A1 (en) 2012-10-03
KR20110057644A (ko) 2011-06-01
KR101073385B1 (ko) 2011-10-17

Similar Documents

Publication Publication Date Title
WO2011065630A1 (ko) 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
WO2015122691A1 (en) Dynamically modifying elements of user interface based on knowledge graph
US20090240638A1 (en) Syntactic and/or semantic analysis of uniform resource identifiers
CN106874467A (zh) 用于提供搜索结果的方法和装置
EP2391955A1 (en) Document analysis system
WO2020130418A1 (ko) 협력업체 공급망 리스크 분석 방법
KR20140004601A (ko) 모바일 메신저에 적용 가능한 태그를 이용한 재능 교환 및 공통 관심 사용자 매칭 시스템 및 그 방법
Scharl et al. From web intelligence to knowledge co-creation: A platform for analyzing and supporting stakeholder communication
WO2012046906A1 (ko) 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
JP2006185409A (ja) 代行処理システム及び代行処理方法
WO2012046904A1 (ko) 다중 자원 기반 검색정보 제공 장치 및 방법
WO2013008978A1 (ko) 개체 식별 결과 검색 시스템 및 방법
WO2012060502A1 (ko) 연구주체간의 상관관계 추론을 위한 시스템 및 방법
US10019493B2 (en) Related information presentation device, and related information presentation method
US11068121B2 (en) System and method for visual exploration of subnetwork patterns in two-mode networks
WO2016072772A1 (ko) 레퍼런스 의미 지도를 이용한 데이터 시각화 방법 및 시스템
WO2021003922A1 (zh) 页面信息录入优化方法、设备、存储介质及装置
WO2016129804A1 (ko) 소비자 행동 패턴을 기반으로 한 웹페이지 생성 방법 및 활용 방법
WO2018212536A1 (ko) 콘텐츠의 상세 수치정보 제공장치
US20130311860A1 (en) Identifying Referred Documents Based on a Search Result
WO2019103220A1 (ko) 시각화 내비게이션 방식의 법률 정보 서비스 시스템 및 방법
Mekni et al. Sentiment analysis of social media: A case study on big tech layoffs
US11048713B2 (en) System and method for visual exploration of search results in two-mode networks
WO2019190294A1 (ko) 전자문서의 관계기반 저작관리방법 및 저작관리시스템
WO2019239544A1 (ja) 表示形式決定装置、表示形式決定方法および記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10833443

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2010833443

Country of ref document: EP