WO2011065630A1

WO2011065630A1 - 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체

Info

Publication number: WO2011065630A1
Application number: PCT/KR2010/001352
Authority: WO
Inventors: 이미경; 정한민; 김평; 이승우; 류범종
Original assignee: Korea Institute of Science and Technology KIST; Korea Institute of Science and Technology Information KISTI
Current assignee: Korea Institute of Science and Technology KIST; Korea Institute of Science and Technology Information KISTI
Priority date: 2009-11-24
Filing date: 2010-03-04
Publication date: 2011-06-03
Anticipated expiration: 2012-05-24
Also published as: EP2506152A1; KR20110057644A; KR101073385B1

Abstract

연구자의 연구정보 분석 장치 및 그 방법이 개시된다. 본 발명은 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 국가 정보-를 이용하여 연구자정보, 주제정보, 그리고 연도정보에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 UI로 제공함으로써, 연구자의 관심 주제 분야의 동향을 좀 더 자세하게 볼 수 있으며, 연구자네트워크를 구성하는 연구자들의 주요 연구 주제와 관심있게 다루고 있는 연구 주제들을 한눈에 볼 수 있을 뿐만 아니라, 여러 단계의 검색을 수행하지 않고 한번에 연구자만 검색함으로써 그 연구자의 주요 연구 분야의 다른 전문가까지 동시에 볼 수 있다는 효과가 있다.

Description

연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체

본 발명은 온톨로지 기반 참고문헌 분석을 통한 연구자관련 정보 제공에 관한 기술로, 상세하게는 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 국가 정보-를 이용하여 연구자정보, 주제정보, 그리고 연도정보에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 한 눈으로 파악가능한 UI로 제공하기 위한 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.

일반적으로 시맨틱 웹 기술은 컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는 차세대 지능형 웹을 말한다. 현재의 컴퓨터처럼 사람이 마우스나 키보드를 이용해 원하는 정보를 찾아 눈으로 보고 이해하는 웹이 아니라, 컴퓨터가 이해할 수 있는 웹을 말한다. 즉, 사람이 읽고 해석하기에 편리하게 설계되어 있는 현재의 웹 대신에 컴퓨터가 이해할 수 있는 형태의 새로운 언어로 표현해 기계들끼리 서로 의사소통을 할 수 있는 지능형 웹이다.

시맨틱 웹의 원리는 사람들이 이해할 수 있도록 자연어 위주로 되어 있는 현재의 웹 문서와 달리, 정보자원들 사이에 연결되어 있는 의미를 컴퓨터가 이해할 수 있는 형태의 언어로 바꾸는 것이다. 이렇게 되면 컴퓨터가 정보자원의 뜻을 해석하고, 기계들끼리 서로 정보를 주고받으면서 자체적으로 필요한 일을 처리하는 것이 가능해진다.

현재 시맨틱 웹과 관련된 연구는 RDF(Resource Description Framework)를 기반으로 한 온톨로지 기술과 국제표준화기구(International Organization for Standardization, ISO) 중심의 토픽 맵(Topic Map) 기술이 주류를 이루고 있다. 전자는 현재의 웹에 자원(주어)/속성(술어)/속성값(목적어) 등 자원을 기술하는 언어인 메타데이터를 부여해 정보의 의미를 이해하고 처리할 수 있게 하는 기술이다. 후자는 ISO의 XML(eXtensible Markup Language) 기반 표준 기술언어인 XTM(XML Topic Maps) 언어를 이용해 정보와 지식의 분산 관리를 지원하는 기술로, 지식층과 정보층의 이중 구조를 띤다.

이러한 시맨틱 웹이 실현되면 컴퓨터가 자동으로 정보를 처리할 수 있어 정보시스템의 생산성과 효율성이 극대화된다. 컴퓨터 혼자 전자상거래를 할 수 있고, 기업의 시스템 통합(System Integration, SI), 지능형 로봇 시스템, 의료 정보화 등 다양한 분야에 응용할 수 있다.

그러나 종래에는 이러한 시맨틱 웹을 적용한 분야가 적었을 뿐만 아니라, 연구기획에 필요한 연구동향을 효율적으로 파악할 수 있는 기술은 없었다.

즉, 그동안 연구자들은 연구기획, 협업 연구자 선정 및 연구방향을 등을 설정하는데 많은 시간과 노력을 들여야만 한다.

예를 들어, 연구자 A 씨는 '인공지능' 분야에 대한 연구를 기획하고 정보를 찾기 위해 검색 사이트를 뒤졌으나 시작부터 난감한 일을 겪게 된다. '인공지능'이란 단어가 들어 있는 엄청난 양이 정보들 사이에서 헤매는 바람에 쓸데없이 시간과 노력을 허비하고야 말았던 것이다.

또한 연구자 B 씨는 함께 연구를 수행할 전문가들을 찾으려 했다가 어려움을 겪었다. 일반 검색 사이트는 물론이고, 인맥을 동원해 전문가를 찾아 나섰지만 최적의 전문가를 찾기에는 정보 등이 부족했기 때문이다.

그리고 특정 연구자의 연구동향이나 주요 연구분야에 대한 통계를 확인할 수 있는 방법이 없기 때문에 이러한 관련 정보를 분석하여 한 눈에 파악할 수 있도록 제시해 주는 연구자의 연구정보 분석 시스템과 방법을 구축하여 연구기획에 필요한 연구동향 등을 효율적으로 파악할 수 있는 기술의 필요한 것이다.

이러한 문제점을 해결하기 위한 본 발명은 특정 연구자의 연구동향이나 주요 연구분야에 대한 통계를 UI로 표시하여 필요한 정보를 여러 단계의 검색을 수행하지 않고 한번에 연구자만 검색할 수 있도록 하고 관련 정보를 한 눈에 파악할 수 있도록 제시해 주는 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것을 본 발명의 목적으로 한다.

이러한 과제를 해결하기 위한 본 발명은 URI(Uniform Resource Identifier) 기반과 DBMS(database management system) 기반 하에 지식 처리를 수행하여 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-의 지식정보 공유 서비스가 제공될 수 있도록 처리하는 학술정보서비스시스템, 상기 학술정보서비스시스템에서 연구자의 분석정보를 추출하는 연구자의 연구정보분석시스템, 상기 연구자의 연구정보분석시스템에서 연구자정보, 주제정보, 그리고 연도정보를 추출하는 정보추출모듈 그리고 상기 정보추출모듈에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 분석서비스모듈을 포함하여 구성되고, 상기 연구자의 연구정보분석시스템은 상기 연구자의 해당 논문의 원문에서 주제어를 추출하고 상기 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 사용하며, 상기 정보추출모듈은 상기 연구자를 입력하면 SPARQL이라는 질의어를 통해, 상기 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오는 것을 특징으로 한다.

또한, 분석서비스모듈은 상기 정보추출모듈에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어를 모두 표시하고 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시하는 연구자연구동향서비스제공부를 더 포함하도록 하고 동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하는 것을 특징으로 한다.

또한, 상기 분석서비스모듈은 상기 정보추출모듈에서 추출된 정보와 공저자 또는 인용관계로 구성된 연구자 네트워크를 이용하여 연관 주제어를 추출하고 상기 연관 주제어들을 정렬하여 UI(User Interface)로 시각화하여 표시하는 연구자연관주제서비스제공부를 더 포함하도록 구성하고, 상기 연관 주제어가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하는 것을 특징으로 한다.

또, 상기 분석서비스모듈은 상기 정보추출모듈에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 유사연구자서비스제공부를 더 포함하도록 구성하고, 상기 유사도는 상기 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하는 것을 특징으로 한다.

그리고, 상기 분석서비스모듈은 상기 정보추출모듈에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하고 해당 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 연관연구자추천서비스제공부를 더 포함하도록 구성할 수 있다.

상기 연구자연구동향서비스제공부, 상기 연구자연관주제서비스제공부, 상기 유사연구자서비스제공부 또는 상기 연관연구자추천서비스제공부에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되도록 하는 것이 더욱 바람직하다.

한편, 이러한 문제점을 해결하기 위한 본 발명은 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-를 제공하는 연구자의 연구정보 분석시스템을 이용한 연구자의 연구 정보 분석 방법에 있어서, (a)상기 연구정보 분석시스템에서 해당 연구자의 연구자정보, 주제정보, 그리고 연도정보를 추출하는 단계, (b)연구자를 입력하는 단계, (c)해당 연구자에 대한 연구자정보, 주제정보, 그리고 연도정보를 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 단계 그리고 (d)상기 제공된 분석 데이터를 UI(User Interface)로 시각화하여 표시하는 단계를 포함하여 이루어지게 할 수 있다.

상기 (a)단계는 상기 연구자의 연구정보 분석시스템을 이용하여 연구자별 해당 논문의 원문에서 주제어를 추출하고 상기 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 저장하도록 하고 상기 (b)단계는 상기 연구자를 입력하면 SPARQL이라는 질의어를 통해, 상기 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오는 단계를 더 포함하여 이루어지게 할 수 있다.

상기 (c)단계는 상기 (b)단계에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어를 모두 추출하는 단계, 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시하는 단계 및 동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하는 단계를 더 포함하여 이루어지는 것을 특징으로 한다.

상기 (c)단계는 상기 (b)단계에서 추출된 정보와 연구자 네트워크 공저자 또는 인용관계를 이용하여 연관주제어를 추출하는 단계와 상기 연관 주제어를 정렬하여 UI(User Interface)로 시각화하여 표시하는 단계 및 상기 연관주제가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하는 단계를 더 포함하여 이루어지게 할 수 있다.

또한, c)단계는 상기 (b)단계에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 단계 및 상기 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하여 표시하는 단계를 더 포함하여 이루어지는 것을 특징으로 한다.

그리고 (c)단계는 상기 (b)단계에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하는 단계 및 해당 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 단계를 더 포함하여 이루어지게 할 수도 있다.

이러한 연구자연구동향서비스제공부, 연구자연관주제서비스제공부, 유사연구자서비스제공부 또는 연관연구자추천서비스제공부에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되게 하면 더욱 바람직하다.

기존의 연구자 동향은 연구자가 쓴 논문들을 연도별 보여 준다던지, 연구자의 대표 주제를 뽑아놓고 그것들의 연도별 추이를 보여주게 되지만, 본 발명의 연구자의 연구정보 분석 장치 및 그 방법에 의하면 매년 연구자가 관심을 가졌던 주제들을 모두 시각화하여 A분야는 언제부터 연구하게 되었고, 언제 가장 활발하게 연구했으며 언제 소멸됐는지, B분야는 언제 등장해서 언제 연구를 열심히 수행했는지 등의 연구자의 관심 주제 분야의 동향을 좀 더 자세하게 볼 수 있도록 하는 효과가 있다.

또한, 기존에는 이렇게 한번의 연관성을 통해 또 다른 정보를 제공해주는 서비스는 존재하지 않았지만 연구자네트워크(같이 공동연구를 수행했거나 연구를 함에 있어서 관련있는 사람들의 모임)를 구성하는 연구자들의 주요 연구 주제와 관심있게 다루고 있는 연구 주제들을 한눈에 볼 수 있는 효과가 있다.

그리고 기존의 서비스에서는 연구자(주요 토픽 정보만), 전문가 정보를 따로 추출하여 서비스하였기 때문에 연구자를 검색하고 거기서 발견한 토픽에 대해 다시 검색해서 전문가 정보를 찾아내야 하지만 본원 발명에 의하면 여러 단계의 검색을 수행하지 않고 한번에 연구자만 검색함으로써 그 연구자의 주요 연구 분야의 다른 전문가까지 동시에 볼 수 있다는 효과가 있다.

도 1은 본 발명의 일실시예에 의한 연구자의 연구정보 분석 장치의 구성도,

도 2는 본 발명의 일실시예에 의한 연구자의 연구정보 분석 방법을 설명하기 위한 흐름도,

도 3은 본 발명의 연구자연구동향서비스제공부에서 표시할 수 있는 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화한 예시 도면,

도 4는 본 발명의 연구자연관주제서비스제공부에서 표시할 수 있는 연관 주제의 연구자들을 정렬하여 UI(User Interface)로 시각화한 예시 도면,

도 5는 본 발명의 유사연구자서비스제공부에서 표시할 수 있는 유사 연구자들의 리스트를 UI(User Interface)로 시각화한 예시 도면,

도 6은 본 발명의 연관연구자추천서비스제공부에서 표시할 수 있는 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화한 예시 도면,

그리고,

도 7은 본 발명에서 표시할 수 있는 UI화면들을 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 예시한 도면이다.

<도면의 주요 부분에 대한 부호의 설명>

110 : 연구정보분석시스템 120 : 연구자주제 정보추출부

130 : 연구자 연구동향 서비스제공부 140 :연구자 연관주제 서비스제공부150 : 유사연구자 서비스제공부 160 : 연관연구자추천서비스제공부

본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정 해석되지 아니하며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…시스템", "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.

이하, 도면을 참조하여 본 발명의 일실시예에 대하여 설명한다.

도 1은 본 발명의 일실시예에 의한 연구자의 연구정보 분석 장치의 구성도로서, 도시된 바와 같이, 연구자의 연구정보 분석 장치(100)는 기존의 학술정보서비스시스템에서 연구자의 분석정보를 제공하는 연구정보분석시스템(110), 연구정보분석시스템(110)의 연구자 분석 정보로부터 연구자와 관련된 연구자정보, 주제어정보, 그리고 연도정보를 추출하는 연구자주제 정보추출부(120), 그리고 연구자주제 정보추출부(120)에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 분석서비스모듈로 동작되는 연구자 연구동향 서비스제공부(130), 연구자 연관주제 서비스제공부(140), 유사연구자 서비스제공부(150), 연관연구자추천서비스제공부(160)를 포함하여 구성된다.

연구자의 연구정보분석시스템(110)은 URI(Uniform Resource Identifier) 기반과 DBMS(database management system) 기반 하에 지식 처리를 수행하여 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-의 지식정보 공유 서비스가 제공되는 학술정보서비스시스템으로부터 연구자의 분석정보를 추출하도록 구성된다.

연구자의 연구정보분석시스템(110)의 경우, 연구자가 매년 어떤 분야의 연구를 수행해왔는지 그래서 연구 동향이 어떻게 변하고 있는지 확인할 수 있도록 구성되어 있다. 이 서비스를 통해 사용자는 해당 연구자가 시기별로 어떤 분야의 연구에 집중을 하였는지, 연구 성향은 어떻게 변했는지를 간접적으로 알 수 있게 된다.

이를 위하여 연구자의 연구정보분석시스템(110)은 연구자의 해당 논문의 원문에서 주제어를 추출하고 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 사용할 수 있도록 구성한다.

트리플 형태로 변환된 데이터는 온톨로지 추론 엔진에 저장된다. 트리플(Triple)이란 주제, 술부, 목적(Subject, Predicate, Object) 형태로 데이터를 표현하는 것이다.

예를 든다면, (논문A는, 가진다, 저자1을), (논문 A는, 가진다, 주제A를), (논문A는, 발간되었다, 2008년에) 이런 트리플이 저장되어 있다고 가정할 때-물론 실제로는 이렇게 간단하지 않고 각 저자나 주제들도 모두 URI라는 것으로 매칭되어 있어서 실제의 값은 또 다른 트리플로 연결되어 있어서 여러 단계를 거쳐서 답을 가져오게 된다- 그럼 논문 A를 중심으로, 저자와 주제와 연도는 연결이 될 수 있다.

저장되는 정보는 상술한 바와 같이 무수한 트리플들이 될 수 있으며, 서비스에서 저자(연구자) 정보를 입력으로 나머지 관련 정보를 출력하도록 요청하는 질의를 추론엔진으로 던지면 SPARQL(Simple Protocol and RDF Query Language)이라는 질의어를 통해, 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오는 것이다. 이러한 동작은 서비스 수행 시 작동된다.

SPARQL은 W3C에서 만든 RDF 질의 언어이다.

일반적으로 성과물(논문)의 경우, 메타정보와 원문을 가지며 메타정보에는 성과물의 저자(연구자), 공저자, 발간물 정보, 발행 연도, 주제어와 같은 여러 가지 정보들을 가지고 있다.

구체적으로 논문의 메타정보에는 Title, 저자, 저자의 소속기관, 논문 출처(학회, 학술지), 연도, 초록, 국가 정보 등이 포함되어 있다. 논문의 원문과 논문의 메타정보를 통해 우리가 원하는 정보들을 추출하고 (원문에서 주제어 추출, 메타정보에서 논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 국가 정보) 이를 가공하여 온톨로지에 의해 데이터들을 트리플 형태로 변환하여 사용하는 것이다.

주제어의 경우는 메타정보에 등록되지 않은 경우는 원문으로부터 직접 추출할 수도 있다.

본 발명에서 필요로 하는 정보는 “연구자 - 주제어 - 연도”이다. 성과물을 중심으로 추출한 이런 정보들을 서로 연결시켜 주고 연결된 3개의 정보는 항상 저장하도록 한다.

여기서 DBMS(database management system)는 일반적으로 중앙부서(관리부서)에서 통제하고 있는 데이타의 종합적인 집합을 데이타베이스(database)라고 하며, 데이타베이스 이외에 그 데이타가 저장된 하드웨어와 데이타의 저장과 검색을 통제하는 소프트웨어를 총칭하여 DBMS(데이타베이스 관리시스템)한다.

결국 모든 응용 프로그램들이 데이타베이스를 공유할 수 있도록 관리·지원하여 주는 소프트웨어를 말하며, 데이타베이스의 구성/접근방법/통제역할 등을 수행하는 것을 DBMS라 하는 것이다.

한편 URI(Uniform Resource Identifier)는 World Wide Web (WWW(12))상에서 접근하고자 하는 자원의 위치를 나타내기 위해서 사용한다. 자원은 "문서", "이미지", "동영상", "프로그램", "이메일" 등 모든 것이 될 수 있다

연구자주제 정보추출부(120)는 연구자의 연구정보분석시스템(110)에서 연구자정보, 주제정보, 그리고 연도정보를 추출하는 정보추출모듈로 동작된다. 즉, 연구자가 입력되면 SPARQL이라는 질의어를 통해, 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오도록 동작되어 연구자와 주제어 정보, 연도 정보를 추출하여 서로 연결 관계를 생성한다.

분석서비스모듈로 동작되는 연구자연구동향서비스제공부(130)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어에 대한 연도별 추이를 분석하고 이렇게 분석된 자료를 가공하여 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시할 수 있다.

또한, 동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하게 할 수 있다.

이 서비스는 연구자주제 정보추출부(120)에서 추출한 “연구자 - 주제 - 연도”의 데이터에서 한명의 연구자-연구자A-를 선택하고, 연구자 A에 속하는 “연구자A - 주제 - 연도” 데이터를 추출한 후, 연도별로 정렬을 시키는 것이다.

이때 같은 연도 상에 중복된 주제가 있는 경우는 가중치 값으로 가산한다. 이를 통해 특정 연도에 주요 연구 분야를 확인할 수 있어서 연구자의 연구 동향을 파악할 수 있다.

원래 서비스에서는 논문이 발간된 학회 또는 저널(출처정보)의 등급에 따라 가산점을 부여하고 여기에 건수로 (가산점 * 건수)로 가중치를 매기는 것이 바람직하지만, 본 발명에서는 출처 정보의 등급을 따로 나누지 않고 그냥 건수로 처리하는 것으로 설명한다.

구체적으로 동일 연도에서 주제 A가 5번 등장하고 주제 B는 1번만 등장했다면, 주제 A는 5점, B는 1점으로 설정하고, 시각화 UI도면에서는 연도에 따라 주제(범례)를 카운트하여 계산하면 되고, 그래프 옆 태그 클라우드 형태로 보여줄 때 역시 가중치를 고려하여 폰트의 크기를 조절하면 되는 것이다.

도 3의 연구자연구동향서비스제공부에서 표시할 수 있는 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화한 예시 도면을 참조하여 이를 설명하면, 연구자연구동향서비스제공부(130)의 경우 연구자가 매년 어떤 분야의 연구를 수행해왔는지 그래서 연구 동향이 어떻게 변하고 있는지를 확인할 수 있는 것이다. 이 서비스를 통해 사용자는 해당 연구자가 언제 어떤 분야의 연구에 집중을 하였는지, 연구 성향은 어떻게 변했는지를 간접적으로 알 수 있게 된다.

이를 위하여 도면의 좌측에는 연도별 연구동향을 연도에 따른 주제 동향을 그래프로 표시하고 우측에는 태그클라우드로 표시한 것이다.

좌측의 연도별 연구동향그래프에서 X축은 연도를 Y축은 분야별 연구 건수를 표시함으로써, 매년 상위 연구 분야를 보여주고, 연구 분야의 동향을 확인할 수 있는 것이다.

이 서비스 또한 연구자주제 정보추출부(120)에서 추출한 “연구자 - 주제 - 연도”의 데이터에서 한명의 연구자, 연구자A를 선택하고, 연구자 A에 속하는 “연구자A - 주제 - 연도” 데이터를 추출한 후, 연도별로 정렬을 시킨 것이다.

또한, 우측도면의 태그클라우드의 표시는 자신이 원하는 태그를 빨리 찾을 수 있도록 하기 위하여 본 발명에서는 가중치가 높은 연구 주제어를 좀더 큰 글꼴과 눈에 띄는 칼라로 표시하는 것이다. 이러한 태그클라우드는 일반적인 사항이므로 상세한 설명은 생략하기로 한다.

따라서, 연구자연구동향서비스제공부(130)에서 표시하는 UI(User Interface)를 통해 특정 연도에 주요 연구 분야를 확인할 수 있어서 연구자의 연구 동향을 손쉽게 파악할 수 있는 것이다.

즉, 기존의 연구자 동향은 연구자가 쓴 논문들을 연도별 보여준 다던지, 연구자의 대표 주제를 뽑아놓고 그것들의 연도별 추이를 보여주게 되지만, 본 발명에서는 매년 연구자가 관심을 가졌던 주제들을 모두 시각화하여 A분야는 언제부터 연구하게 되었고, 언제 가장 활발하게 연구했으며 언제 소멸됐는지, B분야는 언제 등장해서 언제 연구를 열심히 수행했는지 등의 연구자의 관심 주제 분야의 동향을 좀 더 자세하게 볼 수 있는 특징이 있는 것이다.

한편, 분석서비스모듈로 동작되는 연구자연관주제서비스제공부(140)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보와 공저자 또는 인용관계로 구성된 연구자 네트워크를 이용하여 연관 주제어를 추출하여 분석하고 이렇게 분석된 자료는 연관 주제어의 연구자들을 정렬하여 UI(User Interface)로 시각화하여 표시할 수 있다.

또한, 연구자연관주제서비스제공부(140)는 연관주제가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하게 할 수 있다.

예를 들어 연구자1이 "주제A, 주제B, 주제C, 주제D, 주제E"에 대하여, 연구자2가 "주제B, 주제C, 주제F, 주제G, 주제H"에 대하여, 연구자3이 "주제A, 주제B, 주제H, 주제I, 주제J"에 대하여 현재 네트워크를 구성하는 연구자A,B,C가 위와 같은 주제들을 연구하고 있다고 설정하면, 네트워크에서 나올 수 있는 “연구자 연관 주제”는 주제A(2), 주제B(3), 주제C(2), 주제D(1), 주제E(1), 주제F(1), 주제G(1), 주제H(2), 주제I(1), 주제J(1)가 된다. 이때 주제의 괄호안의 숫자는 가중치를 나타내는 것이다.

즉, 많은 사람들이 모이게 되면 같은 그룹에 해당되면서 공동으로 연구하는 주제의 가중치가 올라가게 된다.

본 서비스는 기존의 연구자 네트워크가 생성될 때 구성된 사람들의 주요 연구 분야에 대한 통계를 보여주는 서비스이다.

연구자 네트워크의 경우, 공저자나 인용 관계 등의 연구자들간의 연관 관계에 의해 구성된다. 연구자 네트워크는 이미 많이 사용되고 있지만 연구자 네트워크를 통해 나타나는 연구자들의 목록을 통해 연구자 연관 주제를 추출할 수 있다.

물론 연구자 네트워크 뿐만 아니라 모든 연구자들의 목록을 통해 해당 그룹의 연구 주제를 판단할 수 있다.

본 서비스에서도 연구자주제 정보추출부(120)에서 추출한 “연구자 - 주제 - 연도” 정보를 이용한다.

연구자를 추출할 때는 해당 그룹의 연구자들을 모두 포함시키고 연구자들의 정보를 추출하면 연구분야(주제)로 정렬을 시켜, 겹쳐지는 주제는 가중치를 부여하여 하나로 처리한다.

그렇게 되면 해당 연구자 그룹에서의 주요 공통 연구 주제들을 확인할 수 있다. 시각화는 태그 클라우드나 목록을 통해 제공할 수 있다.

도 4의 연구자연관주제서비스제공부에서 표시할 수 있는 연관 주제의 연구자들을 정렬하여 UI(User Interface)로 시각화한 예시 도면을 참고하면, 각 주제어별로 태그 클라우드로 표시하되 가중치에 따라 폰트의 크기나 색상을 달리해서 식별이 잘 되게 시각화한 도면으로 각 주제어와 이에 따른 가중치로 표시한 것이다.

또한, 분석서비스모듈로 동작되는 유사연구자서비스제공부(150)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 추출하고 이렇게 추출된 리스트는 UI(User Interface)로 시각화하여 표시하게 할 수 있다.

이때 유사도는 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하도록 구성할 수 있다.

도 5의 유사연구자서비스제공부에서 표시할 수 있는 유사 연구자들의 리스트를 UI(User Interface)로 시각화한 예시 도면을 참고하면, 유사연구자서비스제공부(150)는, 해당 연구자와 연구 분야가 겹치는 연구자들을 제공하는 것이다. 이를 통해 얼마나 유사한 연구를 하고 있는지를 알 수 있다.

즉, 연구자주제 정보추출부(120)에서 추출된 정보 중 “연구자 - 주제 - 연도” 정보를 이용하여 산출한다. 연도 값을 이용하게 되면 같은 시기에 유사한 연구를 하는 연구자를 찾을 수 있어 더욱 상세한 비교를 할 수 있기 때문이다.

유사 연구자를 추출할 때는, 유사도를 선택할 수 있게 한다(0~100%).

유사연구자의 경우, 연도별로 (예를 들어 2002~2004년까지) 같은 연구를 한 연구자들을 비교하는 것이 바람직하지만 본 발명에서는 연도는 고려하지 않고 연구자의 전체 주제어 리스트를 대상으로 연구자마다 전체 주제어와 비교를 시작한다.

유사도는 서비스 실행시 지정해 주는데, 연구자의 전체 주제어 개수를 고려하여 유사도를 계산한다.

예를 들어 홍길동의 전체 주제분야가 10개라면 10개의 주제와 1개가 매칭될때마다 10%가 되고, 홍길동과 홍길순을 비교해서 겹쳐지는 주제가 5개가 있다면, 이 둘의 유사도는 50%가 되는 것이다.

이런식으로 모두 연구자들과 주제어를 매칭시켜 원하는 유사도 이상의 연구자가 있으면 유사 연구자로 결과 값을 제공하는 것이다.

도 5는 유사도가 80%인 연구자들을 목록으로 표시한 것임을 알 수 있다.

또한, 분석서비스모듈로 동작되는 연관연구자추천서비스제공부(160)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하고 이렇게 추출된 주제어별로 논문을 많이 제출한 -즉, 성과가 많은-연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하게 할 수 있다.

연관연구자추천서비스제공부(160)는 해당 연구자의 주요 연구 분야의 전문가들을 추천해주고자 한다. 이는 일반 검색 포털에서 연관 검색어와 유사한 기능이다. 하지만, 본 발명에서는 해당 연구자의 주제 분야에서 전문가들을 바로 제공함으로써, 해당 연구자의 주제어에 대한 전문가를 따로 검색해야하는 번거로움을 해결할 수 있는 것이다.

우선, 해당 연구자를 추출하여 주제어를 Top N으로 추출한다.

이를 통해 Top N에 선택된 주제어를 이용하여, 앞에서 나온 “연구자 - 주제 - 연도” 데이터에서 Top1~N까지의 주제어 별로 연구자들을 추출한다.

해당 주제어에 가장 빈번히 나타난 연구자(전문가)를 M명을 해당 분야의 전문가로 칭하고, 이를 제공해 주는 것이다..

도 6의 연관연구자추천서비스제공부에서 표시할 수 있는 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화한 예시 도면을 참고하면, 주요 주제어를 "neural network", "cellular neural network", "global exponential", "time delay" 그리고 "periodic solution"에 대하여 X축으로 나열하고 Y축으로는 해당 주제어에 대한 분야의 전문가들의 수를 나타낸 것이다. 즉, 대표연구자의 주요 연구분야를 5개 선택하여 그래프로 나타내고 해당 연구 분야를 선택할때마다 그 분야의 주요 전문가들을 보여준다. 링크를 통해 해당 연구자 페이지로 이동이 가능하여, 위에서 나온 서비스들을 이용할 수 있게 된다.

도 6에서는 주제어로 "neural network"을 선택하면 해당 주제어에 대한 전문가 5명을 순위대로 표시해 주고 있는 것이다.

유사연구자서비스제공부(150)에서 제공하는 유사연구자와 연관연구자추천서비스제공부(150)에는 제공되는 전문가는 다음과 같이 구별된다.

유사연구자서비스제공부(150)에서 제공하는 유사연구자는 검색된 연구자와 연구 분야가 많이 겹치는 연구자를 말한다.

예를 들어, 내가 검색한 “홍길동”은 주제1, 주제2, 주제3, 주제4, 주제5를 연구하는데, 홍길동의 유사 연구자는 유사도가 높을수록 주제1, 주제2, 주제3, 주제4, 주제5 중에 겹치는 주제를 많이 연구하는 사람을 말한다.

연관연구자추천서비스제공부(150)에는 제공되는 전문가는 홍길동의 주제1의 전문가(A,B,C,D,E), 주제2의 전문가(F,G,H,I), 주제3의 전문가(J, K, L, M, N…) 등을 말한다.

한편, 연구자연구동향서비스제공부(130), 연구자연관주제서비스제공부(140), 유사연구자서비스제공부(150) 또는 연관연구자추천서비스제공부(150)에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되도록 하게 할 수 있다.

즉, 도 7의 본 발명에서 표시할 수 있는 UI화면들을 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 예시한 도면을 참고하면, OntoFrame2008의 기존 UI에 "Jinde cao"라는 연구자를 입력한 경우 화면 중앙에는 수평으로 다수 개의 아이콘으로 표시되는 창이 표시되며, 좌측에는 해당 연구자가 발표한 논문을 디스플레이시키는 창("PAPER")과, 중앙에는 관련 연구자 네트워크를 알려주는 창("RESEARCHERS")이 그리고 중앙 우측에는 연관연구자추천서비스를 표시하는 창("related RESEARCHERS")이 표시되어 있으며, 우측 단부에는 수직으로 다수 개의 아이콘을 표시하되 상단에는 연구자 정보 창("RESEARCHER INFO")과 그 하다에 연구자연구동향 서비스창("RESEARCHER TRENDS")을 그 하단에는 유사연구자추천서비스창("SIMILAR RESEARCHER")을 표시하도록 하고 해당 창을 클릭하면 관련된 UI화면들을 표시할 수 있도록 하는 것이다.

이하, 도면을 참조하여 연구자의 연구정보 분석 방법에 대하여 설명한다.

도 2는 본 발명의 일실시예에 의한 연구자의 연구정보 분석 방법을 설명하기 위한 흐름도로서, 도시된 바와 같이 연구자의 연구정보분석시스템(110)은 URI(Uniform Resource Identifier) 기반과 DBMS(database management system) 기반 하에 지식 처리를 수행하여 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-의 지식정보 공유 서비스가 제공되는 학술정보서비스시스템으로부터 연구자의 분석정보를 추출한다(S210).

이때 연구자의 연구정보분석시스템(110)은 연구자의 해당 논문의 원문에서 주제어를 추출하고 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 사용할 수 있도록 구성한다.

연구자 정보를 입력으로 나머지 정보를 출력하는 질의를 추론엔진으로 던지면 SPARQL(Simple Protocol and RDF Query Language)이라는 질의어를 통해, 트리플들에서 연결관계들을 추론해서 원하는 정보를 도출한다(S220).

연구자주제 정보추출부(120)는 연구자의 연구정보분석시스템(110)에서 연구자정보, 주제정보, 그리고 연도정보를 추출한다(S230). 즉, 연구자가 입력되면 SPARQL이라는 질의어를 통해, 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오도록 동작되어 연구자와 주제어 정보, 연도 정보를 추출하여 서로 연결 관계를 생성하는 것이다.

그리고 연구자주제 정보추출부(120)에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구 주제어에 대한 연도별 추이를 분석한다(S240).

연구자주제 정보추출부(120)에서 추출한 “연구자 - 주제 - 연도”의 데이터에서 한명의 연구자-연구자A-를 선택하고, 연구자 A에 속하는 “연구자A - 주제 - 연도” 데이터를 추출한 후, 연도별로 정렬을 시키는 것이다.

단계 S240에서 추출된 정보를 기준으로 하여 중복되는 주제어가 있는 지를 판단한다(S242).

이는 동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 특정 연도에 주요 연구 분야를 확인할 수 있어서 연구자의 연구 동향을 파악할 수 있도록 하기 위해서이다.

단계 S242에서 중복되는 주제어가 있는 것으로 판단되면 가중치를 부여하도록 한다(S244).

이러한 가중치는 동일 연도에서 주제 A가 5번 등장하고 주제 B는 1번만 등장했다면, 주제 A는 5점, B는 1점으로 설정하는 방식으로 부여하도록 한다.

단계 S244에서 가중치가 부여되거나 단계 S242에서 중복되는 주제어가 없는 경우에는 분석된 자료를 기준으로 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화한다(S246).

시각화 UI도면에서는 연도에 따라 주제(범례)를 카운트하여 계산하면 되고, 그래프 옆 태그 클라우드 형태로 보여줄 때 역시 가중치를 고려하여 폰트의 크기를 조절하면 되는 것이다.

도 3을 참고하면 연구자가 매년 어떤 분야의 연구를 수행해왔는지 그래서 연구 동향이 어떻게 변하고 있는지를 확인할 수 있을 뿐만 아니라 해당 연구자가 언제 어떤 분야의 연구에 집중을 하였는지, 연구 성향은 어떻게 변했는지를 간접적으로 알 수 있게 된다.

이러한 시각화는 연도에 따른 주제 동향을 그래프로 표시하고 우측에는 태그클라우드로 표시한 것이다.

또한 연구자연관주제서비스제공부(140)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보와 연구자 네트워크 공저자 또는 인용관계를 이용하여 연관주제를 추출하도록 분석한다(S250).

이는 기존의 연구자 네트워크가 생성될 때 구성된 사람들의 주요 연구 분야에 대한 통계를 보여주기 위해서이다.

그리고 연관주제가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하게 할 수 있다.

즉, 단계 S252에서 연관 주제가 중복되어 있는 가를 판단하여 중복된 연관주제가 있는 경우에는 연관주제의 빈도수에 따라 가중치를 부여하도록 한다.

가중치는 상술한 바와 같이 연구자1이 "주제A, 주제B, 주제C, 주제D, 주제E"에 대하여, 연구자2가 "주제B, 주제C, 주제F, 주제G, 주제H"에 대하여, 연구자3이 "주제A, 주제B, 주제H, 주제I, 주제J"에 대하여 현재 네트워크를 구성하는 연구자A,B,C가 위와 같은 주제들을 연구하고 있다고 설정하면, 네트워크에서 나올 수 있는 “연구자 연관 주제”는 주제A(2), 주제B(3), 주제C(2), 주제D(1), 주제E(1), 주제F(1), 주제G(1), 주제H(2), 주제I(1), 주제J(1)가 된다. 이때 주제의 괄호안의 숫자는 가중치를 나타내는 것이다.

즉, 많은 사람들이 모이게 되면 같은 그룹에 해당되면서 공동으로 연구하는 주제의 가중치가 올라가게 되는 것이다.

단계 S254에서 가중치가 부여되면 연관 주제의 연구자들을 정렬하여 UI(User Interface)로 시각화하여 표시하도록 한다(S256).

도 4의 시각화한 예시 도면을 참고하면, 각 주제어별로 태그 클라우드로 표시하되 가중치에 따라 폰트의 크기나 색상을 달리해서 식별이 잘 되게 시각화한 도면으로 각 주제어와 이에 따른 가중치로 표시한 것이다.

또한, 분석서비스모듈로 동작되는 유사연구자서비스제공부(150)는 정보추출모듈인 연구자주제 정보추출부(120)에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 추출하도록 한다(S260).

단계 S260은 해당 연구자와 연구 분야가 겹치는 연구자들을 제공하도록 함으로써, 얼마나 유사한 연구를 하고 있는지를 알 수 있기 때문이다.

연구자는 유사도 선택을 하여 가장 근접한 유사연구자를 선택하도록 할 수 있다.

즉, 단계 S262에서는 유사 연구자를 추출할 때는, 유사도를 선택할 수 있게 한다(0~100%).

단계 S262에서 유사도가 선택되면 유사연구자서비스제공부(150)는 선택된 주제어 N개에 대한 유사도 목록을 추출한다(S264).

이런식으로 모두 연구자들과 주제어를 매칭시켜 원하는 유사도 이상의 연구자가 있으면 유사 연구자로 결과 값을 UI로 시각화한다(S266).

도 5의 시각화한 예시 도면을 참고하면, 유사연구자서비스제공부(150)는, 해당 연구자와 연구 분야가 겹치는 연구자들을 제공하는 것이다. 이를 통해 얼마나 유사한 연구를 하고 있는지를 알 수 있다.

또한, 단계 S270에서는 연관연구자추천서비스제공부(160)에서 정보추출부(120)에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하고 이렇게 추출된 주제어별로 논문을 많이 제출한 연구자들인 전문가의 리스트를 분석하도록 한다.

이는 해당 연구자의 주제 분야에서 전문가들을 바로 제공함으로써, 해당 연구자의 주제어에 대한 전문가를 따로 검색해야하는 번거로움을 해결할 수 있도록 하기 위해서이다.

이렇게 추출된 해당 연구자들의 주제어를 Top N으로 추출한다(S272).

Top N에 선택된 주제어를 이용하여, 정보추출부(120)에서 추출된 정보 “연구자 - 주제 - 연도” 데이터에서 Top1~N까지의 주제어 별로 연구자들을 전문가로 추출한다(S274).

이후 추출된 전문가들 중에서 해당 주제어에 가장 빈번히 나타난 전문가를 M명을 해당 분야의 전문가로 칭하고, 이를 제공해 준다(S276).

이렇게 제공된 각 주제어별 M명의 전문가는 UI(User Interface)로 시각화하여 표시하도록 한다(S278).

도 6의 UI(User Interface)로 시각화한 예시 도면을 참고하면, 대표연구자의 주요 연구분야를 5개 선택하여 그래프로 나타내고 해당 연구 분야를 선택할 때마다 그 분야의 주요 전문가들을 보여준다. 링크를 통해 해당 연구자 페이지로 이동이 가능하여, 위에서 나온 서비스들을 이용할 수 있게 된다.

또한, 단계 S246, 단계 S256, 단계 S266 그리고 단계 S278에서 시각화한 도면은 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되도록 하게 할 수 있다.

즉, 도 7의 도면을 참고하면, 본 발명과 관련된 창들을 디스플레이시킴으로써, 연구자만 검색함으로써 그 연구자의 연구동향, 연관주제 연구자, 유사연구자와 주요 연구 분야의 다른 전문가까지 여러 단계의 검색을 수행하지 않고 한번에 표시가능하도록 할 수 있는 것이다.

이러한 본 발명에 의한 방법들은 각 단계별로 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 기록 장치로서, ROM, RAM, Cache, 하드 디스크, 광디스크, 플로피 디스크, 자기 테이프 등이 있다. 또한, 캐리어 웨이브의 형태로 구현되는 것도 포함하며, 예를 들어 인터넷을 통한 전송 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.

이상에서 본 발명은 기재된 구체예에 대하여 상세히 설명되었지만 본 발명의 기술사상 범위 내에서 다양한 변형 및 수정이 가능함은 당업자에게 있어서 명백한 것이며, 이러한 변형 및 수정이 첨부된 특허 청구범위에 속함은 당연한 것이다.

본 발명은 온톨로지 기반 참고문헌 분석을 통한 연구자관련 정보 제공에 관한 기술로 연구자와 관련된 분석 정보에서 추출된 정보들을 한 눈으로 파악가능한 UI로 제공하기 때문에 주제 분야의 동향을 좀 더 자세하게 볼 수 있으며, 주요 연구 주제와 관심있게 다루고 있는 연구 주제들을 한눈에 볼 수 있고 주요 연구 분야의 다른 전문가까지 동시에 볼 수 있는 효과가 있다.

Claims

URI(Uniform Resource Identifier) 기반과 DBMS(database management system) 기반 하에 지식 처리를 수행하여 연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-의 지식정보 공유 서비스가 제공될 수 있도록 처리하는 학술정보서비스시스템;

상기 학술정보서비스시스템에서 연구자의 분석정보를 추출하는 연구자의 연구정보분석시스템;

상기 연구자의 연구정보분석시스템에서 연구자정보, 주제정보, 그리고 연도정보를 추출하는 정보추출모듈; 및

상기 정보추출모듈에서 추출된 정보들을 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 분석서비스모듈;

을 포함하여 구성되는 연구자의 연구 정보 분석 장치.
제 1항에 있어서,

상기 연구자의 연구정보분석시스템은

상기 연구자의 해당 논문의 원문에서 주제어를 추출하고 상기 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 저장하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 2항에 있어서,

상기 정보추출모듈은

상기 연구자를 입력하면 SPARQL이라는 질의어를 통해, 상기 트리플들에서 연결관계들을 추론해서 원하는 정보를 가져오는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 3항에 있어서,

상기 분석서비스모듈은

상기 정보추출모듈에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어를 모두 표시하고 해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시하는 연구자연구동향서비스제공부;

를 더 포함하도록 하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 4항에 있어서,

상기 연구자연구동향서비스제공부는

동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 3항에 있어서,

상기 분석서비스모듈은

상기 정보추출모듈에서 추출된 정보와 공저자 또는 인용관계로 구성된 연구자 네트워크를 이용하여 연관주제를 추출하고 상기 연관 주제어들을 정렬하여 UI(User Interface)로 시각화하여 표시하는 연구자연관주제서비스제공부;

를 더 포함하도록 하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 6항에 있어서,

상기 연구자연관주제서비스제공부는

상기 연관주제가 중복되어 표시되는 경우는 동일 연관주제어의 빈도수에 따라 가중치를 부여하여 표시하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 3항에 있어서,

상기 분석서비스모듈은

상기 정보추출모듈에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 유사연구자서비스제공부;

를 더 포함하도록 구성하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 8항에 있어서,

상기 유사도는

상기 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 3항에 있어서,

상기 분석서비스모듈은

상기 정보추출모듈에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하고 해당 주제어별로 성과가 많은 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 연관연구자추천서비스제공부;

를 더 포함하도록 구성하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
제 5항, 제 7항, 제 9항 또는 제 10항에 있어서,

상기 연구자연구동향서비스제공부, 상기 연구자연관주제서비스제공부, 상기 유사연구자서비스제공부 또는 상기 연관연구자추천서비스제공부에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시되도록 하는 것을 특징으로 하는 연구자의 연구 정보 분석 장치.
연구자와 관련된 분석 정보-논문 제목, 저자, 소속기관, 출처정보, 연도, 초록, 주제어, 국가 정보-를 제공하는 연구자의 연구정보 분석시스템을 이용한 연구자의 연구 정보 분석 방법에 있어서,

(a)상기 연구정보 분석시스템에서 상기 연구자의 연구자정보, 주제정보, 그리고 연도정보를 추출하는 단계;

(b)연구자를 입력하는 단계;

(c)상기 연구자에 대한 연구자정보, 주제정보, 그리고 연도정보를 가중치, 유사도, 빈도에 따른 데이터로 분석하여 제공하는 단계; 및

(d)상기 제공된 분석 데이터를 UI(User Interface)로 시각화하여 표시하는 단계;

를 포함하여 이루어지는 연구자의 연구 정보 분석 방법.
제 12항에 있어서,

상기 (a)단계는

상기 연구자의 연구정보 분석시스템을 이용하여 연구자별 해당 논문의 원문에서 주제어를 추출하고 상기 논문의 메타정보에서 연도정보를 추출하여 온톨로지에 의해 데이터들을 트리플형태로 변환하여 저장하도록 하는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
제 12항에 있어서,

상기 (b)단계는

상기 연구자를 입력하면 SPARQL이라는 질의어를 통해, 상기 트리플들에서 연결관계들을 추론해서 관련 정보를 추출하는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
제 12항에 있어서,

상기 (c)단계는

상기 (b)단계에서 추출된 정보로 해당 연구자의 특정 연도별 주요 연구주제어를 모두 추출하는 단계;

해당 주제어의 연도별 추이를 표시하는 UI(User Interface)로 시각화하여 표시하는 단계; 및

동일 연도상에 중복 주제어가 존재하는 경우 동일 연도상의 빈도수에 따라 가중치를 부여하여 표시하는 단계;

를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
제 12항에 있어서,

상기 (c)단계는

상기 (b)단계에서 추출된 정보와 공저자 또는 인용관계로 구성된 연구자 네트워크를 이용하여 연관주제어를 추출하는 단계;

상기 연관 주제어를 정렬하여 UI(User Interface)로 시각화하여 표시하는 단계; 및

상기 연관주제가 중복되어 표시되는 경우는 동일 연관주제의 빈도수에 따라 가중치를 부여하여 표시하는 단계;

를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
제 12항에 있어서,

상기 (c)단계는

상기 (b)단계에서 추출된 정보로 상기 연구자의 전체 주제어 리스트를 기준으로 다른 연구자들의 전체 주제어와 비교하여 설정된 유사도 이상의 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 단계; 및

상기 연구자의 전체 주제어의 리스트의 건수를 백분율화하여 일치하는 주제어의 빈도수에 따라 해당 백분율을 합하여 산출하여 표시하는 단계;

를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
제 12항에 있어서,

상기 (c)단계는

상기 (b)단계에서 추출된 정보로 해당 연구자의 전체 논문에서 연구 빈도수가 높은 주제어를 다수 개 추출하는 단계; 및

해당 주제어별로 논문을 많이 제출한 연구자들의 리스트를 UI(User Interface)로 시각화하여 표시하는 단계;

를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.
제 15항, 제 16항, 제 17항 또는 제 18항에 있어서,

상기 연구자연구동향서비스제공부, 상기 연구자연관주제서비스제공부, 상기 유사연구자서비스제공부 또는 상기 연관연구자추천서비스제공부에서 제공되는 각각의 시각화된 UI는 온토프레임(OntoFrame) 연구자 페이지의 시멘틱 서비스 컴포넌트로 하나 이상 표시하는 단계;

를 더 포함하여 이루어지는 것을 특징으로 하는 연구자의 연구 정보 분석 방법.