[go: up one dir, main page]

KR20160058587A - 문서 요약을 위한 디스플레이 장치 및 방법 - Google Patents

문서 요약을 위한 디스플레이 장치 및 방법 Download PDF

Info

Publication number
KR20160058587A
KR20160058587A KR1020140160273A KR20140160273A KR20160058587A KR 20160058587 A KR20160058587 A KR 20160058587A KR 1020140160273 A KR1020140160273 A KR 1020140160273A KR 20140160273 A KR20140160273 A KR 20140160273A KR 20160058587 A KR20160058587 A KR 20160058587A
Authority
KR
South Korea
Prior art keywords
document
sentence
keyword
extracted
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1020140160273A
Other languages
English (en)
Inventor
박경수
조은경
류희섭
이동진
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020140160273A priority Critical patent/KR20160058587A/ko
Priority to US14/929,520 priority patent/US20160140221A1/en
Priority to EP15194788.4A priority patent/EP3021239A3/en
Priority to CN201510791284.5A priority patent/CN105608068A/zh
Publication of KR20160058587A publication Critical patent/KR20160058587A/ko
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

문서 요약을 위한 디스플레이 장치 및 방법이 개시된다. 본 발명에 따른 디스플레이 장치는, 컨텐츠 서버와 데이터 통신을 수행하여 메인 문서 및 메인 문서와 관련된 서브 문서 중 적어도 하나를 수신하는 통신부, 메인 문서로부터 노출 빈도가 높은 키워드를 추출하고, 수신된 서브 문서를 참조하여 추출된 키워드로부터 요약 문장 생성을 위한 핵심 키워드를 결정하는 문서 분석부 및 핵심 키워드에 기초하여 메인 문서의 각 문장별 신뢰도를 결정하고, 결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출하며, 추출된 문장의 구조 형태를 분석하여 문장을 구성하는 단어를 재구성하여 요약 문장을 생성하는 프로세서를 포함한다. 이에 따라, 디스플레이 장치는 정보성과 논리적 응집성이 확보된 요약 문서를 생성할 수 있다.

Description

문서 요약을 위한 디스플레이 장치 및 방법{Display apparatus and method for summarizing of document}
본 발명은 문서 요약을 위한 디스플레이 장치 및 방법에 관한 것으로서, 보다 상세하게는 텍스트 형태의 문서를 요약을 위한 디스플레이 장치 및 방법에 관한 것이다.
일반적으로, 텍스트 형태의 문서 요약 방식은 규칙 기반의 요약 방식, 통계적 요약 방식 및 규칙 기반과 통계적 방식이 혼합된 하이브리드 요약 방식이 있다.
규칙 기반의 요약 방식은 비교적 소수의 규칙을 반복적으로 적용하여 문서상의 문장을 파싱한다. 그러나, 이 같은 규칙 기반의 요약 방식은 모호성 처리에 한계가 있을 뿐만 아니라, 모호성 증가로 인하여 분석 복잡도가 증가하는 문제가 있다.
통계적 요약 방식은 요약하고자 하는 문서상에서 어휘 간의 연관 관계 및 구문 간의 결합 관계를 통계적으로 모델링하고 적용하는 방식이다. 이 같은 통계적요약 방식은 규칙 기반의 요약 방식에서 발생하는 모호성 문제를 해결할 수 있으나, 통계 정보 추출을 위한 학습 데이터의 부족으로 인하여 모호성 해소의 정확도가 저하될 수 있다. 뿐만 아니라, 이 같은 통계적 요약 방식은 방대한 통계 파라미터 공간의 탐색으로 인하여 문서의 구문 분석 수행 속도가 현저히 떨어지는 문제가 있다.
하이브리드 요약 방식은 규칙 기반의 요약 방식과 통계적 요약 방식을 혼합하여 규칙 기반의 요약 방식과 통계적 요약 방식에서 발생하는 단점을 보안하고자 하는 방식이다. 그러나, 이 같은 하이브리드 요약 방식은 단순히 문서를 축약하는 형태의 요약에 대해서만 수행된다.
따라서, 이 같은 종래의 문서 요약 방식은 문서상에서 핵심이 되는 핵심 정보와 작성자의 의도가 반영되는 부가적인 정보가 응집성 있게 반영되는 형태로 요약이 이루어지지 못하는 문제가 있다.
본 발명은 상술한 필요성에 따라 안출된 것으로, 본 발명의 목적은, 다중 문서를 고려하여 문서의 요약이 수행되도록 함을 목적으로 한다.
나아가, 본 발명은 담화 분석을 통해 정보성과 논리적 응집성이 확보된 요약 문서를 생성하도록 함을 목적으로 한다.
더 나아가, 본 발명은 문서상에서 객관적인 정보 및 주관적인 정보가 복합적으로 이루어진 요약 문서를 생성하도록 함을 목적으로 한다.
이상과 같은 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 디스플레이 장치는, 컨텐츠 서버와 데이터 통신을 수행하여 메인 문서 및 상기 메인 문서와 관련된 서브 문서 중 적어도 하나를 수신하는 통신부, 상기 메인 문서로부터 노출 빈도가 높은 키워드를 추출하고, 상기 수신된 서브 문서를 참조하여 상기 추출된 키워드로부터 요약 문장 생성을 위한 핵심 키워드를 결정하는 문서 분석부 및 상기 핵심 키워드에 기초하여 상기 메인 문서의 각 문장별 신뢰도를 결정하고, 상기 결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출하며, 상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 단어를 재구성하여 요약 문장을 생성하는 프로세서를 포함한다.
그리고, 상기 프로세서는, 상기 메인 문서의 각 문장별 상기 핵심 키워드의 분포도로부터 신뢰도 값을 산출하며, 산출된 신뢰도 값과 기설정된 임계값을 비교하여 상기 기설정된 임계값 이상의 신뢰도 값을 가지는 문장을 요약 문장 생성을 위한 문장으로 추출할 수 있다.
또한, 상기 프로세서는, 상기 추출된 문장이 복수 개이면, 담화 분석(Discourse Analysis)을 통해 상기 메인 문서상에서 핵심 주제가 되는 주제 단락을 획득하고, 상기 추출된 복수의 문장 중 상기 획득한 주제 단락 내에 포함된 문장을 요약 문장 생성을 위한 문장으로 추출할 수 있다.
그리고, 상기 프로세서는, 구문 분석(Syntax Analysis)을 통해 상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 복수의 단어 중 핵심 문장을 이루는 단어를 추출하고, 상기 추출된 단어에 기초하여 요약 문장을 생성할 수 있다.
또한, 상기 프로세서는, 상기 추출된 단어들 간의 공지시 관계 여부를 분석하여 동일한 의미를 가지는 적어도 하나의 단어를 제외한 나머지 단어에 기초하여 요약 문장을 생성할 수 있다.
그리고, 상기 요약 문장을 디스플레이하는 디스플레이부를 더 포함하며, 상기 프로세서는, 상기 획득한 주제 단락 내에 포함된 복수의 문장 중 기등록된 주관적 의미 요소와 관련된 키워드를 포함하는 적어도 하나의 문장과 상기 요약 문장을 이용하여 요약 문서를 생성하고, 상기 생성된 요약 문서를 상기 디스플레이부를 통해 디스플레이하며, 상기 주관적 의미 요소는, 상기 메인 문서에 대한 사용자의 평가, 감성 및 의견 중 적어도 하나와 관련된 요소일 수 있다.
또한, 상기 문서 분석부는 상기 메인 문서가 개체 중심 문서이면, 상기 메인 문서상에서 추출된 키워드를 핵심 키워드로 결정하고, 상기 메인 문서가 사건 관계 중심 문서이면, 상기 서브 문서를 참조하여 핵심 키워드를 결정할 수 있다.
그리고, 상기 문서 분석부는, 상기 메인 문서가 사건 관계 중심 문서이면, 복수의 서브 문서별 문서 제목을 분석하여 상기 추출된 키워드를 포함하는 문서 제목을 갖는 서브 문서를 참조하여 핵심 키워드를 결정할 수 있다.
한편, 본 발명의 또다른 실시 예에 따르면, 디스플레이 장치에서 문서 요약을 위한 방법은, 메인 문서로부터 노출 빈도가 높은 키워드를 추출하는 단계, 적어도 하나의 서브 문서를 참조하여 상기 추출된 키워드로부터 요약 문장 생성을 위한 핵심 키워드를 결정하는 단계, 상기 핵심 키워드에 기초하여 상기 메인 문서의 각 문장별 신뢰도를 결정하고, 상기 결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출하는 단계 및 상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 단어를 재구성하여 요약 문장을 생성하는 단계를 포함한다.
그리고, 상기 추출하는 단계는, 상기 메인 문서의 각 문장별 상기 핵심 키워드의 분포도로부터 신뢰도 값을 산출하며, 산출된 신뢰도 값과 기설정된 임계값을 비교하여 상기 기설정된 임계값 이상의 신뢰도 값을 가지는 문장을 요약 문장 생성을 위한 문장으로 추출할 수 있다.
또한, 상기 요약 문장 생성을 위한 문장을 추출하는 단계는, 상기 추출된 문장이 복수 개이면, 담화 분석(Discourse Analysis)을 통해 상기 메인 문서상에서 핵심 주제가 되는 주제 단락을 획득하고, 상기 추출된 복수의 문장 중 상기 획득한 주제 단락 내에 포함된 문장을 요약 문장 생성을 위한 문장으로 추출할 수 있다.
그리고, 상기 요약 문장을 생성하는 단계는, 구문 분석(Syntax Analysis)을 통해 상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 복수의 단어 중 핵심 문장을 이루는 단어를 추출하고, 상기 추출된 단어에 기초하여 요약 문장을 생성할 수 있다.
또한, 상기 요약 문장을 생성하는 단계는, 상기 추출된 단어들 간의 공지시 관계 여부를 분석하여 동일한 의미를 가지는 적어도 하나의 단어를 제외한 나머지 단어에 기초하여 요약 문장을 생성할 수 있다.
그리고, 상기 요약 문서를 생성하는 단계는, 상기 획득한 주제 단락 내에 포함된 복수의 문장 중 기등록된 주관적 의미 요소와 관련된 키워드를 포함하는 적어도 하나의 문장과 상기 요약 문장을 이용하여 요약 문서를 생성하는 단계를 더 포함하며, 상기 주관적 의미 요소는, 상기 메인 문서에 대한 사용자의 평가, 감성 및 의견 중 적어도 하나와 관련된 요소일 수 있다.
또한, 상기 추출된 키워드를 분석하여 문서 특성을 판단하는 단계를 더 포함하며, 상기 핵심 키워드를 결정하는 단계는, 상기 메인 문서가 개체 중심 문서인 것으로 판단되면, 상기 메인 문서상에서 추출된 키워드를 핵심 키워드로 결정하고, 상기 메인 문서가 사건 관계 중심 문서인 것으로 판단되면, 상기 적어도 하나의 서브 문서를 참조하여 핵심 키워드를 결정할 수 있다.
그리고, 상기 핵심 키워드를 결정하는 단계는, 상기 메인 문서가 사건 관계 중심 문서인 것으로 판단되면, 복수의 서브 문서별 문서 제목을 분석하여 상기 추출된 키워드를 포함하는 문서 제목을 갖는 서브 문서를 참조하여 핵심 키워드를 결정할 수 있다.
한편, 본 발명의 또다른 실시 예에 따르면, 디스플레이 장치와 결합되어 하기의 단계를 실행시키기 위하여 기록 매체에 저장된 컴퓨터 프로그램은 메인 문서로부터 노출 빈도가 높은 키워드를 추출하는 단계, 적어도 하나의 서브 문서를 참조하여 상기 추출된 키워드로부터 요약 문장 생성을 위한 핵심 키워드를 결정하는 단계, 상기 핵심 키워드에 기초하여 상기 메인 문서의 각 문장별 신뢰도를 결정하고, 상기 결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출하는 단계 및 상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 단어를 재구성하여 요약 문장을 생성하는 단계를 포함하며 문서 요약을 제공한다.
이상과 같이 본 발명의 다양한 실시 예에 따르면, 디스플레이 장치는 다중 문서를 고려하여 문서의 요약이 수행함으로써, 정보성과 논리적 응집성이 확보된 요약 문서를 생성할 수 있다. 나아가, 본 발명에 따른 디스플레이 장치는 문서상에서 객관적인 정보 및 주관적인 정보가 복합적으로 이루어진 요약 문서를 생성함으로써, 요약 문서를 통해 작성자의 의도하고자 하는 의미적 요소까지 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 디스플레이 장치의 블록도,
도 2는 본 발명의 일 실시예에 따른 메인 문서의 예시도,
도 3은 본 발명의 일 실시예에 따른 요약 문서를 생성하기 위한 요약 문장을 생성하는 예시도,
도 4는 본 발명의 일 실시예에 따른 주관적 의미가 포함된 요약 문서를 생성하는 예시도,
도 5는 본 발명의 일 실시예에 따른 디스플레이 장치에서 상이한 요약 문서 생성을 위한 메뉴 UI를 제공하는 예시도,
도 6은 본 발명의 일 실시예에 따른 디스플레이 장치에서 제1 요약 레벨에 따라 생성된 핵심 요약 문서를 나타내는 예시도,
도 7은 본 발명의 일 실시예에 따른 디스플레이 장치에서 제2 요약 레벨에 따라 생성된 일반 요약 문서를 나타내는 예시도,
도 8은 본 발명의 일 실시예에 따른 디스플레이 장치에서 제3 요약 레벨에 따라 생성된 확장 요약 문서를 나타내는 예시도,
도 9는 본 발명의 일 실시예에 따른 디스플레이 장치에서 요약 문서를 생성하는 방법의 흐름도,
도 10은 본 발명에 따른 디스플레이 장치에서 요약 문서 생성을 위한 핵심 문장을 추출하는 예시도이다.
이하 첨부된 도면들을 참조하여 본 발명의 일시 예를 보다 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 디스플레이 장치의 블록도이다.
도 1에 도시된 바와 같이, 디스플레이 장치는 예를 들어, 테블릿 PC, eBook 기기 등 텍스트 컨텐츠를 제공하는 모든 단말 장치가 될 수 있다. 이 같은 디스플레이 장치는 통신부(110), 디스플레이부(120), 문서 분석부(130), 프로세서(140) 및 저장부(150)를 포함한다.
통신부(110)는 컨텐츠를 제공하는 컨텐츠 서버(미도시)와 데이터 통신을 수행하여 메인 문서 관련 컨텐츠 및 해당 메인 문서와 관련된 서브 문서 관련 컨텐츠 중 적어도 하나를 수신한다. 이 같은 통신부(110)는 근거리 무선 통신 모듈(미도시), 무선 통신 모듈(미도시) 등과 같은 다양한 통신 모듈을 포함할 수 있다. 여기서, 근거리 무선 통신 모듈(미도시)은 근거리에 위치한 대화형 서버(200) 및 컨텐츠를 제공하는 외부 서버(미도시)와 무선 통신을 수행하는 통신 모듈로써, 예를 들어, 블루투스, 지그비 등이 될 수 있다. 무선 통신 모듈(미도시)은 와이파이(WiFi), IEEE 등과 같은 무선 통신 프로토콜에 따라 외부 네트워크에 연결되어 통신을 수행하는 모듈이다. 이 밖에 무선 통신 모듈은 3G(3rd Generation), 3GPP(3rd Generation Partnership Project), LTE(Long Term Evoloution) 등과 같은 다양한 이동 통신 규격에 따라 이동 통신 망에 접속하여 통신을 수행하는 이동 통신 모듈을 더 포함할 수도 있다.
디스플레이부(120)는 사용자 요청에 따라, 컨텐츠 서버(미도시)로부터 수신된 웹 문서 혹은 저장부(140)에 기저장된 문서 관련 컨텐츠를 디스플레이한다. 여기서, 웹 문서 혹은 기저장된 문서는 텍스트 형태의 문서가 될 수 있다. 이하에서는 사용자의 요청에 따라, 디스플레이부(120)를 통해 화면상에 디스플레이되는 문서 관련 컨텐츠를 메인 문서로 명명하기로 한다.프로세서(140)는 저장부(150)에 기저장된 각종 프로그램을 이용하여 디스플레이 장치의 전반적인 동작을 제어한다. 특히, 프로세서(140)는 사용자 명령에 따라, 디스플레이부(120)를 통해 디스플레이된 메인 문서에 대한 문서 요약을 수행한다. 구체적으로, 프로세서(140)는 디스플레이된 메인 문서에 대한 요약 명령에 따라, 저장부(150)에 기저장된 문석 분석 관련 프로그램을 램(RAM)에 복사하고, 램에 복사된 문서 분석 관련 프로그램을 이용하여 메인 문서에 대한 문서 요약을 수행할 수 있다.
한편, 프로세서는 일반적으로 장치의 제어를 담당하는 구성으로, 중앙처리장치, 마이크로 프로세서, 제어부 등과 혼용될 수 있으며, 장치의 전반적인 동작을 제어할 수 있도록 하는 것으로 문서 분석부(130), 통신부(110) 등 다른 기능부와 단일칩 시스템 (System-on-a-chip 또는 System on chip, SOC, SoC)로 구현될 수 있다.
문서 분석부(130)는 램(미도시)에 복사된 문서 분석 관련 프로그램을 이용하여 화면상에 디스플레이된 메인 문서로부터 노출 빈도가 높은 복수의 키워드를 추출한다. 또한, 문서 분석부(130)는 통신부(110)를 통해 수신된 적어도 하나의 서브 문서를 참조하여 메인 문서로부터 기추출된 복수의 키워드로부터 요약 문서를 생성하기 위한 핵심 키워드를 결정한다. 여기서, 서브 문서는 메인 문서상의 이슈와 관련된 이슈에 대한 내용을 포함하는 문서가 될 수 있다.
이 같은 핵심 키워드가 결정되면, 프로세서(140)는 문서 분석부(130)를 통해 추출된 핵심 키워드에 기초하여 메인 문서의 각 문장별 신뢰도를 결정한다. 이후, 프로세서(140)는 기결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출하고, 추출된 문장의 구조 형태를 분석하여 해당 문장을 구성하는 단어를 재구성하여 요약 문장을 생성한다.
구체적으로, 문서 분석부(130)는 메인 문서상의 각 문장별 단어를 추출하고, 추출된 단어 중 기설정된 개수 이상으로 노출된 단어를 노출 빈도가 높은 키워드로 추출한다. 이 같은 키워드가 추출되면, 프로세서(140)는 추출된 키워드를 분석하여 문서 특성을 판단하여 메인 문서상에서 요약 문서를 생성할지 아니면, 적어도 하나의 서브 문서를 참조하여 요약 문서를 생성할지 여부를 판단한다. 실시예에 따라, 프로세서(140)는 추출된 키워드를 분석하여 메인 문서가 인물, 장소, 작품명과 같은 개체 중심 관련 문서인지 아니면, 사건 관계 중심 관련 문서인지 여부를 판단하여 서브 문서를 참조할지를 결정할 수 있다.
메인 문서가 개체 중심 관련 문서인 것으로 판단되면, 문서 분석부(130)는 메인 문서상에서 노출 빈도가 높은 것으로 추출된 복수의 키워드를 핵심 키워드로 결정한다.
한편, 메인 문서가 사건 관계 중심 관련 문서인 것으로 판단되면, 문서 분석부(130)는 컨텐츠 서버(미도시)에서 제공하는 복수의 서브 문서의 내용을 분석하여 기추출된 복수의 키워드 중 적어도 하나의 키워드를 포함하는 서브 문서를 메인 문서와 관련된 문서로 결정할 수 있다. 그러나, 본 발명은 이에 한정되지 않으며, 문서 분석부(130)는 컨텐츠 서버(미도시)에서 제공하는 복수의 서브 문서의 문서 제목을 분석하여 기추출된 복수의 키워드 중 적어도 하나의 키워드를 포함하는 문서 제목을 갖는 서브 문서를 메인 문서와 관련된 문서로 결정할 수 있다.
메인 문서와 관련된 서브 문서가 결정되면, 문서 분석부(130)는 메인 문서와 관련된 문서로 결정된 서브 문서에 기초하여 기추출된 복수의 키워드로부터 핵심 키워드를 결정할 수 있다. 실시예에 따라, 문서 분석부(130)는 메인 문서와 관련된 서브 문서상의 각 문장별 단어를 추출하고, 추출된 단어 중 기설정된 개수 이상으로 노출된 단어를 노출 빈도가 높은 키워드로 추출한다. 이 같은 키워드가 추출되면, 문서 분석부(130)는 메인 문서로부터 추출된 키워드와 서브 문서로부터 추출된 키워드 중 공통 키워드를 메인 문서의 핵심 키워드로 결정할 수 있다.
이 같은 실시예를 통해 핵심 키워드가 결정되면, 프로세서(140)는 메인 문서상의 각 문장 중 적어도 하나의 핵심 키워드를 포함하는 문장을 추출한다. 이후, 프로세서(140)는 추출된 문장별 핵심 키워드의 분포도로부터 신뢰도 값을 산출한다. 여기서, 신뢰도 값은 각 문장별 핵심 키워드를 포함하는 개수에 비례하여 결정되는 값이 될 수 있다. 따라서, 프로세서(140)는 문장별 산출된 신뢰도 값과 기설정된 임계값을 비교하여 기설정된 임계값 이상의 신뢰도 값을 가지는 문장을 요약 문서 생성을 위한 핵심 문장으로 추출한다.
그러나, 본 발명은 이에 한정되지 않으며, 프로세서(140)는 핵심 키워드를 포함하는 문장이 추출되면, 추출된 문장 내에 포함되는 핵심 키워드의 개수가 기설정된 개수 이상인 문장을 요약 문서 생성을 위한 핵심 문장으로 추출할 수 있다.
이 같은 다양한 실시예를 통해 요약 문서 생성을 위한 복수의 핵심 문장이 추출되면, 프로세서(140)는 담화 분석(Discourse Analysis)을 통해 메인 문서의 구조를 분석하여 일관성(Coherence), 응집성(Cohesin), 의도성, 용이성, 정보성, 상황성, 상호 텍스트성 등의 문서의 각 단락별 특성을 파악하고, 그 결과로부터 메인 문서에서 핵심 주제가 되는 주제 단락을 획득한다. 구체적으로, 프로세서(140)는 담화 분석을 통해 메인 문서상에서 문장과 문장 간의 관계와 문형을 고려하여 핵심 주제가 되는 주제 단락을 획득할 수 있다. 일반적으로, 문서의 문단이 연역적 구성 방식에 의해 이루어지는 타입의 문서인 경우, 주제 단락은 서론에 해당하는 단락이 될 수 있으며, 문서의 문단이 귀납적 구성 방식에 의해 이루어지는 타입의 문서인 경우, 주제 단락은 결론에 해당하는 단락이 될 수 있다. 따라서, 프로세서(140)는 이 같은 담화 분석을 통해 메인 문서에 대한 구성 방식을 분석하고, 그 구성 방식에 기초하여 주제 단락을 획득할 수 있다. 이 같은 분석을 통해 메인 문서로부터 주제 단락이 결정되면, 프로세서(140)는 요약 문서 생성을 위한 핵심 문장 중 핵심 주제가 되는 주제 단락 내에 포함하는 핵심 문장의 구조 형태를 분석하여 핵심 문장 내 단어를 재구성하여 요약 문장을 생성할 수 있다.
일 실시예에 따라, 프로세서(140)는 구문 분석(Syntax Analysis)을 통해 핵심 문장으로 추출된 문장을 요약 문장으로 생성할 수 있다.
구체적으로, 프로세서(140)는 요약 문서 생성을 위한 핵심 문장이 결정되면, 구문 분석을 통해 핵심 문장의 구조 형태를 분석하여 핵심 문장을 이루는 기본 단위의 단어를 재구성하여 요약 문장을 생성할 수 있다.
또다른 실시예에 따라, 프로세서(140)는 요약 문서 생성을 위한 핵심 문장이 결정되면, 구문 분석을 통해 핵심 문장의 구조 형태를 분석하여 핵심 문장을 이루는 기본 단위의 단어를 추출한다. 이후, 프로세서(140)는 추출된 단어들 간의 공지시 관계 여부를 분석하여 동일한 의미를 가지는 적어도 하나의 단어를 제외한 나머지 단어에 기초하여 요약 문장을 생성할 수 있다.
예를 들어, 메인 문서로부터 “Rockwell International Corp.’s Tulsa unit said it signed a tentative agreement extending its contract with Boeing Co. to provide structural parts for Boeing’s 747 jetliners.”라는 핵심 문장이 추출될 수 있다.
이 같은 핵심 문장이 추출되면, 프로세서(140)는 CFG(context Free Grammar), DG(Dependency Grammar), PSG(Probabilistic Phrase Structure Grammar), HPSG(Head Driven Phrase Structure Grammar), LFG(Lexical Functional Grammar) 등의 전산 언어 문법 알고리즘을 이용하여 기추출된 핵심 문장의 텍스트를 구문 분석 트리로 구조화한다.
“Rockwell International Corp.’s Tulsa unit said it signed a tentative agreement extending its contract with Boeing Co. to provide structural parts for Boeing’s 747 jetliners.”라는 핵심 문장은 아래와 같은 구문 분석 트리로 구조화될 수 있다.
(TOP
(S
(NP (NNP Rockwell_NNP) (NNP International_NNP) (NNP Corp._NNP) (. 's_POS) (NNP Tulsa_NNP) (NNP unit_NN))
(VP (VBD said_VBD)
(S
(NP (PRP it_PRP))
(VP (VB signed_VBD)
(NP (DT a_DT) (NN tentative_JJ) (NN agreement_NN)
(NN extending_VBG))
(PP (IN its_PRP$) (NP (NP (NN contract_NN))
(PP (IN with_IN)
(NP
(NP (NNP Boeing_NNP) (NNP Co._NNP)
(VP to_TO) (NN provide_VB) (NN structural_JJ) (NNS parts_NNS))
(PP (IN for_IN)
(NP (NNP Boeing_NNP) (NNPS 's_POS) (NNP 747_CD) (NNS jetliners_NNS))
)
)
)
)
)
)
)
)
(. ._.)
)
)
이후, 프로세서(140)는 기추출된 핵심 문장으로부터 구조화된 구문 분석 트리에서 상위 NP, VP 및 VP에 해당하는 핵심어(Head Word) 노드를 제외한 나머지 노드를 제거한다. 즉, 프로세서(140)는 구조화된 구문 분석 트리에서 상위 NP, VP 및 VP 노드에 해당하는 핵심어(Head Word) 노드를 남기고, 상위 NP, VP 및 VP 노드 아래에 위치한 하위 NP, VP, PP 및 VBG 노드를 제거한다. 이 같은 방식을 통해 아래와 같은 핵심어 노드만 남겨진 구문 분석 트리가 생성될 수 있다.
(TOP
(S
(NP (NNP Rockwell_NNP) (NNP International_NNP) (NNP Corp._NNP) (. 's_POS) (NNP Tulsa_NNP) (NNP unit_NN))
(VP (VBD said_VBD)
(S
(NP (PRP it_PRP))
(VP (VB signed_VBD)
(NP (DT a_DT) (NN tentative_JJ) (NN agreement_NN)
(PP (IN with_IN)
(NP
(NP (NNP Boeing_NNP) (NNP Co._NNP)
)
)
)
)
)
)
)
(. ._.)
)
)
이 같은 구문 분석 트리를 통해 “Rockewll International Corp’s Tusa unit”, “said”, “it”, “signed”, “a tentative agreement” 및 “with Boeign Co.”라는 핵심어 노드가 결정될 수 있다. 따라서, 프로세서(140)는 핵심어 노드에 해당하는 단어를 이용하여 기추출된 핵심 문장에 대한 요약 문장을 생성할 수 있다.
한편, 프로세서(140)는 전술한 예를 통해 요약 문장과 관련된 핵심어 노드가 결정되면, 프로세서(140)는 담화 분석 기법에 의한 공지시 규칙을 이용하여 대명사와 개체명을 일치시킨다. 담화 분석 기법에 의한 공지시 규칙은 선험적, 경험적 규칙을 활용하여 학습된 규칙으로써, 이 같은 공지시 규칙을 통해 프로세서(140)는 “it”이라는 대명사를 “Rockewll International Corp’s Tusa unit”이라는 개체명과 일치시킬 수 있다. 이 같은 공지시 관계 일치를 통해, “it”이라는 대명사는 “Rockewll International Corp’s Tusa unit”이라는 개체명으로 전환될 수 있다. 공지시 관계 일치 후, 프로세서(140)는 핵심어 노드로부터 반복되는 잉여 개체 노드인 “Rockewll International Corp’s Tusa unit”와 잉여 용언 노드인 “said”를 제거하고, 나머지 핵심어 노드에 기초하여 핵심 문장에 대한 요약 문장을 생성할 수 있다.
즉, “Rockwell International Corp.’s Tulsa unit said it signed a tentative agreement extending its contract with Boeing Co. to provide structural parts for Boeing’s 747 jetliners.”라는 핵심 문장은 “Rockwell International Corp.’s Tulsa unit signed a tentative agreement with Boeing Co.”라는 요약 문장으로 생성될 수 있다. 이 같은 요약 문장이 생성되면, 프로세서(140)는 생성된 요약 문장을 화면상에 디스플레이하도록 디스플레이부(120)를 제어한다. 이 같은 제어 명령에 따라, 디스플레이부(120)는 핵심 문장과 관련하여 생성된 요약 문장을 화면상에 디스플레이할 수 있다.
한편, 본 발명의 추가적인 양상에 따라, 프로세서(140)는 메인 문서상에서 기획득한 주제 단락 내에 포함된 복수의 문장 중 기등록된 주관적 의미 요소와 관련된 키워드를 포함하는 적어도 하나의 문장과 기획득한 요약 문장을 이용하여 요약 문서를 생성하고, 생성된 요약 문서를 디스플레이부(120)를 통해 화면상에 디스플레이할 수 있다. 여기서, 주관적 의미 요소는 메인 문서를 작성한 작성자의 의도를 나타내기 위한 요소로써, 이 같은 주관적 의미 요소는 작성자의 평가, 감성, 의견과 관련된 표현을 나타내는 단어를 포함할 수 있다.
따라서, 프로세서(140)는 저장부(150)에 기저장된 주관적 의미 요소로 정의된 단어를 참조하여 메인 문서상에서 기획득한 주제 단락 내에서 작성자의 평가, 감성, 의견과 관련된 표현을 나타내는 키워드를 포함하는 문장을 획득할 수 있다. 이 같은 문장이 획득되면, 프로세서(140)는 기생성된 요약 문장과 작성자의 의도를 나타내는 문장을 이용하여 요약 문서를 생성한다. 이 같이, 본 발명에 따른 디스플레이 장치는 메인 문서로부터 객관적인 사실 관계 뿐만 아니라, 작성자의 작성 의도가 고려된 의미적 경향을 제시하는 요약 문서를 생성할 수 있다.
한편, 본 발명의 추가적인 양상에 따라, 프로세서(140)는 사용자에 의해 선택된된 요약 레벨에 따라 요약 문서를 생성할 수 있다.
구체적으로, 저장부(150)는 요약 문서 생성과 관련하여 기설정된 요약 레벨 정보를 저장할 수 있다. 여기서, 요약 레벨 정보는 핵심 요약 문서를 생성하기 위한 제1 요약 레벨, 일반 요약 문서를 생성하기 위한 제2 요약 레벨 및 확장 요약 문서를 생성하기 위한 제3 요약 레벨을 포함할 수 있다.
실시예에 따라, 제1 요약 레벨에 해당하는 핵심 요약 문서는 메인 문서상의 각 문장 중 적어도 하나의 핵심 키워드를 포함하는 문장을 추출하고, 추출된 문장별 포함된 핵심 키워드의 개수에 기초하여 가장 높은 신뢰도 값을 가지는 문장으로부터 생성되는 문서가 될 수 있다. 그리고, 제2 요약 레벨에 해당하는 일반 요약 문서는 메인 문서의 구조 분석을 통해 각 단락별 특성을 파악하여 핵심 주제가 되는 단락에 포함된 문장에 기초하여 생성된 문서가 될 수 있다. 그리고, 제3 요약 레벨에 해당하는 확장 요약 문서는 제2 요약 레벨과 관련하여 생성된 일반 요약 문서와 작성자의 작성 의도가 고려된 문장에 기초하여 생성된 문서가 될 수 있다.
따라서, 프로세서(140)는 사용자 명령에 따라, 제1 내지 제3 요약 레벨 중 하나가 선택되면, 메인 문서상에서 사용자에 의해 선택된 요약 레벨에 대응되는 요약 문서를 생성할 수 있다
이하에서는, 전술한 디스플레이 장치에서 요약 문서를 생성하는 동작에 대해서 보다 구체적으로 설명하도록 한다.
도 2는 본 발명의 일 실시예에 따른 메인 문서의 예시도이며, 도 3은 본 발명의 일 실시예에 따른 요약 문서를 생성하기 위한 요약 문장을 생성하는 예시도다.
도 2에 도시된 바와 같이, 디스플레이 장치의 화면상에는 컨텐츠 서버(미도시)로부터 수신한 텍스트 형태의 메인 문서(210) 관련 컨텐츠가 화면상에 디스플레이될 수 있다. 이 같은 메인 문서(210)가 디스플레이된 상태에서 사용자의 요약 문서 생성 명령이 입력되면, 문서 분석부(130)는 텍스트 형태의 메인 문서(210)를 분석하여 메인 문서(210) 상의 각 문장별 단어를 추출하고, 추출된 단어 중 개수 이상으로 노출된 단어를 노출 빈도가 높은 키워드로 추출한다. 도시된 바와 같이, 이 같은 메인 문서(210)로부터 "○○○", "△△△", "결혼", "aaa", "영화", "AAA 스포츠" 및 "마케팅"이라는 키워드가 추출될 수 있다.
이 같은 복수의 키워드가 추출되면, 프로세서(140)는 추출된 키워드를 분석하여 문서 특성을 판단한다. 구체적으로, 도시된 바와 같이, 메인 문서(210)로부터 추출된 "○○○", "△△△", "결혼", "aaa", "영화", "AAA 스포츠" 및 "마케팅"이라는 키워드는 인물, 장소, 작품명과 같은 개체 중심 관련 문서에 대한 키워드로 부적합할 수 있다. 따라서, 프로세서(140)는 메인 문서에 대한 요약 문장을 생성하기 위해서 서브 문서를 참조할 것으로 결정할 수 있다. 이 같은 결정에 따라, 문서 분석부(130)는 컨텐츠 서버(미도시)에서 제공하는 복수의 서브 문서의 내용 혹은 문서 제목을 분석하여 기추출된 복수의 키워드 중 적어도 하나의 키워드를 포함하는 서브 문서를 메인 문서와 관련된 문서로 결정할 수 있다.
메인 문서와 관련된 서브 문서가 결정되면, 문서 분석부(130)는 결정된 서브 문서상의 각 문장별 단어를 추출하고, 추출된 단어 중 기설정된 개수 이상으로 노출된 단어를 노출 빈도가 높은 키워드로 추출한다. 이 같은 키워드가 추출되면, 문서 분석부(130)는 메인 문서로부터 추출된 키워드와 서브 문서로부터 추출된 키워드 중 공통 키워드를 메인 문서의 핵심 키워드로 결정할 수 있다.
전술한 예와 같이, 메인 문서(210)로부터 "○○○", △△△", "결혼", "aaa", "영화", "AAA 스포츠" 및 "마케팅"이라는 키워드가 추출될 수 있으며, 이 같은 키워드 중 "○○○", △△△", "결혼", "AAA 스포츠"에 대한 키워드가 서브 문서와의 공통 키워드가 될 수 있다. 따라서, 문서 분석부(130)는 서브 문서와의 공통 키워드인 "○○○", △△△", "결혼", "AAA 스포츠"를 핵심 키워드로 결정할 수 있다.
이 같은 복수의 핵심 키워드가 결정되면, 프로세서(140)는 메인 문서상의 각 문장으로부터 적어도 하나의 핵심 키워드를 포함하는 문장을 추출한다. 이후, 프로세서(140)는 추출된 문장별 핵심 키워드의 분포도로부터 신뢰도 값을 산출한 후, 산출된 신뢰도 값과 기설정된 임계값을 비교하여 기설정된 임계값 이상의 신뢰도 값을 가지는 문장을 요약 문서 생성을 위한 핵심 문장으로 추출한다.
도 3의 (a)에 도시된 바와 같이, 예를 들어, 제1 단락의 첫 번째 문장과, 제3 단락의 첫 번째 문장 그리고, 제3 단락의 두 번째 문장이 핵심 문장(310)으로 추출될 수 있다. 이 같이, 메인 문서(210)로부터 복수의 핵심 문장(310)이 추출되면, 프로세서(140)는 담화 분석을 통해 메인 문서(210)상에서 핵심 주제가 되는 주제 단락을 획득할 수 있다. 구체적으로, 프로세서(140)는 담화 분석(Discourse Analysis)을 통해 메인 문서의 구조를 분석하여 메인 문서를 구성하는 제1 내지 제3 단락의 관계를 파악하여 핵심 주제가 되는 주제 단락을 획득할 수 있다. 즉, 프로세서(140)는 각 단락 간의 연결 관계를 통해 특정 단락을 주제 단락으로 획득할 수 있다. 이 같은 담화 분석을 통해 제3 단락(220)이 주제 단락으로 획득되면, 프로세서(140)는 기추출된 핵심 문장 중 주제 단락에 포함되는 핵심 문장을 구문 분석을 통해 요약 문장으로 생성한다.
따라서, 프로세서(140)는 핵심 문장(310)으로 추출된 제1 단락의 첫 번째 문장과, 제3 단락의 첫 번째 문장 그리고, 제3 단락의 두 번째 문장 중 제3 단락의 첫 번째 문장과 두 번째 문장을 요약 문서 생성을 위한 핵심 문장으로 결정한다. 이후, 프로세서(140)는 구문 분석을 통해 요약 문서 생성을 위한 핵심 문장으로 결정된 제3 단락의 첫 번째 문장과 두 번째 문장을 요약한다. 따라서, 제3 단락의 첫 번째 문장과 두 번째 문장 각각은 도 3의 (b)에 도시된 바와 같은 형태의 요약 문장(320)으로 생성될 수 있다.
예를 들어, 제3 단락의 첫 번째 문장은 "한편, AAA 스포츠는 △△△과 결혼한 ○○○와 중국 시장 공략을 염두에 두고 모델로 발탁하였다."이며, 제3 단락의 두 번째 문장은 "AAA 스포츠는 △△△과 결혼한 ○○○로 인해 중국 내 연매출 1500억원 달성을 목표로 하고 있다."가 될 수 있다. 따라서, 프로세서(140)는 제3 단락의 첫 번째 문장 및 두 번째 문장에 대한 구문 분석을 통해 핵심 문장을 이루는 기본 단위의 단어를 재구성한다. 따라서, 프로세서(140)는 "한편, AAA 스포츠는 △△△과 결혼한 ○○○와 중국 시장 공략을 염두에 두고 모델로 발탁하였다."라는 제3 단락의 첫 번째 문장을 "AAA 스포츠는 ○○○를 모델로 발탁하였다"라는 요약 문장과, "AAA 스포츠는 △△△과 결혼한 ○○○로 인해 중국 내 연매출 1500억원 달성을 목표로 하고 있다."라는 제3 단락의 두 번째 문장을 "AAA 스포츠는 중국 내 연매출 1500억원 달성을 목표로 하고 있다."라는 요약 문장을 생성할 수 있다.
한편, 프로세서(140)는 메인 문서상에서 기획득한 주제 단락 내에 포함된 복수의 문장 중 기등록된 주관적 의미 요소와 관련된 키워드를 포함하는 적어도 하나의 문장과 기획득한 요약 문장을 이용하여 요약 문서를 생성할 수 있다.
도 4는 본 발명의 일 실시예에 따른 주관적 의미가 포함된 요약 문서를 생성하는 예시도이다.
도 3의 (b)에서 설명한 바와 같이, 프로세서(140)는 구문 분석을 통해 요약 문서 생성을 위한 핵심 문장으로 결정된 제3 단락의 첫 번째 문장과 두 번째 문장을 요약하여 요약 문장(320)을 생성한다. 이 같은 요약 문장(320)은 객관적 의미가 포함된 요약 문서가 될 수 있다. 이 같은 객관적 의미가 포함된 요약 문장(320)이 생성되면, 프로세서(140)는 메인 문서(210)상에서 기획득한 주제 단락 내에 포함된 복수의 문장 중 기등록된 주관적 의미 요소와 관련된 키워드를 포함하는 문장을 추출한다.
전술한 바와 같이, 주관적 의미 요소는 메인 문서를 작성한 작성자의 의도를 나타내기 위한 요소로써, 이 같은 주관적 의미 요소는 작성자의 평가, 감성, 의견과 관련된 표현을 나타내는 단어를 포함할 수 있다. 따라서, 프로세서(140)는 저장부(150)에 기저장된 주관적 의미 요소로 정의된 단어를 참조하여 메인 문서상에서 기획득한 주제 단락 내에서 작성자의 평가, 감성, 의견과 관련된 표현을 나타내는 키워드를 포함하는 문장을 획득할 수 있다.
예를 들어, 메인 문서(210)상에서 주제 단락으로 결정된 제3 단락의 문장 중 마지막 문장이 "기대된다"라는 단어를 포함하고 있으며, 이 같은 단어가 주관적 의미 요소로 분류된 경우, 프로세서(140)는 주제 단락으로 결정된 제3 단락의 마지막 문장을 메인 문서(210)를 작성한 작성자의 의도를 나타내기 위한 주관적 의미가 포함된 문장으로 결정한다. 따라서, 프로세서(140)는 요약 문서 생성을 위한 핵심 문장으로 결정된 제3 단락의 첫 번째 문장과 두 번째 문장으로 기생성된 요약 문장(411)과 제3 단락의 마지막 문장(413)을 이용하여 메인 문서(210)에 대한 요약 문서(410)를 생성할 수 있다.
이하에서는, 본 발명에 따른 디스플레이 장치에서 사용자 명령에 따라 상이한 요약 문서를 생성하는 동작에 대해서 상세히 설명하도록 한다.
도 5는 본 발명의 일 실시예에 따른 디스플레이 장치에서 상이한 요약 문서 생성을 위한 메뉴 UI를 제공하는 예시도이며, 도 6은 본 발명의 일 실시예에 따른 디스플레이 장치에서 제1 요약 레벨에 따라 생성된 핵심 요약 문서를 나타내는 예시도이며, 도 7은 본 발명의 일 실시예에 따른 디스플레이 장치에서 제2 요약 레벨에 따라 생성된 일반 요약 문서를 나타내는 예시도이며, 도 8은 본 발명의 일 실시예에 따른 디스플레이 장치에서 제3 요약 레벨에 따라 생성된 확장 요약 문서를 나타내는 예시도이다.
도 5에 도시된 바와 같이, 프로세서(140)는 요약 문서 생성을 위한 설정 명령이 입력되면, 저장부(150)에 기저장된 요약 레벨 정보에 기초하여 제1 내지 제3 요약 레벨 중 하나에 대응되는 요약 문서를 생성하기 위한 메뉴 UI를 디스플이하도록 디스플레이부(120)를 제어한다. 이에 따라, 디스플레이부(120)는 상이한 정도의 요약 문서를 생성하기 위한 메뉴 UI(510)를 화면상에 디스플레이할 수 있다. 즉, 디스플레이부(120)는 제1 요약 레벨에 해당하는 핵심 요약(511), 제2 요약 레벨에 해당하는 일반 요약(513) 및 제3 요약 레벨에 해당하는 확장 요약(515)을 포함하는 메뉴 UI(510)를 화면상에 디스플레이할 수 있다.
여기서, 제1 요약 레벨에 해당하는 핵심 요약(511)은 메인 문서상의 각 문장 중 적어도 하나의 핵심 키워드를 포함하는 문장을 추출하고, 추출된 문장별 포함된 핵심 키워드의 개수에 기초하여 가장 높은 신뢰도 값을 가지는 문장으로부터 생성되는 요약 문서가 될 수 있다. 그리고, 제2 요약 레벨에 해당하는 일반 요약(513)은 메인 문서의 구조 분석을 통해 각 단락별 특성을 파악하여 핵심 주제가 되는 단락에 포함된 문장에 기초하여 생성되는 요약 문서가 될 수 있다. 그리고, 제3 요약 레벨에 해당하는 확장 요약(515)은 제2 요약 레벨과 관련하여 생성된 일반 요약 문서와 작성자의 작성 의도가 고려된 문장에 기초하여 생성된 요약 문서가 될 수 있다.
예를 들어, 도 2 와 같은 메인 문서(210)로부터 "○○○", “△△△", "결혼", "AAA 스포츠"라는 핵심 키워드가 결정된 상태에서, 핵심 요약(511)에 대한 선택 명령이 입력되면, 프로세서(140)는 메인 문서(210) 상의 각 문장 중 기결정된 핵심 키워드 개수가 가장 많이 분포된 문장에 기초하여 핵심 요약 문서를 생성한다. 이에 따라, 디스플레이부(120)는 도 6에 도시된 바와 같이, “AAA 스포츠 --- △△△ --- 결혼 --- ○○○ --- 마케팅 ---.”이라는 핵심 요약 문서(610)를 화면상에 디스플레이할 수 있다.
한편, 도 2와 같은 메인 문서(210)로부터 "○○○", “△△△", "결혼", "AAA 스포츠"라는 핵심 키워드가 결정된 상태에서, 일반 요약(513)에 대한 선택 명령이 입력되면, 프로세서(140)는 메인 문서(210) 상의 각 단락 중 구조 분석을 통해 핵심 주제가 되는 단락을 결정한다. 예를 들어, 마지막 단락이 주제가 되는 단락으로 결정되면, 프로세서(140)는 주제 단락으로 결정된 단락 내에 포함된 문장에 기초하여 일반 요약 문서를 생성한다. 이에 따라, 디스플레이부(120)는 도 7에 도시된 바와 같이, “AAA 스포츠 --- △△△ --- 결혼 --- ○○○ --- 마케팅 ---. --- AAA 스포츠 --- 마케팅 ---.”이라는 일반 요약 문서(710)를 화면상에 디스플레이할 수 있다.
한편, 도 2와 같은 메인 문서(210)로부터 "○○○", “△△△", "결혼", "AAA 스포츠"라는 핵심 키워드가 결정된 상태에서, 확장 요약(515)에 대한 선택 명령이 입력되면, 프로세서(140)는 기결정된 주제 단락 내에 포함된 문장에 기초하여 일반 요약 문서를 생성한다. 또한, 프로세서(140)는 메인 문서(210) 상에 포함된 각 문장 중 작성자의 작성 의도가 고려된 문장을 추출한다. 이후, 프로세서(140)는 기생성된 일반 요약 문서 및 기추출된 작성자의 작성 의도가 고려된 문장에 기초하여 확장 요약 문서를 생성한다. 이에 따라, 디스플레이부(120)는 도 8에 도시된 바와 같이, “AAA 스포츠 --- △△△ --- 결혼 --- ○○○ --- 마케팅 ---. --- AAA 스포츠 --- 마케팅 --- 기대 ---“라는 확장 요약 문서(810)를 화면상에 디스플레이할 수 있다.이하에서는, 본 발명에 따른 디스플레이 장치에서 메인 문서에 대한 요약 문서를 생성하는 방법에 대해서 상세히 설명하도록 한다.
도 9는 본 발명의 일 실시예에 따른 디스플레이 장치에서 요약 문서를 생성하는 방법의 흐름도이다.
도 9에 도시된 바와 같이, 디스플레이 장치는 컨텐츠 서버(미도시)로부터 사용자가 요청한 문서(이하 메인 문서라 함)를 디스플레이한다. 여기서, 메인 문서는 텍스트 형태의 문서가 될 수 있다. 이 같은 메인 문서가 디스플레이된 상태에서 요약 문서에 대한 사용자 명령이 입력되면, 디스플레이 장치는 화면상에 디스플레이된 메인 문서로부터 노출 빈도가 높은 복수의 키워드를 추출한다(S910). 구체적으로, 디스플레이 장치는 화면상에 디스플레이된 메인 문서상의 각 문장별 단어를 추출하고, 추출된 단어 중 기설정된 개수 이상으로 노출된 단어를 노출 빈도가 높은 키워드로 추출할 수 있다.
이 같은 복수의 키워드가 추출되면, 디스플레이 장치는 추출된 키워드로부터 문서 특성을 판단하여 메인 문서가 인물, 장소, 작품명 등의 개체 중심 문서인지 아니면, 사건 관계 중심 문서인지 여부를 판단한다(S920). 그러나, 본 발명은 이에 한정되지 않으면, 디스플레이 장치는 추출된 키워드를 분석하여 개체 중심 관련 문서를 제외한 나머지 문서에 대해서 서브 문서를 참조하는 것으로 결정할 수 있다.
판단 결과, 메인 문서가 개체 중심 관련 문서인 것으로 판단되면, 디스플레이 장치는 메인 문서상에서 노출 빈도가 높은 것으로 추출된 복수의 키워드를 핵심 키워드로 결정한다(S930). 한편, 메인 문서가 사건 관계 중심 관련 문서이거나 혹은 개체 중심 관련 문서가 아닌 것으로 판단되면, 디스플레이 장치는 메인 문서와 관련된 서브 문서의 키워드에 기초하여 기추출된 복수의 키워드로부터 핵심 키워드를 결정한다(S940). 구체적으로, 디스플레이 장치는 메인 문서가 사건 관계 중심 관련 문서이거나 혹은 개체 중심 관련 문서가 아닌 것으로 판단되면, 컨텐츠 서버(미도시)에서 제공하는 복수의 서브 문서의 내용을 분석하여 기추출된 복수의 키워드 중 적어도 하나의 키워드를 포함하는 서브 문서를 메인 문서와 관련된 문서로 결정할 수 있다. 그러나, 본 발명은 이에 한정되지 않으며, 디스플레이 장치는 컨텐츠 서버(미도시)에서 제공하는 복수의 서브 문서의 문서 제목을 분석하여 기추출된 복수의 키워드 중 적어도 하나의 키워드를 포함하는 문서 제목을 갖는 서브 문서를 메인 문서와 관련된 문서로 결정할 수 있다. 메인 문서와 관련된 서브 문서가 결정되면, 디스플레이 장치는 메인 문서와 관련된 문서로 결정된 서브 문서에 기초하여 기추출된 복수의 키워드로부터 핵심 키워드를 결정할 수 있다.
이 같은 실시예를 통해 핵심 키워드가 결정되면, 디스플레이 장치는 핵심 키워드에 기초하여 메인 문서의 각 문장별 신뢰도를 결정하고, 결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출한다(S950). 여기서, 기설정된 조건에 부합되는 적어도 하나의 문장은 요약 문서 생성을 위한 핵심 문장이 될 수 있다. 이 같은 요약 문서 생성을 위한 핵심 문장은 다음과 같은 방법을 통해 추출될 수 있다.
도 10은 본 발명에 따른 디스플레이 장치에서 요약 문서 생성을 위한 핵심 문장을 추출하는 예시도이다.
도 10에 도시된 바와 같이, 전술한 실시예를 통해 메인 문서상에서 노출 빈도가 높은 복수의 키워드로부터 핵심 키워드가 추출되면, 디스플레이 장치는 메인 문서상의 각 문장 중 적어도 하나의 핵심 키워드를 포함하는 문장을 추출한다. 이후, 디스플레이 장치는 추출된 문장별 핵심 키워드의 분포도로부터 신뢰도 값을 산출한다(S1010). 여기서, 신뢰도 값은 각 문장별 핵심 키워드를 포함하는 개수에 비례하여 결정되는 값이 될 수 있다. 이후, 디스플레이 장치는 문장별 산출된 신뢰도 값과 기설정된 임계값을 비교하여 기설정된 임계값 이상의 신뢰도 값을 가지는 문장을 요약 문서 생성을 위한 핵심 문장으로 추출한다(S1020,S1030).
그러나, 본 발명은 이에 한정되지 않으며, 디스플레이 장치는 핵심 키워드를 포함하는 문장이 추출되면, 추출된 문장 내에 포함되는 핵심 키워드의 개수가 기설정된 개수 이상인 문장을 요약 문서 생성을 위한 핵심 문장으로 추출할 수 있다.
한편, 디스플레이 장치는 추출된 핵심 문장이 복수 개이면, 담화 분석을 통해 메인 문서상에서 핵심 주제가 되는 주제 단락을 획득하고, 추출된 복수의 문장 중 주제 단락 내에 포함된 문장을 요약 문장 생성을 위한 핵심 문장으로 추출할 수 있다. 이 같은 방법을 통해 요약 문서 생성을 위한 핵심 문장이 추출되면, 디스플레이 장치는 추출된 문장의 구조 형태를 분석하여 문장을 구성하는 단어를 재구성하여 요약 문장을 생성한다(S960). 일 실시예에 따라, 디스플레이 장치는 구문 분석(Syntax Analysis)을 통해 핵심 문장으로 추출된 문장을 요약 문장으로 생성할 수 있다. 구체적으로, 디스플레이 장치는 요약 문서 생성을 위한 핵심 문장이 결정되면, 구문 분석을 통해 핵심 문장의 구조 형태를 분석하여 핵심 문장을 이루는 기본 단위의 단어를 재구성하여 요약 문장을 생성할 수 있다.
또다른 실시예에 따라, 디스플레이 장치는 요약 문서 생성을 위한 핵심 문장이 결정되면, 구문 분석을 통해 핵심 문장의 구조 형태를 분석하여 핵심 문장을 이루는 기본 단위의 단어를 추출한다. 이후, 디스플레이 장치는 추출된 단어들 간의 공지시 관계 여부를 분석하여 동일한 의미를 가지는 적어도 하나의 단어를 제외한 나머지 단어에 기초하여 요약 문장을 생성할 수 있다.
이 같은 실시예를 통해 기추출된 핵심 문장에 대한 요약 문장이 생성되면, 디스플레이 장치는 메인 문서상에서 기획득한 주제 단락 내에 포함된 복수의 문장 중 기등록된 주관적 의미 요소와 관련된 키워드를 포함하는 적어도 하나의 문장과 기획득한 요약 문장을 이용하여 요약 문서를 생성한다(S970). 여기서, 주관적 의미 요소는 메인 문서를 작성한 작성자의 의도를 나타내기 위한 요소로써, 이 같은 주관적 의미 요소는 작성자의 평가, 감성, 의견과 관련된 표현을 나타내는 단어를 포함할 수 있다. 따라서, 디스플레이 장치는 주관적 의미 요소로 정의된 단어를 참조하여 메인 문서상에서 기획득한 주제 단락 내에서 작성자의 평가, 감성, 의견과 관련된 표현을 나타내는 키워드를 포함하는 문장을 획득할 수 있다. 이 같은 문장이 획득되면, 디스플레이 장치는 기생성된 요약 문장과 작성자의 의도를 나타내는 문장을 이용하여 요약 문서를 생성한다.
이 같이, 본 발명에 따른 디스플레이 장치는 메인 문서로부터 객관적인 사실 관계 뿐만 아니라, 작성자의 작성 의도가 고려된 의미적 경향을 제시하는 요약 문서를 생성할 수 있다.
또한, 상술한 바와 같은 문서를 요약하는 방법은 상술한 바와 같은 문서 요약 방법을 실행하기 위한 적어도 하나의 실행 프로그램으로 구현될 수 있으며, 이러한 실행 프로그램은 비일시적 컴퓨터 판독 가능 매체에 저장될 수 있다.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로, 상술한 프로그램들은 RAM(Random Access Memory), 플레시메모리, ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electronically Erasable and Programmable ROM), 레지스터, 하드디스크, 리무버블 디스크, 메모리 카드, USB 메모리, CD-ROM 등과 같이, 단말기에서 판독 가능한 다양한 유형의 기록 매체에 저장되어 있을 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다.
이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
110 : 통신부 120 : 디스플레이부
130 : 문서 생성부 140 : 프로세서
150 : 저장부

Claims (17)

  1. 디스플레이 장치에 있어서,
    컨텐츠 서버와 데이터 통신을 수행하여 메인 문서 및 상기 메인 문서와 관련된 서브 문서 중 적어도 하나를 수신하는 통신부;
    상기 메인 문서로부터 노출 빈도가 높은 키워드를 추출하고, 상기 수신된 서브 문서를 참조하여 상기 추출된 키워드로부터 요약 문장 생성을 위한 핵심 키워드를 결정하는 문서 분석부; 및
    상기 핵심 키워드에 기초하여 상기 메인 문서의 각 문장별 신뢰도를 결정하고, 상기 결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출하며, 상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 단어를 재구성하여 요약 문장을 생성하는 프로세서;
    를 포함하는 디스플레이 장치.
  2. 제 1 항에 있어서,
    상기 프로세서는,
    상기 메인 문서의 각 문장별 상기 핵심 키워드의 분포도로부터 신뢰도 값을 산출하며, 산출된 신뢰도 값과 기설정된 임계값을 비교하여 상기 기설정된 임계값 이상의 신뢰도 값을 가지는 문장을 요약 문장 생성을 위한 문장으로 추출하는 것을 특징으로 하는 디스플레이 장치.
  3. 제 2 항에 있어서,
    상기 프로세서는,
    상기 추출된 문장이 복수 개이면, 담화 분석(Discourse Analysis)을 통해 상기 메인 문서상에서 핵심 주제가 되는 주제 단락을 획득하고, 상기 추출된 복수의 문장 중 상기 획득한 주제 단락 내에 포함된 문장을 요약 문장 생성을 위한 문장으로 추출하는 것을 특징으로 하는 디스플레이 장치.
  4. 제 3 항에 있어서,
    상기 프로세서는,
    구문 분석(Syntax Analysis)을 통해 상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 복수의 단어 중 핵심 문장을 이루는 단어를 추출하고, 상기 추출된 단어에 기초하여 요약 문장을 생성하는 것을 특징으로 하는 디스플레이 장치.
  5. 제 4 항에 있어서,
    상기 프로세서는,
    상기 추출된 단어들 간의 공지시 관계 여부를 분석하여 동일한 의미를 가지는 적어도 하나의 단어를 제외한 나머지 단어에 기초하여 요약 문장을 생성하는 것을 특징으로 하는 디스플레이 장치.
  6. 제 3 항에 있어서,
    상기 요약 문장을 디스플레이하는 디스플레이부;를 더 포함하며,
    상기 프로세서는,
    상기 획득한 주제 단락 내에 포함된 복수의 문장 중 기등록된 주관적 의미 요소와 관련된 키워드를 포함하는 적어도 하나의 문장과 상기 요약 문장을 이용하여 요약 문서를 생성하고, 상기 생성된 요약 문서를 상기 디스플레이부를 통해 디스플레이하며,
    상기 주관적 의미 요소는,
    상기 메인 문서에 대한 사용자의 평가, 감성 및 의견 중 적어도 하나와 관련된 요소인 것을 특징으로 하는 디스플레이 장치.
  7. 제 1 항에 있어서,
    상기 문서 분석부는
    상기 메인 문서가 개체 중심 문서이면, 상기 메인 문서상에서 추출된 키워드를 핵심 키워드로 결정하고, 상기 메인 문서가 사건 관계 중심 문서이면, 상기 서브 문서를 참조하여 핵심 키워드를 결정하는 것을 특징으로 하는 디스플레이 장치.
  8. 제 7 항에 있어서,
    상기 문서 분석부는,
    상기 메인 문서가 사건 관계 중심 문서이면, 복수의 서브 문서별 문서 제목을 분석하여 상기 추출된 키워드를 포함하는 문서 제목을 갖는 서브 문서를 참조하여 핵심 키워드를 결정하는 것을 특징으로 하는 디스플레이 장치.
  9. 디스플레이 장치에서 문서 요약을 위한 방법에 있어서,
    메인 문서로부터 노출 빈도가 높은 키워드를 추출하는 단계;
    적어도 하나의 서브 문서를 참조하여 상기 추출된 키워드로부터 요약 문장 생성을 위한 핵심 키워드를 결정하는 단계;
    상기 핵심 키워드에 기초하여 상기 메인 문서의 각 문장별 신뢰도를 결정하고, 상기 결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출하는 단계; 및
    상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 단어를 재구성하여 요약 문장을 생성하는 단계;
    를 포함하는 문서 요약 방법.
  10. 제 9 항에 있어서,
    상기 추출하는 단계는,
    상기 메인 문서의 각 문장별 상기 핵심 키워드의 분포도로부터 신뢰도 값을 산출하며, 산출된 신뢰도 값과 기설정된 임계값을 비교하여 상기 기설정된 임계값 이상의 신뢰도 값을 가지는 문장을 요약 문장 생성을 위한 문장으로 추출하는 것을 특징으로 하는 문서 요약 방법.
  11. 제 10 항에 있어서,
    상기 요약 문장 생성을 위한 문장을 추출하는 단계는,
    상기 추출된 문장이 복수 개이면, 담화 분석(Discourse Analysis)을 통해 상기 메인 문서상에서 핵심 주제가 되는 주제 단락을 획득하고, 상기 추출된 복수의 문장 중 상기 획득한 주제 단락 내에 포함된 문장을 요약 문장 생성을 위한 문장으로 추출하는 것을 특징으로 하는 문서 요약 방법.
  12. 제 11 항에 있어서,
    상기 요약 문장을 생성하는 단계는,
    구문 분석(Syntax Analysis)을 통해 상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 복수의 단어 중 핵심 문장을 이루는 단어를 추출하고, 상기 추출된 단어에 기초하여 요약 문장을 생성하는 것을 특징으로 하는 문서 요약 방법.
  13. 제 12 항에 있어서,
    상기 요약 문장을 생성하는 단계는,
    상기 추출된 단어들 간의 공지시 관계 여부를 분석하여 동일한 의미를 가지는 적어도 하나의 단어를 제외한 나머지 단어에 기초하여 요약 문장을 생성하는 것을 특징으로 하는 문서 요약 방법.
  14. 제 11 항에 있어서,
    상기 요약 문서를 생성하는 단계는,
    상기 획득한 주제 단락 내에 포함된 복수의 문장 중 기등록된 주관적 의미 요소와 관련된 키워드를 포함하는 적어도 하나의 문장과 상기 요약 문장을 이용하여 요약 문서를 생성하는 단계;를 더 포함하며,
    상기 주관적 의미 요소는,
    상기 메인 문서에 대한 사용자의 평가, 감성 및 의견 중 적어도 하나와 관련된 요소인 것을 특징으로 하는 문서 요약 방법.
  15. 제 9 항에 있어서,
    상기 추출된 키워드를 분석하여 문서 특성을 판단하는 단계;를 더 포함하며,
    상기 핵심 키워드를 결정하는 단계는,
    상기 메인 문서가 개체 중심 문서인 것으로 판단되면, 상기 메인 문서상에서 추출된 키워드를 핵심 키워드로 결정하고, 상기 메인 문서가 사건 관계 중심 문서인 것으로 판단되면, 상기 적어도 하나의 서브 문서를 참조하여 핵심 키워드를 결정하는 것을 특징으로 하는 문서 요약 방법.
  16. 제 15 항에 있어서,
    상기 핵심 키워드를 결정하는 단계는,
    상기 메인 문서가 사건 관계 중심 문서인 것으로 판단되면, 복수의 서브 문서별 문서 제목을 분석하여 상기 추출된 키워드를 포함하는 문서 제목을 갖는 서브 문서를 참조하여 핵심 키워드를 결정하는 것을 특징으로 하는 문서 요약 방법.
  17. 디스플레이 장치와 결합되어 하기의 단계를 실행시키기 위하여 기록 매체에 저장된 컴퓨터 프로그램에 있어서,
    메인 문서로부터 노출 빈도가 높은 키워드를 추출하는 단계;
    적어도 하나의 서브 문서를 참조하여 상기 추출된 키워드로부터 요약 문장 생성을 위한 핵심 키워드를 결정하는 단계;
    상기 핵심 키워드에 기초하여 상기 메인 문서의 각 문장별 신뢰도를 결정하고, 상기 결정된 신뢰도를 참조하여 기설정된 조건에 부합되는 문장을 추출하는 단계; 및
    상기 추출된 문장의 구조 형태를 분석하여 상기 문장을 구성하는 단어를 재구성하여 요약 문장을 생성하는 단계;
    를 포함하며 문서 요약을 제공하는, 기록 매체에 저장된 컴퓨터 프로그램.


KR1020140160273A 2014-11-17 2014-11-17 문서 요약을 위한 디스플레이 장치 및 방법 Withdrawn KR20160058587A (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020140160273A KR20160058587A (ko) 2014-11-17 2014-11-17 문서 요약을 위한 디스플레이 장치 및 방법
US14/929,520 US20160140221A1 (en) 2014-11-17 2015-11-02 Display apparatus and method for summarizing of document
EP15194788.4A EP3021239A3 (en) 2014-11-17 2015-11-16 Display apparatus and method for summarizing of document
CN201510791284.5A CN105608068A (zh) 2014-11-17 2015-11-17 用于概括文档的显示装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140160273A KR20160058587A (ko) 2014-11-17 2014-11-17 문서 요약을 위한 디스플레이 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20160058587A true KR20160058587A (ko) 2016-05-25

Family

ID=54703756

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140160273A Withdrawn KR20160058587A (ko) 2014-11-17 2014-11-17 문서 요약을 위한 디스플레이 장치 및 방법

Country Status (4)

Country Link
US (1) US20160140221A1 (ko)
EP (1) EP3021239A3 (ko)
KR (1) KR20160058587A (ko)
CN (1) CN105608068A (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190013426A (ko) * 2017-08-01 2019-02-11 삼성전자주식회사 인공지능 학습모델을 이용하여 요약 정보를 제공하기 위한 전자 장치 및 이의 제어 방법
US10699062B2 (en) 2017-08-01 2020-06-30 Samsung Electronics Co., Ltd. Apparatus and method for providing summarized information using an artificial intelligence model
KR102158352B1 (ko) * 2020-03-27 2020-09-21 (주)케이엔랩 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램
WO2020206278A1 (en) * 2019-04-03 2020-10-08 RELX Inc. Systems and methods for generating logical documents for a document evaluation system
WO2021149923A1 (ko) * 2020-01-20 2021-07-29 주식회사 씨오티커넥티드 영상 검색 제공 방법 및 장치
KR102460438B1 (ko) * 2022-05-30 2022-10-31 (주)유알피시스템 요약문과 키워드 추출을 위한 문서 정보처리 시스템 및 문서 정보처리 방법
KR102540947B1 (ko) * 2022-08-05 2023-06-07 (주)유알피 유의어 사전 자동 구축을 통한 문서 정보처리 시스템 및 문서 정보처리 방법
US12124809B2 (en) 2020-02-12 2024-10-22 Samsung Electronics Co., Ltd. Electronic apparatus for summarizing a sentence based on a user preference and control method thereof

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100114768A1 (en) 2008-10-31 2010-05-06 Wachovia Corporation Payment vehicle with on and off function
US10867298B1 (en) 2008-10-31 2020-12-15 Wells Fargo Bank, N.A. Payment vehicle with on and off function
US11429975B1 (en) 2015-03-27 2022-08-30 Wells Fargo Bank, N.A. Token management system
US11170364B1 (en) 2015-07-31 2021-11-09 Wells Fargo Bank, N.A. Connected payment card systems and methods
US12130937B1 (en) 2016-07-01 2024-10-29 Wells Fargo Bank, N.A. Control tower for prospective transactions
US11615402B1 (en) 2016-07-01 2023-03-28 Wells Fargo Bank, N.A. Access control tower
US11935020B1 (en) 2016-07-01 2024-03-19 Wells Fargo Bank, N.A. Control tower for prospective transactions
US11386223B1 (en) 2016-07-01 2022-07-12 Wells Fargo Bank, N.A. Access control tower
US10992679B1 (en) 2016-07-01 2021-04-27 Wells Fargo Bank, N.A. Access control tower
US11886611B1 (en) 2016-07-01 2024-01-30 Wells Fargo Bank, N.A. Control tower for virtual rewards currency
US10572726B1 (en) * 2016-10-21 2020-02-25 Digital Research Solutions, Inc. Media summarizer
US11556936B1 (en) 2017-04-25 2023-01-17 Wells Fargo Bank, N.A. System and method for card control
US10664528B1 (en) 2017-06-28 2020-05-26 Wells Fargo Bank, N.A. Optimizing display of disclosure based on prior interactions
US11062388B1 (en) 2017-07-06 2021-07-13 Wells Fargo Bank, N.A Data control tower
US11188887B1 (en) 2017-11-20 2021-11-30 Wells Fargo Bank, N.A. Systems and methods for payment information access management
CN110889279B (zh) * 2018-08-15 2024-06-25 珠海金山办公软件有限公司 一种在文档中显示展示信息的方法及装置
US11775775B2 (en) * 2019-05-21 2023-10-03 Salesforce.Com, Inc. Systems and methods for reading comprehension for a question answering task
CN110688349B (zh) * 2019-08-29 2023-05-26 重庆小雨点小额贷款有限公司 一种文档整理方法、装置、终端及计算机可读存储介质
US11334722B2 (en) * 2019-09-23 2022-05-17 Hong Kong Applied Science and Technology Research Institute Company Limited Method of summarizing text with sentence extraction
CN112825110A (zh) * 2019-11-20 2021-05-21 掌阅科技股份有限公司 基于主题模型的书籍中心内容提取方法及计算设备
CN111930929B (zh) * 2020-07-09 2023-11-10 车智互联(北京)科技有限公司 一种文章标题生成方法、装置及计算设备
US10992606B1 (en) 2020-09-04 2021-04-27 Wells Fargo Bank, N.A. Synchronous interfacing with unaffiliated networked systems to alter functionality of sets of electronic assets
US11546338B1 (en) 2021-01-05 2023-01-03 Wells Fargo Bank, N.A. Digital account controls portal and protocols for federated and non-federated systems and devices
US12155641B1 (en) 2022-04-15 2024-11-26 Wells Fargo Bank, N.A. Network access tokens and meta-application programming interfaces for enhanced inter-enterprise system data promulgation and profiling

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7698339B2 (en) * 2004-08-13 2010-04-13 Microsoft Corporation Method and system for summarizing a document
US7752204B2 (en) * 2005-11-18 2010-07-06 The Boeing Company Query-based text summarization
JP6110389B2 (ja) * 2011-10-14 2017-04-05 ヤフー株式会社 電子文書の内容を自動的に要約するための方法、有形のコンピュータ可読媒体及びシステム
CN104331394A (zh) * 2014-08-29 2015-02-04 南通大学 一种基于观点的文本分类方法
CN104866554B (zh) * 2015-05-15 2018-04-27 大连理工大学 一种基于社会化标注的个性化搜索方法及系统
CN105005589B (zh) * 2015-06-26 2017-12-29 腾讯科技(深圳)有限公司 一种文本分类的方法和装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190013426A (ko) * 2017-08-01 2019-02-11 삼성전자주식회사 인공지능 학습모델을 이용하여 요약 정보를 제공하기 위한 전자 장치 및 이의 제어 방법
US10699062B2 (en) 2017-08-01 2020-06-30 Samsung Electronics Co., Ltd. Apparatus and method for providing summarized information using an artificial intelligence model
US11017156B2 (en) 2017-08-01 2021-05-25 Samsung Electronics Co., Ltd. Apparatus and method for providing summarized information using an artificial intelligence model
US11574116B2 (en) 2017-08-01 2023-02-07 Samsung Electronics Co., Ltd. Apparatus and method for providing summarized information using an artificial intelligence model
KR20230084460A (ko) * 2017-08-01 2023-06-13 삼성전자주식회사 인공지능 학습모델을 이용하여 요약 정보를 제공하기 위한 전자 장치 및 이의 제어 방법
WO2020206278A1 (en) * 2019-04-03 2020-10-08 RELX Inc. Systems and methods for generating logical documents for a document evaluation system
WO2021149923A1 (ko) * 2020-01-20 2021-07-29 주식회사 씨오티커넥티드 영상 검색 제공 방법 및 장치
US12124809B2 (en) 2020-02-12 2024-10-22 Samsung Electronics Co., Ltd. Electronic apparatus for summarizing a sentence based on a user preference and control method thereof
KR102158352B1 (ko) * 2020-03-27 2020-09-21 (주)케이엔랩 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램
KR102460438B1 (ko) * 2022-05-30 2022-10-31 (주)유알피시스템 요약문과 키워드 추출을 위한 문서 정보처리 시스템 및 문서 정보처리 방법
KR102540947B1 (ko) * 2022-08-05 2023-06-07 (주)유알피 유의어 사전 자동 구축을 통한 문서 정보처리 시스템 및 문서 정보처리 방법

Also Published As

Publication number Publication date
EP3021239A2 (en) 2016-05-18
US20160140221A1 (en) 2016-05-19
CN105608068A (zh) 2016-05-25
EP3021239A3 (en) 2016-05-25

Similar Documents

Publication Publication Date Title
KR20160058587A (ko) 문서 요약을 위한 디스플레이 장치 및 방법
US9310879B2 (en) Methods and systems for displaying web pages based on a user-specific browser history analysis
JP6653334B2 (ja) 情報抽出方法及び装置
CN106156083B (zh) 一种领域知识处理方法及装置
CN104978314B (zh) 媒体内容推荐方法及装置
CN105488021B (zh) 一种生成多文档摘要的方法和装置
CN111428025A (zh) 文本摘要方法、装置、电子设备和存储介质
CN111126060A (zh) 一种主题词的提取方法、装置、设备及存储介质
CN111143551A (zh) 文本预处理方法、分类方法、装置及设备
CN106610931B (zh) 话题名称的提取方法及装置
CN107273546B (zh) 仿冒应用检测方法以及系统
WO2018026489A1 (en) Surfacing unique facts for entities
US20170169102A1 (en) Method and electronic device for controlling data query
KR20150084706A (ko) 온톨로지의 지식 학습 장치 및 그의 방법
CN116955720A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
CN110457691A (zh) 基于剧本角色的情感曲线分析方法和装置
CN113553421A (zh) 评论文本的生成方法、装置、电子设备和存储介质
US8346745B2 (en) Information retrieval method, computer readable medium and information retrieval apparatus
JP6680472B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN109753646B (zh) 一种文章属性识别方法以及电子设备
RU2595531C2 (ru) Способ и система генерирования определения слова на основе множественных источников
CN106406882A (zh) 一种论坛中帖子背景的展现方法和装置
CN105630769A (zh) 文档主题词提取方法及装置
CN113254573B (zh) 文本摘要生成方法、装置、电子设备及可读存储介质
WO2017071190A1 (zh) 输入数据的处理方法、装置、设备及非易失性计算机存储介质

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20141117

PG1501 Laying open of application
PC1203 Withdrawal of no request for examination
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid