[go: up one dir, main page]

KR20080029602A - Method and device for preventing the leakage of confidential documents - Google Patents

Method and device for preventing the leakage of confidential documents Download PDF

Info

Publication number
KR20080029602A
KR20080029602A KR1020060096436A KR20060096436A KR20080029602A KR 20080029602 A KR20080029602 A KR 20080029602A KR 1020060096436 A KR1020060096436 A KR 1020060096436A KR 20060096436 A KR20060096436 A KR 20060096436A KR 20080029602 A KR20080029602 A KR 20080029602A
Authority
KR
South Korea
Prior art keywords
confidential
monitoring
documents
document
confidential document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020060096436A
Other languages
Korean (ko)
Other versions
KR100882349B1 (en
Inventor
이호균
이승민
남택용
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020060096436A priority Critical patent/KR100882349B1/en
Publication of KR20080029602A publication Critical patent/KR20080029602A/en
Application granted granted Critical
Publication of KR100882349B1 publication Critical patent/KR100882349B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Storage Device Security (AREA)

Abstract

본 발명은, 기밀문서 유출 방지 방법 및 장치에 관한 것으로서, 지원하는 모든 감시단으로부터 문서를 수집하는 과정과, 등록된 문서 및 등록되지 않은 문서 모두에 대해 기밀문서 여부를 인식하기 위한 기밀문서 지식을 습득하는 과정과, 상기 기밀문서 지식의 습득에 따라 해당 기밀 탐지 알고리즘을 기반으로 기밀문서를 감시 및 판정하는 과정과, 상기 판정된 기밀문서를 차단하는 과정을 포함하는 것을 특징으로 하며, 이에 따라 기존에 감시하지 못했던 산재되어 있는 데이터(등록되지 않은 기밀문서)도 감시 및 실시간 차단할 수 있는 효과가 있다. The present invention relates to a method and a device for preventing the leakage of confidential documents, the process of collecting documents from all the supporting monitoring group, and to acquire the knowledge of confidential documents for recognizing whether or not confidential documents for both registered and unregistered documents And monitoring and determining the confidential document based on the confidentiality detection algorithm according to the acquisition of the knowledge of the confidential document, and blocking the determined confidential document. Spreading data (unregistered confidential documents) that could not be monitored can also be monitored and blocked in real time.

Description

기밀문서 유출 방지 방법 및 장치{METHOD AND APPARATUS FOR PREVENTING CONFIDENTIAL INFORMATION LEAK}METHOD AND APPARATUS FOR PREVENTING CONFIDENTIAL INFORMATION LEAK}

도 1은 본 발명의 실시예에 따른 기밀문서 유출 방지를 위한 시스템 구조를 도시한 구성도, 1 is a block diagram showing a system structure for preventing the leakage of confidential documents according to an embodiment of the present invention,

도 2는 본 발명의 실시예에 따른 기밀문서 유출 방지 장치의 구조를 도시한 구성도, 2 is a block diagram showing a structure of a leak prevention apparatus for confidential documents according to an embodiment of the present invention;

도 3은 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 기밀 데이터에 대한 지식 습득 과정을 도시한 흐름도, 3 is a flowchart illustrating a process of acquiring knowledge about confidential data in an apparatus for preventing leakage of confidential documents according to an embodiment of the present invention;

도 4a 및 도 4b는 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 자동 기밀 판정 알고리즘의 적용 지점들을 보여주는 블록도,4A and 4B are block diagrams showing application points of an automatic confidentiality determination algorithm in a confidential document leakage prevention apparatus according to an embodiment of the present invention;

도 5는 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 언어기반 기밀문서 판정 과정을 도시한 흐름도, 5 is a flowchart illustrating a language-based confidential document determination process in the apparatus for preventing the leakage of confidential documents according to an embodiment of the present invention;

도 6은 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 비언어기반 기밀문서 판정 과정을 도시한 흐름도,6 is a flowchart illustrating a non-language-based confidential document determination process in a confidential document leakage prevention apparatus according to an embodiment of the present invention;

도 7은 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 두 가지 기밀문서 판정 알고리즘의 적용 과정을 도시한 흐름도. 7 is a flowchart illustrating an application process of two confidential document determination algorithms in a confidential document leakage prevention apparatus according to an embodiment of the present invention.

본 발명은 정부, 기업 등의 네트워크에서의 기밀문서 유출 방지 시스템에 관한 것으로서, 특히 기밀문서 유출 방지 시스템에서 기계 학습(언어 기반) 및 핑거 프린팅(비언어 기반)을 이용한 기밀문서 유출 방지 방법 및 장치에 관한 것이다. The present invention relates to a system for preventing leakage of confidential documents in a network of a government, a company, and the like, and particularly, a method and apparatus for preventing leakage of confidential documents using machine learning (language based) and finger printing (non-language based) in a confidential document leakage prevention system. It is about.

현재, 고객의 개인정보나 기업의 기밀정보 등이 이메일, 인스턴트 메시징 서비스, P2P 등을 통하여 의도적으로 또는 부주의로 인하여 무분별하게 유통됨으로써 심각한 정보 유출이 우려되고 있는 실정이다. At present, serious information leakage is feared because personal information of a customer or confidential information of a company is indiscriminately distributed through e-mail, instant messaging service, P2P, etc. intentionally or inadvertently.

일반적으로 여러 가지 손실 유형 가운데 기밀문서 유출에 의한 경제적 손실이 가장 많은 부분을 차지하며, 매년 이러한 경제적 손실이 증가하는 추세이다. In general, among the various types of losses, the economic loss due to the leakage of confidential documents is the largest, and this economic loss is increasing every year.

최근 국내에서 발생한 정보 유출에 대한 산업 스파이 사건은 2003년 이후 급증하고 있으며, 2003년부터 2005년 12월까지 총 61건이 적발되었고 업계 추산 약 82조 3,270억원의 손실이 발생하였다. 유출 양상도 과거 생계형에서 최근 발생한 반도체 기술 유출 사건에서 볼 수 있듯이 외국 정부 연계 및 기업형 사건으로 대형화되고 있고, 수법도 핵심인력 매수, 스카우트, 위장업체 설립, 절취·해킹 등 모든 수단이 동원되고 있다. Recently, industrial espionage cases of information leaks in Korea have been increasing rapidly since 2003. A total of 61 cases were caught from 2003 to December 2005, and the industry estimated loss of about 82.327 trillion won. As the leak pattern is seen in the recent semiconductor technology leakage incidents from the past livelihoods, it is being enlarged by foreign government linkages and enterprise-type incidents. The technique is also mobilizing all means such as buying key personnel, scouting, establishing a camouflage company, and cutting off and hacking.

이와 같은 기밀문서 유출을 방지하기 위한 종래의 기술은 DRM과 같은 정적인 문서 보안 방법을 중점을 두고 있었다. 하지만, 상기 DRM을 이용한 문서 보안 방법은 문서 보안 운영 체계를 보았을 때 변형된 문서 또는 작업 중인 문서 등에 대해서 정보 누출에 취약한 부분이 많이 있다. 특히, 이러한 DRM을 이용한 문서 보안은 기밀문서를 사용자가 직접 등록을 해야 한다. 즉, 상기 종래의 기술은 사용자들이 지정한 기밀문서만 보호하게 된다. 그러나 내부자가 자신이 작성하거나 수정한 정보를 유출하고자 한다면 이를 실시간으로 차단하기가 어려운 실정이다. 이와 같은 내부 정보 유출이 발생을 막기 위해서는 해당 문서의 내용을 모르는 사람이 막아야만 한다. 또한, 상기 종래의 기술은 일단 등록된 문서에 대해서도 내부자가 기밀문서 파일을 직접 복사하거나 인쇄하지 않고, 새 문서 파일에 기밀문서의 내용을 직접 입력하거나 부분 복사하는 경우, 상기 DRM 방식으로는 대응이 불가능하다. Conventional techniques for preventing such confidential document leakage focused on static document security methods such as DRM. However, the document security method using the DRM is vulnerable to information leakage of the modified document or the document in operation when viewing the document security operating system. In particular, document security using such DRM requires the user to manually register a confidential document. That is, the conventional technology protects only confidential documents designated by users. However, if the insider wants to leak the information he / she has written or modified, it is difficult to block it in real time. In order to prevent such internal information leakage, a person who does not know the contents of the document should be prevented. In addition, the conventional technology does not respond to the DRM method even when the insider directly inputs or partially copies the contents of the confidential document in a new document file without directly copying or printing the confidential document file even for the registered document. impossible.

또한, 종래의 기밀문서의 유출을 막기 위한 시스템에서는 기밀문서의 자동 판단이 불가능해서 데이터 입출력 자체를 불가능하게 하거나, 키워드 비교만으로 감시하였으므로 무조건적인 컴퓨터 사용을 제한하였다. In addition, in the conventional system for preventing the leakage of confidential documents, it is impossible to automatically determine confidential documents, thereby making the data input / output itself impossible or monitoring only by keyword comparison, thereby restricting the use of computers unconditionally.

따라서 본 발명의 목적은 사용자가 등록하지 않은 기밀문서를 자동으로 기밀문서 여부를 판정하고 차단함으로써 기밀문서 유출을 방지하기 위한 방법 및 장치를 제공함에 있다. Accordingly, an object of the present invention is to provide a method and apparatus for preventing leakage of confidential documents by automatically determining whether a confidential document is not registered by a user and blocking the confidential document.

본 발명의 다른 목적은 언어적인 방법 및 비언어적인 방법을 이용하여 데이터의 상태에 따라 모든 유출 가능 포인트에서 모든 데이터를 자동 감시 및 기밀 유 출 판정을 하여 실시간으로 차단하기 위한 기밀문서 유출 방지 방법 및 장치를 제공함에 있다. Another object of the present invention is a method and apparatus for preventing leakage of confidential documents for blocking in real time by automatically monitoring and confidential leak determination of all data at all possible leak points according to the state of data using linguistic and non-verbal methods. In providing.

상기 이러한 본 발명의 목적들을 달성하기 위한 기밀문서 유출 방지 방법은, 지원하는 모든 감시단으로부터 문서를 수집하는 과정과, 상기 수집된 기밀문서 중에서 등록된 문서 및 등록되지 않은 문서 모두에 대해 기밀문서 여부를 인식하기 위한 기밀문서 지식을 습득하는 과정과, 상기 기밀문서 지식의 습득에 따라 해당 기밀 탐지 알고리즘을 기반으로 기밀문서를 감시 및 판정하는 과정과, 상기 판정된 기밀문서를 차단하는 과정을 포함하는 것을 특징으로 한다. The method for preventing the leakage of confidential documents for achieving the object of the present invention, the process of collecting documents from all the monitoring unit to support, whether the registered document and the non-registered documents in both of the collected confidential documents whether Acquiring confidential document knowledge for recognition, monitoring and determining the confidential document based on the corresponding secret detection algorithm according to the acquisition of the confidential document knowledge, and blocking the determined confidential document. It features.

상기 본 발명의 목적들을 달성하기 위한 기밀문서 유출 방지 장치는, 지원하는 모든 감시단으로부터 문서를 수집하는 문서 수집부와, 상기 수집된 기밀문서 중에서 등록된 문서 및 등록되지 않은 문서 모두에 대해 기밀문서 여부를 인식하기 위한 기밀문서 지식을 습득하고, 상기 기밀문서 지식의 습득에 따라 해당 기밀 탐지 알고리즘을 기반으로 기밀문서 여부를 판정하는 제어부와, 상기 기밀문서 지식의 습득에 따라 상기 모든 감시단에서 문서의 유출을 감시하고, 상기 제어부에서 판정된 기밀문서를 차단하는 감시 및 차단부와, 정보 및 습득한 기밀문서 지식 및 상기 기밀문서 지식의 습득에 따라 생성된 모델에 대한 정보를 저장하는 저장부를 포함하는 것을 특징으로 한다. Confidential document leakage prevention device for achieving the object of the present invention, the document collection unit for collecting documents from all the monitoring unit to support, whether the document is a confidential document for both registered and unregistered documents among the collected confidential documents; A control unit for acquiring a confidential document knowledge for recognizing a secret document, and determining whether the confidential document is based on the secret detection algorithm according to the acquisition of the secret document knowledge; And a storage unit for monitoring and blocking the confidential document determined by the control unit, and a storage unit for storing information about the information and the model generated according to the acquired confidential document knowledge and the confidential document knowledge. It features.

이하, 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 우선 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 그리고 본 발명을 설명함에 있어, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. First of all, in adding reference numerals to the components of each drawing, it should be noted that the same reference numerals have the same reference numerals as much as possible even if displayed on different drawings. In the following description of the present invention, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted.

본 발명의 실시예에서는 기밀문서의 유출을 탐지하기 위해 언어적인 방법(기계 학습)과 비언어적인 방법(핑거 프린트)을 이용하여 네트워크단과 데스탑의 입/출력(I/O) 단에서 유출되는 모든 데이터를 자동으로 감시하고, 기밀 유출로 판정되는 경우 이를 실시간으로 차단하도록 한다. In the embodiment of the present invention, all data leaked from the network and the input / output (I / O) of the desktop using a linguistic method (machine learning) and non-verbal method (finger print) to detect the leakage of confidential documents. Automatically monitor and block in real time if it is determined to be a confidential leak.

상기 언어 정보에 기반으로 하는 기계 학습 방법은 생물학에서 정의한 분류학(Taxonomy)에 기반을 두고 있다. 예를 들어 제약회사의 기밀문서를 판정해야 한다면, 해당 기밀문서는 제약학에 관련된 단어를 포함할 확률이 높다. 이와 같이 각 분야를 대표하는 단어를 포함하는 기반으로 문서를 분야별로 분류할 수 있다. 이를 기반으로 제약 관련 문서와 그렇지 않은 문서의 분류를 기계 학습할 경우 상당히 높은 수준의 판정율을 기대할 수 있다. 현재까지 언어 분류학은 모든 분야의 문서에 대한 분류가 아니라, 특정 분야의 문서 분류의 경우 실용화가 가능한 수준의 탐지율을 보이고 있다. The machine learning method based on the language information is based on taxonomy defined in biology. For example, if a pharmaceutical company's confidential document needs to be determined, the confidential document is likely to contain words related to pharmaceuticals. As such, the document may be classified by field based on the words including the words representing the respective fields. Based on this, we can expect a fairly high level of decision rate when machine learning the classification of pharmaceutical documents and those that do not. To date, linguistic taxonomy is not a classification of documents in all fields, but a detection rate that is practical for the classification of documents in a specific field.

한편, 비언어적인 방법은 코드 기반 알고리즘을 통해 암호학에서 쓰이는 해쉬 이론을 적용함으로써, 기물 문서들을 수집해서 각 문서들의 고유한 키를 생성한 다. 이렇게 생성되는 키는 기밀문서마다 고유한 것으로 사람의 지문 또는 DNA에 비유될 수 있다. 이러한 키 개념은 일반적으로 암호화에서 많이 적용되는 것으로서, 원문에 대해 한 개의 키만 생성되기 때문에 하나의 문서만을 식별할 수 있으나, 본원 발명의 실시예에서는 생성되는 키가 문서의 유사도에 따라서 동일 문서의 변형본인 경우에도 같은 키가 생성되도록 한다. 즉, 기밀문서의 변형을 탐지할 수 있도록 한다. 이와 같은 코드 기반의 알고리즘의 경우 언어 정보를 보는 것이 아니라 이진 파일 수준에서의 코드를 키 정보로 활용하기 때문에 한번 시스템이 구축되면 언어에 독립적으로 보안 시스템을 구축할 수 있다.Non-verbal methods, on the other hand, employ hash theory used in cryptography through code-based algorithms to collect unique documents and generate unique keys for each document. The keys generated are unique to each confidential document and can be compared to a person's fingerprint or DNA. Such a key concept is generally applied in encryption, and since only one key is generated for the original text, only one document can be identified. However, in the embodiment of the present invention, the generated key is modified according to the similarity of the document. In your case, make sure that the same key is generated. That is, the deformation of the confidential document can be detected. In the case of such a code-based algorithm, since the code at the binary file level is used as the key information rather than the language information, once the system is built, the security system can be built independently of the language.

그러면 상기 언어 기반 및 코드 기반의 알고리즘을 이용하여 기밀문서 유출을 감시 및 차단함으로써 유출을 방지하기 위한 본 발명의 실시예에 따른 기밀문서 유출 방지 시스템의 구조를 첨부된 도면을 참조하여 설명하기로 한다. Next, a structure of a confidential document leakage prevention system according to an embodiment of the present invention for preventing leakage by monitoring and blocking the leakage of confidential documents using the language-based and code-based algorithm will be described with reference to the accompanying drawings. .

도 1은 본 발명의 실시예에 따른 기밀문서 유출 방지를 위한 시스템 구조를 도시한 구성도이다. 1 is a block diagram showing a system structure for preventing the leakage of confidential documents according to an embodiment of the present invention.

상기 도 1을 참조하면, 상기 정보 유출 방지 시스템은 크게 언어 기반(기계 학습)과, 비언어적인 코드 기반(핑거 프린트)의 기밀 인식 기술을 적용하며, 네트워크 내의 다수의 PC들(101a 내지 101n)과 연계하고, 상기 각 PC들(101a 내지 101 n)의 기밀문서들을 감시(데스크탑 감시 및 네트워크 감시) 및 유출되는 기밀문서를 차단하는 기밀문서 유출 방지 장치(110)를 포함한다. 이러한 기밀문서 유출 방지 장치에 대해 첨부된 도 2를 참조하여 구체적으로 설명하기로 한다. Referring to FIG. 1, the information leakage prevention system is largely based on language-based (machine learning) and non-verbal code-based (finger print) confidential recognition technology, and includes a plurality of PCs 101a to 101n in a network. And a confidential document leakage prevention apparatus 110 for interlocking and monitoring confidential documents of each of the PCs 101a to 101n and blocking leaked confidential documents. The confidential document leakage prevention apparatus will be described in detail with reference to FIG. 2.

상기 기밀문서 유출 방지 장치는 송/수신부(111)와, 감시 및 차단부(112)와, 제어부(113)와, 저장부(114) 및 정보 수집부(115)를 포함한다. The confidential document leakage prevention apparatus includes a transmission / reception unit 111, a monitoring and blocking unit 112, a control unit 113, a storage unit 114, and an information collecting unit 115.

상기 송/수신부(111)는 각 PC들(101a 내지 101n)의 기밀문서, 네트워크 전송 정보 및 입/출력(I/O) 정보 등 기밀 유출 방지에 관련된 모든 정보들을 송/수신한다. The transmission / reception unit 111 transmits / receives all information related to the prevention of confidential leakage such as confidential documents, network transmission information, and input / output (I / O) information of each of the PCs 101a to 101n.

상기 감시 및 차단부(112)는 상기 네트워크 단의 모든 I/O단 예를 들어, 상기 모든 PC들(101a 내지 101 n)로 입/출력되는 문서들을 실시간 감시하고, 기밀문서로 판정된 문서에 대한 기밀문서를 차단한다. The monitoring and blocking unit 112 monitors in real time the documents input / output to all the I / O terminals of the network, for example, all the PCs 101a to 101n, and checks the documents determined as confidential documents. Block confidential documents for

상기 제어부(113)는 상기 송/수신부(111)를 통해 수신된 문서들의 정보를 확인하여 기밀문서 여부를 판정하고, 언어기반 및 비언어기반의 알고리즘을 이용하여 기밀문서인지를 인식하기 위한 지식을 획득하고, 관련 모델을 생성한다. 여기서 상기 제어부(113)는 비언어기반의 알고리즘을 이용한 판정 시 고유 함수를 통해 100% 일치하는 문서만 검사하는 것이 아닌, 문서의 부분 삭제, 위치 수정과 같은 변경된 문서에 대해서도 판정을 한다. The controller 113 checks the information of the documents received through the transmitter / receiver 111 to determine whether it is a confidential document, and uses knowledge for recognizing whether it is a confidential document using language-based and non-language-based algorithms. Acquire and generate related models. In this case, the control unit 113 determines not only the documents that are 100% matched through the eigenfunctions but also the changed documents such as partial deletion and position correction when determining by using a non-language-based algorithm.

상기 저장부(114)는 상기 기밀문서 수동 등록 및 수신된 문서들의 정보를 관리하고, 상기 기밀문서인지를 위해 획득한 지식들 및 생성된 관련 모델을 저장한다. 또한, 저장부(114)는 해당 분야의 사전 및 기밀문서 핑거 프린트에 대한 정보를 저장한다. The storage unit 114 manages the information of the documents manually registered and received, and stores the acquired knowledge and the related model generated for the confidential document. In addition, the storage unit 114 stores information on dictionary and confidential document fingerprints in the corresponding field.

상기 정보 수집부(115)는 상기 각 PC들(101a 내지 101n)에서 새로 생성된 파일들의 정보를 수집하여 제어부(113)로 전달한다. The information collecting unit 115 collects information of newly generated files in each of the PCs 101a to 101n and transmits the collected information to the control unit 113.

이와 같은 구조를 갖는 기밀문서 유출 방지 장치에서 기밀 데이터에 대한 지식 습득 및 기밀문서 판정을 통해 기밀문서 유출을 방지하기 위한 방법에 대해 구체적으로 설명하기로 한다. In the confidential document leakage prevention apparatus having such a structure, a method for preventing the leakage of the confidential document through acquiring knowledge of the confidential data and determining the confidential document will be described in detail.

기밀문서 유출 방지 장치는 기밀문서 유출을 방지하기 위해 우선, 기밀문서 지식을 생성해야 하는데, 기밀문서 지식 생성은 구조화된 데이터와 비구조화된 데이터 모두에 대해 기밀문서를 인식할 수 있는 지식 습득을 의미한다. 이러한 기밀문서 지식 습득에 대한 과정을 첨부된 도면을 참조하여 설명하기로 한다. In order to prevent the leakage of confidential documents, the confidential document leakage prevention device must first generate the confidential document knowledge. The creation of the confidential document knowledge means the acquisition of knowledge that can recognize the confidential document for both structured and unstructured data. do. This process of acquiring knowledge of confidential documents will be described with reference to the accompanying drawings.

도 3은 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 기밀 데이터에 대한 지식 습득 과정을 도시한 흐름도이다. 3 is a flowchart illustrating a process of acquiring knowledge about confidential data in the apparatus for preventing the leakage of confidential documents according to an embodiment of the present invention.

상기 도 3을 참조하면, 201단계에서 기밀문서 유출 방지 장치는 정보 수집부(115)를 통해 기업 네트워크 내 모든 PC들(101a 내지 101n)에서 문서를 수집한다. 이후, 202단계에서 기밀문서 유출 방지 장치는 수집된 문서들을 문서의 타입(doc, pdf, hwp 등) 별로 분류하고, 203단계에서 분류된 파일을 아스키코드로 변환(ex. doc->txt)한다. 그런 다음 204단계에서 변환된 파일의 데이터를 문서 분류 기술을 이용하여 분야별로 분류한다. Referring to FIG. 3, in step 201, the confidential document leakage prevention apparatus collects documents from all PCs 101a through 101n in the enterprise network through the information collecting unit 115. Thereafter, in step 202, the confidential document leakage prevention apparatus classifies the collected documents according to document types (doc, pdf, hwp, etc.), and converts the classified files into ASCII codes (ex.doc-> txt) in step 203. . Then, in step 204, the data of the converted file is classified by field using document classification technology.

205단계에서 기밀문서 유출 방지 장치는 상기 분야별로 분류된 문서가 기밀문서인지를 확인하여 기밀문서인 경우 206단계로 진행하고, 그렇지 않은 경우 동작을 종료한다. In operation 205, the apparatus for preventing the leakage of confidential documents checks whether the documents classified by the field are confidential documents, and proceeds to step 206 when the classified documents are confidential documents, and ends the operation.

이후, 기밀문서 유출 방지 장치는 상기 기밀문서로 판정된 문서를 언어 기반 또는 비언어 기반 방식에 따라 즉, 언어 기반 또는 비언어 기반 기밀 탐지 알고리 즘을 이용하여 해당 모델들을 생성 및 갱신하게 된다. 따라서 206단계에서 기밀문서 유출 방지 장치는 상기 기밀문서가 새로운 기밀문서로서, 언어 기반 기밀 탐지 알고리즘을 이용하는 경우, 207단계에서 상기 기밀문서로 분류된 문서 중에서 새 단어를 추출하고, 208단계에서 사전 및 학습 모델을 생성 및 갱신한 다음 213단계로 진행한다. Thereafter, the confidential document leakage prevention device generates and updates the models determined as the confidential document in a language-based or non-language-based manner, that is, using a language-based or non-language-based confidential detection algorithm. Therefore, in step 206, when the confidential document is a new confidential document and uses a language-based confidential detection algorithm, the confidential document extraction apparatus extracts a new word from the documents classified as the confidential document in step 207, and in step 208, After creating and updating the learning model, proceed to step 213.

반면, 상기 206단계에서 상기 언어 기반 탐지 알고리즘을 이용하지 않는 경우, 209단계에서 기밀문서 유출 방지 장치는 비언어(코드) 기반 기밀 탐지 알고리즘을 이용할 것인지를 판단하여 비언어 기반 탐지 알고리즘을 이용하는 경우라면 210단계에서 등록된 기밀문서인지를 판단한다. 만약, 기존에 등록된 기밀문서인 경우 그대로 동작을 종료하고, 기존에 등록되지 않은 기밀문서인 경우 211단계에서 새로운 기밀문서의 핑거 프린트를 생성하고, 212단계에서 생성된 핑거 프린트를 핑거프린터 모델에 추가하여 상기 핑거 프린트 모델을 갱신한다. On the other hand, if the language-based detection algorithm is not used in step 206, the confidential document leakage prevention device determines whether to use a non-language (code) -based confidential detection algorithm in step 209 to use a non-language-based detection algorithm In step 210 it is determined whether the registered confidential document. If the previously registered confidential document, the operation is terminated as it is, and if the previously unregistered confidential document, the fingerprint of the new confidential document is generated in step 211, and the fingerprint generated in step 212 is applied to the fingerprint printer model. In addition, the fingerprint model is updated.

그런 다음 213단계에서 기밀문서 유출 방지 장치는 학습 모델 및 핑거 프린트 모델을 주기적으로 각 감시단으로 배포한다. Then, in step 213, the confidential document leakage prevention device periodically distributes the learning model and the fingerprint model to each monitoring group.

이와 같은 지식 습득 과정의 상기 204단계에서 분야별 데이터 분류는 예를 들어 하기 <표 1> 내지 <표 3>에 나타낸 바와 같을 수 있다. In the step 204 of the knowledge acquisition process, the data classification for each field may be, for example, as shown in Tables 1 to 3 below.

데이터 분류 방법How to classify your data 설명Explanation 구조화된 데이터Structured data 데이터베이스 파일과 같이 파일 구성이 규격화된 파일Files whose file organization is standardized, such as database files 비 구조화된 데이터Unstructured data 일반 문서 파일처럼 그 구성이 규격화되지 않은 파일Files whose configuration is not qualified, such as normal document files 관리되는 데이터Managed data 기업망 내부의 지정된 파일 서버에 수집, 관리되는 파일File collected and managed on designated file server inside corporate network 산재된 데이터Interspersed data 각 사용자 PC에 산재되어 있는 관리되지 않는 파일Unmanaged files scattered on each user's PC

상기 <표 1>에 나타낸 바와 같이, 상기 데이터 분류는 구조화된 데이터, 비 구조화된 데이터, 관리되는 데이터 및 산재된 데이터 등으로 분류될 수 있다. 여기서 상기 구조화된 데이터는 데이터베이스 파일과 같이 파일 구성이 규격화된 파일을 나타내고, 비 구조화된 데이터는 일반 문서 파일처럼 그 구성이 규격화되지 않은 파일을 나타낸다. 그리고 상기 관리되는 데이터는 기업망 내부의 지정된 파일 서버에 수집 및 관리되는 파일을 나타내고, 산재된 데이터는 각 사용자 PC에 산재되어 있는 관리되지 않은 파일을 나타낸다. As shown in Table 1, the data classification may be classified into structured data, unstructured data, managed data, and interspersed data. Herein, the structured data represents a file whose file structure is standardized, such as a database file, and the unstructured data represents a file whose structure is not standardized, such as a general document file. The managed data represents files collected and managed in a designated file server in an enterprise network, and the interspersed data represents unmanaged files scattered in each user PC.

파일 예제File example 구조화된 데이터Structured data 비 구조화된 데이터Unstructured data 관리되는 데이터Managed data 1) 기업 DB 데이터들1) Company DB Data 2) 파일 서버의 각종 문서.2) Various documents of file server. 산재된 데이터Interspersed data 3) 개인용 DB 데이터들3) Personal DB Data 4) 각 PC의 각종 문서들4) Documents of each PC

보안 난이도 (기존 시스템)Security Difficulty (Legacy System) 구조화된 데이터Structured data 비 구조화된 데이터Unstructured data 관리되는 데이터Managed data 가장 보안이 쉬움Most secure 기존 DRM 기반 보안 시스템Existing DRM-based Security System 산재된 데이터Interspersed data 기존 시스템 보안지원 안됨Existing system security not supported 기존 시스템 보안지원 안됨Existing system security not supported

상기 <표 2>에 나타낸 바와 같이, 첫 번째로 상기 관리되는 데이터이고 구조화된 데이터는 기업 DB 데이터들을 의미하고, 두 번째로 상기 관리되는 데이터이고 비 구조화된 데이터는 파일 서버의 각종 문서를 의미하고, 세 번째로 상기 산재된 데이터이고 구조화된 데이터는 개인용 DB 데이터들을 의미하고, 네 번째로 상기 산재된 데이터이고 비 구조화된 데이터는 각 PC의 각종 문서들을 의미한다. 이러한 경우 상기 <표 3>을 참조하여 기존 시스템의 보안 난이도를 살펴보면, 첫 번째의 경우 가장 쉽게 보안이 가능하고, 두 번째의 경우 기존 DRM 기반 보안 시스템을 이용하여 보안이 가능하며, 세 번째 및 네 번째 경우에는 기존 시스템으로는 보안이 불가능하다. As shown in Table 2, the first managed data and structured data refers to enterprise DB data, and the second managed data and unstructured data refers to various documents of a file server. Third, the interspersed and structured data refers to personal DB data, and fourth, the interspersed and unstructured data refers to various documents of each PC. In this case, referring to <Table 3>, the security difficulty of the existing system is described. In the first case, the security is most easily possible. In the second case, the security is possible using the existing DRM-based security system. In the second case, security is not possible with the existing system.

한편, 데이터의 상태는 크게 저장 중인 데이터(Data at rest), 사용 중인 데이터(Data in use), 이동 중인 데이터(Data in motion)로 구분할 수 있다. 이러한 저장 중인 데이터는 관리되는 데이터에 분류될 수 있으며, 나머지 사용 중인 데이터 및 이동 중인 데이터는 산재된 데이터에 분류될 수 있다. 따라서 기존의 DRM의 경우, 저장 중인 데이터는 기밀문서 유출이 차단이 가능하지만, 사용 중인 데이터 및 이동 중인 데이트는 차단이 불가능한 상태이다. On the other hand, the state of the data can be largely divided into data at rest, data in use, data in motion. This data in storage can be classified into managed data, and the remaining data in use and data in motion can be classified into interspersed data. Therefore, in the case of the existing DRM, it is possible to block the leakage of confidential documents, but the data in use and moving data cannot be blocked.

따라서 습득한 기밀문서 지식에 따라 구조화된 데이터는 물론 비구조화된 데이터 즉, 등록되지 않은 데이터들에 대해서도 감시하여 기밀문서의 유출을 차단할 수 있어야 한다. 그러므로 이하, 본 발명의 실시예에 따라 등록되지 않은 데이터들에 대해서도 감시 및 기밀 여부를 판정하여 유출을 차단하는 과정에 대해 설명하기로 한다. 그리고 상술한 바와 같은 지식 습득 방법도 언어 기반 및 비언어 기반에 따르므로 기밀정보 탐지 방법 또한 언어 기반 기밀정보 탐지 알고리즘과 비언어 기반 기밀문서 탐지 알고리즘을 이용하여 설명하기로 한다. Therefore, it is necessary to monitor the leakage of confidential documents by monitoring not only the structured data but also the unstructured data, that is, the unregistered data. Therefore, the following describes a process of blocking leakage by determining whether to monitor and confidentially even the unregistered data according to an embodiment of the present invention. In addition, since the knowledge acquisition method described above also depends on language-based and non-language-based methods, confidential information detection methods will also be described using language-based confidential information detection algorithms and non-language-based confidential document detection algorithms.

상기 사용 중인 데이터의 차단을 위해서는 완벽한 호스트 감시 에이전트 기술을 지원해야 한다. 이는 대부분의 정보 유출이 USB 복사, CD 복사, 프린팅 등으로 이루어지기 때문에 본 발명의 실시예에서는 운영체제 단에서 USB, CD, 프린트 요청 등을 가로채서 기밀문서 여부를 감시한다. 이때, 유출되는 파일은 등록된 기밀문서 뿐만 아니라 그 문서의 일부분 또는 변형본일 수 있기 때문에 본 발명의 실시예서는 파일 등록 여부에 관계없이 기밀문서 여부를 판정한다. 이를 위해 기밀문서 유출 방지 장치에서 감시 및 차단부(112)가 지원하는 모든 감시단의 위치에 대해 첨부된 도 4의 (b)를 참조하여 설명하기로 한다. In order to block the data in use, a complete host monitoring agent technology must be supported. This is because most of the information leakage is made by USB copy, CD copy, printing, etc. In the embodiment of the present invention, the operating system stage intercepts the USB, CD, print request, etc. and monitors the confidential document. In this case, the leaked file may be not only a registered confidential document but also a part or a modification of the document, and according to the exemplary embodiment of the present invention, whether the file is registered or not is determined as a confidential document. For this purpose, the location of all the monitoring units supported by the monitoring and blocking unit 112 in the confidential document leakage prevention apparatus will be described with reference to FIG. 4 (b).

상기 감시 및 차단부(112)는 321단계에서 기업 내부의 모든 PC에 보안 에이전트 설치를 하고, 322단계 모든 PC에서 데이터 유출입 감시한다. 구체적으로 323단계 내지 325단계와 같이, CD 저장 과정 감시, USB 저장 과정 감시, 파일 저장 과정 감시한다. 그런 다음 이러한 감시 결과를 통해 상기 감시 및 차단부(112)는 326단계에서 기밀문서 판정 시 해당 세션을 차단 및 기록 저장한다. The monitoring and blocking unit 112 installs a security agent on all PCs inside the enterprise in step 321, and monitors data leakage and inflow in all PCs in step 322. In more detail, as in steps 323 to 325, the CD storage process monitoring, the USB storage process monitoring, and the file storage process monitoring are performed. Then, through the monitoring result, the monitoring and blocking unit 112 blocks and records the session when determining the confidential document in step 326.

한편, 상기 이동 중인 데이터의 차단을 위해서는 실시간 패킷 캡처링 기술과 고성능 게이트웨이 형태의 제품을 제공할 수 있다. 만약, 기밀문서가 이메일, 웹 트래픽, FTP, P2P 등과 같은 네트워크를 통해 외부로 유출되는 경우 이를 실시간으로 탐지하고 차단하기 위해서는 기업 네트워크의 관문(Ingress/Egress) 단에서 게이트웨이를 설치하고, 이동 중인 트래픽의 기밀 여부를 판정, 차단할 수 있으며, 등록되지 않은 파일도 기밀 여부를 판정할 수 있다. 이를 위해 기밀문서 유출 방지 장치에서 감시 및 차단부(112)가 지원하는 모든 감시단의 위치에 대해 첨부된 도 4 (a)를 참조하여 설명하기로 한다.  Meanwhile, in order to block the moving data, a real time packet capturing technology and a high performance gateway type product may be provided. If a confidential document is leaked to the outside through a network such as email, web traffic, FTP, P2P, etc. in order to detect and block in real time, install a gateway at the ingress / egress stage of the corporate network, It is possible to determine whether or not the confidentiality of the file, and also to determine whether or not confidential files. For this purpose, the location of all the monitoring units supported by the monitoring and blocking unit 112 in the confidential document leakage prevention apparatus will be described with reference to FIG. 4 (a).

상기 감시 및 차단부(112)는 321단계에서 Ingress/Egress 포인트에 게이트웨이를 설치한다. 이에 따라 312단계에서 모든 네트워크 단에서의 데이터 유출입을 감시한다. 그리고 313단계 내지 315단계에서 감시 및 차단부(112)는 계층 7(Layer 7)까지 모든 트래픽의 데이터 분석, HTTP, FTP, 메신저 등 각종 응용 트래픽 분석, 이메일의 첨부 파일 분석을 수행한다. 이렇게 분석된 결과를 통해 316단계에서 상기 감시 및 차단부(112)는 기밀문서 판정 시 해당 세션 차단 및 기록 저장을 수행한다. The monitoring and blocking unit 112 installs a gateway at an ingress / egress point in step 321. Accordingly, in step 312, data leakage of all network ends is monitored. In steps 313 to 315, the monitoring and blocking unit 112 analyzes data of all traffic up to Layer 7, analyzes various application traffic such as HTTP, FTP, and messenger, and analyzes attachments of email. Based on the analysis result, in step 316, the monitoring and blocking unit 112 performs blocking and recording of the corresponding session when determining a confidential document.

그러면 이와 같은 감시 및 분석에 따른 기밀문서 판정 과정에 대해 언어 기반 및 비언어 기반 방식으로 구분하여 첨부된 도면들을 참조하여 설명하기로 한다. Then, the confidential document determination process according to the monitoring and analysis will be described with reference to the accompanying drawings by dividing into a language-based and a non-language-based manner.

도 5는 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 언어기반 기밀문서 판정 과정을 도시한 흐름도이고, 도 6은 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 비언어 기반 기밀문서 판정 과정을 도시한 흐름도이다. 5 is a flowchart illustrating a process of determining a language-based confidential document in the apparatus for preventing the leakage of confidential documents according to an embodiment of the present invention, and FIG. 6 is a non-language-based classified document determination in the apparatus for preventing the leakage of confidential documents according to an embodiment of the present invention. It is a flow chart showing the process.

우선, 언어 기반 방식은 분류학(Taxonomy)의 원리를 이용하여 각 분야에 대표적인 단어들의 조합을 통해서 문서의 문맥을 파악, 해당 문서가 기술하는 분야를 판정하는 방법이다.First, the language-based method uses the principle of taxonomy to grasp the context of a document through a combination of words representative of each field, and to determine the field described by the document.

상기 도 5를 참조하면, 이러한 언어 기반에 따른 기밀문서 탐지를 위해 기밀문서 유출 방지 장치는 410단계에서 시스템 도입 초기에 해당 기업의 기밀문서 예제를 수집한다. 이와 함께 기밀문서 유출 방지 장치는 비 기밀문서도 수집한다. Referring to FIG. 5, in order to detect a confidential document based on the language, the apparatus for preventing the leakage of a confidential document collects an example of a confidential document of the corresponding company at the beginning of the system introduction in step 410. In addition, the confidential document leakage prevention device also collects non-confidential documents.

그러면 420단계에서 기밀문서 유출 방지 장치는 수집된 문서를 분석하여 통계 사전을 구축하고, 430단계에서 기밀문서에 자주 등장하는 단어로 단어 리스트를 구축한다. 즉, 해당 분야의 고유한 사전을 구축하는데, 예를 들어 제약 회사인 경우 문서에 질병명이나 제약 관련 화학 약품 명칭을 많이 포함하고 있을 것이므로 기밀문서 유출 방지 장치는 일반적인 문서에 포함되는 일상 단어들은 모두 제거하고 해당 회사에서 많이 쓰이는 단어들을 선별해서 사전을 구축한다. Then, in step 420, the confidential document leakage prevention device analyzes the collected documents to build a statistical dictionary, and in step 430, a word list is constructed of words frequently appearing in the confidential documents. In other words, it creates a unique dictionary in the field. For example, a pharmaceutical company may contain many disease names or pharmaceutical-related chemical names in a document, so the leak prevention device removes all the daily words contained in the general document. Then build a dictionary by selecting words that are used a lot in the company.

이후 440단계에서 기밀문서 유출 방지 장치는 기계학습 알고리즘을 이용하여 문서에 단어가 포함된 정도를 기준으로 기밀문서인지를 판정할 수 있는 확률 모델(예를 들어 TFIDF 등)을 생성한다. 그러면 450단계에서 기밀문서 유출 방지 장치는 상기 생성된 확률 모델을 이용하여 각종 I/O단에서 문서 전송이 탐지되는 경우 전송될 문서가 기밀문서인지를 판정한다. 이러한 확률 모델은 사용자의 요청에 따라 갱신될 수 있다. 예들 들어, 신상품이 개발되어 새로운 용어들이 많이 추가될 경우 예제 문서를 새로 수집하여 사전을 갱신하고, 기계학습 과정을 새로 수행하여 확률 모델을 갱신할 수 있다. Thereafter, in step 440, the apparatus for preventing leakage of confidential documents generates a probability model (for example, TFIDF) capable of determining whether the confidential document is a confidential document based on the degree of the word included in the document using a machine learning algorithm. Then, in operation 450, the apparatus for preventing leakage of confidential documents determines whether a document to be transmitted is a confidential document when document transmission is detected at various I / O stages using the generated probability model. This probability model can be updated at the request of the user. For example, if a new product is developed and a lot of new terms are added, a new example document may be collected to update the dictionary, and a new machine learning process may be performed to update the probability model.

다음으로, 비언어 기반 방식은 미리 기밀문서를 학습시켜서 기밀문서들의 핑거프린트를 확보한다. 이러한 핑거프린트는 언어 정보에 기반을 둔 것이 아니라 이진 코드에 기반을 둔 것으로 내용 일부의 추가, 삭제, 위치 변경과 같은 문서의 유형에 상관없이 동일 문서 인식이 가능하다. Next, the non-language-based scheme learns confidential documents in advance to secure fingerprints of confidential documents. These fingerprints are not based on language information, but based on binary code, and can recognize the same document regardless of the type of document such as adding, deleting, or repositioning a part of the content.

상기 도 6을 참조하면, 510단계에서 기밀문서 유출 방지 장치는 기밀문서를 수집한다. 이후, 기밀문서 유출 방지 장치는 비언어 기반의 기밀문서 탐지를 위해 관리되는 기밀문서에 대해서 주기적으로 해쉬키(hash key) 등록을 수행해야 한다. 따라서 520단계에서 기밀문서 유출 방지 장치는 기밀문서를 해쉬 함수에 입력하고, 530단계에서 기밀문서에 해당하는 해쉬 키를 반환한다. Referring to FIG. 6, in operation 510, the apparatus for preventing the leakage of confidential documents collects confidential documents. Afterwards, the confidential document leakage prevention device should periodically perform hash key registration on the confidential document managed for non-verbal based secret document detection. Therefore, in operation 520, the apparatus for preventing leakage of confidential documents inputs a confidential document into a hash function, and returns a hash key corresponding to the confidential document in operation 530.

그런 다음 540단계에서 기밀문서 유출 방지 장치는 기밀문서들의 해쉬 키들을 모아놓은 집합 파일 즉, 해쉬 리스트를 생성하여 주기적으로 각 검사단에 배포한 후, 550단계에서 해쉬 리스트를 이용하여 기밀 파일 여부를 검사한다. Then, in step 540, the apparatus for preventing the leakage of confidential documents generates a set file that collects hash keys of confidential documents, that is, a hash list, and periodically distributes them to each inspection unit. Check it.

따라서 이러한 비언어 기반 방식에서 기밀문서 유출 방지 장치는 핑거 프린트 함수(해쉬 함수)를 이용하여 원본 문서와 100% 일치해야 동일 문서인지를 인식하는 것이 아닌, 문서의 변형에 상관없이 같은 내용을 포함하고 있는지를 인식할 수 있다. 예를 들어, 문서의 일부분이 삭제되어 있거나, 문서의 두 부분이 위치가 변경되는 경우라도 같은 문서의 변형본인지를 탐지할 수 있다.Therefore, in this non-language-based approach, the confidential document leakage prevention device uses the fingerprint function (hash function) to recognize the same document only when it is 100% identical to the original document. You can recognize if it exists. For example, it is possible to detect whether a part of a document is deleted or if two parts of a document are changed in position, even if they are variations of the same document.

그러면 상술한 바와 같은 언어 기반 방식과 비언어 기반 방식을 혼용하는 경우의 과정을 도면을 참조하여 설명하기로 한다. Next, a process in the case of using the above-described language-based method and a non-language-based method will be described with reference to the drawings.

도 7은 본 발명의 실시예에 따라 기밀문서 유출 방지 장치에서 두 가지 기밀문서 판정 알고리즘의 적용 과정을 도시한 흐름도이다. 7 is a flowchart illustrating an application process of two confidential document determination algorithms in the apparatus for preventing the leakage of confidential documents according to an embodiment of the present invention.

상기 도 7을 참조하면, 601단계에서 기밀문서 유출 방지 장치는 상기 도 6에서 설명한 바와 같이, 비언어 기반 검사를 수행한 후 602단계에서 기밀문서 파일인지를 확인한다. 확인 결과, 기밀문서 파일인 경우 603단계에서 기밀문서 유출 방지 장치는 작업을 차단하고, 사용자의 기밀문서 유출 행위에 대한 로그 정보를 저장한 후 607단계로 진행한다. Referring to FIG. 7, in operation 601, the apparatus for preventing the leakage of confidential documents checks whether a confidential document file is performed in step 602 after performing a non-verbal based inspection as described in FIG. 6. As a result of the check, in the case of the confidential document file, the confidential document leakage prevention device blocks the operation in step 603, stores log information on the user's confidential document leakage behavior, and proceeds to step 607.

반면, 비언어 기반 방식의 기밀문서 파일이 아닌 경우, 604단계에서 기밀문서 유출 방지 장치는 상기 도 5에서 설명한 바와 같이, 언어 기반 방식의 검사를 수행하여 605단계에서 기밀문서 파일인지를 확인하다. 확인결과, 기밀문서 파일이 아닌 경우 다시 601단계로 진행하여 대기 상태를 유지한다. 반면, 언어 기반 방식의 기밀문서 파일인 경우 606단계에서 기밀정보 유출 방지 장치는 작업을 차단하고, 사용자의 기밀문서 유출 행위에 대한 로그 정보를 저장한다. On the other hand, if the non-language-based confidential document file, in step 604, the confidential document leakage prevention device performs a language-based inspection, as described above in Figure 5 to determine whether the confidential document file in step 605. As a result of the check, if the file is not a confidential document, the process proceeds back to step 601 to maintain the standby state. On the other hand, in the case of a language-based confidential document file, in step 606, the confidential information leakage prevention device blocks a job and stores log information on the user's confidential document leakage behavior.

그런 다음 607단계에서 기밀문서 유출 방지 장치는 보안 서버로 새로 탐지된 기밀문서 파일을 전송하고, 608단계에서 상기 도 5에서 설명한 바와 같이, 구축된 사전 및 판정 모델을 갱신한다. Then, in step 607, the confidential document leakage prevention apparatus transmits the newly detected confidential document file to the security server, and in step 608, the established dictionary and decision model are updated.

이와 같이 언어 기반, 비언어 기반의 두 가지 기밀 탐지 알고리즘은 검사단의 상황에 따라 각각 이용하거나 혼용하여 이용할 수 있다. 예를 들어 상기 <표 2>의 첫 번째 및 두 번째 경우와 같이, 기업 내부망의 파일 서버에 설치된 감시단이라면 저장된 파일들이 모두 등록된 기밀문서이므로 비언어 기반 알고리즘만 적용하고, 세 번째 및 네 번째 경우와 같이, 일반 PC의 검사단이라면 등록되지 않은 기밀문서가 산재되어 있으므로 두 알고리즘 모두를 적용해야 한다. As such, the two language-based and non-language-based confidential detection algorithms can be used or mixed depending on the situation of the inspection team. For example, as in the first and second cases of <Table 2>, if the monitoring group is installed on the file server of the corporate internal network, only the non-language-based algorithm is applied because the stored files are all registered confidential documents. As in the case of general PC inspection team, there are scattered confidential documents, so both algorithms should be applied.

상술한 바와 같이 언어 기반, 비언어 기반의 두 가지 기밀 탐지 알고리즘을 이용하여 기밀문서를 감시함에 따라 기밀문서 유출 방지 장치는 기밀문서 유출을 인식 즉, 판정할 수 있다. 이러한 기밀문서 유출 인식을 위해 기밀문서 유출 방지 장치는 상술한 바와 같은 기밀문서 지식 습득 과정을 통해 확보한 지식을 기반으로 하여 실시간으로 감시 대상에 대한 검사를 수행한다. As described above, as the confidential document is monitored using two language-based and non-language-based confidential detection algorithms, the apparatus for preventing the leakage of the confidential document may recognize or determine the leakage of the confidential document. In order to recognize the confidential document leakage, the confidential document leakage prevention device performs inspection on a monitoring target in real time based on the knowledge obtained through the process of acquiring the confidential document knowledge as described above.

따라서 이러한 기밀문서 유출 감시는 사용자의 컴퓨팅 환경에 영향을 최소화하면서 실시간으로 수행할 수 있고, 네트워크 트래픽 감시의 경우에는 트래픽 양의 변화에 관계없이 일정한 성능을 보일 수 있다. Therefore, such confidential document leakage monitoring can be performed in real time with minimal impact on the user's computing environment, and in the case of network traffic monitoring, it can show a constant performance regardless of the change in traffic volume.

또한, 본 발명의 실시예에서는 상기 도 5 내지 도 7에서 설명한 바와 같은 과정들을 유기적으로 결합시켜서 시너지 효과를 얻을 수 있는 정책 기반 보안 체계를 구축할 수 있다. 더욱이, 본 발명의 실시예에서는 비언어 기반 탐지 알고리즘을 통해 사용 언어에 상관없이 기밀문서를 파악할 수 있으므로 다른 언어를 사용하는 시스템 구축도 가능하다. In addition, in the embodiment of the present invention, it is possible to construct a policy-based security system that can achieve synergistic effects by organically combining the processes described in FIG. 5 to FIG. Furthermore, in the embodiment of the present invention, since a confidential document can be identified regardless of a language using a non-language-based detection algorithm, it is possible to construct a system using another language.

한편, 본 발명의 상세한 설명에서는 구체적인 실시 예에 관하여 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 안되며 후술하는 발명청구의 범위뿐만 아니라 이 발명청구의 범위와 균등한 것들에 의해 정해져야 한다.Meanwhile, in the detailed description of the present invention, specific embodiments have been described, but various modifications are possible without departing from the scope of the present invention. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the scope of the following claims, but also by the equivalents of the claims.

상술한 바와 같이 본 발명은 언어 기반 및 비언어 기반의 탐지 알고리즘을 적용함으로써 데이터 내용을 확인하는 선별적 감시 체계 구축이 가능하며, 기존에 감시하지 못했던 산재되어 있는 데이터(등록되지 않은 기밀문서)도 감시 및 실시간 차단할 수 있는 효과가 있다. As described above, the present invention enables the construction of a selective monitoring system for confirming the data content by applying language-based and non-language-based detection algorithms, and scattered data (unregistered confidential documents) that were not previously monitored. It has the effect of monitoring and blocking in real time.

또한, 본 발명은 무조건적인 사용 금지 조치나 보안사고 발생 후 로그 파일을 통한 사후 추적이 아닌 사용자가 모든 I/O 작업을 불편함이 없이 그대로 사용할 수 있고, 보안 관리자가 실시간 감시 및 추적이 가능한 보안 체계를 구축할 수 있는 효과가 있다. In addition, the present invention can be used as a user without any inconvenience, without any post-tracking through the log file after unconditional prohibition measures or security incidents without any inconvenience, the security administrator can monitor and track in real time It has the effect of establishing a system.

Claims (20)

지원하는 모든 감시단으로부터 문서를 수집하는 과정과, The process of collecting documents from all supporting watchdogs, 상기 수집된 기밀문서 중에서 등록된 문서 및 등록되지 않은 문서 모두에 대해 기밀문서 여부를 인식하기 위한 기밀문서 지식을 습득하는 과정과, Acquiring a confidential document knowledge for recognizing a confidential document for both registered and unregistered documents among the collected confidential documents; 상기 기밀문서 지식의 습득에 따라 해당 기밀 탐지 알고리즘을 기반으로 기밀문서를 감시 및 판정하는 과정과, Monitoring and determining a confidential document based on the confidentiality detection algorithm according to the acquisition of the confidential document knowledge; 상기 판정된 기밀문서를 차단하는 과정을 포함하는 것을 특징으로 하는 기밀문서 유출 방지 방법.Method of preventing the leakage of confidential documents comprising the step of blocking the determined confidential document. 제1항에 있어서, 상기 기밀문서를 감시 및 판정하는 과정은,The method of claim 1, wherein the monitoring and determining of the confidential document comprises: 상기 기밀문서 지식의 습득에 따른 감시 대상에 저장된 파일이 모두 등록된 문서인 경우 비언어 기반의 기밀 탐지 알고리즘을 이용하여 기밀문서를 감시 및 판정함을 특징으로 하는 기밀문서 유출 방지 방법. If all files stored in the monitoring target according to the acquisition of the confidential document knowledge is a registered document, a confidential document leakage prevention method characterized in that for monitoring and determining the confidential document using a non-language-based secret detection algorithm. 제1항에 있어서, 상기 기밀문서를 감시 및 판정하는 과정은, The method of claim 1, wherein the monitoring and determining of the confidential document comprises: 상기 기밀문서 지식의 습득에 따른 감시 대상에 저장된 파일이 등록되지 않은 문서인 경우 언어 기반 및 비언어 기반의 기밀 탐지 알고리즘을 이용하여 기밀문서를 감시 및 판정함을 특징으로 하는 기밀문서 유출 방지 방법. If the file stored in the monitoring target according to the acquisition of the confidential document knowledge is a document that is not registered, the confidential document leakage prevention method characterized in that for monitoring and determining the confidential document using a language-based and non-language-based secret detection algorithm. 제1항에 있어서, 상기 기밀문서 지식을 습득하는 과정은, The method of claim 1, wherein the process of acquiring knowledge of the confidential document comprises: 상기 수집된 문서를 타입별로 분류하는 단계와, Classifying the collected documents by type; 상기 분류된 파일을 코드 변환하는 단계와, Transcoding the classified file; 상기 변환된 파일의 데이터를 분야별로 분류하는 단계와, Classifying the data of the converted file by field; 상기 분야별 분류된 데이터를 언어 기반 또는 비언어 기반에 따른 모델을 생성 및 갱신하는 단계와, Generating and updating a model based on the field-classified data based on language or non-language; 상기 생성된 모델을 주기적으로 상기 각 검사단에 배포하는 단계를 포함하는 것을 특징으로 하는 기밀문서 유출 방지 방법. And distributing the generated model to each of the inspection units periodically. 제4항에 있어서, 상기 언어 기반에 따른 모델을 생성하는 단계는, The method of claim 4, wherein the generating of the model based on the language comprises: 임의의 검사 대상의 예제 문서들을 수집하는 단계와, Collecting example documents of any inspection object; 상기 수집된 문서들에서 기술하는 해당 분야의 통계 사전을 구축하는 단계와, Constructing a statistical dictionary for the field described in the collected documents; 상기 수집된 문서들에서 상기 통계 사전을 이용하여 상기 해당 분야에서 자주 쓰이는 단어들을 선별하여 단어 리스트를 생성하는 단계와, Generating a word list by selecting words frequently used in the corresponding field using the statistical dictionary from the collected documents; 상기 단어 리스트에서 상기 선별된 단어가 포함된 확률에 따른 학습 모델을 생성하는 단계를 포함하는 것을 특징으로 하는 기밀문서 유출 방지 방법. And generating a learning model according to a probability that the selected word is included in the word list. 제4항에 있어서, 상기 비언어 기반에 따른 모델을 생성하는 단계는, The method of claim 4, wherein generating the non-verbal based model comprises: 저장된 기밀문서들을 수집하는 단계와, Collecting stored confidential documents; 상기 수집된 기밀문서들을 해쉬 함수에 각각 입력하는 단계와, Inputting the collected confidential documents into a hash function, respectively; 상기 기밀문서들에 해당하는 해쉬 키를 반환하여 해쉬 키 등록을 수행하는 단계와, Performing hash key registration by returning hash keys corresponding to the confidential documents; 상기 기밀문서들의 해쉬 키를 모아서 해쉬 리스트를 생성하는 단계와, Generating a hash list by collecting hash keys of the confidential documents; 상기 생성된 해쉬 리스트를 통해 핑거 프린트 모델을 생성하는 단계를 포함하는 것을 특징으로 하는 기밀문서 유출 방지 방법. And generating a fingerprint model through the generated hash list. 제2항에 있어서, 상기 기밀문서를 감시 및 판정하는 과정은, The method of claim 2, wherein the monitoring and determining of the confidential document comprises: 상기 비언어 기반 기밀 탐지 알고리즘을 이용하는 경우, 상기 기밀문서 지식의 습득에 따라 생성된 모델이 각 감시단에 배포되면 상기 각 감시단으로 유출되는 문서를 감시하는 단계와,In the case of using the non-language-based confidential detection algorithm, if the model generated according to the knowledge of the confidential document is distributed to each monitoring step, monitoring the documents leaked to each monitoring step; 상기 생성된 모델의 해쉬 리스트를 이용하여 상기 유출되는 문서가 기밀문서인지를 판정하는 단계를 포함하는 것을 특징으로 하는 기밀문서 유출 방지 방법.And determining whether the leaked document is a confidential document by using the generated hash list of the model. 제3항에 있어서, 상기 기밀문서를 감시 및 판정하는 과정은, The method of claim 3, wherein the monitoring and determining of the confidential document comprises: 상기 언어 기반 기밀 탐지 알고리즘을 이용하는 경우, 상기 기밀문서 지식의 습득에 따라 생성된 모델이 각 감시단에 배포되면 상기 각 감시단으로 유출되는 문서를 감시하는 단계와,In the case of using the language-based confidentiality detection algorithm, if the model generated according to the knowledge of the confidential document is distributed to each monitoring step, monitoring the documents leaked to each monitoring step; 상기 생성된 모델의 해쉬 리스트를 이용하여 상기 유출되는 문서가 기밀문서인지를 판정하는 단계를 포함하는 것을 특징으로 하는 기밀문서 유출 방지 방법.And determining whether the leaked document is a confidential document by using the generated hash list of the model. 제1항에 있어서, 상기 기밀문서를 감시하는 과정은 The method of claim 1, wherein the monitoring of the confidential document comprises 상기 감시단이 네트워크 감시단인 경우, 모든 네트워크 감시단에서 계층 7까지의 모든 트래픽의 데이터 분석, 응용 트래픽 분석 및 이메일의 첨부 파일 분석을 통한 감시함을 특징으로 하는 기밀문서 유출 방지 방법. If the monitoring unit is a network monitoring unit, confidential network leakage prevention method characterized in that the monitoring through the data analysis, application traffic analysis and email attachment analysis of all traffic up to layer 7 in all network monitoring. 제1항에 있어서, 상기 기밀문서를 감시하는 과정은, The method of claim 1, wherein the monitoring of the confidential document comprises: 상기 감시단이 데스크탑(PC) 감시단인 경우, 모든 PC에서 데이터 유출입을 감시하며, 씨디(CD) 저장 과정, 유에스비(USB) 저장 과정, 파일 저장 과정을 감시함을 특징으로 하는 기밀문서 유출 방지 방법. When the monitoring unit is a desktop (PC) monitoring unit, the leakage of confidential documents, characterized in that to monitor the data flow in and out of all PC, CD (CD) storage process, USB storage process, file storage process. 지원하는 모든 감시단으로부터 문서를 수집하는 문서 수집부와, A document collection unit that collects documents from all supporting monitors; 상기 수집된 기밀문서 중에서 등록된 문서 및 등록되지 않은 문서 모두에 대해 기밀문서 여부를 인식하기 위한 기밀문서 지식을 습득하고, 상기 기밀문서 지식의 습득에 따라 해당 기밀 탐지 알고리즘을 기반으로 기밀문서 여부를 판정하는 제어부와, Acquire confidential document knowledge for recognizing the confidential document for both registered and unregistered documents among the collected confidential documents, and whether the confidential document is based on the corresponding confidentiality detection algorithm according to the acquisition of the confidential document knowledge. A control unit to determine, 상기 기밀문서 지식의 습득에 따라 상기 모든 감시단에서 문서의 유출을 감시하고, 상기 제어부에서 판정된 기밀문서를 차단하는 감시 및 차단부와, A monitoring and blocking unit for monitoring the leakage of documents by all the monitoring units according to the acquisition of the confidential document knowledge, and blocking the confidential documents determined by the control unit; 정보 및 습득한 기밀문서 지식 및 상기 기밀문서 지식의 습득에 따라 생성된 모델에 대한 정보를 저장하는 저장부를 포함하는 것을 특징으로 하는 기밀문서 유 출 방지 장치.And a storage unit for storing the information, the acquired confidential document knowledge, and the information about the model generated according to the acquisition of the confidential document knowledge. 제11항에 있어서, The method of claim 11, 상기 제어부는 상기 기밀문서 지식의 습득에 따른 감시 대상에 저장된 파일이 모두 등록된 문서인 경우, 비언어 기반의 기밀 탐지 알고리즘을 이용하여 기밀문서를 판정함 여부를 특징으로 하는 기밀문서 유출 방지 장치.And the controller determines whether a confidential document is determined using a non-language-based confidentiality detection algorithm when all files stored in the monitoring target according to the knowledge of the confidential document are registered. 제11항에 있어서, The method of claim 11, 상기 제어부는 상기 기밀문서 지식의 습득에 따른 감시 대상에 저장된 파일이 등록되지 않은 문서인 경우 언어 기반 및 비언어 기반의 기밀 탐지 알고리즘을 이용하여 기밀문서 여부를 판정함을 기밀문서 유출 방지 장치. And the controller determines whether a confidential document is classified using a language-based or non-language-based confidentiality detection algorithm when the file stored in the monitoring target according to the knowledge of the confidential document is not registered. 제11항에 있어서, The method of claim 11, 상기 제어부는 상기 수집부에서 수집된 문서들을 전달받아 타입별로 분류하고, 상기 분류된 파일을 코드 변환하여 변환된 파일의 데이터를 분야별로 분류하고, 상기 분야별로 분류된 데이터를 언어 기반 또는 비언어 기반에 따른 모델을 생성 및 갱신하여 주기적으로 상기 각 검사단에 배포함을 특징으로 하는 기밀문서 유출 방지 장치. The controller receives the documents collected by the collection unit, classifies the data by type, classifies the data of the converted file by code conversion of the classified file, and classifies the data classified by the field based on language or non-language. A device for preventing the leakage of confidential documents, characterized in that to generate and update the model according to the distribution periodically to each of the inspection stage. 제14항에 있어서, The method of claim 14, 상기 제어부는 상기 언어 기반에 따른 모델을 생성하는 경우, 상기 문서 수집부를 통해 수집된 임의의 검사 대상의 예제 문서들에서 기술하는 해당 분야의 통계 사전을 구축하고, 상기 통계 사전을 이용하여 상기 해당 분야에서 자주 쓰이는 단어들을 선별하여 단어 리스트를 생성하고, 생성된 단어 리스트에서 상기 선별된 단어가 포함된 확률에 따른 학습 모델을 생성하는 단계를 포함하는 것을 특징으로 하는 기밀문서 유출 방지 장치. When the controller generates the model based on the language, the controller constructs a statistical dictionary of the corresponding field described in the example documents of the inspection target collected through the document collecting unit, and uses the statistical dictionary to build the statistical dictionary. And generating a word list by selecting frequently used words from the generated word list, and generating a learning model according to a probability that the selected word is included in the generated word list. 제14항에 있어서, The method of claim 14, 상기 제어부는 상기 비언어 기반에 따른 모델을 생성하는 경우, 상기 문서 수집부에서 수집된 기밀문서들을 해쉬 함수에 각각 입력하고, 상기 기밀문서들에 해당하는 해쉬 키를 반환하여 해쉬 키를 등록하고, 상기 기밀문서들의 해쉬 키를 모아서 구축한 해쉬 리스트를 갖는 핑거 프린트 모델을 생성함을 특징으로 하는 기밀문서 유출 방지 장치. When generating the non-verbal based model, the controller inputs the confidential documents collected by the document collecting unit to a hash function, registers the hash keys by returning hash keys corresponding to the confidential documents, And a fingerprint print model having a hash list constructed by collecting hash keys of the confidential documents. 제11항에 있어서, The method of claim 11, 상기 감시 및 차단부는 상기 감시단이 네트워크 감시단인 경우, 모든 네트워크 감시단에서 계층 7까지의 모든 트래픽의 데이터 분석, 응용 트래픽 분석 및 이메일의 첨부 파일 분석을 통한 감시함을 특징으로 하는 기밀문서 유출 방지 장치.The monitoring and blocking unit, when the monitoring unit is a network monitoring unit, the confidential document leakage prevention device, characterized in that for monitoring through the data analysis, application traffic analysis and email attachment analysis of all traffic up to layer 7 in all network monitoring. 제17항에 있어서, The method of claim 17, 상기 감시단이 상기 네트워크 감시단인 경우, 모든 네트워크 감시단의 입/출입 포인트는 게이트웨이를 구비함을 특징으로 하는 기밀문서 유출 방지 장치. When the monitoring unit is the network monitoring unit, all the network entry and exit points of the security terminal characterized in that it comprises a gateway. 제11항에 있어서, The method of claim 11, 상기 감시 및 차단부는 상기 감시단이 데스크탑(PC) 감시단인 경우, 모든 PC에서 데이터 유출입을 감시하며, 씨디(CD) 저장 과정, 유에스비(USB) 저장 과정, 파일 저장 과정을 감시함을 특징으로 하는 기밀문서 유출 방지 장치. When the monitoring unit is a desktop (PC) monitoring unit, the monitoring and blocking unit monitors data flow in and out of all PCs, and monitors a CD storage process, a USB storage process, and a file storage process. Document leakage prevention device. 제19항에 있어서, The method of claim 19, 상기 감시단이 상기 데스크 탑 감시단인 경우, 모든 데스크 탑(PC)은 보안 에이전트를 구비함을 특징으로 하는 기밀문서 유출 방지 장치. When the monitoring unit is the desktop monitoring unit, all the desktop (PC) has a security document leakage prevention device, characterized in that it comprises a security agent.
KR1020060096436A 2006-09-29 2006-09-29 Method and device for preventing the leakage of confidential documents Active KR100882349B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060096436A KR100882349B1 (en) 2006-09-29 2006-09-29 Method and device for preventing the leakage of confidential documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060096436A KR100882349B1 (en) 2006-09-29 2006-09-29 Method and device for preventing the leakage of confidential documents

Publications (2)

Publication Number Publication Date
KR20080029602A true KR20080029602A (en) 2008-04-03
KR100882349B1 KR100882349B1 (en) 2009-02-12

Family

ID=39532141

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060096436A Active KR100882349B1 (en) 2006-09-29 2006-09-29 Method and device for preventing the leakage of confidential documents

Country Status (1)

Country Link
KR (1) KR100882349B1 (en)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010011691A3 (en) * 2008-07-21 2010-04-22 Workshare Technology, Inc. Methods and systems to fingerprint textual information using word runs
WO2010030871A3 (en) * 2008-09-11 2010-06-17 Workshare Technology, Inc. Methods and systems to implement fingerprint lookups across remote agents
WO2011027976A3 (en) * 2009-09-03 2011-04-28 (주)잉카인터넷 Method for blocking the execution of a hacking process
KR101158797B1 (en) * 2010-04-28 2012-06-26 경기대학교 산학협력단 Apparatus and Method for preventing leakage of secret data
US8406456B2 (en) 2008-11-20 2013-03-26 Workshare Technology, Inc. Methods and systems for image fingerprinting
EP2975547A1 (en) 2014-07-17 2016-01-20 Electronics and Telecommunications Research Institute Method and apparatus for preventing illegitimate outflow of electronic document
US9613340B2 (en) 2011-06-14 2017-04-04 Workshare Ltd. Method and system for shared document approval
KR20180018238A (en) 2016-08-10 2018-02-21 숭실대학교산학협력단 Method and apparatus for determining information leakage risk
US9948676B2 (en) 2013-07-25 2018-04-17 Workshare, Ltd. System and method for securing documents prior to transmission
US10025759B2 (en) 2010-11-29 2018-07-17 Workshare Technology, Inc. Methods and systems for monitoring documents exchanged over email applications
KR20190061831A (en) * 2017-11-28 2019-06-05 (주)소만사 System and method of detecting confidential information based on 2-tier for endpoint DLP
US10783326B2 (en) 2013-03-14 2020-09-22 Workshare, Ltd. System for tracking changes in a collaborative document editing environment
US10911492B2 (en) 2013-07-25 2021-02-02 Workshare Ltd. System and method for securing documents prior to transmission
US10963584B2 (en) 2011-06-08 2021-03-30 Workshare Ltd. Method and system for collaborative editing of a remotely stored document
US10963578B2 (en) 2008-11-18 2021-03-30 Workshare Technology, Inc. Methods and systems for preventing transmission of sensitive data from a remote computer device
US11030163B2 (en) 2011-11-29 2021-06-08 Workshare, Ltd. System for tracking and displaying changes in a set of related electronic documents
US11182551B2 (en) 2014-12-29 2021-11-23 Workshare Ltd. System and method for determining document version geneology
US11341191B2 (en) 2013-03-14 2022-05-24 Workshare Ltd. Method and system for document retrieval with selective document comparison
KR20220095444A (en) * 2020-12-30 2022-07-07 주식회사 리노스 Apparatus for detecting confidential data leakage via communication network
US11763013B2 (en) 2015-08-07 2023-09-19 Workshare, Ltd. Transaction document management system and method
CN117692143A (en) * 2024-02-02 2024-03-12 泉州市凯润通信科技有限公司 Communication key management method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1535433A (en) * 2001-07-04 2004-10-06 库吉萨姆媒介公司 An Extensible Interactive Document Retrieval System Based on Classification
JP4747591B2 (en) * 2005-01-31 2011-08-17 日本電気株式会社 Confidential document retrieval system, confidential document retrieval method, and confidential document retrieval program

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8286171B2 (en) 2008-07-21 2012-10-09 Workshare Technology, Inc. Methods and systems to fingerprint textual information using word runs
WO2010011691A3 (en) * 2008-07-21 2010-04-22 Workshare Technology, Inc. Methods and systems to fingerprint textual information using word runs
US9614813B2 (en) 2008-07-21 2017-04-04 Workshare Technology, Inc. Methods and systems to implement fingerprint lookups across remote agents
US9473512B2 (en) 2008-07-21 2016-10-18 Workshare Technology, Inc. Methods and systems to implement fingerprint lookups across remote agents
WO2010030871A3 (en) * 2008-09-11 2010-06-17 Workshare Technology, Inc. Methods and systems to implement fingerprint lookups across remote agents
US10963578B2 (en) 2008-11-18 2021-03-30 Workshare Technology, Inc. Methods and systems for preventing transmission of sensitive data from a remote computer device
US8406456B2 (en) 2008-11-20 2013-03-26 Workshare Technology, Inc. Methods and systems for image fingerprinting
GB2485505A (en) * 2009-09-03 2012-05-16 Inca Internet Co Ltd Method for blocking the execution of a hacking process
GB2485505B (en) * 2009-09-03 2014-12-03 Inca Internet Co Ltd Method for blocking the execution of a hacking process
CN102483783A (en) * 2009-09-03 2012-05-30 Inca网络有限公司 Execution blocking method for hacking attack processing
KR101042857B1 (en) * 2009-09-03 2011-06-20 주식회사 잉카인터넷 How to block hacking process
WO2011027976A3 (en) * 2009-09-03 2011-04-28 (주)잉카인터넷 Method for blocking the execution of a hacking process
KR101158797B1 (en) * 2010-04-28 2012-06-26 경기대학교 산학협력단 Apparatus and Method for preventing leakage of secret data
US11042736B2 (en) 2010-11-29 2021-06-22 Workshare Technology, Inc. Methods and systems for monitoring documents exchanged over computer networks
US10445572B2 (en) 2010-11-29 2019-10-15 Workshare Technology, Inc. Methods and systems for monitoring documents exchanged over email applications
US10025759B2 (en) 2010-11-29 2018-07-17 Workshare Technology, Inc. Methods and systems for monitoring documents exchanged over email applications
US11386394B2 (en) 2011-06-08 2022-07-12 Workshare, Ltd. Method and system for shared document approval
US10963584B2 (en) 2011-06-08 2021-03-30 Workshare Ltd. Method and system for collaborative editing of a remotely stored document
US9613340B2 (en) 2011-06-14 2017-04-04 Workshare Ltd. Method and system for shared document approval
US11030163B2 (en) 2011-11-29 2021-06-08 Workshare, Ltd. System for tracking and displaying changes in a set of related electronic documents
US11341191B2 (en) 2013-03-14 2022-05-24 Workshare Ltd. Method and system for document retrieval with selective document comparison
US10783326B2 (en) 2013-03-14 2020-09-22 Workshare, Ltd. System for tracking changes in a collaborative document editing environment
US10911492B2 (en) 2013-07-25 2021-02-02 Workshare Ltd. System and method for securing documents prior to transmission
US9948676B2 (en) 2013-07-25 2018-04-17 Workshare, Ltd. System and method for securing documents prior to transmission
EP2975547A1 (en) 2014-07-17 2016-01-20 Electronics and Telecommunications Research Institute Method and apparatus for preventing illegitimate outflow of electronic document
US9560032B2 (en) 2014-07-17 2017-01-31 Electronics And Telecommunications Research Institute Method and apparatus for preventing illegitimate outflow of electronic document
US11182551B2 (en) 2014-12-29 2021-11-23 Workshare Ltd. System and method for determining document version geneology
US11763013B2 (en) 2015-08-07 2023-09-19 Workshare, Ltd. Transaction document management system and method
US12493706B2 (en) 2015-08-07 2025-12-09 Workshare, Ltd. Transaction document management system and method
KR20180018238A (en) 2016-08-10 2018-02-21 숭실대학교산학협력단 Method and apparatus for determining information leakage risk
KR20190061831A (en) * 2017-11-28 2019-06-05 (주)소만사 System and method of detecting confidential information based on 2-tier for endpoint DLP
KR20220095444A (en) * 2020-12-30 2022-07-07 주식회사 리노스 Apparatus for detecting confidential data leakage via communication network
CN117692143A (en) * 2024-02-02 2024-03-12 泉州市凯润通信科技有限公司 Communication key management method
CN117692143B (en) * 2024-02-02 2024-04-12 泉州市凯润通信科技有限公司 Communication key management method

Also Published As

Publication number Publication date
KR100882349B1 (en) 2009-02-12

Similar Documents

Publication Publication Date Title
KR100882349B1 (en) Method and device for preventing the leakage of confidential documents
Li et al. Llm-pbe: Assessing data privacy in large language models
US10963578B2 (en) Methods and systems for preventing transmission of sensitive data from a remote computer device
Alneyadi et al. A survey on data leakage prevention systems
US9654510B1 (en) Match signature recognition for detecting false positive incidents and improving post-incident remediation
US8199965B1 (en) System, method, and computer program product for preventing image-related data loss
CN107577939B (en) Data leakage prevention method based on keyword technology
US8352535B2 (en) Method and system for managing confidential information
US20190347429A1 (en) Method and system for managing electronic documents based on sensitivity of information
US20140331338A1 (en) Device and method for preventing confidential data leaks
US20140111834A1 (en) Document policies for a document processing unit
CN105373614A (en) Sub-user identification method and system based on user account
Shin et al. Cybersecurity event detection with new and re-emerging words
US9888036B2 (en) Message sending device, message receiving device, message checking method, and recording medium
JP2006155535A (en) Personal information search program, personal information management system and personal information management function-equipped information processor
Thomas Machine learning applications for cybersecurity
Mohasseb et al. Cyber security incidents analysis and classification in a case study of Korean enterprises
JP2008262259A (en) Information leakage prevention system
Alhijawi et al. Text-based authorship identification-a survey
KR102619521B1 (en) Method and apparatus for encrypting confidention information based on artificial intelligence
Wu et al. Keystroke and Mouse Movement Profiling for Data Loss Prevention.
Weidman et al. The acceptable state: An analysis of the current state of acceptable use policies in academic institutions
Stallings Data loss prevention as a privacy-enhancing technology
Abid et al. A dynamic and automated access control management system for social networks
Alhindi et al. Data Loss Prevention using document semantic signature

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20060929

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20071113

Patent event code: PE09021S01D

PG1501 Laying open of application
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20080522

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20081127

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20090130

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20090202

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20111208

Year of fee payment: 20

PR1001 Payment of annual fee

Payment date: 20111208

Start annual number: 4

End annual number: 20