[go: up one dir, main page]

KR20020027987A - Method and apparatus for protecting contents of porno - Google Patents

Method and apparatus for protecting contents of porno Download PDF

Info

Publication number
KR20020027987A
KR20020027987A KR1020000058828A KR20000058828A KR20020027987A KR 20020027987 A KR20020027987 A KR 20020027987A KR 1020000058828 A KR1020000058828 A KR 1020000058828A KR 20000058828 A KR20000058828 A KR 20000058828A KR 20020027987 A KR20020027987 A KR 20020027987A
Authority
KR
South Korea
Prior art keywords
pornography
url
site
pornographic
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1020000058828A
Other languages
Korean (ko)
Inventor
황금용
김주성
Original Assignee
황금용
주식회사 엠디컴
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 황금용, 주식회사 엠디컴 filed Critical 황금용
Priority to KR1020000058828A priority Critical patent/KR20020027987A/en
Publication of KR20020027987A publication Critical patent/KR20020027987A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer And Data Communications (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

개시된 음란물 차단방법 및 차단장치는 멀티미디어 데이터의 음란성 여부를 판단하여 음란물로 판단될 경우에 사용자가 접근하지 못하도록 한다.The disclosed pornography blocking method and blocking device determines whether the multimedia data is obscene and prevents the user from accessing the pornographic material when it is determined to be pornographic.

음란물 사이트의 URL이 저장되는 데이터 베이스와, 사용자 컴퓨터가 접근하는 URL을 전송 받아 데이터 베이스에 음란물의 여부를 질의 및 응답 받고 응답 결과에 따라 사용자 컴퓨터가 해당 URL에 접근하는 것을 허용 또는 차단함과 아울러 리스트에 없는 URL일 경우에 음란물 여부의 판별을 요청하는 메인 서버와, 메인 서버가 음란물 판별을 요청하는 URL의 HTML 문서를 전송 받아 음란물 여부를 판단하고 음란물일 경우에 그 URL을 데이터 베이스의 음란물 리스트에 추가하여 저장하는 음란물 사이트 판별엔진을 구비하여, 사용자 컴퓨터가 접근하고자 하는 URL을 전송 받고, 전송 받은 URL을 데이터 베이스에 미리 저장된 음란물 리스트에 질의하여 음란물 사이트 여부를 응답 받으며, 응답 결과 음란물 사이트의 여부에 따라 사용자 컴퓨터가 해당 URL에 접근하는 것을 허용 또는 차단하고, 해당 URL의 접근을 허용하였을 경우에 음란물 사이트의 여부를 판단하여 음란물 사이트로 판단될 경우에 데이터 베이스의 음란물 리스트에 추가 저장한다.In addition to receiving a database where URLs of pornographic sites are stored, and URLs accessed by user computers, the database can query and respond to pornographic materials, and allow or block user computers from accessing the URLs according to the response results. If the URL is not in the list, the main server requests to determine whether it is pornographic material, and the main server receives the HTML document of the URL requesting the pornography to determine whether it is pornographic material. In addition to the pornographic site discrimination engine to store in addition to, the user receives a URL that you want to access, query the received URL on the pre-stored pornographic list in the database to receive a response whether the pornographic site, the response result of the pornographic site Depending on whether or not your computer Permit or block, and to a case in allowing access of the URL is determined whether or not the pornography sites and stores added to the explicit content list in the database if it is determined as a pornography site.

Description

음란물 차단방법 및 차단장치{Method and apparatus for protecting contents of porno}Method and apparatus for protecting sexually explicit material {Method and apparatus for protecting contents of porno}

본 발명은 인터넷 기반의 월드 와이드 웹(world wide web : 이하, '웹'이라고 약칭함)에서 멀티미디어 데이터의 음란물 여부를 판단하고, 음란물의 멀티미디어 데이터로 판단될 경우에 이를 차단하는 음란물 차단방법 및 차단장치에 관한 것이다.The present invention determines whether pornography of multimedia data in the Internet-based world wide web (hereinafter, abbreviated as 'web'), and block the method of blocking pornography if it is determined to be multimedia data of pornography. Relates to a device.

통신기술 및 컴퓨터 분야의 급격한 발전과 더불어 인터넷은 소정의 정보 습득과 교류의 장으로서 하나의 필수적인 수단이 되었으며, 그 기능 및 역할이 폭발적으로 증대되고 있다. 이러한 인터넷은 정보 제공자(information provider) 및/또는 특정 서버들이 접속되어 있는 인터넷망에 인터넷 가입자들이 자신의 컴퓨터를 통해 데이터 통신이 가능하게 연결하여 이루어지는 것으로 정보 제공자들이나 특정 서버가 개설하고 있는 소정의 웹사이트에 인터넷 가입자가 컴퓨터를 통해 접속한 후 해당 웹사이트에서 제공하는 각종 정보 및/또는 서비스를 활용함으로써 이루어지는 것이다. 또한 상기 인터넷은 특정 서비스 군에 속하는 사람들끼리의 데이터 통신에만 한정되지 않고, 국가나 지역에 구분됨이 없이 소정의 정보를 취득하고, 제공되는 서비스를 활용할 수 있는 것으로 현재 가장 각광받고 있는 정보의 취득 및 통신망으로 자리잡고 있다.With the rapid development of communication technology and computer field, the Internet has become an essential means of acquiring and exchanging information, and its functions and roles are exploding. The Internet is formed by connecting Internet subscribers to their computers through an information network and / or an internet network to which specific servers are connected. Internet subscribers access the site through a computer and then utilize various information and / or services provided by the website. In addition, the Internet is not limited to data communication between people belonging to a specific service group, and is able to acquire predetermined information without being divided into countries or regions, and use the provided services. It is set up as a communication network.

그리고 인터넷의 확신과 더불어 많은 웹사이트들이 생성되고, 계속해서 증가하고 있는 추세이다. 특히 웹사이트에서 제공하고 있는 다양한 정보들은 인터넷의 확산을 촉진시키고 있다. 한편, e-비지니스 등의 새로운 사업 영역이 확대됨에 따라 문자뿐만 아니라 음성, 음악, 영상 및 3차원 영상물 등을 비롯하여 다양한 멀티미디어 컨텐츠가 웹사이트를 통해 제공되고 있다.And with the confidence of the Internet, many websites are being created and growing. In particular, the various information provided by the website is promoting the spread of the Internet. Meanwhile, with the expansion of new business areas such as e-business, various multimedia contents including not only texts but also voices, music, images, and 3D images are provided through websites.

이러한 가운데 상업성을 노린 음란물 사이트들도 상대적으로 늘어나, 확산된 인터넷 환경 속에서 누구나 용이하게 접근할 수 있게 되었고, 미성년자들에게 음란물이 노출되는 정도는 매우 심각한 상황으로서 새로운 사회적 문제를 발생시키고 있다. 그러므로 미성년자들이 인터넷을 통해 음란물 사이트에 접근하지 못하도록차단하는 것이 매우 시급하다.In the meantime, commercial pornography sites have been relatively increased, making it easy for anyone to access in the spread of the Internet environment, and the exposure of pornography to minors is a very serious situation, causing new social problems. Therefore, it is very urgent to block minors from accessing pornography sites over the Internet.

미성년자들이 인터넷을 통해 음란물 사이트에 접근하는 것을 차단하기 위하여 종래에는 URL 주소 또는 홈페이지의 문자들을 분석하여 음란물 여부를 판단하고, 음란물로 판단될 경우에 이를 차단하고 있다. 그러나 상기한 바와 같이 음란물을 차단하는 방법은 멀티미디어 데이터의 내용과는 상관없이 이루어지므로 영상 및 음성 등과 같은 실제 음란물의 대상이 되는 멀티미디어 데이터의 차단에는 한계가 있다. 그러므로 멀티미디어 데이터의 내용에 따라 음란성의 여부를 정확하게 판단하고, 음란 사이트로 판단될 경우에 이를 차단하는 기술이 요구되고 있다. 그러나 웹사이트에 있는 방대한 양의 디지털 멀티미디어 데이터의 내용을 분석하여 음란성 여부를 판단하는 것은 매우 어렵고, 또한 많은 시간이 소요되는 문제가 있다.In order to block access to pornography sites through the Internet, minors are conventionally analyzed by analyzing characters of a URL address or a homepage, and if they are considered to be pornography, they are blocked. However, as described above, since the method of blocking the pornographic material is performed irrespective of the contents of the multimedia data, there is a limit to the blocking of the multimedia data that is the target of the actual pornographic material such as video and audio. Therefore, there is a demand for a technology that accurately determines whether or not obscenity is determined according to the contents of multimedia data, and blocks it when it is determined to be an obscene site. However, it is very difficult to determine whether or not sexually explicit by analyzing the content of the vast amount of digital multimedia data on the website, and also has a problem that takes a lot of time.

한편, 최근 방대한 멀티미디어 데이터의 효율적인 저장 및 검색을 위하여 MPEG-7(Moving Picture Experts Group-7)의 국제 표준화가 이루어지고 있다. 상기 MPEG-7에서의 표준화는 음성 및 영상 등의 멀티미디어 특징들을 적은 양의 크기와 높은 효율을 가지고 표현하는 기술자(descriptor)와, 이런 기술자들의 조합으로 구성되는 기술자 구성안(descriptor scheme)으로 되어 있다.On the other hand, international standardization of Moving Picture Experts Group-7 (MPEG-7) has been recently performed for efficient storage and retrieval of vast multimedia data. The standardization in MPEG-7 consists of a descriptor that expresses multimedia features such as voice and video with a small amount and high efficiency, and a descriptor scheme composed of a combination of these descriptors.

MPEG-7 기술자는 데이터가 지니고 있는 내용(공간적 관계, 색, 질감, 모양, 물체의 움직임, 소리, 음폭 및 스펙트럼 등)에서 소정의 특징을 추출하여 특정 벡터의 형태로 표현된다.The MPEG-7 descriptor extracts certain features from the contents of the data (spatial relations, colors, textures, shapes, object movements, sounds, sound widths, and spectrums) and is expressed in the form of specific vectors.

따라서 본 발명의 목적은 멀티미디어 데이터의 내용을 기반으로 하여 음란물을 정확하게 판단 및 차단하는 음란물 차단방법 및 차단장치를 제공하는 데 있다.Accordingly, an object of the present invention is to provide a method and a blocker for blocking pornographic material that accurately determines and blocks pornographic material based on the contents of multimedia data.

본 발명의 다른 목적은 웹사이트 상의 방대한 멀티미디어 데이터가 음란물인지를 빠르고, 효율적으로 판정 및 차단할 수 있는 음란물 차단방법 및 차단장치를 제공하는데 있다.It is another object of the present invention to provide a method and a blocker for blocking pornographic material that can quickly and efficiently determine and block whether or not massive multimedia data on a website is pornographic material.

본 발명의 또 다른 목적은 판단한 음란물 사이트의 리스트(list)를 이용하여 음란물 여부를 판단하는 음란물 리스트 필터링 방식과. 멀티미디어 데이터의 내용을 기반으로 음란물을 판단하는 음란물 등급판정 엔진을 병행하여 음란물 사이트의 여부를 빠른 속도로 판단 및 차단하는 음란물 차단방법 및 차단장치를 제공하는데 있다.Another object of the present invention and the pornography list filtering method for determining whether or not pornographic material using the list (list) of the determined pornographic site. The present invention provides a method for blocking pornography and a blocking device for determining and blocking a pornography site at a high speed by performing a pornography rating determination engine that determines pornography based on the contents of multimedia data.

도 1은 본 발명의 음란물 차단장치의 구성을 보인 도면이고,1 is a view showing the configuration of the obscene material blocking apparatus of the present invention,

도 2는 본 발명의 음란물 차단장치에서 사용되는 음란물 사이트 판별엔진을 보인 도면이며,2 is a view showing a pornographic site discrimination engine used in the pornographic blocking device of the present invention,

도 3a 및 도 3b는 본 발명의 음란물 차단방법을 보인 신호 흐름도이다.3A and 3B are signal flows illustrating a method for blocking pornography of the present invention.

*도면의 주요 부분에 대한 부호의 설명** Description of the symbols for the main parts of the drawings *

10 : 사용자 컴퓨터 12 : 메인 서버10: user computer 12: main server

14 : 데이터 베이스 16 : 음란 사이트 판별엔진14: database 16: obscene site discrimination engine

18 : 웹 문서18: Web Document

이러한 목적을 달성하기 위한 본 발명의 음란물 차단방법에 따르면, 사용자 컴퓨터가 접근하고자 하는 URL을 전송 받는 제 1 과정; 상기 제 1 과정에서 전송 받은 URL을 데이터 베이스에 미리 저장된 음란물 리스트에 질의하여 음란물 사이트 여부를 응답 받는 제 2 과정; 상기 제 2 과정에서 응답 결과 음란물 사이트의 여부에 따라 사용자 컴퓨터가 해당 URL에 접근하는 것을 허용 또는 차단하는 제 3 과정; 상기 제 3 과정에서 해당 URL의 접근을 허용하였을 경우에 음란물 사이트의 여부를 판단하는 제 4 과정; 및 상기 제 4 과정에서 음란물 사이트로 판단될 경우에 상기 데이터 베이스의 음란물 리스트에 추가 저장하는 제 5 과정으로 이루어짐을 특징으로 한다.According to the method for blocking pornography according to the present invention for achieving the above object, the first process of receiving a URL to the user computer to access; A second step of receiving a response indicating whether the pornography site is a query by querying the pornography list previously stored in the database of the URL received in the first step; A third step of allowing or blocking a user computer from accessing a corresponding URL according to whether or not the pornography site is a result of the response in the second step; A fourth step of determining whether or not the pornography site is allowed when access to the corresponding URL is allowed in the third step; And a fifth process of additionally storing the pornography site in the database if the pornography site is determined in the fourth process.

그리고 상기 제 3 과정은; 음란물 사이트에 대한 유해 등급을 판단하고, 판단한 유해 등급에 따라 해당 URL의 접근 허용 또는 차단하고, 상기 제 4 과정은; 해당 URL에서 HTML 문서를 전송 받아 분석 및 멀티미디어 파일의 목록을 생성하는 제 11 과정; 상기 제 11 과정에서 생성한 멀티미디어 파일에서 음란물 판정에 필요한 소정의 특징을 추출하는 제 12 과정; 상기 제 12 과정에서 추출한 소정의 특징을 미리 설정된 음란물 판정의 표본과 비교하여 유사도를 측정하고 각각의 멀티미디어 파일이 해당 페이지 내에서 차지하는 비중에 가중치를 두어 페이지의 전체적인 음란성 등급을 계산하는 제 13 과정; 및 상기 제 13 과정에서 측정 및 계산 결과로 음란물 사이트 여부를 판단하는 제 14 과정으로 이루어지며,And the third process; Determining a harmful rating for pornographic sites, allowing or blocking the access of the URL according to the determined harmful rating, the fourth process; An eleventh process of receiving an HTML document from a corresponding URL and analyzing and generating a list of multimedia files; A twelfth step of extracting a predetermined feature for determining pornography from the multimedia file generated in the eleventh step; A thirteenth step of comparing a predetermined feature extracted in the twelfth step with a sample of a predetermined pornography judgment to measure similarity, and weighting a weight of each multimedia file in the corresponding page to calculate an overall vocal grade of the page; And a fourteenth process of determining whether or not the pornographic site is based on the measurement and calculation result in the thirteenth process.

상기 제 12 과정은; 전송 받은 멀티미디어 파일에서 색상, 질감 및 모양에 대한 특징을 추출하며, 상기 제 14 과정은; 소정의 멀티미디어 파일의 이미지 크기가 미리 설정된 크기 이상일 경우에 가중치를 두지 않고 그 이미지의 유사도로 음란물 사이트의 여부를 판단하는 것을 특징으로 한다.The twelfth process; Extracting features of color, texture, and shape from the received multimedia file; When an image size of a predetermined multimedia file is equal to or larger than a preset size, it is determined whether or not a pornography site is provided by the similarity of the image without weighting.

또한 본 발명의 음란물 차단장치에 따르면, 음란물 사이트의 URL이 음란물 리스트로 저장 및 출력되는 데이터 베이스; 사용자 컴퓨터가 접근하고자 하는 웹사이트의 URL을 전송 받아 상기 데이터 베이스에 음란물 사이트의 여부를 질의 및 응답 받고 응답 결과에 따라 사용자 컴퓨터가 해당 URL에 접근하는 것을 허용 또는 차단함과 아울러 음란물 리스트에 없는 URL일 경우에 음란물 여부의 판별을 요청하는 메인 서버; 및 상기 메인 서버가 음란물 판별을 요청하는 URL의 HTML 문서를 전송 받아 음란물 사이트 여부를 판단하고 음란물 사이트일 경우에 그 URL을 상기 데이터 베이스의 음란물 리스트에 추가하여 저장하는 음란물 사이트 판별엔진으로 구성됨을 특징으로 한다.In addition, according to the pornographic blocking device of the present invention, the database of the URL of the pornographic site is stored and output as a pornographic list; Receives the URL of the website that the user wants to access, asks and responds to the database whether it is a pornography site, and allows or blocks the user's computer to access the URL according to the response result. In the case of the main server for requesting the determination of whether pornography; And a pornography site discrimination engine that receives the HTML document of a URL for requesting pornography discrimination and determines whether the pornography site is a pornographic site, and adds the URL to the pornography list of the database to store the pornographic site. It is done.

이하 첨부된 도면을 참조하여 본 발명의 음란물 차단방법 및 차단장치를 상세히 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail the obscene material blocking method and apparatus of the present invention.

도 1은 본 발명의 음란물 차단장치의 구성을 보인 도면이다. 이에 도시된 바와 같이 본 발명은 먼저, 사용자 컴퓨터(10)가 접근하고자 하는 웹사이트의 URL을 메인 서버(12)로 전송한다. 그러면, 메인 서버(12)는 사용자 컴퓨터(10)로부터 전송 받은 웹사이트의 URL을 데이터 베이스(14)의 음란물 리스트에 있는 URL인지를 질의하고, 데이터 베이스(14)로부터 질의에 대한 응답을 받는다.1 is a view showing the configuration of the obscene material blocking apparatus of the present invention. As shown in the drawing, the present invention first transmits a URL of a website to be accessed by the user computer 10 to the main server 12. Then, the main server 12 inquires whether the URL of the website received from the user computer 10 is the URL in the pornography list of the database 14, and receives a response to the query from the database 14.

즉, 상기 데이터 베이스(14)에는 현재까지 후술하는 음란물 사이트 판별엔진(16)이 판단한 음란물 사이트에 대한 URL 리스트가 미리 저장되어 있는 것으로서 메인 서버(12)는 사용자 컴퓨터(10)가 접근하고자 하는 웹사이트의 URL이 데이터 베이스(14)에 저장되어 있는 음란물 사이트의 URL 리스트에 있는지를 질의하여 응답을 받는다.That is, the database 14 previously stores a list of URLs for pornographic sites determined by the pornographic site discrimination engine 16, which will be described later, and the main server 12 is configured to access a web to which the user computer 10 attempts to access. The query is queried if the URL of the site is in the URL list of the pornographic site stored in the database 14, and a response is received.

상기 질의 및 응답 결과 데이터 베이스(14)의 음란물 리스트에 있는 URL일 경우에 메인 서버(12)는 사용자 컴퓨터(10)로 차단신호를 전송하여 접속을 차단한다. 그리고 상기 질의 및 응답 결과 데이터 베이스(14)의 음란물 리스트에 없는 URL일 경우에 메인 서버(12)는 음란 사이트 판별 엔진(16)에게 음란물 여부의 판별을 요청한다.In the case of the URL in the pornography list of the query and response result database 14, the main server 12 transmits a blocking signal to the user computer 10 to block access. In the case where the URL is not in the pornography list of the query and response result database 14, the main server 12 requests the lewd site determination engine 16 to determine whether pornography is present.

상기 음란 사이트 판별 엔진(16)은, 예를 들면, 도 2에 도시된 바와 같이 4개의 부분으로 구성되어 있는 것으로서 먼저 멀티미디어 데이터 즉, 사용자가 접근하고자 하는 URL의 웹 문서(18)가 입력되고(20), 입력된 웹 문서(18)에서 MPEG-7 표준을 기반으로 메타 데이터가 추출된다(22). 여기서, MPEG-7 메타 데이터는 공간적 관계, 색, 질감, 모양, 물체의 움직임, 소리, 음폭 및 스펙트럼 등의 특징을 표현하는 MPEG-7 표준 기술자 및 그것들의 구성안으로 이루어지는 것으로서 이렇게 추출된 MPEG-7 메타 데이터를 이용하여 음란물의 여부 즉, 음란물의 등급을 판정하고(24), 음란물 판정 결과를 이용하여 웹페이지를 차단 또는 표시할 것인지를 판정한다(26).The obscene site discrimination engine 16 is composed of four parts, as shown in FIG. 2, for example, and multimedia data, that is, a web document 18 of a URL that a user wants to access is inputted (1). 20, metadata is extracted from the input web document 18 based on the MPEG-7 standard (22). Here, MPEG-7 metadata is composed of MPEG-7 standard descriptors expressing features such as spatial relations, colors, textures, shapes, object movements, sounds, widths, and spectrums, and their constructions. The meta data is used to determine whether pornography is included, that is, the grade of the pornography (24), and whether to block or display a web page using the pornography determination result is determined (26).

그리고 판정 결과 음란물 사이트일 경우에 이를 데이터 베이스(14)의 음란물 리스트에 추가하여 저장함과 아울러 사용자 컴퓨터(10)가 해당 사이트로 접근하지 못하도록 하고, 음란물 사이트가 아닐 경우에 사용자가 해당 사이트의 웹 문서(18)에 접근하는 것을 허용한다.If the result of the determination is a pornography site, it is added to the pornography list of the database 14 and stored, and the user's computer 10 cannot access the site. Allow access to 18.

도 3a 및 도 3b는 본 발명의 음란물 차단방법을 보인 신호 흐름도이다. 이에 도시된 바와 같이 단계(300)에서 사용자 컴퓨터(10)가 접근하고자 하는 웹사이트의 URL을 메인 서버(12)로 전송하고, 메인 서버(12)는 단계(302)에서 사용자 컴퓨터(10)가 접근하고자 하는 웹사이트의 URL을, 데이터 베이스(14)에 저장되어 있는 음란물 리스트 내에서 사용자 그룹(연령별 계층 그룹)에 따라 적용해야 할 차단 등급에 해당되는 URL인지를 비교한다.3A and 3B are signal flows illustrating a method for blocking pornography of the present invention. As shown in FIG. 300, in step 300, the URL of the website to be accessed by the user computer 10 is transmitted to the main server 12, and the main server 12 receives the user computer 10 in step 302. The URL of the website to be accessed is compared with a URL corresponding to a blocking level to be applied according to a user group (age group by age group) in the pornography list stored in the database 14.

다음 단계(304)에서 판단 결과 유해 등급이 높은 음란물 사이트일 경우에 단계(306)에서 사용자 컴퓨터(10)로 해당 웹사이트의 차단신호를 전송한 후 단계(308)에서 사용자 컴퓨터(10)의 접속을 차단하고, 권장 사이트로 접속한다.If it is determined that the pornography site has a high harmful level in the next step 304, the block signal of the website is transmitted to the user computer 10 in step 306, and then the user computer 10 is connected in step 308. Block and connect to the recommended site.

그리고 단계(304)에서 판단 결과 유해 등급이 낮거나 음란물 리스트에 없을 경우에는 단계(310)에서 사용자 컴퓨터(10)로 웹사이트의 접근 허용신호를 전송하고, 단계(312)에서 사용자 컴퓨터(10)를 접근하고자 하는 해당 사이트로 연결한다.If it is determined in step 304 that the harmful level is low or not in the pornography list, the access permission signal of the website is transmitted to the user computer 10 in step 310, and the user computer 10 in step 312. Link to the site you want to access.

또한 상기 단계(304)의 판단 결과 음란물 리스트에 없을 경우에 단계(314)에서 음란 사이트 판별엔진(16)에게, 사용자 컴퓨터(10)가 접근하고자 하는 웹사이트의 URL을 넘겨 해당 웹사이트의 음란성 등급 분석을 요청한다.In addition, when the determination result of the step 304 is not in the pornography list, in step 314, the website of the website to be accessed by the user computer 10 is handed over to the obscene site determination engine 16, and the pornography rating of the website is passed. Ask for analysis.

음란 사이트 판별엔진(16)은, 단계(316)에서 음란물 등급 분석을 요청 받은 URL에서 HTML 문서를 전송 받고, 단계(318)에서 전송 받은 HTML 문서 즉, 웹 문서(18)를 분석하여 그 HTML 문서에 포함되어 있는 이미지 및 동영상 파일 등의 멀티미디어 파일의 목록을 생성한다.The obscene site discrimination engine 16 receives the HTML document from the URL for which the pornographic grade analysis is requested in step 316, analyzes the HTML document received in step 318, that is, the web document 18, and analyzes the HTML document. Create a list of multimedia files such as image and video files included in the.

다음 단계(320)에서는 분석한 멀티미디어 파일을 전송 받고, 단계(322)에서 전송 받은 멀티미디어 파일에서 소정의 특징을 추출 즉, 음란 사이트 판별엔진(16) 내에 포함되어 있는 특징 추출엔진을 통해 상기 전송 받은 멀티미디어 파일에서 색상, 질감 및 모양 등에 의한 특징으로 추출한다.In the next step 320, the analyzed multimedia file is received, and the predetermined feature is extracted from the multimedia file received in step 322, that is, the feature is received through the feature extraction engine included in the obscene site discrimination engine 16. Extracted from multimedia files by features such as color, texture, and shape.

이와 같이 하여 멀티미디어 파일에서 소정의 특징이 추출되면, 단계(324)에서 상기 추출된 소정의 특징을 미리 저장되어 있는 기준 음란물 표본의 특징 데이터 베이스와 비교하여 유사도를 측정하고, 단계(326)에서 페이지 내의 멀티미디어 파일들의 전체적인 유사도를 측정 즉, 페이지 내에 포함되어 있는 각각의 멀티미디어 파일들이 페이지 내에서 차지하는 비중에 가중치를 두어 전체적인 페이지의 음란성 등급을 계산한다.When the predetermined feature is extracted from the multimedia file in this way, the extracted predetermined feature is compared with the feature database of the reference pornographic sample stored in advance in step 324 to measure similarity, and the page in step 326. The overall similarity of the multimedia files in the page is measured, that is, the weight of each multimedia file included in the page is weighted in the page to calculate the degree of obsceneness of the entire page.

여기서, 멀티미디어 파일들이 페이지 내에서 차지하는 비중에 가중치를 두어 전체적인 페이지의 음란성 등급을 계산하는 동작을 설명한다.Here, an operation of calculating an obscene grade of the overall page by weighting the weight of the multimedia files in the page will be described.

유사도를 D라고 하고, 임계값을 T라고 하며, i 번째 그림의 X축 픽셀 수를 Xi라고 하며, i 번째 그림의 Y축 픽셀 수를 Yi라고 할 경우에 i 번째 그림의 전체 픽셀 수는 Xi * Yi가 되고, 유사도는 Di가 된다.If the similarity is called D, the threshold is T, the number of X-axis pixels in the i th figure is Xi, and the number of Y axes in the i th figure is Yi, the total number of pixels in the i th figure is Xi * Yi becomes and the similarity becomes Di.

그러면, i 번째 그림의 유사도 크기 Si는 다음의 수학식 1과 같다.Then, the similarity magnitude Si of the i th picture is expressed by Equation 1 below.

Si = (Xi * Yi) * DiSi = (Xi * Yi) * Di

상기 계산한 유사도의 크기 Si가 임계값의 크기 (Xi * Yi) * T보다 클 경우에 비 음란물이 된다.When the calculated size of similarity Si is larger than the size of the threshold value (Xi * Yi) * T, it becomes non-descriptive material.

그러면, 음란 정도 Mi는 다음의 수학식 2와 같이 된다.Then, the degree of obscene Mi is as shown in Equation 2 below.

Mi = Si - (Xi * Yi) * T =(Xi * Yi) * Di -(Xi * Yi) * TMi = Si-(Xi * Yi) * T = (Xi * Yi) * Di-(Xi * Yi) * T

= (Xi * Yi) * (Di - T)= (Xi * Yi) * (Di-T)

상기 음란 정도의 합을 구하면, 다음의 수학식 3과 같다.When the sum of the degrees of indecentness is obtained, the following equation (3) is obtained.

상기 수학식 3에서 구한 음란정도의 합이 '0'보다 작거나 같으면, 음란성 그림의 비가 많은 사이트가 된다.If the sum of the degree of indetermination obtained from Equation 3 is less than or equal to '0', it becomes a site having a large ratio of indecent pictures.

그리고 상기에서 페이지 내의 소정의 이미지가 크기를 무시할 수 없을 정도의 크기 즉, 미리 정해진 크기 이상의 이미지일 경우에 페이지 내의 상대적인 비중에 따르지 않고, 그 이미지 자체의 유사도(기준 음란물 표본 특징 데이터 베이스) 만으로 유사도를 결정한다.In addition, in the case where the predetermined image in the page is not large enough to ignore the size, that is, the image having a predetermined size or more, the similarity is determined based only on the similarity of the image itself (reference pornographic sample feature database). Determine.

이와 같이 하여 음란성 등급의 계산이 완료되면, 단계(328)에서는 측정 결과를 판단하여 유사도가 미리 설정된 임계값보다 높을 경우에 단계(330)에서 데이터 베이스(14)의 음란물 리스트에 해당 URL을 추가하여 저장한다. 그리고 상기 단계(328)에서 측정 결과를 판단하여 유사도가 미리 설정된 임계값보다 낮거나 또는 유사도가 미리 설정된 임계값보다 높아 데이터 베이스(14)의 음란물 리스트에 해당 URL을 추가 저장한 후에는 단계(332)에서 처리 결과를 기록하고, URL을 보관한다.In this way, when the calculation of the sexually explicit grade is completed, in step 328, the result of the measurement is determined, and when the similarity is higher than the preset threshold, in step 330, the corresponding URL is added to the pornographic list of the database 14 Save it. In operation 332, after the measurement result is determined and the similarity is lower than the preset threshold or the similarity is higher than the preset threshold, the corresponding URL is additionally stored in the pornography list of the database 14. ), Record the result of the processing and save the URL.

이상에서와 같이 본 발명에 따르면, 사용자 컴퓨터가 소정의 웹사이트에 접근할 경우에 음란물 사이트의 리스트를 이용하여 사용자 컴퓨터가 접근하고자 하는 소정의 웹사이트의 음란물 여부를 판단 및 접근 허용 여부를 결정하고, 또한 음란물 리스트에 없는 웹사이트일 경우에 음란물 등급판정 엔진을 이용하여 음란물 여부를 판단 및 데이터 베이스의 음란물 리스트에 추가하여 저장하는 것으로서 음란물 사이트의 여부를 빠른 속도로 판단하여 접근 허가 또는 접근 차단할 수 있다.As described above, according to the present invention, when the user computer accesses a predetermined website, a list of pornographic sites is used to determine whether or not the predetermined website is to be accessed by the user computer. In addition, in the case of a website that is not on the pornography list, the pornography rating engine is used to determine whether the pornography is in addition to the pornography list in the database and store the pornography site. have.

Claims (6)

사용자 컴퓨터가 접근하고자 하는 URL을 전송 받는 제 1 과정;A first step of receiving a URL to be accessed by a user computer; 상기 제 1 과정에서 전송 받은 URL을 데이터 베이스에 미리 저장된 음란물 리스트에 질의하여 음란물 사이트 여부를 응답 받는 제 2 과정;A second step of receiving a response indicating whether the pornography site is a query by querying the pornography list previously stored in the database of the URL received in the first step; 상기 제 2 과정에서 응답 결과 음란물 사이트의 여부에 따라 사용자 컴퓨터가 해당 URL에 접근하는 것을 허용 또는 차단하는 제 3 과정;A third step of allowing or blocking a user computer from accessing a corresponding URL according to whether or not the pornography site is a result of the response in the second step; 상기 제 3 과정에서 해당 URL의 접근을 허용하였을 경우에 음란물 사이트의 여부를 판단하는 제 4 과정; 및A fourth step of determining whether or not the pornography site is allowed when access to the corresponding URL is allowed in the third step; And 상기 제 4 과정에서 음란물 사이트로 판단될 경우에 상기 데이터 베이스의 음란물 리스트에 추가 저장하는 제 5 과정으로 이루어짐을 특징으로 하는 음란물 차단방법.And a fifth process of adding and storing the pornography site in the database if the pornography site is determined in the fourth process. 제 1 항에 있어서, 상기 제 3 과정은;The method of claim 1, wherein the third process comprises: 음란물 사이트에 대한 유해 등급을 판단하고, 판단한 유해 등급에 따라 해당 URL의 접근 허용 또는 차단하는 것을 특징으로 하는 음란물 차단방법.Determination of harmful ratings for pornographic sites, and the method for blocking pornography, characterized in that to allow or block the access of the URL according to the determined harmful ratings. 제 1 항에 있어서, 상기 제 4 과정은;The method of claim 1, wherein the fourth process comprises; 해당 URL에서 HTML 문서를 전송 받아 분석 및 멀티미디어 파일의 목록을 생성하는 제 11 과정;An eleventh process of receiving an HTML document from a corresponding URL and analyzing and generating a list of multimedia files; 상기 제 11 과정에서 생성한 멀티미디어 파일에서 음란물 판정에 필요한 소정의 특징을 추출하는 제 12 과정;A twelfth step of extracting a predetermined feature for determining pornography from the multimedia file generated in the eleventh step; 상기 제 12 과정에서 추출한 소정의 특징을 미리 설정된 음란물 판정의 표본과 비교하여 유사도를 측정하고 각각의 멀티미디어 파일이 해당 페이지 내에서 차지하는 비중에 가중치를 두어 페이지의 전체적인 음란성 등급을 계산하는 제 13 과정; 및A thirteenth step of comparing a predetermined feature extracted in the twelfth step with a sample of a predetermined pornography judgment to measure similarity, and weighting a weight of each multimedia file in the corresponding page to calculate an overall vocal grade of the page; And 상기 제 13 과정에서 측정 및 계산 결과로 음란물 사이트 여부를 판단하는 제 14 과정으로 이루어짐을 특징으로 하는 음란물 차단방법.14. The method of claim 13, wherein the determining of whether the pornography site is performed based on the measurement and the calculation result is performed in the thirteenth process. 제 3 항에 있어서, 상기 제 12 과정은;The method of claim 3, wherein the twelfth process comprises: 전송 받은 멀티미디어 파일에서 색상, 질감 및 모양에 대한 특징을 추출하는 것을 특징으로 하는 음란물 차단방법.A method for blocking pornography, characterized by extracting features of color, texture, and shape from a received multimedia file. 제 3 항에 있어서, 상기 제 14 과정은;The method of claim 3, wherein the fourteenth process comprises: 소정의 멀티미디어 파일의 이미지 크기가 미리 설정된 크기 이상일 경우에 가중치를 두지 않고 그 이미지의 유사도로 음란물 사이트의 여부를 판단하는 것을 특징으로 하는 음란물 차단방법.When the image size of a predetermined multimedia file is larger than a predetermined size, the pornography blocking method characterized in that it is determined whether or not the pornographic site by the similarity of the image without weight. 음란물 사이트의 URL이 음란물 리스트로 저장 및 출력되는 데이터 베이스;A database in which the URL of the pornography site is stored and output as a pornography list; 사용자 컴퓨터가 접근하고자 하는 웹사이트의 URL을 전송 받아 상기 데이터베이스에 음란물 사이트의 여부를 질의 및 응답 받고 응답 결과에 따라 사용자 컴퓨터가 해당 URL에 접근하는 것을 허용 또는 차단함과 아울러 음란물 리스트에 없는 URL일 경우에 음란물 여부의 판별을 요청하는 메인 서버; 및It is a URL that is not in the pornography list as well as allowing or blocking the user's computer access to the URL based on the response result. A main server for requesting determination of pornography in a case; And 상기 메인 서버가 음란물 판별을 요청하는 URL의 HTML 문서를 전송 받아 음란물 사이트 여부를 판단하고 음란물 사이트일 경우에 그 URL을 상기 데이터 베이스의 음란물 리스트에 추가하여 저장하는 음란물 사이트 판별엔진으로 구성됨을 특징으로 하는 음란물 차단장치.The main server receives an HTML document of a URL for requesting pornography to determine whether it is a pornography site, and in the case of a pornography site, the pornography site discrimination engine configured to add and store the URL to the pornography list of the database. Sexually explicit material blocking device.
KR1020000058828A 2000-10-06 2000-10-06 Method and apparatus for protecting contents of porno Withdrawn KR20020027987A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000058828A KR20020027987A (en) 2000-10-06 2000-10-06 Method and apparatus for protecting contents of porno

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000058828A KR20020027987A (en) 2000-10-06 2000-10-06 Method and apparatus for protecting contents of porno

Publications (1)

Publication Number Publication Date
KR20020027987A true KR20020027987A (en) 2002-04-15

Family

ID=19692210

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000058828A Withdrawn KR20020027987A (en) 2000-10-06 2000-10-06 Method and apparatus for protecting contents of porno

Country Status (1)

Country Link
KR (1) KR20020027987A (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100658799B1 (en) * 2005-08-17 2006-12-19 (주)엠아이티소프트 Obscene image blocking service system, obscene image judgment method and blocking method
KR101013484B1 (en) * 2008-09-25 2011-02-14 고려대학교 산학협력단 Pornography detection system and method
KR101024006B1 (en) * 2009-05-25 2011-03-29 (주)트리니티소프트 Web firewall with white ual collection method and web ual collection function in web firewall
KR101030819B1 (en) * 2002-05-07 2011-04-22 소니 에릭슨 모빌 커뮤니케이션즈 에이비 How to load applications into your device, device and smartcard
KR101040510B1 (en) * 2009-05-26 2011-06-16 (주)필링크 Network harmful protection system and its driving method
US8713596B2 (en) 2007-07-03 2014-04-29 Lg Electronics Inc. Method and system for blocking hazardous information
KR20190007175A (en) * 2017-07-12 2019-01-22 최갑천 Apparatus for detecting harmful contents
KR20190033345A (en) * 2017-09-21 2019-03-29 서강대학교산학협력단 Method and system of classifying web site for adult having pornographic images
KR20200105179A (en) * 2019-02-28 2020-09-07 안상필 System for collecting status of web site
KR102213373B1 (en) * 2020-06-16 2021-02-08 김민석 Apparatus and method for blocking harmful contents using metadata
CN113901369A (en) * 2021-10-09 2022-01-07 北京小川在线网络技术有限公司 Data interception method and device for illegal picture
KR20220049673A (en) * 2020-10-14 2022-04-22 주식회사 에이아이스페라 Private server detection device and the control method thereof
KR20230059015A (en) * 2021-10-25 2023-05-03 주식회사 투링크 System for blocking harmful site and method thereof

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101030819B1 (en) * 2002-05-07 2011-04-22 소니 에릭슨 모빌 커뮤니케이션즈 에이비 How to load applications into your device, device and smartcard
KR100658799B1 (en) * 2005-08-17 2006-12-19 (주)엠아이티소프트 Obscene image blocking service system, obscene image judgment method and blocking method
KR101428037B1 (en) * 2007-07-03 2014-08-07 엘지전자 주식회사 method and system for blocking noxious information
US8713596B2 (en) 2007-07-03 2014-04-29 Lg Electronics Inc. Method and system for blocking hazardous information
KR101013484B1 (en) * 2008-09-25 2011-02-14 고려대학교 산학협력단 Pornography detection system and method
KR101024006B1 (en) * 2009-05-25 2011-03-29 (주)트리니티소프트 Web firewall with white ual collection method and web ual collection function in web firewall
KR101040510B1 (en) * 2009-05-26 2011-06-16 (주)필링크 Network harmful protection system and its driving method
KR20190007175A (en) * 2017-07-12 2019-01-22 최갑천 Apparatus for detecting harmful contents
KR20190033345A (en) * 2017-09-21 2019-03-29 서강대학교산학협력단 Method and system of classifying web site for adult having pornographic images
KR20200105179A (en) * 2019-02-28 2020-09-07 안상필 System for collecting status of web site
KR102213373B1 (en) * 2020-06-16 2021-02-08 김민석 Apparatus and method for blocking harmful contents using metadata
WO2021256755A1 (en) * 2020-06-16 2021-12-23 김민석 Device and method for managing harmful content by using metadata
KR20220049673A (en) * 2020-10-14 2022-04-22 주식회사 에이아이스페라 Private server detection device and the control method thereof
CN113901369A (en) * 2021-10-09 2022-01-07 北京小川在线网络技术有限公司 Data interception method and device for illegal picture
KR20230059015A (en) * 2021-10-25 2023-05-03 주식회사 투링크 System for blocking harmful site and method thereof

Similar Documents

Publication Publication Date Title
US9043268B2 (en) Method and system for displaying links to search results with corresponding images
CA2323883C (en) Method and device for classifying internet objects and objects stored oncomputer-readable media
US10210179B2 (en) Dynamic feature weighting
US7900147B2 (en) System and method for enabling disconnected web access
KR20190086741A (en) Animated snippets for search results
CN111159563B (en) Method, device, equipment and storage medium for determining user interest point information
CN102436564A (en) Method and device for identifying tampered webpage
KR20020027987A (en) Method and apparatus for protecting contents of porno
WO2009031759A1 (en) Method and system for generating search collection of query
KR100354207B1 (en) Method and apparatus for protecting contents of porno on internet
US20060218168A1 (en) Method of managing web sites registered in search engine and a system thereof
WO2014183544A1 (en) Method and device for generating a personalized navigation webpage
CN114282097A (en) Information identification method and device
CN114647787A (en) User personalized recommendation method based on multi-modal data
CN120996023A (en) A Sensitive Feature Detection and Analysis Method for Apps Based on Large Language Models
CN103399855A (en) Behavior intention determining method and device based on multiple data sources
CN114299074B (en) Video segmentation method, device, equipment and storage medium
RU2399090C2 (en) System and method for real time internet search of multimedia content
CN116450913A (en) Retrieval method, retrieval device, server and computer readable storage medium
KR100481430B1 (en) Method and system for displaying the searching result with specified image
CN111737517A (en) A method and system for instant recommendation based on short video
EP1267280A2 (en) Method and apparatus for populating, indexing and searching a non-html web content database
CN117763510A (en) Webpage identification method, device, equipment, medium and program product
US20150058307A1 (en) Device for rapid provision of information
EP1162553A2 (en) Method and apparatus for indexing and searching for non-html web content

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20001006

PG1501 Laying open of application
PC1203 Withdrawal of no request for examination
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid