KR100415173B1 - Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data - Google Patents
Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data Download PDFInfo
- Publication number
- KR100415173B1 KR100415173B1 KR10-2001-0007931A KR20010007931A KR100415173B1 KR 100415173 B1 KR100415173 B1 KR 100415173B1 KR 20010007931 A KR20010007931 A KR 20010007931A KR 100415173 B1 KR100415173 B1 KR 100415173B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- customer
- address
- information
- standardization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
본 발명은 다수의 고객 데이터베이스 정보 비교에 의해서 변동된 데이터의 자동 표준화에 의한 데이터의 표준화와 중복화 및 가구화가 이루어지도록 한 고객 접촉정보의 자동 표준화 방법에 관한 것이다.The present invention relates to an automatic standardization method of customer contact information which allows standardization, duplication and householdization of data by automatic standardization of data changed by comparing a plurality of customer database information.
본 발명 데이터 정제 관리시스템을 이용한 변동 데이터의 비교 추출에 따른 고객 접촉정보의 자동 표준화 방법은 고객의 입력 또는 외부 데이터베이스를 통한 고객의 접촉 정보에 의한 데이터가 입력되면 입력된 정보의 스트링 처리에 의한 데이터 분석 작업 대상의 테이블이 선택되는 단계와, 고객 데이터별로 세분화된 정보 테이블에 해당되는 레퍼런스 테이블이 호출되어 상기 레퍼런스 테이블에 저장된 문자열과 고객 데이터의 항목별 정보의 비교가 수행되는 단계와, 상기 레퍼런스 테이블의 표준화된 문자열을 기준으로 한 고객 접촉 정보 데이터의 클리닝과 데이터 자동 변경이 수행되어 정제 데이터를 생성시키는 단계와, 상기 정제 데이터가 시스템 내의 다른 레퍼런스 데이터베이스를 생성시키는 단계와 상기 정제 데이터가 이름을 기준으로 항목별로 순차 정렬되고 테이블의 항목별 중복 레코드의 삭제 또는 통합에 의한 중복자 처리 단계와, 상기 데이터 정제 단계에서 행정동 코드가 부여된 고객 데이터의 주거지 정보를 기준으로 가구 중복에 의한 데이터 가구화 단계의 순차적 구성으로 이루어진다.The automatic standardization method of customer contact information according to the comparative extraction of the variation data using the data purification management system of the present invention is performed by processing the string of the input information when the data by the customer's contact information is input through the customer's input or an external database. Selecting a table to be analyzed, a reference table corresponding to an information table broken down for each customer data, and calling a comparison of the character strings stored in the reference table with information for each item of the customer data; Cleaning and automatically changing data of the customer contact information data based on a standardized character string of the user; generating refinement data; generating refinement data for another reference database in the system; and refining data by name. to Deduplication processing by deleting or consolidating duplicate records by item in a table and sorting by item, and data furniture by furniture duplication based on residential information of customer data assigned with administrative code in the data refining step. It consists of a sequential configuration.
본 발명 데이터 정제 관리시스템을 이용한 변동 데이터의 비교 추출에 따른 고객 접촉정보의 자동 표준화 방법은 다수 고객의 각종 인적 정보가 포함된 접촉 데이터의 정제에 의해서 표준화된 데이터베이스가 구축됨과 아울러 정제된 데이터베이스 정보를 이용한 효율적인 고객 마케팅이 수행될 수 있도록 함과 아울러 마케팅 데이터베이스의 최적화에 따른 활용성을 극대화시켜 추후 생성되는 마케팅 프로그램의 효율성능을 증대시킬 수 있는 장점이 있다.The automatic standardization method of customer contact information according to the comparative extraction of the variation data using the data refining management system of the present invention establishes a standardized database by refining contact data including various personal information of a plurality of customers, In addition to enabling efficient customer marketing, there is an advantage that can increase the efficiency of the marketing program generated later by maximizing the utilization of the optimization of the marketing database.
Description
본 발명은 다수의 고객 데이터베이스 정보 비교에 의해서 변동된 데이터의 자동 표준화에 의한 데이터의 표준화와 중복화 및 가구화가 이루어지도록 한 것으로서, 보다 자세하게는 고객 접촉 정보에 의한 입력 데이터가 이름, 주소, 전화번호등의 항목별로 세분화되어 레퍼런스 테이블을 통한 데이터 정정과 추가 및 가베지(garbage) 처리의 데이터 정제에 의해서 표준화된 레퍼런스 데이터베이스가 작성되고 상기 레퍼런스 데이터베이스 정보간의 비교 추출된 정보에 의해서 단일 데이터의 중복자 처리와 통합 데이터의 일치된 정보 추출에 의한 데이터의 가구화가 수행되며, 트래킹(tracing)에 의한 최신 변경 데이터 확인에 의한 거주지 정보를 갱신하여 최초 접촉정보의 정확도가 향상될 수 있도록 함으로써, 다수 고객의 각종 인적 정보가 포함된 접촉 데이터의 가공을 통해서 표준화된 데이터베이스가 구축됨과 아울러 정제된 데이터베이스 정보를 이용한 효율적인 고객 마케팅이 수행될 수 있도록 한 데이터 정제 관리시스템을 이용한 변동 데이터의 비교 추출에 따른 고객 접촉정보의 자동 표준화 방법에 관한 것이다.고객을 대상으로 하는 기업체들에게는 대개 고객 데이터가 축적되어 있으나 이들 데이터는 원천이나 쓰임새에 따라 각기 다른 형태로 관리되어 있어 이들 데이터를 효과적으로 정리, 통합 관리하는데 많은 어려움이 있다. 또한 많은 경우에 국내의 높은 이동률( 년간 25% ) 때문에 고객주소나 전화번호 등이 제대로 갱신되지 않아 많은 우량고객을 그냥 앉아서 잃어 버리고 있다.The present invention is to standardize, duplicate and furniture the data by automatic standardization of data changed by comparing a plurality of customer database information, more specifically, input data by the customer contact information is name, address, telephone number The standardized reference database is created by subdividing each item into a standard table by data correction and addition and garbage processing through a reference table. The data is integrated by extracting the matched information of the integrated data, and by updating the residence information by checking the latest change data by tracking, so that the accuracy of the initial contact information can be improved. Contact with information It is about automatic standardization of customer contact information by comparing and extracting fluctuation data using the data refining management system that enables the standardized database to be constructed through data processing and efficient customer marketing using the purified database information. In general, customer data is accumulated in customer-targeted companies, but these data are managed in different forms according to their source and use, which makes it difficult to effectively organize and integrate these data. In addition, in many cases, because of the high rate of movement in Korea (25% per year), the customer address or telephone number is not properly updated, and many excellent customers are just sitting and lost.
이러한 현재 접촉정보 데이터 관리는 다양하고 예외가 많은 표기방식 때문에 전사적으로 표준화 처리해 주는 시스템은 없었고, 고객 마케팅을 위한 분석 및 관리를 위한 기존 기술은 눈으로 확인하고 수정하는 방식이므로 이러한 방식으로는 인력, 비용, 시간이 낭비가 되므로 고객 접촉정보를 관리를 하지 않는 경우도 있었다.In the current contact information data management, there is no system that standardizes company-wide due to various and exceptions, and the existing technology for analysis and management for customer marketing is a method of identifying and modifying visually. In some cases, customer contact information was not managed because of the cost and time wasted.
이로 인해 많은 기업체들은 자사의 고객 데이터량에 대해서는 자신하고 있지만 전체 고객 데이터의 통합은 물론, 실질적인 정확도, 최신성, 중복률 가구화의 진정한 고객 정보에 대한 파악은 자신하지 못하고 있다.As a result, many companies are confident about the volume of their data, but they are not confident about the integration of the entire customer data, as well as the true customer information of actual accuracy, freshness, and redundancy.
따라서, 본 발명은 종래 고객관리 시스템에서 제기되고 있는 상기 제반 단점과 문제점을 해결하기 위하여 창안된 것으로서, 고객 접촉정보에 의한 최초의 입력 데이터가 항목별로 세분화되어 레퍼런스 테이블을 통한 데이터 정정과 추가 및 가베지(garbage) 처리의 데이터 정제에 의해서 표준화된 레퍼런스 데이터베이스가 작성되고 상기 레퍼런스 데이터베이스 정보간의 비교 추출된 정보에 의해서 단일 데이터의 중복자 처리와 통합 데이터의 일치된 정보 추출에 의한 데이터의 가구화가 수행되도록 함으로써, 정제된 데이터베이스 정보를 이용하여 효율적인 고객 관리가 이루어질 수 있도록 한 데이터 정제 관리시스템을 이용한 변동 데이터의 비교 추출에 따른 고객 접촉정보의 자동 표준화 방법을 제공함에 발명의 목적이 있다.Accordingly, the present invention was devised to solve the above-mentioned disadvantages and problems in the conventional customer management system, and the first input data based on the customer contact information is broken down by item so that data correction and addition and garbage through the reference table can be made. A standardized reference database is created by data purification of garbage processing, and the data obtained by the comparison and extraction of the reference database information is subjected to the redundancy processing of a single data and the furniture generation by matching information extraction of integrated data. It is an object of the present invention to provide a method for automatically standardizing customer contact information according to comparative extraction of variation data using a data purification management system that enables efficient customer management using purified database information.
또한, 본 발명의 다른 목적은 고객 데이터의 접촉정보를 표준화, 통합, 가구화하여 고객 정보의 정확성과 다양성을 확보할 수 있을 뿐만 아니라 각 기업들의 필요에 따라 E-mail 표준화, 주거지 분석에 필요한 행정지역동코드 추가, 주소부분에서의 직장 주소를 구분 할 수 있는 선택적 프로세스를 추가 할 수 있도록 한 데에 있다.In addition, another object of the present invention is not only to secure the accuracy and diversity of customer information by standardizing, integrating, and furnishing contact information of customer data, but also to manage e-mail standardization and residential analysis according to each company's needs. The addition of local codes and the addition of an optional process to distinguish work addresses in the address section.
도1은 본 발명에 따른 고객 접촉정보 자동 표준화 방법의 전체적인 시스템 구성도.1 is an overall system configuration of a method for automatically standardizing customer contact information according to the present invention.
도2는 본 발명에 따른 표준화 부분 주민번호를 처리하는 하위 프로세스가 도시된 순서도.2 is a flow chart illustrating a sub-process for processing standardized partial social security numbers in accordance with the present invention.
도3은 본 발명에 따른 표준화의 이름이 처리되는 하위 프로세스가 도시된 순서도.3 is a flow chart showing a subprocess in which the name of standardization is processed in accordance with the present invention;
도4는 본 발명에 따른 표준화의 전화번호가 처리되는 하위 프로세스가 도시된순서도.Figure 4 is a flow chart illustrating a subprocess in which the telephone number of standardization according to the present invention is processed.
도5는 본 발명에 따른 표준화의 우편번호가 처리되는 하위 프로세스가 도시된순서도.Figure 5 is a flow chart illustrating a subprocess in which the postal code of standardization according to the present invention is processed.
도6은 본 발명에 따른 표준화의 주소 항목을 처리하는 하위 프로세스가 도시된 순서도.Figure 6 is a flow chart illustrating a subprocess for processing address entries of normalization in accordance with the present invention.
도7은 본 발명에 따른 표준화의 행정동코드 처리 하위 프로세스가 도시된 순서도.Fig. 7 is a flowchart showing the administrative code processing subprocess of standardization according to the present invention.
도8은 본 발명에 따른 표준화의 E-mail 처리 정보에 대한 하위 프로세스가 도시된 순서도.Fig. 8 is a flowchart showing a subprocess for standardizing E-mail processing information according to the present invention.
도9는 본 발명에 따른 표준화의 중복자 처리에 대한 하위 프로세스가 도시된순서도.9 is a flow chart illustrating a sub-process for redundant processing of standardization in accordance with the present invention.
도10은 본 발명에 따른 표준화된 데이터의 통합 대한 하위 프로세스가 도시된순서도.10 is a flow chart illustrating a subprocess for the integration of standardized data in accordance with the present invention.
도11은 본 발명에 따른 데이터 가구화의 하위 프로세스가 도시된 순서도.Figure 11 is a flow chart illustrating the subprocess of data furnishing in accordance with the present invention.
본 발명의 상기 목적은, 고객의 입력 또는 외부 데이터베이스를 통한 고객의 접촉 정보에 의한 데이터가 입력되면 입력된 정보의 스트링 처리에 의한 데이터 분석 작업 대상의 테이블이 선택되는 단계와, 고객 데이터별로 세분화된 정보 테이블에 해당되는 레퍼런스 테이블이 호출되어 상기 레퍼런스 테이블에 저장된 문자열과 고객 데이터의 항목별 정보의 비교가 수행되는 단계와, 상기 레퍼런스 테이블의 표준화된 문자열을 기준으로 한 고객 접촉 정보 데이터의 클리닝과 데이터 자동 변경이 수행되어 정제 데이터를 생성시키는 단계와, 상기 정제 데이터가 이름을 기준으로 항목별로 순차 정렬되고 테이블의 항목별 중복 레코드의 삭제 또는 통합에 의한 중복자 처리 단계와, 상기 데이터 정제 단계에서 행정동 코드가 부여된 고객 데이터의 주거지 정보를 기준으로 가구 중복에 의한 데이터 가구화 단계를 포함하여 구성됨에 의해서 달성된다.본 발명에 의해서 데이터의 표준화가 수행되는 고객의 입력 데이터 또는 외부 데이터베이스에서 추출되는 고객 접촉 데이터는 반복되는 표준화 과정에서 생성되는 레퍼런스 데이터베이스 정보를 기준으로 비교 검토 및 추출되어 각 항목별 레퍼런스 테이블의 문자열에 적합한 정제 데이터로 변환이 이루어지게 된다.상기 레퍼런스 데이터베이스는 저장된 각 항목별 데이터가 각 레퍼런스 테이블에 의해서 정보의 클리닝과 통합 작업에 의해 표준화된 데이터만이 저장되며 각 레퍼런스 테이블의 문자열 비교 검토에 따라 연속적으로 다수의 레퍼런스 데이터베이스가 생성되어 데이터베이스간의 통합을 이루게 된다.또한, 통합 레퍼런스 데이터베이스의 표준화된 데이터 정보에 포함된 각 항목별 데이터의 순차적 정렬에 따른 항목별 정보의 비교에 의해서 중복 데이터의 삭제 및 데이터간 통합 작업이 수행되고 재정렬된 데이터간의 거주지 정보에 기초한 나이, 성별, 이름 정보에 의해서 고객 데이터간의 가족 여부를 판단함으로써 데이터의 가구화에 따른 가족 관계가 추론될 수 있을 것이다.본 발명 데이터 정제 관리시스템을 이용한 변동 데이터의 비교 추출에 따른 고객 접촉정보의 자동 표준화 방법의 상기 목적에 대한 기술적 구성을 비롯한 작용효과에 관한 사항은 본 발명의 바람직한 실시예가 도시된 도면을 참조한 아래의 상세한 설명에 의해서 명확하게 이해될 것이다.상기의 목적을 달성하기 위힌 고객의 접촉정보를 이름 주민번호/전화번호/우편번호/주소로 구분을 하여 레퍼런스 테이블을 참조한 프로세스 진행과정을 순서도로 표시하였다.The above object of the present invention is a step of selecting a table of the data analysis work target by processing the string of the input information when the data by the customer input or contact information of the customer through the external database is selected, and broken down by customer data A reference table corresponding to the information table is called to compare the information stored in the reference table with item-specific information of the customer data, and to clean and data the customer contact information data based on the standardized character string of the reference table. An automatic change is performed to generate purified data, the purified data is sequentially sorted by item based on a name, and a duplicater processing step is performed by deleting or consolidating a duplicate record for each item in a table; Home of coded customer data It is achieved by including a step of data furnishing by furniture duplication based on the information. The customer input data or the customer contact data extracted from an external database in which the standardization of data is performed by the present invention is performed in the repeated standardization process. Based on the generated reference database information, the information is compared and extracted and converted into refined data suitable for character strings of the reference tables for each item. The reference database stores the information of each item stored by each reference table. Only data standardized by the consolidation operation is stored, and a plurality of reference databases are created in succession according to the string comparison of each reference table to achieve consolidation among the databases. By comparing the information of each item according to the sequential sorting of the data of each item included in the normalized data information, the deletion of duplicate data and the integration of data are performed, and by age, gender, and name information based on residence information between the rearranged data The family relationship according to the furniture can be inferred by judging the family status between the customer data. For the above purpose of the automatic standardization method of the customer contact information according to the comparative extraction of the variation data using the data purification management system of the present invention. The matters related to the operational effects, including the technical configuration, will be clearly understood by the following detailed description with reference to the drawings in which preferred embodiments of the present invention are shown. Refer to reference table by separating by number / zip / address The process was to show the progress of the flowchart.
먼저, 도1은 본 발명에 따른 고객 접촉정보 자동 표준화 방법의 전체적인 시스템 구성도로서, 도시된 바와같이 본 발명의 변동 데이터 비교 추출에 따른 고객 접촉정보의 자동 표준화 방법은 고객의 입력 또는 외부 데이터베이스를 통한 고객의 접촉 정보에 의한 데이터가 입력되는 단계와, 입력된 정보의 스트링 처리에 의한 데이터 분석 대상의 항목별 테이블이 선택되는 단계와, 고객 데이터별로 세분화된 정보 테이블에 해당되는 레퍼런스 테이블이 호출되고 상기 레퍼런스 테이블에 저장된 문자열과 고객 데이터의 항목별 정보의 비교가 수행되는 단계와, 상기 레퍼런스 테이블의 표준화된 문자열을 기준으로 한 고객 접촉 정보 데이터의 클리닝과 데이터 자동 변경이 수행되어 정제 데이터를 생성시키는 단계와, 상기 정제 데이터가 시스템 내의 다른 레퍼런스 데이터베이스를 생성시키는 단계와, 상기 정제 데이터가 이름을 기준으로 항목별로 순차 정렬되고 테이블의 항목별 중복 레코드의 삭제 또는 통합에 의한 중복자 처리 단계와, 상기 데이터 정제 단계에서 행정동 코드가 부여된 고객 데이터의 주거지 정보를 기준으로 가구 중복에 의한 데이터 가구화 단계를 포함하여 구성된다.이때, 상기 각 단계별 프로세스의 하위에는 단계별로 세분화된 데이터 처리 과정이 포함된 하위 레퍼런스가 존재하며 레퍼런스의 기본 문자열 정보에 의한 각 단계별 데이터의 표준화 프로세스에 대하여 살펴보면 다음과 같다.First, FIG. 1 is an overall system configuration diagram of a method for automatically standardizing customer contact information according to the present invention. As shown in FIG. The step of inputting the data by the customer's contact information through the step, the step of selecting the item-specific table of the data analysis target by the string processing of the input information, and the reference table corresponding to the information table broken down by customer data is called Comparing the character string information stored in the reference table with item information of the customer data, and cleaning and automatically changing the data of the customer contact information based on the standardized character string of the reference table to generate purified data. The purification data is stored in the system. Creating a reference database, processing the duplicated data by sorting the purified data sequentially by item based on a name, deleting or merging duplicate records of each item in a table, and providing a customer administration code in the data refining step Based on the information of the residence of the data is configured to include the data furnishing step by the duplication of the furniture, at the bottom of each step of the process there is a sub-reference containing the data processing step by step and the base string information of the reference The standardization process of each step data by using is as follows.
도2는 본 발명에 따른 표준화 부분 주민번호를 처리하는 하위 프로세스가 도시된 순서도로서, 도시된 바와같이 먼저 입력된 주민번호 정보의 분석에 의해서 숫자를 제외한 문자가 제거되고 주민번호 숫자 총 13자리중 전방 6자리의 생년월일 형식 내용이 확인되고 후방 7자리의 첫번째 숫자를 이용해 남성과 여성의 성별을 구분한다.또한, 생년월일 및 성별 고유번호의 기초 정보에 의해서 분류된 주민등록번호는 Mod(11- Mod (1자리 * 2+2자리 * 3+3자리 * 4+4자리 * 5+5자리 * 6+6자리 * 7+7자리 * 8+8자리 * 9+9자리 * 2+10자리 * 3+11자리 * 4+12자리 * 5,11) - 13자리,10) = 0 이라는 계산식에 의해서 계산되어 분류된 주민번호의 정확성이 판단된다.2 is a flowchart illustrating a sub-process for processing a standardized partial social security number according to the present invention. As shown in FIG. 2, characters except for numbers are removed by analysis of previously input social security number information. The first six digits of birth date are checked and the first seven digits are used to distinguish the genders of males and females.In addition, social security numbers classified by basic information of birth date and gender identification number are Mod (11- Mod (1). Digit * 2 + 2 Digits * 3 + 3 Digits * 4 + 4 Digits * 5 + 5 Digits * 6 + 6 Digits * 7 + 7 Digits * 8 + 8 Digits * 9 + 9 Digits * 2 + 10 Digits * 3 + 11 Digits Digit * 4 + 12 digits * 5,11)-13 digits, 10) = 0 is calculated by the formula to determine the accuracy of the classification.
도3은 본 발명에 따른 표준화의 이름이 처리되는 하위 프로세스가 도시된 순서도로서, 도시된 바와같이 이름 항목의 데이터 분석에 의해서 이름 사이의 스페이스를 삭제하고 전체 이름의 자릿수를 판독하여 삭제된 자릿수가 5 이상이면 이름구분 레퍼런스 테이블 호출에 의해서 3자리 또는 4자리 이름을 제외한 부분, 예를 들어 '귀하', '님께', '에게'등의 단어가 제거된다.또한, 상기 특정 단어 외의 이름구분이 판독되지 않은 이름의 경우는 특별 예외성이 인정되어 에러 처리에 의한 시스템 관리자의 수작업에 의한 표준화가 이루어지게 되며 상기 도2의 주민번호 구분 항목과 연동되는 여성구분 레퍼런스 테이블에 의해서 여성 이름의 분류가 수행된다.3 is a flow chart showing a sub-process in which the name of standardization is processed according to the present invention. As shown in FIG. 3, the number of digits deleted by deleting the space between names and reading the number of digits of the entire name by data analysis of the name item is shown. If the value is 5 or more, a part of the name except for a three- or four-digit name, for example, 'you', 'your', or 'to', is removed by the name classification reference table call. In the case of unread names, special exceptions are recognized, and standardization by manual operation of the system administrator by error handling is performed. Is performed.
도4는 본 발명에 따른 표준화의 전화번호가 처리되는 하위 프로세스가 도시된 순서도로서, 도시된 바와같이 정제 작업 선택에 의해서 스트링 처리된 전화번호 데이터가 수신되면 지역번호와 국번 및 개인번호로 구분되고 지역번호와 국번이 동시 판독 가능한 항목의 주소 구분자와 연동되어 주소를 참조한 지역번호 및 국번으로 자동 갱신된다.예를 들어, 지역번호가 '02'인 서울의 경우 변경된 일부 구(區)의 3자리 국번이 4자리 국번으로 갱신되고 지역번호 레퍼펀스 테이블에 의해서 서울을 제외한 지역의 경우는 종래의 4자리 지역번호는 주소 체계를 기준으로 한 3자리 지역번호로, 2자리 국번은 변경된 3자리 국번으로 각각 갱신되고 별도 호출되는 핸드폰번호 레퍼런스 테이블에 의해서 핸드폰 여부가 판단되어 표준화된 레퍼런스 데이터베이스로 전송된다.한편, 지역번호가 미기재된 전화번호에 대하여 주소 갱신 프로세스를 통해 추론된 지역의 해당 지역번호가 추가되고 상기 지역번호 레퍼런스 테이블을 이용한 해당 지역의 국번 갱신이 이루어지게 되며, 자택전화번호와 직장전화번호 및 핸드폰번호, 팩스번호로 분류되어 전화번호 항목의 표준화가 이루어지게 된다.4 is a flowchart illustrating a sub-process in which standardized telephone numbers are processed according to the present invention, and when the telephone number data is string-processed by selecting a refining operation, as shown, it is divided into an area code, a station number, and an individual number. The area code and the station number are automatically updated with the area code and the station number referring to the address in conjunction with the address separator of the item that can be read simultaneously.For example, in Seoul, where the area code is '02', the changed three digits In case of areas except Seoul by the area code reference table, the conventional 4-digit area code is a 3-digit area code based on the address system, and the 2-digit station code is a changed 3-digit station number. Cell phone number is judged by each cell number reference table updated and called separately and transferred to standardized reference database. On the other hand, the area code of the area inferred through the address update process is added to the phone number without the area code, and the area code of the area is updated using the area code reference table. It is classified into a work phone number, a mobile phone number, and a fax number to standardize phone number items.
도5는 본 발명에 따른 표준화의 우편번호가 처리되는 하위 프로세스가 도시된 순서도로서, 도시된 바와같이 주소 구분과 동시에 분류되는 우편번호 항목에 대해서 우편번호 레퍼런스 테이블 호출에 의한 시도, 시군구, 동읍면, 리, 번지를 확인하여 해당 지역의 우편번호를 추가 또는 갱신한다.이는 정보통신부에서 발행된 전국의 번지별 우편번호체계에 의해서 레퍼런스 테이블로 구축된 번지/리, 건물(아파트), 동/읍/면의 순서대로 순서대로 분류 검색되어 신규 우편번호의 갱신이 이루어지게 된다.5 is a flowchart illustrating a sub-process in which a postal code of standardization is processed according to the present invention. As shown in FIG. Add or update the postal code of the region by checking the address, address, and address.This is the address / ri, the building (apartment), and the east / eup, which are constructed as reference tables by the national postal code system issued by the Ministry of Information and Communication. The new zip code is updated by sorting and searching in the order of / page.
도6은 본 발명에 따른 표준화의 주소 항목을 처리하는 하위 프로세스가 도시된 순서도로서, 도시된 바와같이 입력된 주소 데이터의 전방을 시도, 시군, 구, 읍면동, 리의 순서대로 분할하고 그 후방의 번지/호, 통/반, 주택명, 주거형태, 동/호의 순서대로 분할되게 한다.이때, 주소 후방에 표시되는 번지와 호수 및 통, 반, 아파트, 동호 등의 구분 가능한 문자열의 예외성이 포함될 수 있는 문자에 대하여 구분자 레퍼런스 테이블에 저장되고 분할된 주소 구분의 구분자 레퍼런스 테이블의 호출에 의해서 주소 후방의 데이터 표준화가 이루어지게 된다.예를 들어 아파트 주소 표시의 경우 'xx 아파트'로 표준화될 아파트명 구분자의 예외성으로 APT, ⓐ, A.P.T등의 구분자가 구분자 레퍼런스 테이블에 저장되어 상기 분할된 주소 후방의 구분자와 비교되면서 표준화된 'xx 아파트'의 문자열로 표준화를 이루게 된다.또한, 주소 항목에 대한 표준화가 완료되면 도5의 우편번호 표준화 단계와 연동되어 번지별 또는 건물별 우편번호가 추가 또는 갱신되고 직장구분 레퍼런스 테이블에 의해서 직장주소의 판단에 의한 직장수소 항목의 레퍼런스 데이터베이스에 저장이 완료된다.FIG. 6 is a flowchart illustrating a subprocess for processing address items of standardization according to the present invention, in which the front of the input address data is divided in the order of city, city, ward, eup-myeon dong, and ridge as shown in the figure. / Ho, ban / ban, house name, type of residence, and dong / ho, with the exception of the address displayed behind the address and the distinguishable character strings such as lake and barrel, ban, apartment, and dongho. The standardization of the data behind the address is done by calling the delimiter reference table of the partitioned address delimiter, which is stored in the delimiter reference table for the number of characters that can be used. As an exception of delimiter, delimiters such as APT, ⓐ, APT are stored in delimiter reference table and compared with delimiters behind the divided address. In addition, standardization of the address of 'xx apartment' is completed. When standardization of address items is completed, the postal code by address or building is added or updated in accordance with the postal code standardization step of FIG. By the way, the storage is completed in the reference database of the work hydrogen items based on the determination of the work address.
도7은 본 발명에 따른 표준화의 행정동코드 처리 하위 프로세스가 도시된 순서도로서, 도시된 바와같이 주소 항목의 레퍼런스 테이블과 연동되는 번지별 행정동 레퍼런스 테이블을 호출하여 시도, 시군구, 읍면동, 리, 번지를 비교 확인하여 레퍼런스 테이블에 별도 기준에 의해 일련번호로 정리된 행정동코드가 부여되고 입력된 주소 정보에 번지가 없을 경우에는 상기 주소항목 표준화 단계를 참조로 법정동에 대한 행정동코드를 부과 또는 추가하게 된다.7 is a flowchart illustrating a sub-process administrative code processing standardization according to the present invention. As shown in FIG. By comparing and checking the reference table, administrative codes arranged as serial numbers are assigned to separate reference tables, and if there is no address in the input address information, administrative codes for statutory buildings are imposed or added with reference to the standardization step of the address item.
도8은 본 발명에 따른 표준화의 E-mail 처리 정보에 대한 하위 프로세스가 도시된 순서도로서, 도시된 바와 같이 E-mail 계정의 구분자인 '@'의 존재 여부를 판단하여 @를 기준으로 아이디와 도메인명을 분리하고 도메인명의 분류 기준이 제시되는 도메인 레퍼런스 테이블 호출에 의해서 불충분한 도메인의 표기나 잘못된 스펠링의 표기에 대해서 대표되는 하나의 도메인명으로 통일하여 표준화된 도메인에 의한 E-mail계정이 레러펀스 데이터베이스에 저장된다.8 is a flowchart illustrating a sub-process for standardizing E-mail processing information according to the present invention. As shown in FIG. E-mail accounts with standardized domains are unified by one domain name, which is represented by a domain reference table call that separates domain names and classifies criteria for domain names. It is stored in the fund database.
도9와 도10은 본 발명에 따른 표준화의 중복자 처리에 대한 하위 프로세스가 도시된 순서도로서, 도시된 바와같이 상기 전 단계들의표준화 과정을 거쳐 레퍼런스 데이터베이스에 저장된 고객 데이터의 이름 항목을 중심으로 주민번호와 전화번호를 오름차순으로 정렬되도록 하여 각 레코드의 비교 검토에 따라 중복된 레코드가 검색됨과 아울러 최종적으로 주소 항목에 의한 비교에 의해서 중복된 레코드의 삭제 또는 통합에 의한 중복자 처리가 이루어지게 된다.9 and 10 are flowcharts showing a sub-process for standardization of duplicater processing according to the present invention. As shown in FIG. By arranging numbers and phone numbers in ascending order, duplicate records are searched by comparing and reviewing each record, and finally, duplicated data processing is performed by deleting or merging duplicate records by comparison by address item.
또한, 상기 단계를 거쳐 표준화가 이루어진 단일 항목의 데이터들을 이름과 주민번호, 이름과 전화번호, 이름과 주소의 복합 항목별로 도9에 의해서 통합된 데이터와 외부의 관계사 데이터를 비교 검토하여 데이터 레코드간의 상호 매칭된 레코드에 대해서 통합고객번호를 부여하고 삭제 또는 통합등의 중복자 처리와 아울러 통합된 데이터베이스에 저장된다.In addition, the data of the single item that has been standardized through the above steps are compared and compared between the data consolidated by FIG. 9 and the external affiliate data by the complex items of name, social security number, name and telephone number, name and address. An integrated customer number is assigned to each matched record and stored in an integrated database along with duplicate processing such as deletion or consolidation.
도11은 본 발명에 따른 데이터 가구화의 하위 프로세스가 도시된 순서도로서, 도시된 바와같이 상기 중복자 처리 단계를 거쳐 통합된 데이터를 통해 전화번호와 주소 항목의 정제 데이터가 추출되고 상기 전화번호와 주소 데이터를 중심으로 중복된 전화번호와 주소 항목에 의해서 가족 구성원의 개념을 토대로 데이터의 가구화가 이루어지게 되며, 상기 중복자 처리 단계와 유사한 데이터 비교 방식에 의해서 이루어지게 된다.FIG. 11 is a flowchart illustrating a subprocess of data furnishing according to the present invention. As shown in FIG. 11, purified data of a phone number and an address item is extracted through data integrated through the redundancy processing step, and the phone number and The data is furnitureized based on the concept of a family member by the overlapping telephone number and the address item based on the address data, and is performed by a data comparison method similar to the duplicater processing step.
이상에서 설명한 바와같이, 본 발명 데이터 정제 관리시스템을 이용한 변동 데이터의 비교 추출에 따른 고객 접촉정보의 자동 표준화 방법은 고객 접촉정보에 의한 최초의 입력 데이터가 항목별로 세분화되어 레퍼런스 테이블을 통한 데이터 정정과 추가 및 가베지(garbage) 처리의 데이터 정제에 의해서 표준화된 레퍼런스 데이터베이스가 작성되고 상기 레퍼런스 데이터베이스 정보간의 비교 추출된 정보에 의해서 단일 데이터의 중복자 처리와 통합 데이터의 일치된 정보 추출에 의한 데이터의 가구화가 수행되도록 함으로써, 다수 고객의 각종 인적 정보가 포함된 접촉 데이터의 정제에 의해서 표준화된 데이터베이스가 구축됨과 아울러 정제된 데이터베이스 정보를 이용한 효율적인 고객 마케팅이 수행될 수 있도록 함과 아울러 마케팅 데이터베이스의 최적화에 따른 활용성을 극대화시켜 추후 생성되는 마케팅 프로그램의 효율성능을 증대시킬 수 있는 장점이 있다.As described above, the automatic standardization method of the customer contact information according to the comparative extraction of the variation data using the data purification management system of the present invention is the first input data by the customer contact information is subdivided by item and the data correction through the reference table A standardized reference database is created by data addition and garbage processing, and data reconciliation is performed by the overlapping processing of a single data and the matching information extraction of integrated data by comparing and extracting information between the reference database information. In this way, a standardized database can be established by refining contact data including various personal information of a plurality of customers, and efficient marketing can be carried out using the purified database information. Maximizing the utility of the optimization of the has the advantage that can increase the efficiency of the generated marketing program.
또한, 본 발명은 고객의 전화번호나 주소등의 오류를 수정, 표준화하여 사용함으로써 DM,TM,EM등의 마케팅 프로그램의 결번율, 반송률을 감소시켜 전화조사나 우편발송의 비용 낭비를 최소화하고 고객의 전화번호, 주소등을 갱신하여 재활성된 마케팅을 수행함으로써 휴면 고객의 재활성화에 따른 경제적인 이점이 있다.In addition, the present invention by reducing and standardizing errors, such as the telephone number or address of the customer by reducing the defect rate, return rate of marketing programs such as DM, TM, EM, etc., minimizing the waste of the cost of telephone research or mailing By renewing the phone number, address, etc. of the reactivated marketing, there is an economic advantage of reactivation of dormant customers.
그리고, 본 발명에 따른 표준화된 레퍼런스 데이터베이스는 각종 데이터와의 다양한 통합, 연동을 통해 전략적이고 보다 효과적인 데이터베이스 마케팅을 실시할 수 있는 효과가 있다.In addition, the standardized reference database according to the present invention has an effect of performing strategic and more effective database marketing through various integration and interworking with various data.
Claims (6)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2001-0007931A KR100415173B1 (en) | 2001-02-16 | 2001-02-16 | Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2001-0007931A KR100415173B1 (en) | 2001-02-16 | 2001-02-16 | Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20010044398A KR20010044398A (en) | 2001-06-05 |
| KR100415173B1 true KR100415173B1 (en) | 2004-01-14 |
Family
ID=19705858
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR10-2001-0007931A Expired - Fee Related KR100415173B1 (en) | 2001-02-16 | 2001-02-16 | Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR100415173B1 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100911762B1 (en) * | 2008-06-23 | 2009-08-11 | (주)지디에스케이 | Address standardization system and method |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100506911B1 (en) * | 2002-08-30 | 2005-08-17 | 한국인포서비스 주식회사 | Compare apparatus and method for telephone number |
| KR100728612B1 (en) * | 2004-07-29 | 2007-06-14 | (주)위세아이텍 | Data Quality Management Method in Data Migration |
| KR101447526B1 (en) * | 2013-02-01 | 2014-10-08 | (주)수지원넷소프트 | Method and apparatus for sorting personal information database based on an address and for grouping information from the sorted database |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5966695A (en) * | 1995-10-17 | 1999-10-12 | Citibank, N.A. | Sales and marketing support system using a graphical query prospect database |
| KR20000000217A (en) * | 1999-10-02 | 2000-01-15 | 이수원 | System for altering receipt point of postal matters for service subscribers |
| KR20000024680A (en) * | 2000-02-29 | 2000-05-06 | 이만순 | System for providing portal service |
| KR20000030842A (en) * | 2000-03-21 | 2000-06-05 | 이호철 | A method for designing and supplying database of communication-related personal information, and integrated communication service method using them |
| KR20010084364A (en) * | 2000-02-25 | 2001-09-06 | 이병두 | Internet personal identification managing method and system |
| KR20010091207A (en) * | 2000-03-14 | 2001-10-23 | 전하진 | System for global management of client data of internet services |
-
2001
- 2001-02-16 KR KR10-2001-0007931A patent/KR100415173B1/en not_active Expired - Fee Related
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5966695A (en) * | 1995-10-17 | 1999-10-12 | Citibank, N.A. | Sales and marketing support system using a graphical query prospect database |
| KR20000000217A (en) * | 1999-10-02 | 2000-01-15 | 이수원 | System for altering receipt point of postal matters for service subscribers |
| KR20010084364A (en) * | 2000-02-25 | 2001-09-06 | 이병두 | Internet personal identification managing method and system |
| KR20000024680A (en) * | 2000-02-29 | 2000-05-06 | 이만순 | System for providing portal service |
| KR20010091207A (en) * | 2000-03-14 | 2001-10-23 | 전하진 | System for global management of client data of internet services |
| KR20000030842A (en) * | 2000-03-21 | 2000-06-05 | 이호철 | A method for designing and supplying database of communication-related personal information, and integrated communication service method using them |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100911762B1 (en) * | 2008-06-23 | 2009-08-11 | (주)지디에스케이 | Address standardization system and method |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20010044398A (en) | 2001-06-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7200602B2 (en) | Data set comparison and net change processing | |
| KR101276602B1 (en) | System and method for searching and matching data having ideogrammatic content | |
| AU2010249253B2 (en) | A method for automatically indexing documents | |
| US20040133561A1 (en) | System and method for identifying alternate contact information | |
| KR100911762B1 (en) | Address standardization system and method | |
| JP2011134342A5 (en) | ||
| US20060112133A1 (en) | System and method for creating and maintaining data records to improve accuracy thereof | |
| AU2002331728A1 (en) | A method for automatically indexing documents | |
| KR101930034B1 (en) | Apparatus and method for determining domain | |
| KR100415173B1 (en) | Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data | |
| JP7588989B2 (en) | Address code generation system, enterprise configuration information management system and program | |
| EP1116137B1 (en) | Database, and methods of data storage and retrieval | |
| US20030055838A1 (en) | Data storing method and data storing structure | |
| KR100921217B1 (en) | Income estimation system and method | |
| JP5148157B2 (en) | Customer information management device | |
| CN1265308C (en) | Automatic inquiry system and method | |
| KR101447526B1 (en) | Method and apparatus for sorting personal information database based on an address and for grouping information from the sorted database | |
| JP5541628B2 (en) | Telephone book publisher information tracking device, system, program, and method | |
| US7181443B2 (en) | System and method for supporting a tariff code selection | |
| Van Lieshout et al. | Company Directors: Directory and Census Record Linkage, 1881-1911 | |
| JP4428630B2 (en) | Telephone number management method and telephone number management program | |
| Darroch et al. | CCRI Sample Designs and Sample Point Identification, Data Entry, and Reporting (SPIDER) Software | |
| JPS61182132A (en) | Information retrieval system | |
| CN116644745A (en) | Industry prediction method and equipment based on company name | |
| SE518744C2 (en) | Data extraction method for Internet applications, involves replacing contents of other fields in respective data table in new record stored in predetermined table for expansion |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R15-X000 | Change to inventor requested |
St.27 status event code: A-3-3-R10-R15-oth-X000 |
|
| R16-X000 | Change to inventor recorded |
St.27 status event code: A-3-3-R10-R16-oth-X000 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 8 |
|
| FPAY | Annual fee payment |
Payment date: 20120102 Year of fee payment: 9 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 9 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20130101 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20130101 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |