KR20060007148A - Voice recognition driving method - Google Patents
Voice recognition driving method Download PDFInfo
- Publication number
- KR20060007148A KR20060007148A KR1020040055904A KR20040055904A KR20060007148A KR 20060007148 A KR20060007148 A KR 20060007148A KR 1020040055904 A KR1020040055904 A KR 1020040055904A KR 20040055904 A KR20040055904 A KR 20040055904A KR 20060007148 A KR20060007148 A KR 20060007148A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- voice recognition
- name
- input
- menu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Telephone Function (AREA)
Abstract
본 발명은 음성인식구동방법이, 음성인식모드에서 음성명령을 요구하는 음성안내메시지가 출력되는 음성명령입력대기과정과, 상기 음성명령입력이 음성인식시간 경과 전에 입력되면, 상기 음성명령을 인식하기 위한 음성인식작업을 수행하는 과정과, 상기 음성명령입력이 음성인식시간이 경과 후에도 입력되지 않으면, 음성인식실패 횟수를 체크하여. 상기 음성인식실패 횟수가 일정횟수 이하이면 상기 음성모드로 전환하며, 상기 음성인식실패 횟수가 일정회수 이상이면 상기 음성인식모드를 종료하는 과정과, 상기 음성인식작업을 통해 상기 음성명령인식이 성공하면, 상기 음성명령에 따른 해당데이터를 표시 및 상기 해당데이터의 수행준비를 알리는 음성안내메시지를 출력 후 상기 해당데이터의 기능을 수행하는 과정과, 상기 음성인식작업을 통해 상기 음성명령인식이 실패하면, 음성인식실패원인을 판단하여, 상기 음성인식실패가 일정횟수이하이면 상기 음성모드로 전환하며, 상기 음성인식실패가 일정횟수이상이며 상기 음성모드를 종료하는 과정으로 이루어짐을 특징으로 한다.According to the present invention, the voice recognition driving method includes a voice command input waiting process for outputting a voice guide message requesting a voice command in the voice recognition mode, and recognizing the voice command when the voice command input is input before the voice recognition time elapses. And performing a voice recognition operation for the voice recognition operation, and checking the voice recognition failure times if the voice command input is not input even after the voice recognition time has elapsed. If the number of voice recognition failures is less than a certain number of times, the voice mode is switched. If the number of voice recognition failures is more than a certain number of times, ending the voice recognition mode; and if the voice command recognition is successful through the voice recognition operation. Displaying a corresponding data according to the voice command and outputting a voice guide message indicating the preparation for performing the corresponding data, and then performing a function of the corresponding data; and if the voice command recognition fails through the voice recognition operation, Determining the cause of the voice recognition failure, if the voice recognition failure is less than a predetermined number of times, the voice mode is switched, and the voice recognition failure is a predetermined number or more, characterized in that the process of ending the voice mode.
음성인식장치, 음성인식모드, 직접통화, 메뉴전환, 이름통화,이름검색Voice recognition device, voice recognition mode, direct call, menu switch, name call, name search
Description
도 1은 본 발명의 실시 예에 따라 음성인식장치를 구비한 휴대단말기의 구성도.1 is a block diagram of a mobile terminal having a voice recognition device according to an embodiment of the present invention.
도 2는 본 발명의 실시 예에 따른 휴대단말기에서 음성인식 동작을 도시한 흐름도.2 is a flowchart illustrating a voice recognition operation in a mobile terminal according to an embodiment of the present invention.
도 3은 본 발명의 제1실시 예에 따른 휴대단말기에서 음성인식 동작을 도시한 흐름도.3 is a flowchart illustrating a voice recognition operation in the mobile terminal according to the first embodiment of the present invention.
도 4a - 도 4d는 도 3을 설명하기 위한 도면.4A-4D are views for explaining FIG. 3;
도 5는 도 3의 직접통화수행을 위한 음성인식 동작을 도시한 흐름도.5 is a flowchart illustrating a voice recognition operation for performing a direct call of FIG. 3.
도 6a - 도 6g는 도 5를 설명하기 위한 도면.6A-6G are views for explaining FIG.
도 7은 도 3의 메뉴전환수행을 위한 음성인식 동작을 도시한 흐름도.FIG. 7 is a flowchart illustrating a voice recognition operation for performing menu switching of FIG. 3.
도 8a - 도 8h는 도 7을 설명하기 위한 도면.8A to 8H are views for explaining FIG. 7.
도 9는 도 3의 이름통화수행을 위한 음성인식 동작을 도시한 흐름도.9 is a flowchart illustrating a voice recognition operation for performing a name call of FIG. 3.
도 10a - 도 10f는 도 9를 설명하기 위한 도면.10A to 10F are views for explaining FIG. 9;
도 11은 도 3의 이름검색수행을 위한 음성인식 동작을 도시한 흐름도.FIG. 11 is a flowchart illustrating a voice recognition operation for performing a name search of FIG. 3.
도 12a - 도 12l은 도 11을 설명하기 위한 도면.12A to 12L are views for explaining FIG.
도 13a 및 도 13b는 도 3의 음성인식장치의 세팅수행을 위한 동작을 도시한 흐름도.13A and 13B are flowcharts illustrating an operation for performing setting of the voice recognition apparatus of FIG. 3.
도 14a - 도 14h는 도 13a를 설명하기 위한 도면.14A to 14H are views for explaining FIG. 13A.
도 15a - 도 15o는 도 13b를 설명하기 위한 도면.15A to 15O are views for explaining FIG. 13B.
도 16a - 도 16f는 본 발명의 제1실시 예에 따른 휴대단말기에서 음성인식 동작 중 실패과정을 도시한 흐름도.16A to 16F are flowcharts illustrating a failure process during a voice recognition operation in a mobile terminal according to the first embodiment of the present invention.
본 발명은 음성인식장치에 관한 것으로, 특히 음성명령을 통해 다양한 기능을 수행하는 음성인식장치의 동작방법에 관한 것이다.The present invention relates to a voice recognition device, and more particularly, to a method of operating a voice recognition device that performs various functions through voice commands.
음성인식(voice recognition)기술이란 인간의 음성을 컴퓨터가 분석해 이를 인식 또는 이해하는 기술을 말하는데, 발음에 따라 입 모양과 혀의 위치 변화로 특정한 주파수를 갖는 인간의 음성을 이용, 발성된 음성을 전기신호로 변환한 후 음성신호의 주파수 특성을 추출해 발음을 인식하는 기술이다, 최근에는 이와 같은 음성인식 기술이 장난감 제어, 어학학습 또는 가전기기 제어등과 같은 다양한 분야에 응용되고 있다. 상기와 같은 음성인식기술을 이용하여 해당기능을 수행한다면 키 입력을 통해 해당기능을 수행하는 불편함을 해소하며, 사용자에게 보다 편리한 방법을 제공할 수 있을 것이다.Voice recognition technology refers to a technology that recognizes or understands human voice by analyzing it. Computer uses a human voice with a specific frequency to change the shape of the mouth and the position of the tongue depending on the pronunciation. This technology recognizes pronunciation by extracting frequency characteristics of voice signals after converting them into signals. Recently, such voice recognition techniques have been applied to various fields such as toy control, language learning or home appliance control. If the corresponding function is performed using the voice recognition technology as described above, the inconvenience of performing the corresponding function through the key input may be solved, and a more convenient method may be provided to the user.
따라서 본 발명의 목적은 음성명령을 통해 다양한 기능을 수행하는 음성인식장치의 동작방법을 제공함에 있다. Accordingly, an object of the present invention is to provide a method of operating a voice recognition device that performs various functions through voice commands.
상기 목적을 달성하기 위한 음성인식구동방법이, 음성인식모드에서, 음성명령입력을 대기하는 과정과, 상기 음성명령입력 시, 상기 음성명령을 수행하기 위한 음성인식작업을 수행하는 과정과, 상기 음성인식작업을 통해 상기 음성명령에 따른 해당기능을 수행하는 과정으로 이루어짐을 특징으로 한다.The voice recognition driving method for achieving the above object includes a process of waiting for a voice command input in the voice recognition mode, a process of performing a voice recognition operation for performing the voice command when the voice command is input, and the voice Characterized in that the process of performing the corresponding function according to the voice command through a recognition operation.
또한 상기 목적을 달성하기 위한 음성인식구동방법이, 음성인식모드에서 음성명령을 요구하는 음성안내메시지가 출력되는 음성명령입력대기과정과, 상기 음성명령입력이 음성인식시간 경과 전에 입력되면, 상기 음성명령을 인식하기 위한 음성인식작업을 수행하는 과정과, 상기 음성명령입력이 음성인식시간이 경과 후에도 입력되지 않으면, 음성인식실패 횟수를 체크하여. 상기 음성인식실패 횟수가 일정횟수 이하이면 상기 음성모드로 전환하며, 상기 음성인식실패 횟수가 일정회수 이상이면 상기 음성인식모드를 종료하는 과정과, 상기 음성인식작업을 통해 상기 음성명령인식이 성공하면, 상기 음성명령에 따른 해당데이터를 표시 및 상기 해당데이터의 수행준비를 알리는 음성안내메시지를 출력 후 상기 해당데이터의 기능을 수행하는 과정과, 상기 음성인식작업을 통해 상기 음성명령인식이 실패하면, 음성인식실패원인을 판단하여, 상기 음성인식실패가 일정횟수이하이면 상기 음성모드로 전환하며, 상기 음성인식실패가 일정횟수이상이며 상기 음성모드를 종료하는 과정으로 이루어짐을 특징으로 한다. In addition, a voice recognition driving method for achieving the above object includes a voice command input waiting process for outputting a voice guidance message requesting a voice command in a voice recognition mode, and when the voice command input is input before the voice recognition time elapses, Performing a voice recognition operation for recognizing a command, and checking the number of voice recognition failures if the voice command input is not input even after the voice recognition time has elapsed. If the number of voice recognition failures is less than a certain number of times, the voice mode is switched. If the number of voice recognition failures is more than a certain number of times, ending the voice recognition mode; and if the voice command recognition is successful through the voice recognition operation. Displaying a corresponding data according to the voice command and outputting a voice guide message indicating the preparation for performing the corresponding data, and then performing a function of the corresponding data; and if the voice command recognition fails through the voice recognition operation, Determining the cause of the voice recognition failure, if the voice recognition failure is less than a predetermined number of times, the voice mode is switched, and the voice recognition failure is a predetermined number or more, characterized in that the process of ending the voice mode.
또한 상기 목적을 달성하기 위한 휴대단말기에서 음성인식구동방법이, 상기 휴대단말기의 파워 온 시, 상기 음성인식장치를 세팅하는 과정과, 상기 음성인식장치 세팅 후, 대기모드로 전환하는 과정과, 상기 대기모드에서 음성인식을 선택 시, 상기 음성인식모드로 전환하는 과정과, 상기 음성인식모드에서, 음성명령입력을 대기하는 과정과, 상기 음성명령입력 시, 상기 음성명령을 수행하기 위한 음성인식작업을 수행하는 과정과, 상기 음성인식작업을 통해 상기 음성명령에 따른 해당기능을 수행하는 과정으로 이루어짐을 특징으로 한다.In addition, the voice recognition driving method in the portable terminal for achieving the above object, the process of setting the voice recognition device, when the power-on of the portable terminal, the process of switching to the standby mode after setting the voice recognition device, and A process of switching to the voice recognition mode when the voice recognition is selected in the standby mode, a process of waiting for a voice command input in the voice recognition mode, and a voice recognition operation for performing the voice command when the voice command is input. And a process of performing a corresponding function according to the voice command through the voice recognition operation.
또한 상기 목적을 달성하기 위한 음성인식구동방법이, 음성인식모드에서 음성명령을 요구하는 음성안내메시지를 출력하며 음성명령입력을 대기하는 과정과, 상기 직접통화수행을 위한 음성명령이 입력되면, 이름입력을 통해 통화를 수행하는 직접통화를 수행하는 과정과, 상기 메뉴전환수행을 위한 음성명령이 입력되면, 선택되는 메뉴모드로 전환하는 메뉴전환을 수행하는 과정과, 상기 이름통화수행을 위한 음성명령이 입력되면, 이름검색을 통해 해당전화번호로 통화를 수행하는 이름통화를 수행하는 과정과, 상기 이름검색수행을 위한 음성명령이 입력되면, 이름을 검색하여 표시하는 이름검색을 수행하는 과정으로 이루어짐을 특징으로 한다.In addition, the voice recognition driving method for achieving the above object, in the voice recognition mode outputs a voice prompt message requesting a voice command and waiting for the voice command input, and if the voice command for performing the direct call is input, name Performing a direct call to conduct a call through an input, performing a menu switch to switch to a selected menu mode when a voice command for performing a menu switch is input, and a voice command for performing a name call Is entered, a process of performing a name call to make a call to the corresponding phone number through name search, and a process of performing a name search to search for and display a name when a voice command for performing the name search is input. It is characterized by.
또한 상기 목적을 달성하기 위한 음성인식구동방법이, 음성인식모드에서 음성명령을 요구하는 음성안내메시지를 출력하며 음성명령입력을 대기하는 과정과, 상기 직접통화수행을 위해 해당이름이 음성명령으로 입력되면, 음성인식작업을 통해 상기 해당이름에 대응되는 전화번호로 통화수행준비를 알리는 음성안내메시지 출력 후 상기 전화번호로 통화를 수행하는 과정과, 상기 메뉴전환수행을 위해 해당 메뉴 선택이 음성명령으로 입력되면, 상기 음성인식작업을 통해 상기 해당메뉴로 전환 준비를 알리는 음성안내메시지 출력 후 상기 해당메뉴로 전환하는 과정과, 상기 이름통화수행을 위해 이름통화메뉴 선택이 음성명령으로 입력되면, 상기 음성인식작업을 통해 상기 이름통화 메뉴수행을 위한 데이터를 표시하며. 해당이름이 음성명령으로 입력되면, 상기 음성인식작업을 통해 상기 해당이름에 대응되는 전화번호로 통화수행준비를 알리는 음성안내메시지 출력 후, 상기 전화번호로 통화를 수행하는 과정과, 상기 이름검색수행을 위해 이름검색메뉴 선택이 음성명령으로 입력되면, 상기 음성인식작업을 통해 상기 이름검색 메뉴수행을 위한 데이터를 표시하며. 해당이름이 음성명령으로 입력되면, 상기 음성인식작업을 통해 상기 해당이름 및 상기 해당이름에 대응되는 전화번호를 알리는 음성안내메시지를 출력하는 과정과, 음성인식장치의 세팅변경을 선택하면, 음성인식메뉴의 세팅값 변경 및 상기 음성인식작업의 세팅값 변경을 수행하는 과정으로 이루어짐을 특징으로 한다.
In addition, the voice recognition driving method for achieving the above object, the voice recognition mode in the voice recognition mode outputs a voice prompt message and waiting for the voice command input, the name is input as a voice command for performing the direct call When the voice recognition operation, and outputs a voice guidance message to the phone number corresponding to the corresponding name to the call ready to perform a call to the phone number, and the menu selection to perform the menu switch to the voice command If input, the process of switching to the corresponding menu after outputting a voice prompt message to inform the preparation to switch to the corresponding menu through the voice recognition operation, if the name call menu selection is input as a voice command for performing the name call, the voice Display the data for performing the name call menu through the recognition operation. When the name is input as a voice command, the voice recognition operation outputs a voice guidance message indicating a call preparation to the phone number corresponding to the corresponding name, and then performs a call to the phone number and performs the name search. If the name search menu selection is input as a voice command, the voice recognition operation displays data for performing the name search menu. If the name is input as a voice command, the voice recognition operation through the voice recognition operation to output a voice guidance message for notifying the name and the phone number corresponding to the name, and selecting the setting of the voice recognition device, voice recognition Characterized in that the process consisting of changing the setting value of the menu and changing the setting value of the voice recognition operation.
이하 본 발명의 바람직한 실시 예들의 상세한 설명이 첨부된 도면들을 참조하여 설명될 것이다. 도면들 중 동일한 구성들은 가능한 한 어느 곳에서든지 동일한 부호들을 나타내고 있음을 유의하여야 한다.DETAILED DESCRIPTION Hereinafter, detailed descriptions of preferred embodiments of the present invention will be described with reference to the accompanying drawings. It should be noted that the same components in the figures represent the same numerals wherever possible.
본 발명의 실시 예에서는 휴대 단말기를 예로 들어 설명될 것이다. 그러나 상기 카메라를 구비한 휴대 단말기뿐만 아니라 TV 수신기를 구비하는 휴대 단말기등 모든 종류의 단말기에서도 동일하게 적용될 수 있다. In the embodiment of the present invention, a portable terminal will be described as an example. However, the same may be applied to all kinds of terminals such as a portable terminal having a camera as well as a portable terminal having a TV receiver.
도 1은 본 발명의 실시 예에 따른 휴대 단말기의 구성을 도시하는 도면 이다. 1 is a diagram illustrating a configuration of a portable terminal according to an exemplary embodiment of the present invention.
상기 도 1을 참조하면, RF부123은 휴대 단말기의 무선 통신 기능을 수행한다. 상기 RF부123은 송신되는 신호의 주파수를 상승변환 및 증폭하는 RF송신기와, 수신되는 신호를 저잡음 증폭하고 주파수를 하강변환하는 RF수신기등을 포함한다. Referring to FIG. 1, the
모뎀(MODEM)120은 상기 송신되는 신호를 부호화 및 변조하는 송신기 및 상기 수신되는 신호를 복조 및 복호화하는 수신기 등을 구비한다. 오디오 처리부125는 코덱을 구성할 수 있으며, 상기 코덱은 패킷데이터 등을 처리하는 데이터 코덱과 음성등의 오디오 신호를 처리하는 오디오 코덱을 구비한다. 상기 오디오 처리부125는 상기 모뎀120에서 수신되는 디지털 오디오신호를 상기 오디오코덱을 통해 아날로그신호 변환하여 재생하거나 또는 마이크로부터 발생되는 송신되는 아날로그 오디오신호를 상기 오디오코덱을 통해 디지털 오디오신호로 변환하여 상기 모뎀120으로 전송하는 기능을 수행한다. 상기 코덱은 별도로 구비거나 또는 제어부110에 포함될 수 있다.The
메모리130은 프로그램 메모리, 데이터 메모리들로 구성될 수 있다. 상기 프로그램 메모리는 휴대단말기의 일반적인 동작을 제어하기 위한 프로그램들 및 본 발명의 실시 예에 따라 음성명령에 따라 해당기능을 수행하도록 제어하는 프로그램들을 저장할 수 있다. 또한 상기 데이터 메모리는 상기프로그램들을 수행하는 중에 발생되는 데이터들을 일시 저장하는 기능을 수행한다. 또한 상기 메모리130은 본 발명의 실시 예에 따라 이름 및 상기 이름에 대응되는 전환번호가 저장된 폰 북을 저장할 수 있다. The
제어부110은 휴대 단말기의 전반적인 동작을 제어하는 기능을 수행한다. 또한 상기 제어부10은 상기 모뎀120 및 코덱을 포함할 수도 있다. 또한 상기 제어부110은 본 발명의 실시 예에 따라 음성인식모드에서 입력되는 음성명령에 대응되는 해당기능 수행하도록 제어한다. 또한 상기 제어부110은 본 발명의 실시 예에 따라 음성인식모드에서 음성명령인식의 실패 원인을 알리도록 제어한다. 또한 상기 제어부110은 본 발명의 실시 예에 따라 음성인식모드에서 호 수신, 메시지 수신 및 종료키 입력등과 같은 이빈트가 발생하면 상기 음성인식모드를 종료하도록 제어한다. The
표시부160은 상기 제어부110에서 출력되는 사용자 데이터를 표시한다. 여기서 상기 표시부160은 LCD를 사용할 수 있으며, 이런 경우 상기 표시부160은 LCD제어부(LCD controller), 영상데이터를 저장할 수 있는 메모리 및 LCD표시소자 등을 구비할 수 있다. 여기서 상기 LCD를 터치스크린(touch screen) 방식으로 구현하는 경우, 입력부로 동작할 수도 있다. 또한 상기 표시부160은 본 발명의 실시 예에 따라 음성인식모드에서 음성인식메뉴의 종류를 표시할 수 있다. The
키입력부127은 숫자 및 문자 정보를 입력하기 위한 키들 및 각종 기능들을 설정하기 위한 기능키들을 구비한다. 또한 상기 키입력부127은 본 발명의 실시 예에 따라 음성인식모드을 수행하기 위한 기능키를 구비할 수 있다.The
상기 음성인식장치170은 자동음성인식부(ASR) 문자변환부(TTS) 및 데이터베 이스(DB)로 구성된다. 상기 자동음성인식부(ASR)는 마이크를 통해 사용자가 발성한 음성을 입력하고, 상기 입력된 음성의 시작점 및 끝점을 검출하여 입력된 음성의 앞뒤에 있는 묵음구간을 제외한 음성구간에서의 특징데이터를 추출한 후, 실시간으로 백터 양자화 한다. 이후 특징데이터를 이용하여 데이터베이스(DB)에 등록된 음성데이터들에 대하여 유사도가 가장 유사한 음성데이터를 검색하여 선정한다. 본 발명에서 상기 자동음성인식부(ASR)는 음성인식모드에서 입력되는 음성명령을 인식하여, 상기 데이터베이스(DB)에 등록된 음성데이터들 중 유사도가 가장 유사한 음성데이터들을 검색하여 선정한다. 상기 문자음성변변부(TTS)는 도움말 파일이나 웹페이지와 같은 컴퓨터 문서의 내용을 사람이 읽어주는 소리로 만들어주는 음성합성 프로그램의 한 종류이다. 본 발명에서 상기 문자음성변환부(TTS)는 음성인식모드에서 입력되는 음성명령에 따른 해당기능에 대한 진행 준비를 알리를 음성안내메시지를 출력한다. 상기 데이터베이스(DB)에는 상기 메모리130의 폰 북에 저장된 이름 및 상기 이름에 대응되는 전화번호와 동일한 데이터가 음성으로 저장되며, 상기 음성인식메뉴의 종류이름이 음성데이터로 저장된다. The
상기와 같은 휴대 단말기에서 음성인식을 수행하는 동작을 도 2를 통해 살펴보면, 201단계에서 상기 휴대단말기의 파워가 온 되면 상기 휴대단말기의 부팅작업이 수행된다. 상기 부팅작업 중 음성인식장치를 세팅하는 202단계를 진행하며, 상기 202단계에서는 초기음성인식 값을 세팅한다, 상기 초기 음성인식 값에는 음성명령인식시간, 음성인식단계, 음성인식결과값 개수 및 자동음성인식장치(ARS)의 버퍼크기, 상기 문자변환부(TTS)의 버퍼크기, 상기 자동음성인식장치(ARS)에서 사용 되는 언어 및 음성안내메시지 볼륨크기가 있다. 또한 상기 202단계에서 상기 음성인식장치의 데이터베이스에 저장된 데이터와 상기 메모리130의 폰 북에 저장된 데이터를 싱크하는 과정을 수행한다. 상기 폰 북의 데이터가 추가, 수정 및 삭제 시, 이에 대응되도록 상기 음성인식장치의 데이터베이스에 저장된 데이터를 갱신한다. 상기 음성인식장치의 데이터베이스에 저장된 데이터와 상기 메모리130의 폰 북에 저장된 데이터간의 싱크과정은 음성인식모드 전환 시마다 수행될 수 있다. 또한 상기 202단계에서 상기 음성인식메뉴의 추가, 수정, 삭제 및 음성인식메뉴의 이름이 변경 시, 상기 변경된 음성인식메뉴의 정보를 상기 음성인식장치의 데이터베이스에 갱신하는 과정을 수행한다. 상기 음성인식메뉴의 정보가 변경 시, 상기 변경된 음성인식메뉴의 정보를 상기 음성인식장치의 데이터베이스에 갱신하는 과정은 음성인식모드 전환 시마다 수행될 수 있다. Referring to FIG. 2, an operation of performing voice recognition in the portable terminal is performed. When the portable terminal is powered on in
상기 음성인식장치의 세팅이 완료되면, 상기 휴대단말기는 203단계의 대기모드로 전환하다. 상기 휴대단말기의 대기모드에서 음성인식을 선택하면, 상기 제어부110은 204단계에서 이를 감지하고 음성인식모드로 전환하는 205단계를 진행한다. 상기 음성인식모드로 전환하면, 상기 제어부110은 이를 감지하고 상기 표시부160을 제어하여 상기 음성인식메뉴의 종류를 표시한다. 상기 음성인식메뉴의 종류표시와 함께 상기 제어부110은 상기 음성인식장치의 문서변환부(TTS)를 제어하여 원하는 음성명령입력을 요구하는 음성안내메시지가 출력되는 206단계를 진행한다. 설정된 음성명령인식시간 내에 음성명령이 입력되면, 상기 제어부110은 207단계에서 이를 감지하고 상기 음성인식장치170의 자동음성인식부(ASR)를 제어하여 음성인식작업을 수행하는 208단계를 진행한다. 상기 음성인식작업이 수행되면, 소리음과 함께 상기 음성인식작업이 수행중임을 알리는 프로세스 바가 표시된다. 상기 음성인식장치170의 자동음성인식부(ASR)에서 인식할 수 있는 인식대상에는 사람이름, 메뉴이름, 숫자, 음성인식결과를 선택할 수 있는 음성명령어등이 있다, 상기 설정된 음성명령인식시간이 경과하여도 음성명령이 입력되지 않으면, 상기 제어부110은 208단계에서 이를 감지하고 상기 음성인식실패의 횟수를 체크한다. 상기 음성인식 실패의 횟수가 일정회수 이하이면, 상기 제어부110은 209단계에서 이를 감지하고 상기 205단계의 음성인식모드로 전환 후 음성명령의 입력을 요구하는 상기 206단계를 진행한다. 상기 음성인식 실패의 횟수가 일정회수 이상이면, 상기 제어부110은 210단계에서 이를 감지하고 상기 음성인식모드를 종료한다.When the setting of the voice recognition device is completed, the portable terminal switches to the standby mode of
상기 208단계의 음성인식작업을 통해 상기 입력된 음성명령에 따른 해당데이터가 존재하면, 상기 제어부110은 211단계 및 212단계에서 이를 감지하고 상기 음성명령에 따른 해당데이터를 표시하는 213단계를 진행한다. 이와 함께 상기 제어부110은 214단계에서 상기 음성인식장치의 문서변환부(TTS)를 제어하여 해당데이터의 진행 준비를 알리는 음성안내메시지를 출력 후, 상기 해당기능을 수행하는 215단계를 진행한다. If the corresponding data according to the input voice command exists through the voice recognition operation in
또한 상기 208단계의 음성인식작업 중 호 수신, 메시지 수신 및 종료키 입력과 같은 이벤트가 발생하면, 상기 제어부110은 상기 211단계에서 이를 감지하고 상기 음성인식작업을 종료하는 216단계를 진행한다. In addition, when an event such as call reception, message reception, and termination key input occurs during the voice recognition operation in
또한 상기 208단계의 음성인식작업을 통해 상기 입력된 음성명령에 따른 해 당데이터가 존재하지 않으며, 상기 제어부110은 상기 212단계에서 이를 감지하고 상기 음성인식실패의 횟수를 체크한다. 상기 음성인식 실패의 횟수가 일정회수 이하이면, 상기 제어부110은 217단계에서 이를 감지하고 상기 205단계의 음성인식모드로 전환 후 음성명령의 입력을 요구하는 상기 206단계를 진행한다. 상기 음성인식 실패의 횟수가 일정회수 이상이면, 상기 제어부110은 218단계에서 이를 감지하고 상기 음성인식실패의 원인을 판단한다. 상기 음성인식실패의 원인이 입력된 음성명령에 따른 해당데이터가 상기 음성인식장치170의 데이터베이스에 존재하지 않아 실패한 것이면, 상기 제어부110은 219단계에서 이를 감지하고 상기 음성인식모드를 종료한다, 또한 상기 음성인식실패의 원인이 일정이상의 소음이면, 상기 제어부110은 219단계에서 이를 감지하고 상기 음성인식모드를 종료한다, In addition, the corresponding data according to the input voice command does not exist through the voice recognition operation in
상기와 같은 휴대 단말기에서 음성인식을 수행하는 과정을 도 3 - 도 16을 통해 상세히 설명한다. A process of performing voice recognition in the above portable terminal will be described in detail with reference to FIGS. 3 to 16.
도 3은 본 발명의 제1실시 예에 따른 휴대단말기에서 음성인식 동작을 도시한 흐름도이며, 도 4a - 도 4e는 도 3을 설명하기 위한 도면이며, 도 5는 도 3의 직접통화수행을 위한 음성인식 동작을 도시한 흐름도이며, 도 6a - 도 6g는 도 5를 설명하기 위한 도면이며, 도 7은 도 3의 메뉴전환수행을 위한 음성인식 동작을 도시한 흐름도이며, 도 8a - 도 8h는 도 7을 설명하기 위한 도면이며, 도 9는 도 3의 이름통화수행을 위한 음성인식 동작을 도시한 흐름도이며, 도 10a - 도 10e는 도 9를 설명하기 위한 도면이며, 도 11은 도 3의 이름검색수행을 위한 음성인식 동작을 도시한 흐름도이며, 도 12a - 도 12l은 도 11을 설명하기 위한 도면이며, 도 13a 및 도 13b는 도 3의 음성인식장치의 세팅수행을 위한 동작을 도시한 흐름도이며, 도 14a - 도 14h는 도 13a를 설명하기 위한 도면이며, 도 15a - 도 15o는 도 13b를 설명하기 위한 도면이며, 도 16a - 도 16f는 본 발명의 제1실시 예에 따른 휴대단말기에서 음성인식 동작 중 실패과정을 도시한 흐름도이다.3 is a flowchart illustrating a voice recognition operation in the mobile terminal according to the first embodiment of the present invention. FIGS. 4A to 4E are views for explaining FIG. 3, and FIG. 5 is for performing the direct call of FIG. 3. 6A through 6G are diagrams for explaining FIG. 5, FIG. 7 is a flowchart illustrating a voice recognition operation for performing menu switching of FIG. 3, and FIGS. 8A through 8H 7 is a flowchart illustrating a voice recognition operation for performing a name call of FIG. 3, FIGS. 10A to 10E are views for explaining FIG. 9, and FIG. 11 is a view of FIG. 3. 12A to 12L are diagrams for explaining FIG. 11, and FIGS. 13A and 13B illustrate an operation for setting of the voice recognition apparatus of FIG. 14A to 14H are diagrams for describing FIG. 13A. 15A to 15O are diagrams for describing FIG. 13B, and FIGS. 16A to 16F are flowcharts illustrating a failure process during a voice recognition operation in the mobile terminal according to the first embodiment of the present invention.
본 발명의 실시 예에서 음성인식의 대상은 이름 및 메뉴이름 및 , 음성인식결과를 선택할 수 있는 음성명령어로 가정하며, 상기음성인식결과를 선택할 수 있는 음성명령어에는 다음 데이터를 선택할 수 있는 '다음'음성명령어 및 이전데이터를 선택할 수 있는 '이전'음성명령어로 가정하여 설명한다. 또한 본 발명의 실시 예에서 상기 음성인식장치의 데이터베이스에 저장된 전화번호의 종류 중 휴대폰을 제1전화번호로, 집을 제2전화번호로 가정하여 설명하며, 상기 제1전화번호가 기본값으로 설정되어 있다고 가정하여 설명한다. 또한 본 발명의 실시 예에서 음성인식의 최대실패횟수는 2회로 가정하며, 상기 음성인식실패횟수가 2회가 되면 상기 음성인식모드를 종료하는 것으로 가정하여 설명한다.In the embodiment of the present invention, the object of the voice recognition is assumed to be a voice command to select the name and menu name, and the voice recognition result, the voice command to select the voice recognition result, 'next' to select the next data The description is based on the assumption that the voice command and the previous data are the 'previous' voice commands. In addition, according to an embodiment of the present invention, a mobile phone is a first phone number and a home is a second phone number among the types of phone numbers stored in the database of the voice recognition device, and the first phone number is set as a default value. It is assumed and explained. In addition, in the embodiment of the present invention, it is assumed that the maximum number of failures of speech recognition is two, and it is assumed that the speech recognition mode is terminated when the number of speech recognition failures is two.
이하 본 발명의 실시 예를 도 1의 참조와 함께 상세히 설명한다.Hereinafter, an embodiment of the present invention will be described in detail with reference to FIG. 1.
상기 도 3 및 도 4를 참조하면, 상기 휴대단말기의 대기모드인 301단계에서 상기 휴대단말기의 사용자가 통화키를 일정시간 이상 입력하거나, 또는 상기 휴대단말기의 메뉴상에서 음성인식을 선택하면, 상기 제어부110은 302단계에서 이를 감지하고 음성인식모드로 전환하는 303단계를 진행한다. 상기 음성모드로 전환하면, 상기 제어부110은 상기 표시부160을 제어하여 상기 음성인식메뉴의 종류를 표시한다. 이와 함께 상기 제어부110은 305단계에서 상기 음성인식장치의 문서변환부(TTS)를 제어하여 원하는 음성명령입력을 요구하는 음성안내메시지를 출력하는 305단계를 진행한다. 도 4a는 상기 휴대단말기의 대기모드를 나타내며, 도 4b는 상기 휴대단말기의 메뉴 종류를 나타낸다. 도 4c는 상기 도 4a에서 통화키를 일정시간 이상 입력하거나 상기 도 4b에서 음성인식(Any voice)을 선택하면 전환되는 음성인식모드를 나타낸다. 상기 도 4c의 음성인식모드로 전환 시 상기 음서인식의 종류를 표시 및 음성명령입력을 요구하는 안내메시지를 출력됨을 나타내고 있다. 도 4d는 상기 음성인식메뉴의 종류를 나타내고 있다.3 and 4, when the user of the mobile terminal inputs a call key for a predetermined time or selects voice recognition on the menu of the mobile terminal in
상기 도 4c와 같은 음성인식모드에서 상기 사용자가 음성명령을 입력하면, 상기 제어부110은 306단계에서 이를 감지하고 상기 입력된 음성명령의 인식대상을 판단한다. 상기 입력된 음성명령이 '사람이름'이면, 상기 제어부110은 307단계에서 이를 감지하고 직접통화를 수행하는 500단계를 진행한다. When the user inputs a voice command in the voice recognition mode as shown in FIG. 4C, the
상기 도 5 및 도 6을 통해 상기 직접통화의 수행동작을 보면, 상기 음성인식모드에서 상기 사용자가 501단계에서 해당이름을 음성명령으로 입력하면, 상기 제어부110은 이를 감지하고 상기 음성인식부(ASR)를 제어하여 상기 음성 입력된 해당이름이 상기 음성인식장치의 데이터베이스에 존재하는지 검색한다. 상기 해당이름이 존재하면, 상기 해당이름 및 기본값으로 설정된 제1전화번호를 표시하며 제1전화번호로 통화수행을 준비중임을 알리는 음성안내메시지를 출력하는 502단계를 진행한다. 상기 제1전화번호로 통화수행 준비가 완료되는 동안 음성입력이 없으면, 상기 제어부110은 504단계에서 이를 감지하고 상기 해당이름의 제1전화번호로 통화를 수행하는 508단계를 진행한다.5 and 6, when the user inputs a corresponding name as a voice command in step 501 in the voice recognition mode, the
상기 제1전화번호로 통화수행 준비 중 일 때 '다음'음성명령이 입력되면, 상기 제어부110은 503단계에서 이를 감지하고 505단계를 진행한다. 상기 505단계에서는 상기 해당이름 및 상기 해당이름으로 저장된 제2전화번호(집)가 표시되며, 제2전화번호(집)로 통화수행을 준비 중임을 알리는 음성안내메시지를 출력한다. 상기 제2전화번호로 통화수행 준비가 완료되는 동안 음성입력이 없으면, 상기 제어부110은 507단계에서 이를 감지하고 상기 해당이름의 제2전화번호로 통화를 수행하는 상기 508단계를 진행한다. 상기 제2전화번호로 통화수행 준비 중일 때 '이전'음성명령이 입력되면, 상기 제어부110은 506단계에서 이를 감지하고 상기 502단계를 진행한다. When the 'next' voice command is input while the call is being prepared for the first phone number, the
도 6a는 음성인식모드를 나타내며, 도 6b는 상기 음성인식모드에서 사용자가 해당이름으로 'Brian Adams'를 음성명령으로 입력하는 과정으로 나타낸다. FIG. 6A illustrates a voice recognition mode, and FIG. 6B illustrates a process in which a user inputs 'Brian Adams' as a voice command in the voice recognition mode.
도 6c는'Brian Adams'의 휴대폰번호 표시 및 상기 휴대폰번호로 통화를 준비 중임을 알리는 음성안내메시지를 출력하는 과정을 나타낸다. 상기 도 6c에서 확인(OK)키가 입력되면 상기 Brian Adams'의 휴대폰 번호로 통화수행을 수행하고, 우측방향키를 입력하면 도 6e가 진행된다. 6C illustrates a process of outputting a mobile phone number display of 'Brian Adams' and a voice guidance message informing that the mobile phone number is being prepared for a call. When the OK key is input in FIG. 6C, the call is performed to the mobile phone number of Brian Adams', and when the right direction key is pressed, FIG. 6E is performed.
도 6d는 상기 휴대폰번호를 준비 중 임을 나타내며, 상기 도 6d에서 휴대폰번호로 통화수행 준비가 완료되는 동안 음성이 입력되지 않으며. 상기 휴대폰번호로 통화를 수행한다. 상기 도 6d에서 확인(OK)키를 입력하면 상기 Brian Adams'의 휴대폰 번호로 통화수행을 수행하고, 우측방향키를 입력하면 도 6e가 진행된다.6d indicates that the mobile phone number is being prepared, and voice is not input while preparation for carrying out a call to the mobile phone number is completed in FIG. 6d. A call is made to the mobile number. In FIG. 6D, when the OK key is input, the mobile phone number of Brian Adams' is performed. When the right direction key is pressed, FIG. 6E is performed.
도 6e는 상기 도 6d에서 '다음'음성명령이 입력되어'Brian Adams'의 집 번호 표시 및 상기 집 번호로 통화를 준비 중임을 알리는 음성안내메시지를 출력하는 과정을 나타낸다. 상기 도 6e에서 확인(OK)키를 입력하면 도 6g를 진행하며, 좌측방향키를 입력하면 상기 도 6c가 진행된다. FIG. 6E illustrates a process of outputting a voice number message indicating that the home command of 'Brian Adams' is being prepared and a call to the home number is prepared by inputting a 'next' voice command in FIG. 6D. In FIG. 6E, if the OK key is input, FIG. 6G is progressed. In the left direction key, FIG. 6C is progressed.
도 6f는 상기 집 번호를 준비 중임을 나타내며, 상기 도 6f에서 상기 집 번호로 통화수행 준비가 완료되는 동안 '이전'음성명령이 입력되면 도 6c로 진행된다. 상기 도 6f에서 확인(OK)키를 입력하면 도 6g를 진행하며, 좌측방향키를 입력하면 상기 도 6c가 진행된다. FIG. 6F indicates that the house number is being prepared. When the voice message 'previous' is input while the call preparation to the house number is completed in FIG. 6F, the process proceeds to FIG. 6C. In FIG. 6F, if the OK key is pressed, FIG. 6G is progressed. In the left direction key, FIG. 6C is progressed.
도 6g는 상기 도 6f에서 상기 집 번호로 통화준비가 완료되는 동안 음성입력이 없으면'Brian Adams'의 집 번호로 통화를 수행하는 과정을 나타낸다. 상기 도 6g에서 키 입력을 통해 확인(OK)을 선택하면 상기 Brian Adams'의 집 번호로 휴대폰 번호로 통화를 수행한다.6G illustrates a process of performing a call to a house number of 'Brian Adams' when there is no voice input while the call preparation is completed to the house number in FIG. 6F. In FIG. 6G, when OK is selected through key input, a call is made to the mobile number of Brian Adams' home number.
상기 음성인식모드에서 상기 사용자가 음성명령을 입력하면, 상기 제어부110은 상기 306단계에서 이를 감지하고 상기 입력된 음성명령의 인식대상을 판단한다. 상기 입력된 음성명령이 '해당메뉴이름'이면, 상기 제어부110은 308단계에서 이를 감지하고 해당메뉴로 전환을 수행하는 700단계를 진행한다. When the user inputs a voice command in the voice recognition mode, the
상기 도 7 및 도 8을 통해 상기 해당메뉴전환의 수행동작을 보면, 상기 음성인식모드에서 상기 사용자가 601단계에서 해당메뉴이름을 음성명령으로 입력하면, 상기 제어부110은 이를 감지하고 상기 음성인식부(ASR)를 제어하여 상기 음성 입력된 해당메뉴이름이 상기 음성인식장치의 데이터베이스에 존재하는지 검색한다. 상기 해당이름이 존재하면, 상기 해당메뉴를 표시하며 상기 해당메뉴로 전환준비중임 을 알리는 음성안내메시지를 출력하는 702단계를 진행한다. 상기 해당메뉴로 전환준비가 완료되는 동안 음성입력이 없으면, 상기 제어부110은 713단계에서 이를 감지하고 상기 해당메뉴모드로 전환하는 707단계를 진행한다.7 and 8, when the user inputs the menu name as a voice command in step 601 in the voice recognition mode, the
상기 해당메뉴로 전환준비 중 일 때 '다음'음성명령이 입력되면, 상기 제어부110은 703단계에서 이를 감지하고 704단계를 진행한다. 상기 704단계에서는 상기 해당메뉴의 다음메뉴로 전환준비 중임을 알리는 음성안내메시지를 출력한다. 상기 다음메뉴로 전환준비가 완료되는 동안 음성입력이 없으면, 상기 제어부110은 706단계에서 이를 감지하고 상기 해당메뉴모드로 전환하는 상기 707단계를 진행한다. 상기 다음메뉴로 전환준비 중 일 때 '이전'음성명령이 입력되면, 상기 제어부110은 705단계에서 이를 감지하고 상기 702단계를 진행한다. When the 'next' voice command is input while preparing to switch to the corresponding menu, the
또한, 키 입력을 통해 상기 음성인식모드에서 표시되는 음성인식메뉴의 종류 중 해당메뉴를 선택하면, 상기 제어부110은 708단계에서 이를 감지하고 상기 음성인식모드를 정지하는 709단계를 진행한다. 상기 음성인식모드가 정지된 상태에서 상기 사용자가 확인키를 입력하면 상기 제어부110은 712단계에서 이를 감지하고 상기 해당메뉴모드로 전환하는 상기 707단계를 진행한다. 또는 상기 음성인식모드가 정지된 상태에서 재 시작을 선택하면, 상기 제어부110은 710 단계에서 이를 감지하고 상기 음성인식모드로 전환하는 715단계를 진행한다. In addition, when a corresponding menu is selected from among the types of the voice recognition menu displayed in the voice recognition mode through key input, the
도 8a는 음성인식모드를 나타내며, 도 8b는 상기 음성인식모드에서 사용자가 해당메뉴이름으로 'Calendar'를 음성명령으로 입력하는 과정으로 나타낸다. 상기 도 8a 및 도 8b에서 하측방향키를 두 번 입력하여 상기'Calendar'가 선택되면 도 8h가 진행된다.FIG. 8A illustrates a voice recognition mode, and FIG. 8B illustrates a process in which a user inputs a 'Calendar' as a voice command as a menu name in the voice recognition mode. 8A and 8B, if the 'Calendar' is selected by inputting the down arrow key twice, the process proceeds to FIG. 8H.
도 8c는 'Calendar' 표시 및 'Calendar' 모드로 전환 준비 중임을 알리는 음성안내메시지를 출력하는 과정을 나타낸다. 상기 도 8c에서 확인(OK)키가 입력되면 상기'Calendar'모드로 전환되며, 하측방향키를 한 번 입력되면 도 8e로 진행된다.8C illustrates a process of outputting a voice guidance message informing that the user is preparing to switch to 'Calendar' display and 'Calendar' mode. In FIG. 8C, when the OK key is input, the mode is changed to the 'Calendar' mode. When the down direction key is input once, the process proceeds to FIG. 8E.
도 8d는 상기 'Calendar'모드로 전환준비 중임을 나타내며, 상기 도 8d에서 'Calendar'모드로 전환준비가 완료되는 동안 음성이 입력되지 않으면 상기'Calendar'모드로 전환된다. 상기 도 8d에서 확인(OK)키가 입력되면 상기'Calendar'모드로 전환되며, 하측방향키가 한 번 입력되면 도 8e로 진행된다.FIG. 8D shows that the 'Calendar' mode is being prepared for conversion. If no voice is input while the preparation for switching to the 'Calendar' mode is completed in FIG. 8D, the mode is converted to the 'Calendar' mode. When the OK key is input in FIG. 8D, the mode is changed to the 'Calendar' mode. When the down direction key is input once, the process proceeds to FIG. 8E.
도 8e는 상기 도 8d에서 '다음'음성명령이 입력되어 다음메뉴인 'Camcorder' 표시 및 상기 'Camcorder'모드로 전환준비 중임을 알리는 음성안내메시지를 출력하는 과정을 나타낸다. 상기 도 8e에서 확인(OK)키가 입력되면 도 8g가 진행되며, 상측방향키를 한 번 입력되면 상기 도 8c가 진행된다. FIG. 8E illustrates a process of outputting a voice guidance message indicating that the 'next' voice command is input in FIG. 8D to display a next menu 'Camcorder' and preparing to switch to the 'Camcorder' mode. When the OK key is input in FIG. 8E, FIG. 8G proceeds, and when the upper direction key is input once, FIG. 8C proceeds.
도 8f는 상기 'Camcorder'모드로 전환준비 중임을 나타낸다. 상기 도 8f에서 'Camcorder'모드로 전환준비 중 '이전'음성명령이 입력되면 도 8c가 진행된다. 상기 도 8f에서 확인(OK)키가 입력하면 도 8g가 진행되며, 상측방향키를 한번 입력되면 상기 도 8c가 진행된다. 8F shows that the camera is preparing to switch to the 'Camcorder' mode. In FIG. 8F, when the 'previous' voice command is input while preparing to switch to the 'Camcorder' mode, FIG. 8C proceeds. In FIG. 8F, when the OK key is input, FIG. 8G proceeds. When the up direction key is input once, FIG. 8C proceeds.
도 8g는 상기 도 8f에서 'Camcorder'모드로 전환준비가 완료되는 동안 음성이 입력되지 않아 상기 'Camcorder'모드로 전환되는 과정을 나타낸다. 상기 도 8g에서 키 입력을 통해 확인(OK)이 선택되면 상기 'Camcorder'모드로 전환된다.FIG. 8G illustrates a process of switching to the 'Camcorder' mode because no voice is input while the preparation for switching to the 'Camcorder' mode is completed in FIG. 8F. In FIG. 8G, when OK is selected through key input, the mode changes to the 'Camcorder' mode.
도 8h는 음성인식모드가 정지된 상태를 나타낸다. 상기 도 8g에서 키 입력을 통해 확인(OK)이 선택되면 상기 'Camcorder'모드로 전환되며, 재 시작(Resume)을 선택하면 상기 도 8a로 전환된다.8H illustrates a state in which the voice recognition mode is stopped. In FIG. 8G, when OK is selected through a key input, the mode is changed to the Camcorder mode. When the resume is selected, the mode is changed to FIG. 8A.
상기 음성인식모드에서 상기 사용자가 음성명령을 입력하면, 상기 제어부110은 상기 306단계에서 이를 감지하고 상기 입력된 음성명령의 인식대상을 판단한다. 상기 입력된 음성명령이 '이름통화'메뉴이면, 상기 제어부110은 309단계에서 이를 감지하고 상기 이름통화를 수행하는 900단계를 진행한다. When the user inputs a voice command in the voice recognition mode, the
상기 도 9 및 도 10을 통해 상기 이름통화의 수행동작을 보면, 상기 제어부110은 상기 음성인식부(ASR)를 제어하여 상기 음성 인식장치의 데이터베이스에 상기 이름통화수행을 위한 데이터가 존재하는지 검색한다. 상기 이름통화수행을 위한 데이터가 존재하지 않으면, 상기 제어부110은 901단계에서 이를 감지하고 상기 이름검색수행을 위한 데이터가 존재하지 않음을 표시하는 903단계를 진행한다. 상기 이름통화수행을 위한 데이터가 존재하면, 상기 제어부110은 901단계에서 이를 감지하고 상기 표시부160을 제어하여 상기 음성 인식장치의 데이터베이스에 저장된 이름 및 상기 이름에 대응되는 전화번호데이터들을 표시하는 902단계를 진행한다. 이와 함께 해당이름에 대한 음성명령입력을 요구하는 음성안내메시지가 출력되는 904단계를 진행한다. 상기 사용자가 해당이름을 음성명령으로 입력하면, 상기 제어부110은 905단계에서 이를 감지하고 상기 902단계에서 표시된 데이터 중 상기 음성명령으로 입력된 해당이름 및 상기 해당이름에 대응되는 전화번호를 검색한다. 상기 해당이름이 존재하면, 상기 해당이름 및 기본값으로 설정된 제1 전화번호를 표시하며 제1전화번호로 통화수행을 준비 중 임을 알리는 음성안내메시지를 출력하는 906단계를 진행한다. 상기 제1전화번호로 통화수행 준비가 완료되는 동안 음성입력이 없으면, 상기 제어부110은 908단계에서 이를 감지하고 상기 해당이름의 제1전화번호로 통화를 수행하는 912단계를 진행한다.9 and 10, the
상기 제1전화번호로 통화수행 준비 중 일 때 '다음'음성명령이 입력되면, 상기 제어부110은 907단계에서 이를 감지하고 909단계를 진행한다. 상기 909단계에서는 상기 해당이름 및 상기 해당이름으로 저장된 제2전화번호(집)가 표시되며, 제2전화번호(집)로 통화수행을 준비 중임을 알리는 음성안내메시지를 출력한다. 상기 제2전화번호로 통화수행 준비가 완료되는 동안 음성입력이 없으면, 상기 제어부110은 911단계에서 이를 감지하고 상기 해당이름의 제2전화번호로 통화를 수행하는 상기 912단계를 진행한다. 상기 제2전화번호로 통화수행 준비 중일 때 '이전'음성명령이 입력되면, 상기 제어부110은 910단계에서 이를 감지하고 상기 906단계를 진행한다. When a 'next' voice command is input while preparing to perform a call to the first phone number, the
또한, 상기 904단계에서 키 입력을 통해 해당이름을 선택하면, 상기 제어부110은 913단계에서 이를 감지하고 상기 음성인식모드를 정지하는 914단계를 진행한다. 상기 음성인식모드가 정지된 상태인 917단계에서 상기 사용자가 키 입력을 통해 상기 해당이름 및 상기 해당이름으로 저장된 전화번호를 선택한 후 통화키를 입력하면, 상기 제어부110은 918단계에서 이를 감지하고 상기 선택된 번호로 통화를 수행하는 상기 912단계를 진행한다. 또는 상기 음성인식모드가 정지된 상태에서 재 시작을 선택하면, 상기 제어부110은 915단계에서 이를 감지하고 상기 음성 인식모드로 전환하는 916단계를 진행한다. If the corresponding name is selected through key input in
도 10a는 음성인식모드를 나타낸다. 도 10b는 상기 음성인식모드에서 사용자가 '이름통화'메뉴를 음성명령으로 입력하는 과정으로 나타내며, 상기 도 10b에서 키 입력을 통해 확인(OK)이 선택되면 도 10c로 진행된다. 10A shows a voice recognition mode. FIG. 10B illustrates a process in which the user inputs a 'name call' menu as a voice command in the voice recognition mode, and when OK is selected through key input in FIG. 10B, the process proceeds to FIG. 10C.
도 10c는 음성인식장치의 데이터베이스에 저장된 이름 및 상기 이름에 대응되는 전화번호데이터들의 표시 및 해당이름에 대한 음성명령입력을 요구하는 음성안내메시지가 출력되는 과정을 나타내고 있다. 상기 도 10c에서 키 입력을 통해 확인(OK)이 선택되면 현재 선택된 이름 및 상기 이름에 대응되는 전화번호로 통화가 수행되며, 방향키 입력을 통해 해당이름이 선택되면 도 10f가 진행된다. 10C illustrates a process of outputting a voice guidance message requesting a display of names stored in a database of a voice recognition device, telephone number data corresponding to the name, and input of a voice command for the corresponding name. In FIG. 10C, when OK is selected through a key input, a call is made to the currently selected name and a phone number corresponding to the name. When the corresponding name is selected through the direction key input, FIG. 10F proceeds.
도 10d는 해당이름으로'Brian Adams'를 음성명령으로 입력하는 과정으로 나타낸다. 상기 도 10d에서 키 입력을 통해 확인(OK)이 선택되면 현재 선택된 이름 및 상기 이름에 대응되는 전화번호로 통화가 수행되며, 방향키 입력을 통해 해당이름이 선택되면 도 10f가 진행된다. 상기 도 10d 이후 과정은 상기 도 6c - 도 6g와 동일하다. 10D illustrates a process of inputting a voice command of 'Brian Adams' as a corresponding name. If OK is selected through key input in FIG. 10D, a call is made to the currently selected name and a phone number corresponding to the name. When the corresponding name is selected through direction key input, FIG. 10F proceeds. The process after FIG. 10D is the same as that of FIGS. 6C-6G.
도 10e는 음성인식장치의 데이터베이스에 저장된 데이터가 없음을 나타낸다.10E shows that there is no data stored in the database of the voice recognition device.
도 10f는 음성인식모드가 정지된 상태를 나타낸다. 상기 도 10f에서 키 입력을 통해 확인(OK)이 선택되면 선택된 이름 및 상기 이름에 대응되는 전화번호로 통화를 수행하며, 재 시작(Resume)을 선택하면 상기 음성인식모드로 전환된다10F illustrates a state in which the voice recognition mode is stopped. In FIG. 10F, when OK is selected through a key input, a call is made to the selected name and the telephone number corresponding to the name, and when the resume is selected, the voice recognition mode is switched.
상기 음성인식모드에서 상기 사용자가 음성명령을 입력하면, 상기 제어부110은 상기 306단계에서 이를 감지하고 상기 입력된 음성명령의 인식대상을 판단한다. 상기 입력된 음성명령이 '이름검색'메뉴이면, 상기 제어부110은 310단계에서 이를 감지하고 상기 이름검색을 수행하는 1100단계를 진행한다. When the user inputs a voice command in the voice recognition mode, the
상기 도 11 및 도 12를 통해 상기 이름검색의 수행동작을 보면, 상기 제어부110은 상기 음성인식부(ASR)를 제어하여 상기 음성 인식장치의 데이터베이스에 상기 이름검색수행을 위한 데이터가 존재하는지 검색한다. 상기 이름통화수행을 위한 데이터가 존재하지 않으면, 상기 제어부110은 1101단계에서 이를 감지하고 상기 이름검색수행을 위한 데이터가 존재하지 않음을 표시하는 1102단계를 진행한다. 상기 이름통화수행을 위한 데이터가 존재하면, 상기 제어부110은 1101단계에서 이를 감지하고 상기 표시부160을 제어하여 상기 음성 인식장치의 데이터베이스에 저장된 이름 및 상기 이름에 대응되는 전화번호데이터들을 표시하는 1103단계를 진행한다. 이와 함께 해당이름에 대한 음성명령입력을 요구하는 음성안내메시지가 출력되는 1104단계를 진행한다. 상기 사용자가 해당이름을 음성명령으로 입력하면, 상기 제어부110은 1105단계에서 이를 감지하고 상기 1104단계에서 표시된 이름데이터 중 상기 음성명령으로 입력된 해당이름을 검색한다. 상기 해당이름이 존재하면, 상기 해당이름 및 기본값으로 설정된 제1전화번호를 표시하며, 상기 해당이름 및 제1전화번호를 알리는 음성안내메시지를 출력하는 1106단계를 진행한다. 상기 제1전화번호의 출력수행을 준비가 완료되는 동안 음성입력이 없으면, 상기 제어부110은 1108단계에서 이를 감지하고 상기 해당이름 및 상기 해당이름의 제1전화번호를 표시하며, 상기 해당이름 및 상기 해당이름의 제1전화번호를 알리는 음성안내메시지를 출력하는 1112단계를 진행한다.11 and 12, the
상기 제1전화번호의 출력수행을 준비 중 일 때 '다음'음성명령이 입력되면, 상기 제어부110은 1107단계에서 이를 감지하고 1109단계를 진행한다. 상기 1109단계에서는 상기 해당이름 및 상기 해당이름으로 저장된 제2전화번호(집)를 표시하며, 상기 해당이름 및 상기 2전화번호(집)를 알리는 음성안내메시지를 출력한다. 상기 제2전화번호의 출력수행을 준비가 완료되는 동안 음성입력이 없으면, 상기 제어부110은 111단계에서 이를 감지하고 상기 해당이름 및 상기 제2전화번호를 알리는 음성안내메시지를 출력하는 상기 1112단계를 진행한다. 상기 제2전화번호로 출력수행을 준비 중 일때 '이전'음성명령이 입력되면, 상기 제어부110은 1110단계에서 이를 감지하고 상기 116단계를 진행한다. When the 'next' voice command is input while preparing to output the first phone number, the
또한, 상기 11004단계에서 키 입력을 통해 해당이름을 선택하면, 상기 제어부110은 1115단계에서 이를 감지하고 상기 음성인식모드를 정지하는 1116단계를 진행한다. 1119단계에서 상기 키 입력을 통해 상기 해당이름에 대응되는 전화번호를 선택 하면, 상기 해당이름 및 선택된 전화번호가 표시되는 1120단계를 진행한다. 또는 상기 음성인식모드가 정지된 상태에서 재 시작을 선택하면, 상기 제어부110은 1117단계에서 이를 감지하고 상기 음성인식모드로 전환하는 1118단계를 진행한다. In addition, if the corresponding name is selected through key input in step 11004, the
도 12a는 음성인식모드를 나타낸다, 도 12b는 상기 음성인식모드에서 음성명령입력을 요구하는 안내메시지가 출력되는 과정을 나타내며, 상기 도 12b에서 키 입력을 통해 확인(OK)이 선택되면 도 12c로 진행된다. FIG. 12A illustrates a voice recognition mode. FIG. 12B illustrates a process of outputting a guide message requesting a voice command input in the voice recognition mode. When FIG. 12B is selected through a key input, FIG. Proceed.
도 12c는 이름검색모드에서 해당이름에 대한 음성명령입력을 요구하는 음성안내메시지가 출력되는 과정으로 나타낸다. 상기 도 12c에서 키 입력을 통해 확인(OK)이 선택되면 선택된 이름 및 전화번호가 표시되며, 방향키가 입력되면 도 12k가 진행된다. 12C illustrates a process of outputting a voice guidance message requesting a voice command input for a corresponding name in the name search mode. In FIG. 12C, when OK is selected through key input, the selected name and phone number are displayed. When the direction key is input, FIG. 12K proceeds.
도 12d는 이름검색모드에서 해당이름으로 'Brian Adams'를 음성명령으로 입력하는 과정으로 나타낸다. 상기 도 12d에서 키 입력을 통해 확인(OK)이 선택되면 선택된 이름 및 전화번호가 표시되며, 방향키가 입력되면 도 12k가 진행된다. 12D illustrates a process of inputting 'Brian Adams' as a voice command in the name search mode as a corresponding name. If OK is selected through key input in FIG. 12D, the selected name and phone number are displayed. When the direction key is input, FIG. 12K proceeds.
도 12e는 'Brian Adams' 및 휴대폰번호 표시하며, 'Brian Adams' 및 휴대폰번호를 알리는 음성안내메시지를 출력하는 과정을 나타낸다. 상기 도 12e에서 키 입력을 통해 확인(OK)이 선택되면 도 12k가 진행되며, 우측방향키를 입력하면 도 12g가 진행된다. 12e shows a 'Brian Adams' and a mobile phone number, and shows a process of outputting a voice guidance message informing 'Brian Adams' and the mobile phone number. 12K proceeds when OK is selected through key input in FIG. 12E, and FIG. 12G proceeds when a right direction key is input.
도 12f는 'Brian Adams' 의 휴대폰번호를 출력기 위한 진행과정을 나타낸다. 상기 도 12f에서 'Brian Adams' 의 휴대폰번호를 출력기 위한 진행과정이 완료되기 전에 음성입력이 없으면 도 12j로 진행되며, 키 입력을 통해 확인(OK)이 선택되면 도 12j가 진행되며, 우측방향키를 입력하면 도 12g가 진행된다.12f shows the process for outputting the mobile number of 'Brian Adams'. In FIG. 12F, if there is no voice input before the process for outputting the mobile number of 'Brian Adams' is completed, the process proceeds to FIG. 12J. If OK is selected through the key input, FIG. 12J is performed. 12 g proceeds if input.
도 12g는 도 12f에서 '다음'음성명령이 입력되어'Brian Adams' 및 집 번호 표시하며, 'Brian Adams' 및 집 번호를 알리는 음성안내메시지를 출력하는 과정을 나타낸다. 상기 도 12g에서 키 입력을 통해 확인(OK)이 선택되면 도 12i가 진행되며, 좌측방향키를 입력하면 도 12e가 진행된다.FIG. 12G illustrates a process of outputting a voice guidance message indicating 'Brian Adams' and a house number by inputting a 'next' voice command in FIG. 12F. 12G proceeds when OK is selected through key input in FIG. 12G, and FIG. 12E proceeds when a left direction key is input.
도 12h는 'Brian Adams' 의 집 번호를 출력기 위한 진행과정을 나타낸다. 상기 도 12h에서 'Brian Adams' 의 휴대폰번호를 출력기 위한 진행과정 중에 '이전'음성명령이 입력되면 도 12e로 진행되며, 키 입력을 통해 확인(OK)이 선택되면 도 12i가 진행되며, 좌측방향키를 입력하면 도 12e가 진행된다.12h shows a process for outputting a house number of 'Brian Adams'. In FIG. 12H, if the 'previous' voice command is input during the process of outputting the mobile number of 'Brian Adams', the process proceeds to FIG. 12E. If OK is selected through key input, FIG. 12I is performed and the left direction key 12E is entered.
도 12i는 'Brian Adams' 및 집 번호 표시하며, 'Brian Adams' 및 집 번호를 알리는 음성안내메시지를 출력하는 과정을 나타낸다. 상기 도 12i에서 좌측방향키를 입력하면 도 12j가 진행된다. 12i illustrates a process of outputting a voice guidance message indicating 'Brian Adams' and a house number and informing 'Brian Adams' and a house number. If the left direction key is input in FIG. 12i, FIG. 12j proceeds.
도 12j는 'Brian Adams' 및 휴대폰번호 표시하며, 'Brian Adams' 및 휴대폰번호를 알리는 음성안내메시지를 출력하는 과정을 나타낸다. 상기 도 12j에서 우측방향키를 입력하면 도 12i가 진행된다. FIG. 12J illustrates a process of outputting a voice guidance message informing 'Brian Adams' and a mobile phone number. If the right direction key is input in FIG. 12J, FIG. 12I proceeds.
도 12k는 음성인식모드가 정지된 상태로, 키 입력을 통해 선택된 이름 및 전화번호의 표시되는 상태를 나타낸다. 상기 도 12k에서 키 입력을 통해 다른 이름이 선택되면 도 12l이 진행되며, 재 시작(Resume)이 선택되면 도 12c가 진행된다. 12K illustrates a state in which the voice recognition mode is stopped and the name and phone number selected through key input are displayed. 12k proceeds when another name is selected through key input in FIG. 12k, and FIG. 12c proceeds when a resume is selected.
상기 303단계의 음서인식모드에서 '옵션'을 선택하면, 상기 제어부110은 311단계에서 이를 감지하고 음성인식장치의 세팅값 변경을 수행하는 1200단계를 진행한다. If the 'option' is selected in the note recognition mode of
도 13 - 도 15를 통해 상기 음성인식장치의 세팅값 변경을 수행과정을 살펴본다. 상기 도 13a를 참조하면, 도 14a와 같은 음성인식모드에서 음성인식장치의 세팅값 변경을 선택하면, 상기 제어부110은 이를 감지하고 도 14a와 같이 세팅종류를 표시하는 1301단계를 진행한다. 상기 세팅의 종류 중 메뉴세팅을 선택하면 상기 제어부110은 1302단계에서 이를 감지하고 도 14c와 같은 음성인식메뉴의 종류를 표시하는 1303단계를 진행한다. 상기 사용자가 해당메뉴를 선택 후 확인을 선택하면, 상기 제어부110은 1304단계 및 1305단계에서 이를 감지하고 상기 선택된 메뉴가 설 정 및 해제여부를 체크한다. 상기 선택된 해당메뉴가 설정되어 있지 않으면, 상기 제어부110은 1306단계에서 이를 감지하고 상기 해당메뉴를 설정하는 1307단계를 진행한다. 또는 상기 선택된 해당메뉴가 설정되어 있으면, 상기 제어부110은 상기 1306단계에서 이를 감지하고 상기 해당메뉴를 해제하는 1308단계를 진행한다. 도 14c 및 도 14d는 선택된 해당메뉴의 확인키 입력에 따라 설정 및 해제되는 상태를 나타내고 있다. 13 to 15, the process of changing the setting value of the voice recognition apparatus will be described. Referring to FIG. 13A, when a setting value change of the voice recognition device is selected in the voice recognition mode as shown in FIG. 14A, the
상기 1303단계에서 옵션을 선택하면, 상기 제어부110은 1309단계에서 이를 감지하고 도 14e와 같이 선택된 해당메뉴의 변경종류를 표시하는 1310단계를 진행한다. 상기 해당메뉴의 변경종류 중 이름변경을 선택하면, 상기 제어부110은 1311단계에서 이를 감지하고 입력창을 표시한다. 도 14f와 같이 1312단계에서 상기 입력창에 변경할 이름을 입력한 후 확인을 선택하면, 상기 제어부110은 1313단계에서 이를 감지하고 선택된 메뉴의 이름을 변경된 이름으로 대체하여 설정하는 1314단계를 진행한다. 도 14g는 선택된 메뉴의 이름을 변경된 이름으로 대체하여 설정하여 표시한 상태를 나타낸다. 종료(Back)가 선택되면, 상기 제어부110은 1315단계에서 이를 감지하고 상기 메뉴세팅을 종료한다. If the option is selected in step 1303, the
상기 1301단계에서 표시되는 세팅의 종류 중 도 15a와 같이 음성인식세팅을 선택하면, 상기 제어부110은 1320단계에서 이를 감지하고 상기 음성인식세팅의 종류를 표시한다. 도 13b를 참조하면, 상기 음성인식세팅의 종류 중 도 15b와 같은 음성명령인식시간을 선택하면, 상기 제어부110은 1321단계에서 이를 감지하고 도 15c와 같이 음성명령인식시간의 종류를 표시하는 1322단계를 진행한다. 상기 음성 명령인식시간의 종류 중 해당 음성명령인식시간을 선택하면, 상기 제어부110은 13223단계에서 이를 감지하고 상기 선택된 음성명령인식시간을 음성인식모드의 음성명령인식시간으로 설정하는 1324단계를 진행한다.If the voice recognition setting is selected from among the types of settings displayed in
상기 음성인식세팅의 종류 중 음성안내메시지를 선택하면, 상기 제어부110은 1325단계에서 이를 감지하고 상기 음성안내메시지 설정여부를 표시한다. 확인키가 입력 시, 상기 제어부110은 이를 감지하고 상기 음성안내메시지가 설정되어 있으면 1327단계에서 이를 감지하고 상기 음성안내메시지를 해제하는 1328단계를 진행한다. 또는 상기 음성안내메시지가 해제되어 있으면 1329단계에서 이를 감지하고 상기 음성안내메시지를 설정하는 1330단계를 진행한다. 도 15d는 음서안내메시지가 설정된 상태를 나타내며, 도 15e는 음서안내메시지가 해제된 상태를 나타낸다. 상기 음성안내메시지의 설정 및 해제과정이 완료되면, 상기 제어부110은 1331단계에서 이를 감지하고 상기 음성안내메시지의 설정 및 해제과정을 종료한다.If the voice guidance message is selected from among the types of voice recognition settings, the
상기 음성인식세팅의 종류 중 도 15f와 같이 음성안내메지의 볼륨설정을 선택하면, 상기 제어부110은 1332단계에서 이를 감지하고 도 15g와 같이 음성볼륨을 설정하는 1333단계를 진행한다. 상기 1333단계에서 음성안내메시지의 볼륨을 설정한 후 확인을 입력하면, 상기 제어부110은 1334단계에서 이를 감지하고 상기 선택된 음성안내메시지의 볼륨크기를 음성인식모드의 음성안내메시지의 볼륨크기로 설정하는 1335단계를 진행한다.If the volume setting of the voice guidance message is selected as shown in FIG. 15F among the types of the voice recognition setting, the
상기 음성인식세팅의 종류 중 도 15h와 같이 음성인식 결과값의 개수를 선택하면, 상기 제어부110은 1336단계에서 이를 감지하고 도 15i와 같이 음성인식 결과 값의 개수의 종류를 표시하는 1337단계를 진행한다. 상기 1337단계에서 음성인식 결과 값의 개수를 선택하면, 상기 제어부110은 1338단계에서 이를 감지하고 상기 음성인식 결과값의 개수를 상기 음성인식모드에서 음성인식을 통해 출력된 결과 값의 개수 설정하는 1339단계를 진행한다.If the number of the voice recognition result values is selected as shown in FIG. 15H among the types of the voice recognition setting, the
상기 음성인식세팅의 종류 중 도 15j와 같이 음성인식단계를 선택하면, 상기 제어부110은 1340단계에서 이를 감지하고 도 15k와 같이 음성인식단계의 종류를 표시하는 1341단계를 진행한다. 상기 1341단계에서 음성인식단계를 선택하면, 상기 제어부110은 1342단계에서 이를 감지하고 상기 선택된 음성인식단계를 상기 음성인식모드에서 음성인식의 정확도를 위한 음성인식단계로 설정하는 1343단계를 진행한다.If the voice recognition step is selected as shown in FIG. 15J, the
상기 음성인식세팅의 종류 중 종료를 선택하면, 상기 제어부110은 1344단계에서 이를 감지하고 저장여부를 묻는다. 상기 사용자가 저장을 선택하면, 상기 제어부110은 1345단계에서 이를 감지하고 상기 1324단계, 상기 1328단계 및 1330단계, 상기 1335e나계, 상기 1339단계, 및 상기 1343단계에서 설정된 세팅 값을 저장하는 1346단계를 진행한다.If the end of the type of the voice recognition setting is selected, the
도 16a - 도 16f는 본 발명의 제1실시 예에 따른 휴대단말기에서 음성인식 동작 중 실패과정을 도시한 흐름도이다.16A and 16F are flowcharts illustrating a failure process during a voice recognition operation in the mobile terminal according to the first embodiment of the present invention.
도 16a는 음성인식모드에서 사용자에게 음성명령입력을 요구하는 안내메시 지를 출력하는 과정을 나타낸다. 도 16b는 음성인식모드의 음성명령인식시간 동안에 사용자의 음성명령입력을 대기하는 과정을 나타낸다. 도 16c는 음성명령의 인식 을 1회 실패 시, 상기 음성인식모드로 전환하여 사용자에게 음성명령재입력을 요구하는 안내메시지를 출력하는 과정을 나타낸다. 16A illustrates a process of outputting a guide message for requesting a voice command input to a user in a voice recognition mode. 16B illustrates a process of waiting for a user's voice command input during a voice command recognition time in a voice recognition mode. FIG. 16C illustrates a process of outputting a guide message requesting a user to re-enter a voice command by switching to the voice recognition mode when the voice command is not recognized once.
도 16d는 음성명령의 인식을 2회 실패 시, 상기 음성명령인식실패의 원인이 상기 음성인식모드의 음성명령인식시간동안 사용자의 음성명령 입력이 없음을 알 리는 과정이다. 도 16e는 음성명령의 인식을 2회 실패 시, 상기 음성명령 인식 실 패의 원인이 입력된 음성명령에 해당하는 데이터가 존재하지 않음을 알리는 과 정이다. 도 16f는 음성명령의 인식을 2회 실패 시, 상기 음성명령인식실패의 원인 이 일정이상의 소음임을 알리는 과정이다.16D is a process of notifying a user of a voice command input during the voice command recognition time in the voice recognition mode, which is the cause of the voice command recognition failure when the voice command is recognized twice. FIG. 16E is a procedure for notifying that there is no data corresponding to a voice command inputted as a cause of the voice command recognition failure when the voice command is recognized twice. 16F is a process of notifying that the cause of the voice command recognition failure is a noise of a predetermined level or more when the voice command is recognized twice.
상기 303단계의 음서인식모드에서 종료를 선택하면, 상기 제어부110은 312단계에서 이를 감지하고 음성인식모드를 종료하는 313단계를 진행한다.When the user selects the end in the note recognition mode in
상술한 본 발명의 설명에서는 휴대 단말기와 같은 구체적인 실시 예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시 할 수 있다. 따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위와 특허청구범위의 균등한 것에 의해 정해져야 한다.In the above description of the present invention, a specific embodiment such as a mobile terminal has been described, but various modifications can be made without departing from the scope of the present invention. Therefore, the scope of the present invention should not be defined by the described embodiments, but should be determined by the equivalent of claims and claims.
즉, 상술한 바와 같이 본 발명은 음성인식 동작을 통해 기능을 수행함으로써, 키 조작 없이 음성명령입력만으로 편리하게 다양한 기능을 수행할 수 있는 효과가 있다.That is, as described above, the present invention performs a function through a voice recognition operation, so that various functions can be conveniently performed only by inputting a voice command without key manipulation.
Claims (33)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020040055904A KR100657059B1 (en) | 2004-07-19 | 2004-07-19 | Voice recognition driving method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020040055904A KR100657059B1 (en) | 2004-07-19 | 2004-07-19 | Voice recognition driving method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20060007148A true KR20060007148A (en) | 2006-01-24 |
| KR100657059B1 KR100657059B1 (en) | 2006-12-13 |
Family
ID=37118516
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020040055904A Expired - Fee Related KR100657059B1 (en) | 2004-07-19 | 2004-07-19 | Voice recognition driving method |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR100657059B1 (en) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013081341A1 (en) * | 2011-11-28 | 2013-06-06 | (주)수풀콜매니저 | Interactive ars voice menu access system and access method using same |
| KR20140095779A (en) * | 2013-01-25 | 2014-08-04 | 엘지전자 주식회사 | A laundry and a controlling method of a laundry |
| KR20160073747A (en) * | 2014-12-17 | 2016-06-27 | 현대자동차주식회사 | Sound recognition apparatus, vehicle having the same and method thereof |
| US10140990B2 (en) | 2013-10-14 | 2018-11-27 | Samsung Electronics Co., Ltd. | Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof |
| WO2019039915A1 (en) * | 2017-08-25 | 2019-02-28 | Samsung Electronics Co., Ltd. | Method of activating voice-recognition service and electronic device for implementing same |
| WO2022065733A1 (en) * | 2020-09-25 | 2022-03-31 | 삼성전자(주) | Electronic device and control method therefor |
| US12183338B2 (en) | 2020-09-25 | 2024-12-31 | Samsung Electronics Co., Ltd. | Electronic apparatus and method for controlling speech recognition request |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101393023B1 (en) * | 2007-03-29 | 2014-05-12 | 엘지전자 주식회사 | Mobile communication device and it's user interface method for voice recognition |
| KR101556594B1 (en) * | 2009-01-14 | 2015-10-01 | 삼성전자 주식회사 | Speech recognition method in signal processing apparatus and signal processing apparatus |
| KR102490376B1 (en) * | 2017-11-06 | 2023-01-25 | 삼성전자 주식회사 | Electronic apparatus and Method of executing a function by speech recognition between the electronic apparatus |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0962014B1 (en) * | 1997-12-30 | 2003-11-12 | Koninklijke Philips Electronics N.V. | Speech recognition device using a command lexicon |
| KR20000049864A (en) * | 2000-05-03 | 2000-08-05 | 임정택 | voice percepting cellular-phone and the controlling method therefore |
| KR100423495B1 (en) * | 2001-06-21 | 2004-03-18 | 삼성전자주식회사 | Operation control system by speech recognition for portable device and a method using the same |
| KR20030010279A (en) * | 2001-07-26 | 2003-02-05 | 삼성전자주식회사 | Computer system with speech recognition function and method of controlling the same |
| KR20040001318A (en) * | 2002-06-27 | 2004-01-07 | 엘지전자 주식회사 | Remote control method using voice recognition of mobile telecommunication terminal equipment |
-
2004
- 2004-07-19 KR KR1020040055904A patent/KR100657059B1/en not_active Expired - Fee Related
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013081341A1 (en) * | 2011-11-28 | 2013-06-06 | (주)수풀콜매니저 | Interactive ars voice menu access system and access method using same |
| KR20140095779A (en) * | 2013-01-25 | 2014-08-04 | 엘지전자 주식회사 | A laundry and a controlling method of a laundry |
| US10140990B2 (en) | 2013-10-14 | 2018-11-27 | Samsung Electronics Co., Ltd. | Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof |
| US10395657B2 (en) | 2013-10-14 | 2019-08-27 | Samsung Electronics Co., Ltd. | Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof |
| US10720162B2 (en) | 2013-10-14 | 2020-07-21 | Samsung Electronics Co., Ltd. | Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof |
| US11823682B2 (en) | 2013-10-14 | 2023-11-21 | Samsung Electronics Co., Ltd. | Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof |
| KR20160073747A (en) * | 2014-12-17 | 2016-06-27 | 현대자동차주식회사 | Sound recognition apparatus, vehicle having the same and method thereof |
| US9799334B2 (en) | 2014-12-17 | 2017-10-24 | Hyundai Motor Company | Speech recognition apparatus, vehicle including the same, and method of controlling the same |
| WO2019039915A1 (en) * | 2017-08-25 | 2019-02-28 | Samsung Electronics Co., Ltd. | Method of activating voice-recognition service and electronic device for implementing same |
| US10692495B2 (en) | 2017-08-25 | 2020-06-23 | Samsung Electronics Co., Ltd | Method of receiving commands for activating voice-recognition service and electronic device for implementing same |
| WO2022065733A1 (en) * | 2020-09-25 | 2022-03-31 | 삼성전자(주) | Electronic device and control method therefor |
| US12183338B2 (en) | 2020-09-25 | 2024-12-31 | Samsung Electronics Co., Ltd. | Electronic apparatus and method for controlling speech recognition request |
Also Published As
| Publication number | Publication date |
|---|---|
| KR100657059B1 (en) | 2006-12-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102210433B1 (en) | Electronic device for speech recognition and method thereof | |
| US6718307B1 (en) | Speech input device with attention span | |
| KR101992676B1 (en) | Method and apparatus for voice recognition using video recognition | |
| JP5355591B2 (en) | Navigation device | |
| US6018711A (en) | Communication system user interface with animated representation of time remaining for input to recognizer | |
| KR100617711B1 (en) | Voice recognition driving method in mobile terminal | |
| BRPI1010584B1 (en) | method for providing input functionality for a speech recognition interaction module | |
| AU2019201441B2 (en) | Electronic device for processing user voice input | |
| KR100657059B1 (en) | Voice recognition driving method | |
| KR20190068133A (en) | Electronic device and method for speech recognition | |
| EP3139377B1 (en) | Guidance device, guidance method, program, and information storage medium | |
| KR20070088029A (en) | Apparatus and method for providing a user interface in a mobile terminal | |
| KR100567828B1 (en) | Apparatus And Method for Enhanced Voice Recognition | |
| CN110839169B (en) | Intelligent equipment remote control device and control method based on same | |
| CN110782886A (en) | System, method, television, device and medium for speech processing | |
| JP2011118690A (en) | Translating device | |
| CN116705015A (en) | Device wake-up method, device and computer-readable storage medium | |
| US20230223019A1 (en) | Information processing device, information processing method, and program | |
| KR102494051B1 (en) | Electronic device for speech recognition and method thereof | |
| KR102359163B1 (en) | Electronic device for speech recognition and method thereof | |
| KR100703414B1 (en) | Information retrieval method using mobile terminal | |
| KR102482457B1 (en) | Display apparatus for performing a voice control and method thereof | |
| JP2003202890A (en) | Speech recognition device, method and program | |
| KR20020040300A (en) | voice recognition system and control methode for computer | |
| KR20080013541A (en) | Voice control device and method of portable terminal |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20091207 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20091207 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |