KR20170135133A - System and method for voice recognition - Google Patents
System and method for voice recognition Download PDFInfo
- Publication number
- KR20170135133A KR20170135133A KR1020160066579A KR20160066579A KR20170135133A KR 20170135133 A KR20170135133 A KR 20170135133A KR 1020160066579 A KR1020160066579 A KR 1020160066579A KR 20160066579 A KR20160066579 A KR 20160066579A KR 20170135133 A KR20170135133 A KR 20170135133A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- recognition
- information
- voice information
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000004891 communication Methods 0.000 claims description 34
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000002779 inactivation Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 230000009849 deactivation Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
본 발명의 실시예들은 음성 인식 시스템 및 방법에 관한 것이다.Embodiments of the present invention relate to speech recognition systems and methods.
가정 내의 조명, 에어컨, 커튼, 및 가스등의 기기들을 인터넷이나 기타 통신망을 통하여 원격으로 제어하는 홈 네트워크 시스템이 보급되고 있으며, 특히 음성으로 이들 기기들을 제어하는 음성 인식 시스템도 출시되고 있다.Home network systems that remotely control appliances such as home lighting, air conditioners, curtains, and gas through the Internet or other communication networks have been popular, and voice recognition systems that control these devices by voice are also being introduced.
음성 인식이란, 입력된 음성신호를 컴퓨터가 분석해 이를 텍스트로 인식 또는 이해하는 기술을 말하는데, 일반적인 음성 인식 장치는, 입력된 음성신호의 특징을 추출하여 특징 벡터로 변환시키고, 미리 구축된 음향 모델 데이터베이스, 어휘 모델 데이터베이스, 및 언어 모델 데이터베이스를 참조하여 비터비 알고리즘을 이용하여 상기 추출된 특징 벡터와 가장 유사한 인식 결과인 텍스트를 제공하도록 구현되어 있다.Speech recognition refers to a technique in which a computer analyzes an input speech signal and recognizes or understands the input speech signal as text. A typical speech recognition apparatus extracts characteristics of an input speech signal, converts the extracted speech signal into a feature vector, , A vocabulary model database, and a language model database, and provides a text that is the most similar recognition result to the extracted feature vector using a Viterbi algorithm.
일반적인 음성 인식 시스템은 복수의 영역에 동일한 복수의 음성 인식 장치를 구분하여 설치하고, 각각의 음성 인식 장치를 이용하여 사용자의 음성을 인식하여 네트워크의 음성 인식 서버로 전달하거나 음성 명령을 수행할 수 있다.In a general speech recognition system, a plurality of the same speech recognition apparatuses are divided and installed in a plurality of areas, and each speech recognition apparatus recognizes a user's speech and transmits it to the speech recognition server of the network or can execute a speech command .
음성 인식 시스템이 영역 별로 음성 인식 장치가 별도로 구성되는 경우 각 음성 인식 장치에서 모드 및 명령에 대한 화자의 모든 음성을 인식하여야 하므로, 각각의 음성 인식 장치를 구성하여 구동시키려면 고성능, 고비용의 장치 사양이 필요하다.If the speech recognition system is configured separately for each area, it is necessary for each speech recognition device to recognize all the speech of the speaker regarding the mode and the command. Therefore, in order to configure and drive each speech recognition device, Is required.
또한, 홈 네트워크 기반의 음성 인식 시스템의 경우 하나의 영역 내의 음성 인식 장치가 관장하는 음성 인식 가능 거리에 한계가 있으므로, 화자의 음성 정보가 원활하게 전달되지 않을 수도 있다.In addition, in the case of a home network-based voice recognition system, the voice recognition information within a single area has a limited voice recognition distance, so that the voice information of the speaker may not be transmitted smoothly.
본 발명의 일실시예는 실내 환경에서 화자가 어느 위치에 있더라도 음성 인식이 가능하도록 하여, 다양한 홈 IoT 기기 제어 등 원할한 음성 인식 기반의 서비스를 제공하는 것을 목적으로 한다.An embodiment of the present invention aims to provide a speech recognition-based service such as control of various home IoT devices by enabling speech recognition regardless of the position of a speaker in an indoor environment.
본 발명의 일실시예는 무선 통신 거리의 제약 상황을 극복하여 화자가 실내 어느 곳에 위치해 있는지 관계없이 어디서나 음성 인식 또는 음성 대화 서비스를 제공한다.One embodiment of the present invention overcomes the constraint of wireless communication distance and provides voice recognition or voice conversation service anywhere, regardless of where the speaker is located in the room.
본 발명의 일실시예는 음성 인식 장치로 음성 정보를 수집하여 전달할 수 있는 음성 수집 장치를 설치함으로써, 저사양 및 저비용으로 광범위한 영역에 대한 음성 인식 시스템을 구축하는 것을 목적으로 한다.An embodiment of the present invention aims to construct a voice recognition system for a wide area at low cost and low cost by providing a voice acquisition device capable of collecting and transmitting voice information to a voice recognition device.
본 발명의 일실시예에 따른 음성 인식 시스템은 미리 설정된 하나 이상의 영역에 설치되어, 상기 하나 이상의 영역으로부터 음성 정보를 수집하는 하나 이상의 음성 수집 장치, 상기 음성 정보를 직접 수신하거나 상기 음성 수집 장치로부터 상기 음성 정보를 수신하는 음성 인식 장치, 및 상기 음성 인식 장치로부터 상기 음성 정보를 수신하고, 상기 음성 정보를 기반으로 제어 대상 기기를 제어하는 음성 인식 서버를 포함한다.The voice recognition system according to an embodiment of the present invention includes at least one voice collection device installed in at least one predetermined area and collecting voice information from the at least one area, And a voice recognition server for receiving the voice information from the voice recognition device and controlling the control subject device based on the voice information.
본 발명의 일측에 따르면, 상기 하나 이상의 음성 수집 장치는 무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송할 수 있다.According to one aspect of the present invention, the at least one voice collection device relays the voice information to another voice collection device in a wireless communication manner, and the other voice collection device transmits the relayed voice information to the voice recognition device Lt; / RTI >
본 발명의 일실시예에 따른 음성 인식 장치는 하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하는 음성 수신부, 상기 음성 수신부를 통하여 수신된 하나 이상의 호출어를 인식하여, 상기 음성수집 장치로부터 상기 음성 정보를 수신하거나 직접 상기 음성 정보를 수신하도록 제어하는 음성 인식 처리부, 및 상기 음성 정보를 음성 인식 서버로 전송하는 음성 전송부를 포함한다. The voice recognition apparatus according to an embodiment of the present invention includes a voice receiving unit that receives voice information from at least one voice collecting device or receives voice information directly, a voice recognition unit that recognizes one or more voice call received through the voice receiving unit, A voice recognition processor for receiving the voice information from the device or directly receiving the voice information, and a voice transmitter for transmitting the voice information to the voice recognition server.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며, 상기 음성 수신부는 상기 선택된 장치로부터 상기 음성 정보를 수신하고, 상기 음성 전송부는 상기 선택된 장치로부터 수신된 상기 음성 정보를 상기 음성 인식 서버로 전송할 수 있다.According to one aspect of the present invention, the speech recognition processing unit determines a priority for the at least one caller based on the at least one caller, and compares the at least one voice collection device corresponding to the caller according to the priority The voice receiving unit receives the voice information from the selected device, and the voice transmitting unit can transmit the voice information received from the selected device to the voice recognition server.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 둘 이상의 호출어가 수신되는 경우, 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 상기 우선 순위를 결정하고, 상기 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하여 상기 음성 정보를 수신하도록 제어할 수 있다.According to an aspect of the present invention, when two or more callers are received, the speech recognition processor determines the priority based on at least one of a caller receiving time or a voice recognition quality, It is possible to select one of the corresponding one or more voice collecting apparatuses and the corresponding voice recognition apparatus to receive the voice information.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며, 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청할 수 있다.According to one aspect of the present invention, the voice recognition processing unit determines a priority for the at least one caller, and selects one of the one or more voice acquisition devices corresponding to the call word and the voice recognition device And may request a voice receiving standby deactivation to the non-selected device among the one or more voice collecting devices and the voice recognizing device.
본 발명의 일실시예에 따른 음성 수집 장치는 미리 설정된 하나 이상의 영역에 설치되어 음성 정보를 수집하고, 상기 음성 정보를 수신하는 음성 수신부, 상기 음성 수신부를 통하여 수신된 호출어를 인식하여, 상기 음성 정보를 수신하도록 제어하는 음성 인식 처리부, 및 상기 음성 정보를 상기 음성 인식 장치로 전송하는 음성 전송부를 포함한다. A voice collecting apparatus according to an embodiment of the present invention includes a voice receiving unit installed in at least one predetermined area to collect voice information and receive the voice information, a voice recognition unit that recognizes a voice call received through the voice receiving unit, And a voice transmission unit for transmitting the voice information to the voice recognition apparatus.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 상기 음성 인식 장치로부터 음성 수신 대기 명령 또는 수신 대기 비활성화 명령을 수신하고, 상기 수신 대기 명령 또는 상기 수신 대기 비활성화 명령에 따라 수신 대기 또는 수신 대기 비활성화되도록 제어할 수 있다.According to one aspect of the present invention, the voice recognition processing unit receives a voice reception standby command or a reception standby inactivation command from the voice recognition apparatus in accordance with a priority determined by the voice recognition apparatus, It is possible to control the reception standby or reception standby to be inactivated according to the standby disable command.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 음성 정보를 수신하도록 제어할 수 있다.According to an aspect of the present invention, the voice recognition processor recognizes different call words from other voice collection devices and controls the voice recognition device to receive the voice information.
본 발명의 일측에 따르면, 상기 음성 전송부는 무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송할 수 있다.According to one aspect of the present invention, the voice transmitting unit relays the voice information to another voice collecting device in a wireless communication manner, and the other voice collecting device can transmit the relayed voice information to the voice recognizing device .
본 발명의 일실시예에 따른 음성 인식 장치를 이용한 음성 인식 방법은 음성 정보를 직접 수신하거나 상기 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치로부터 상기 음성 정보를 수신하는 단계, 및 상기 음성 정보를 음성 인식 서버로 전송하는 단계를 포함하고, 상기 음성 인식 서버는 상기 음성 정보를 기반으로 제어대상기기를 제어할 수 있다.A method of recognizing a speech using a speech recognition apparatus according to an embodiment of the present invention includes receiving voice information directly or receiving the voice information from at least one voice collection device installed in the at least one area, And transmitting the voice information to the server, wherein the voice recognition server can control the control target device based on the voice information.
본 발명의 일측에 따르면, 상기 하나 이상의 음성 수집 장치는 무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송할 수 있다.According to one aspect of the present invention, the at least one voice collection device relays the voice information to another voice collection device in a wireless communication manner, and the other voice collection device transmits the relayed voice information to the voice recognition device Lt; / RTI >
본 발명의 일실시예에 따른 음성 인식 장치의 음성 인식 하는 방법은 하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하는 단계, 수신된 하나 이상의 호출어를 인식하여, 상기 음성 수집 장치로부터 상기 음성 정보를 수신하거나 직접 상기 음성정보를 수신하도록 제어하는 단계, 및 상기 음성 정보를 음성 인식 서버로 전송하는 단계를 포함한다.A method of recognizing speech in a speech recognition apparatus according to an embodiment of the present invention includes receiving speech information from one or more speech collection devices or directly receiving speech information, recognizing one or more received speech words, Receiving the voice information from the voice recognition server or directly receiving the voice information, and transmitting the voice information to the voice recognition server.
본 발명의 일측에 따른 음성 인식 장치의 음성 인식 하는 방법은 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하는 단계, 및 상기 우선 순위에 따라 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 단계를 더 포함하고, 상기 음성 정보를 수신하는 단계는 상기 선택된 장치로부터 상기 음성 정보를 수신하는 단계를 포함하고, 상기 음성 정보를 전송하는 단계는 상기 선택된 장치로부터 수신된 상기 음성 정보를 상기 음성 인식 서버로 전송하는 단계를 포함할 수 있다.A method for speech recognition of a speech recognition apparatus according to an aspect of the present invention includes determining a priority for the one or more call words based on the one or more call words, Wherein the step of selecting one of the speech recognition devices comprises receiving the speech information from the selected device and the step of transmitting the speech information comprises: And transmitting the voice information received from the voice recognition server to the voice recognition server.
본 발명의 일실시예에 따른 음성 인식 장치의 음성 인식 하는 방법은 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하는 단계, 상기 우선 순위에 따라 상기 호출어에 대응하는 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 단계, 및 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청하는 단계를 더 포함할 수 있다.A method for speech recognition of a speech recognition apparatus according to an embodiment of the present invention includes the steps of: determining a priority for the at least one caller based on the at least one caller; Selecting one of the one or more voice collecting devices and the voice recognition device and requesting deactivation of voice receiving standby to the unselected one of the one or more voice collecting devices and the voice recognizing device .
본 발명의 일실시예에 따른 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치를 이용하여 음성 인식하는 방법은 호출어를 수신하는 단계, 상기 호출어가 인식된 경우, 음성 정보를 수신하는 단계, 및 상기 음성 정보를 상기 음성 인식 장치로 전송하는 단계를 포함한다.A method for voice recognition using one or more voice acquisition devices installed in a predetermined one or more areas according to an embodiment of the present invention includes receiving an invocation, receiving voice information when the caller is recognized, And transmitting the voice information to the voice recognition apparatus.
본 발명의 일측에 따른 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치를 이용하여 음성 인식하는 방법은 상기 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 상기 음성 인식 장치로부터 수신 대기 명령 또는 수신 대기 비활성화 명령을 수신하는 단계, 및 상기 수신 대기 명령 또는 상기 수신 대기 비활성화 명령에 따라 수신 대기 또는 수신 대기 비활성화되는 단계를 더 포함할 수 있다.A method for performing speech recognition using one or more speech collection devices installed in a predetermined one or more areas according to one aspect of the present invention includes receiving, from a speech recognition device, Receiving the inactivation command, and inactivating the waiting or receiving standby according to the receiving standby command or the standby standby inactivation command.
본 발명의 일측에 따르면, 상기 음성 정보를 수신하는 단계는 다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 음성 정보를 수신하도록 제어하는 단계를 포함할 수 있다.According to an aspect of the present invention, the step of receiving the voice information may include the step of recognizing different call words with another voice collection device and controlling the voice information to be received.
본 발명의 일측에 따른 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치를 이용하여 음성 인식하는 방법은 무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하는 단계를 더 포함하고, 상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송할 수 있다.A method for voice recognition using one or more voice collection devices installed in one or more predetermined areas according to an aspect of the present invention further comprises relaying the voice information to another voice collection device in a wireless communication manner, The other voice collection device may transmit the relayed voice information to the voice recognition device.
본 발명의 일실시예에 따른 음성 인식 서버는 음석 인식 장치로부터 음성 정보를 수신하는 음성 수신부, 및 상기 음성 정보가 하나 이상의 호출어인 경우, 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며, 상기 선택된 장치가 음성 수신 대기 하도록 제어하는 음성 인식 처리부를 포함한다.A voice recognition server according to an embodiment of the present invention includes a voice receiving unit for receiving voice information from a speech recognition apparatus, and a voice recognition unit for, if the voice information is at least one call word, And a voice recognition processor for determining a priority and selecting one of the voice recognition device and the voice recognition device corresponding to the call word according to the priority and controlling the selected device to wait for voice reception .
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 상기 우선 순위를 결정할 수 있다.According to an aspect of the present invention, the voice recognition processing unit may determine the priority based on at least one of the call receiving time and the voice recognition quality.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 되도록 제어할 수 있다.According to an aspect of the present invention, the voice recognition processing unit may control voice reception standby to be inactivated to a non-selected device among the one or more voice acquisition devices and the voice recognition device.
본 발명의 일실시예에 따르면 실내 환경에서 화자가 어느 위치에 있더라도 음성 인식이 가능하도록 하여, 다양한 홈 IoT 기기 제어 등 원할한 음성 인식 기반의 서비스를 제공할 수 있다.According to an embodiment of the present invention, speech recognition can be performed regardless of the position of a speaker in an indoor environment, and it is possible to provide a smooth speech recognition based service such as control of various home IoT devices.
본 발명의 일실시예에 따르면 무선 통신 거리의 제약 상황을 극복하여 화자가 실내 어느 곳에 위치해 있는지 관계없이 어디서나 음성 인식 또는 음성 대화 서비스를 제공할 수 있다.According to an embodiment of the present invention, a speech recognition or voice conversation service can be provided anywhere, regardless of where the speaker is located, by overcoming the constraint of the wireless communication distance.
본 발명의 일실시예에 따르면 음성 인식 장치로 음성 정보를 수집하여 전달할 수 있는 음성 수집 장치를 설치함으로써, 저사양 및 저비용으로 광범위한 영역에 대한 음성 인식 시스템을 구축할 수 있다.According to an embodiment of the present invention, a voice recognition system for a wide area can be constructed at low cost and low cost by providing a voice acquisition device capable of collecting and transmitting voice information to a voice recognition device.
도 1은 본 발명의 일실시예에 따른 음성 인식 시스템의 구성을 도시한 블록도이다.
도 2는 본 발명의 일측에 따른 음성 인식 시스템을 가정 내의 복수의 영역에 구성한 예를 도시한 도면이다.
도 3a 및 도 3b는 본 발명의 일측에 따른 음성 수집 장치의 구성을 도시한 블록도이다.
도 4a 및 도 4b는 본 발명의 일측에 따른 음성 인식 장치의 구성을 도시한 블록도이다.
도 5는 본 발명의 일실시예에 따른 음성 인식 서버의 구성을 도시한 도면이다.
도 6은 본 발명의 일실시예에 따른 음성 인식 방법을 도시한 흐름도이다.
도 7은 본 발명의 다른 실시예에 따른 음성 인식 방법을 도시한 흐름도이다.
도 8은 본 발명의 다른 실시예에 따른 음성 인식 방법을 도시한 흐름도이다.1 is a block diagram illustrating a configuration of a speech recognition system according to an embodiment of the present invention.
2 is a diagram showing an example in which a speech recognition system according to an aspect of the present invention is configured in a plurality of areas in a home.
3A and 3B are block diagrams showing a configuration of a sound collecting apparatus according to an aspect of the present invention.
4A and 4B are block diagrams showing a configuration of a speech recognition apparatus according to an aspect of the present invention.
5 is a diagram illustrating a configuration of a speech recognition server according to an embodiment of the present invention.
6 is a flowchart illustrating a speech recognition method according to an embodiment of the present invention.
7 is a flowchart illustrating a speech recognition method according to another embodiment of the present invention.
8 is a flowchart illustrating a speech recognition method according to another embodiment of the present invention.
이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시예를 상세하게 설명하지만, 본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.BRIEF DESCRIPTION OF THE DRAWINGS Embodiments of the present invention will now be described in detail with reference to the accompanying drawings and the accompanying drawings, wherein specific structural or functional descriptions for embodiments according to the concepts of the present invention disclosed herein The embodiments according to the concept of the present invention may be embodied in various forms and are not limited to the embodiments described herein.
본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 변경, 균등물, 또는 대체물을 포함한다Embodiments in accordance with the concepts of the present invention are capable of various modifications and may take various forms, so that the embodiments are illustrated in the drawings and described in detail herein. It is to be understood, however, that the intention is not to limit the embodiments according to the concepts of the present invention to the specific disclosed embodiments, but includes modifications, equivalents, or alternatives falling within the spirit and scope of the present invention
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.The terms first, second, or the like may be used to describe various elements, but the elements should not be limited by the terms. The terms may be named for the purpose of distinguishing one element from another, for example without departing from the scope of the right according to the concept of the present invention, the first element being referred to as the second element, Similarly, the second component may also be referred to as the first component.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 "~사이에"와 "바로~사이에" 또는 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between. Expressions that describe the relationship between components, for example, "between" and "immediately" or "directly adjacent to" should be interpreted as well.
본 명세서에서 사용한 용어는 단지 특정한 실시예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used herein is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In this specification, the terms "comprises ", or" having ", and the like, are used to specify one or more of the features, numbers, steps, operations, elements, But do not preclude the presence or addition of steps, operations, elements, parts, or combinations thereof.
한편, 본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는, 그 상세한 설명을 생략할 것이다. 그리고, 본 명세서에서 사용되는 용어(terminology)들은 본 발명의 실시예를 적절히 표현하기 위해 사용된 용어들로서, 이는 사용자, 운용자의 의도 또는 본 발명이 속하는 분야의 관례 등에 따라 달라질 수 있다. 따라서, 본 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear. The terminology used herein is a term used for appropriately expressing an embodiment of the present invention, which may vary depending on the user, the intent of the operator, or the practice of the field to which the present invention belongs. Therefore, the definitions of these terms should be based on the contents throughout this specification.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this embodiment belongs. Terms such as those defined in commonly used dictionaries are to be interpreted as having a meaning consistent with the contextual meaning of the related art and are to be interpreted as ideal or overly formal in the sense of the art unless explicitly defined herein Do not.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.In the following description of the present invention with reference to the accompanying drawings, the same components are denoted by the same reference numerals regardless of the reference numerals, and redundant explanations thereof will be omitted. In the following description of the embodiments, a detailed description of related arts will be omitted if it is determined that the gist of the embodiments may be unnecessarily blurred.
본 발명의 일실시예에 따른 음성 인식 시스템은 실내 환경 곳곳에 화자의 음성 정보를 수집하여 전달할 수 있는 음성 수집 장치를 하나 이상 위치시키고, 무선 통신을 통해 네트워크를 구성하여 음성 인식 장치 또는 음성 인식 서버로 전달하도록 구성할 수 있다.The speech recognition system according to an embodiment of the present invention locates at least one speech collecting device capable of collecting and transmitting speech information of a speaker in various places in an indoor environment and configures a network through wireless communication, As shown in FIG.
본 발명의 일측에 따른 음성 인식 시스템은 복수의 음성 수집 장치를 구성하는 경우, 화자의 음성 정보를 전달할 수 있는 음성 수집 장치 사이에 무선 릴레이 기능을 부여하여 무선 통신 거리의 제약 상황을 극복할 수 있다.The voice recognition system according to an aspect of the present invention can overcome the constraint of wireless communication distance by providing a wireless relay function between voice collecting devices capable of transmitting voice information of a speaker when configuring a plurality of voice collecting devices .
본 발명의 일측에 따르면, 음성 인식 시스템은 화자가 실내 어느 곳에 위치하더라도 어디서나 음성 인식 또는 음성 대화 서비스를 제공할 수 있다.According to one aspect of the present invention, a speech recognition system can provide a speech recognition or voice chat service anywhere the speaker is located anywhere in the room.
도 1은 본 발명의 일실시예에 따른 음성 인식 시스템의 구성을 도시한 블록도이다.1 is a block diagram illustrating a configuration of a speech recognition system according to an embodiment of the present invention.
본 발명의 일실시예에 따른 음성 인식 시스템은 하나 이상의 음성 수집 장치(110), 음성 인식 장치(120), 및 음성 인식 서버(130)를 포함한다.The speech recognition system according to an embodiment of the present invention includes at least one of a
하나 이상의 음성 수집 장치(110)는 미리 설정된 하나 이상의 영역에 설치되어, 하나 이상의 영역으로부터 음성 정보를 수집한다.One or more
음성 인식 장치(120)는 음성 정보를 직접 수신하거나 하나 이상의 음성 수집 장치(110)로부터 음성 정보를 수신한다.The
음성 인식 서버(130)는 음성 인식 장치로부터 음성 정보를 수신하고, 음성 정보를 기반으로 제어 대상 기기를 제어한다.The
하나 이상의 음성 수집 장치(110)는 무선 통신 방식으로 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 할 수 있으며, 다른 음성 수집 장치는 릴레이된 음성 정보를 음성 인식 장치로 전송할 수 있다.One or more
예를 들어, 음성 수집 장치 #4는 설치된 영역으로부터 화자의 음성 정보를 수집하고, 수집된 음성 정보를 무선 통신 릴레이 방식을 통하여 음성 수집 장치 #3으로 전달할 수 있다. For example, the voice
음성 수집 장치 #3은 음성 수집 장치 #4로부터 수신된 음성 정보를 다시 음성 인식 장치(120)로 전송하고, 음성 인식 장치(120)는 수신된 음성 정보를 인식하여 음성 인식 정보를 생성할 수 있다.The voice collecting apparatus # 3 transmits the voice information received from the voice collecting
본 발명의 일측에 따르면, 음성 인식 서버(130)는 음성 인식 정보에 따른 음성 명령을 수행한 음성 인식 결과를 음성 인식 장치로 전송할 수 있다.According to one aspect of the present invention, the
예를 들어, 음성 인식 서버(130)는 인식된 음성 인식 정보를 기반으로 제어 대상 기기를 제어하고, 음성 명령 수행에 대한 음성 인식 결과를 음성 인식 장치(120)로 전달하여 사용자에게 제어 대상 기기의 제어 여부를 알려줄 수 있다.For example, the
음성 인식 장치(120)는 미리 설정된 범위 내에 사용자가 위치하는 경우, 하나 이상의 음성 정보를 직접 수신할 수도 있다.The
예를 들어, 음성 인식 장치(120)는 호출어 및 음성 명령이 포함된 사용자의 음성 정보를 사용자의 위치에 따라 하나 이상의 음성 수집 장치(110)로부터 수신 될 수도 있고, 사용자가 음성 인식 장치(120)에 가까이 위치한 경우 음성 인식 장치(120) 자체적으로 음성 정보를 수집 및 인식할 수도 있다.For example, the
하나 이상의 음성 수집 장치(110)는 음성 인식 장치(120)에서 인식된 호출어를 기반으로 결정되는 우선 순위에 따라, 음성 인식 장치(120)로부터 대기 명령 또는 비활성화 명령을 수신하고, 대기 명령 또는 비활성화 명령에 따라 대기 또는 비활성화될 수도 있다.The one or more
아래에서는 본 발명의 일측에 따른 음성 인식 시스템을 가정 내의 복수의 영역에 구성한 예를 통하여 음성 인식하는 방법에 대하여 설명한다.Hereinafter, a method of recognizing speech through an example where speech recognition systems according to one aspect of the present invention are configured in a plurality of areas within a home will be described.
도 2는 본 발명의 일측에 따른 음성 인식 시스템을 가정 내의 복수의 영역에 구성한 예를 도시한 도면이다.2 is a diagram showing an example in which a speech recognition system according to an aspect of the present invention is configured in a plurality of areas in a home.
도 2를 참조하면, 음성 인식 시스템은 가정 환경에서 음성 정보를 수집하기 위하여 각각의 음성 수집 영역(210~250)에 음성 수집 장치(221~251)를 설치할 수 있으며, 특정 영역(210)의 경우 음성 수집 장치(221~251)로부터 음성 정보를 수신하여 음성 정보를 인식하는 음성 인식 장치(211)를 설치하여 무선 네트워크를 구성할 수 있다.Referring to FIG. 2, the speech recognition system may include
음성 수집 장치(221~251)는 사용자(화자)가 말하는 음성을 음성 정보로써 수집하고, 음성 인식 장치(211)는 수집된 음성 정보를 인식하여 음성 인식 정보를 생성할 수 있다.The
음성 수집 장치(221~251)는 음성 인식 장치(211)로 음성 정보를 전달하기 위한 무선 통신 거리가 멀어서 음성 정보를 전달할 수 없는 경우, 다른 음성 수집 장치를 경유하여 전달할 수도 있다.The
예를 들어, 영역(240)에 위치한 음성 수집 장치 #3(241)은 영역(250)에 위치한 음성 수집 장치 #4(251)을 통하여 음성 인식 장치(211)로 음성 정보를 수신할 수도 있다.For example, the sound collection apparatus # 3 (241) located in the
음성 인식 장치(211)는 사전에 정해진 호출어 기반으로 음성 인식이 시작되도록 할 수 있으며, 음성 인식이 시작되면 수신된 음성 명령이 포함된 사용자의 음성 정보를 음성 인식 서버로 전달할 수 있다.The
예를 들어, 음성 인식 장치(211)는 호출어 및 음성 명령이 포함된 사용자의 음성 정보를 사용자의 위치에 따라 음성 수집 장치(221~251)로부터 수신할 수도 있고, 사용자가 음성 인식 장치(211)가 설치된 영역(210)에 위치한 경우 음성 인식 장치(211)를 통하여 직접 음성 정보를 수집 및 인식할 수도 있다.For example, the
아래에서는 본 발명의 일측에 따른 음성 수집 장치의 구성을 설명하도록 한다. 본 발명의 일측에 따른 음성 수집 장치는 미리 설정된 하나 이상의 영역에 설치될 수 있다.Hereinafter, a configuration of a sound collection apparatus according to an aspect of the present invention will be described. The sound collection device according to an aspect of the present invention may be installed in at least one predetermined area.
도 3a 및 도 3b는 본 발명의 일측에 따른 음성 수집 장치의 구성을 도시한 블록도이다.3A and 3B are block diagrams showing a configuration of a sound collecting apparatus according to an aspect of the present invention.
도 3a 및 3b를 참조하면, 음성 수집 장치는 사용자로부터 음성 정보를 수집하여 처리하는 음성 처리부(310), 음성 정보로부터 음성 인식 가능한 음성 데이터로 변환하는 데이터 처리부(320), 및 음성 수집 장치에 전력을 공급하기 위한 전력 처리부(330)를 포함한다.3A and 3B, the voice collecting apparatus includes a
본 발명의 일측에 따른 음성 처리부(310)는 음성 정보를 수신하는 음성 수신부(311), 음성 정보를 음성 인식 장치로 전송하기 위한 데이터로 변환하는 음성 처리 제어부(312), 음성 수신부(311)를 통하여 수신된 하나 이상의 호출어를 인식하여 음성 정보를 수신하도록 제어하는 음성 인식 처리부(313), 및 음성 정보를 음성 인식 장치로 전송하는 음성 전송부(314)를 포함한다.The
예를 들어, 음성 수신부(311)는 사용자의 음성 정보를 수신할 수 있는 마이크로 구성될 수 있으며, 음성 처리 제어부(312)는 마이크로부터 수신되는 음성 정보를 추출하여 음성 인식 장치로 전송을 하기 위한 데이터 압축 등의 데이터 가공 과정을 수행할 수 있다.For example, the
음성 인식 처리부(313)는 음성 수집 장치의 구동을 시작하기 위한 호출어 인식 등의 간단한 음성 인식 처리를 수행할 수 있다. 예를 들어, 음성 인식 처리부(313)는 음성 수신부(311)를 통하여 수신된 호출어 중 미리 설정된 호출어에 해당하는 경우, 음성 정보를 수신하도록 음성 수신부(311)를 제어할 수 있다.The speech
또한, 음성 인식 처리부(313)는 다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 하나 이상의 음성 정보를 수신하도록 제어할 수 있다.In addition, the
본 발명의 일측에 따르면, 하나 이상의 음성 수집 장치 및 음성 인식 장치는 상기 하나 이상의 영역 별 또는 상기 각각의 장치 별로 미리 설정된 서로 다른 호출어를 인식하여 상기 하나 이상의 음성 정보를 수신할 수 있다.According to one aspect of the present invention, the at least one voice collection device and the voice recognition device can recognize the one or more voice information by recognizing different call words preset for each of the one or more areas or the respective devices.
예를 들어, 하나 이상의 영역 별 설치된 하나 이상의 음성 수집 장치는 음성 인식 처리부(313)를 통하여 인식할 수 있는 호출어가 서로 다를 수 있으며, 각각의 음성 수집 장치마다 설정된 호출어가 인지된 경우에만 해당 음성 수집 장치가 음성 정보를 수신할 수 있다.For example, one or more voice collecting apparatuses installed in one or more areas may have different callers recognizable through the
음성 인식 처리부(313)는 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 음성 인식 장치로부터 대기 명령 또는 비활성화 명령을 수신할 수 있으며, 음성 수집 장치를 대기 명령 또는 비활성화 명령에 따라 대기 또는 비활성화되도록 제어할 수 있다.The voice
음성 전송부(314)는 무선 통신 방식으로 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 다른 음성 수집 장치는 릴레이된 음성 정보를 음성 인식 장치로 전송할 수 있다.The
데이터 처리부(320)는 다른 음성 수집 장치로부터 수신되는 하나 이상의 음성 정보 또는 음성 인식 장치로부터 수신되는 통신 제어 정보를 수신하는 무선 데이터 수신부(321), 하나 이상의 음성 정보를 음성 인식 장치 또는 다른 음성 수집 장치로 전송하는 무선 데이터 전송부(322), 및 무선 데이터 수신부 및 무선 데이터 전송부의 무선 통신을 제어하는 무선 통신 제어부(323)를 포함할 수 있다.The
무선 데이터 처리부(321)는 다른 음성 수집 장치로부터 수신되는 음성 정보 또는 음성 인식 장치로부터 수신되는 통신 제어 정보를 수신할 수 있다. 예를 들어, 통신 제어 정보는 음성 인식 장치에서 복수의 음성 수집 장치에 대한 네트워크를 관리하기 위한 제어 신호를 포함할 수 있으며, 각각의 음성 수집 장치는 통신 제어 정보를 수신하여 음성 정보 수집 범위 또는 다른 음성 수집 장치와의 통신 등을 설정 및 제어할 수 있다.The wireless
무선 데이터 전송부(322)는 음성 처리 제어부(312)로부터 수신된 음성 정보 또는 다른 음성 수집 장치에서 수신된 음성 정보를 음성 인식 장치 또는 릴레이를 위한 다른 음성 수집 장치로 전달할 수 있다.The wireless
무선 통신 제어부(323)는 무선 데이터 전송부(322) 및 네트워크에 대한 통신을 제어할 수 있다.The wireless
전력 처리부(330)는 하나 이상의 전력 수집 장치를 이용하여 전력을 수집하는 전력 수집부(331), 수집된 전력을 저장하는 전력 저장 처리부(332), 및 전력을 음성 수집 장치에 공급하도록 제어하는 전력 관리부(333)를 포함할 수 있다.The
예를 들어, 전력 관리부(333)는 상시 전원 또는 배터리로 음성 수집 장치를 구동하는 경우 전원 처리가 가능하도록 전력을 공급할 수 있으며, 전력 수집부(331)는 배터리로 구동되는 경우 사용 가능한 태양광, 형광등, 진동, 열 등으로부터 전력을 수집할 수 있고, 전력 저장 처리부(332)는 수집된 전력을 저장하여 배터리 충전 또는 배터리의 수명을 연장할 수 있다.For example, the
아래에서는 본 발명의 일측에 따른 음성 인식 장치의 구성을 설명하도록 한다.Hereinafter, a configuration of a speech recognition apparatus according to an aspect of the present invention will be described.
도 4a 및 도 4b는 본 발명의 일측에 따른 음성 인식 장치의 구성을 도시한 블록도이다.4A and 4B are block diagrams showing a configuration of a speech recognition apparatus according to an aspect of the present invention.
도 4a 및 4b를 참조하면, 음성 인식 장치는 음성 수집 장치로부터 음성 정보를 수신하여 처리하는 음성 처리부(410), 음성 정보를 음성 수집 장치 또는 음성 인식 서버로 전달하는 데이터 처리부(420), 및 음성 인식 서버와 연동하여 제어 대상 기기를 제어하는 서버 연동부(430)를 포함한다.4A and 4B, the speech recognition apparatus includes a
음성 처리부(410)는 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치로부터 하나 이상의 음성 정보를 수신하거나 직접 음성 정보를 수신하는 음성 수신부(411), 음성 정보를 분석하는 음성 처리 제어부(412), 음성 수신부(411)를 통하여 수신된 하나 이상의 호출어를 인식하여 상기 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하도록 제어하는 음성 인식 처리부(413), 및 음성 정보를 음성 인식 서버로 전송하는 음성 전송부(414)를 포함한다.The
예를 들어, 음성 수신부(411)는 사용자의 음성 정보를 수신하는 마이크로 구성될 수 있으며, 하나 이상의 음성 수집 장치로부터 하나 이상의 음성 정보가 수신되지 않는 경우, 하나 이상의 음성 정보를 자체적으로 수집할 수도 있다.For example, the
음성 처리 제어부(412)는 마이크에서 수신되는 음성 정보를 추출하거나 음성 수집 장치로부터 수신된 음성 정보의 압축을 푸는 등의 음성 정보를 분석하여 음성 인식 정보를 생성할 수 있다.The voice
음성 수신부(411)는 하나 이상의 음성 수집 장치 중 선택되지 않은 장치로부터 음성 수신 대기 비활성화 요청을 수신하고, 하나 이상의 음성 수집 장치 중 선택된 장치로부터 하나 이상의 음성 정보를 수신할 수 있다.The
음성 인식 처리부(413)는 하나 이상의 호출어를 기반으로 하나 이상의 호출어에 대한 우선 순위를 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택할 수 있으며, 음성 수신부(411)는 선택된 장치로부터 음성 정보를 수신할 수 있고, 음성 전송부(414)는 선택된 장치로부터 수신된 음성 정보를 음성 인식 서버로 전송할 수 있다.The speech
음성 인식 처리부(413)는 둘 이상의 호출어가 수신되는 경우, 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 우선 순위에 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택하여 하나 이상의 음성 정보를 수신하도록 제어할 수 있다.When two or more callers are received, the voice
예를 들어, 음성 인식 처리부(413)는 호출어를 인식하여 음성 인식을 시작할 수 있으며, 여러 음성 수집 장치에서 호출어를 인식한 경우 시간 순 또는 음성 인식 품질 기준 등 우선 순위에 따라 음성 수집 장치를 선택하여 음성 인식을 처리할 수도 있다.For example, the voice
다른 예로, 음성 인식 처리부(413)는 둘 이상의 호출어가 인식되는 경우, 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 우선 순위에 결정하고, 우선 순위에 따라 하나 이상의 음성 수집 장치 중 둘 이상을 선택하여 하나 이상의 음성 정보를 수신하도록 제어할 수도 있다.As another example, when two or more callers are recognized, the voice
음성 인식 처리부(413)는 하나 이상의 호출어에 대한 우선 순위를 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택하며, 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화를 요청할 수도 있다.The speech
또한, 음성 인식 장치는 하나 이상의 영역 별 또는 각각의 장치 별로 미리 설정된 서로 다른 호출어를 인식하여 하나 이상의 음성 정보를 수신 또는 인식할 수 있다.In addition, the speech recognition apparatus recognizes different call words preset for one or more areas or for each device, and can receive or recognize one or more pieces of voice information.
예를 들어, 음성 인식 장치는 영역 별로 설치된 음성 수집 장치에 설정된 호출어와 다른 호출어로 음성 수집 및 인식할 수 있으며, 음성 인식 장치에 설정된 호출어가 인지된 경우에만 음성 정보를 수신 및 인식할 수 있다.For example, the speech recognition apparatus can collect and recognize speech by using a call word and another call word set in the speech collection apparatus installed for each region, and can receive and recognize speech information only when a call set in the speech recognition apparatus is recognized.
데이터 처리부(420)는 음성 수집 장치로부터 수신되는 음성 정보를 수신하는 무선 데이터 수신부(421), 음성 수집 장치로 통신 제어 정보 등을 전달하는 무선 데이터 전송부(422), 네트워크 관리에 필요한 무선 데이터 통신을 제어하는 무선 통신 제어부(423)을 포함할 수 있다.The
서버 연동부(430)는 하나 이상의 음성 정보를 음성 인식 서버로 전달하고, 하나 이상의 음성 정보를 기반으로 생성된 음성 인식 정보에 대응하는 음성 인식 결과를 수신하는 음성 인식 서버 통신부(431), 음성 정보의 인식 처리 상태를 출력하는 사용자 인터페이스부(432) 및 음성 인식 결과를 출력하는 음성 인식 알림부(433)를 포함할 수 있다.The
예를 들어, 음성 인식 서버 통신부(431)는 호출어로 시작된 음성 인식을 통하여 사용자의 음성 명령이 포함된 음성 인식 정보를 음성 인식 서버로 전달하여, 사용자의 음성 명령을 음성 인식 서버가 인식하도록 할 수 있다. 음성 인식 서버 통신부(431)는 음성 인식 정보에 대응하는 음성 인식 결과를 수신할 수 있다.For example, the voice recognition
사용자 인터페이스부(432) 장치 구동 중 또는 음성 인식 처리 상태 등의 사용자 알림 정보를 사용자에게 알려 줄 수 있고, 스피커 또는 LED 표시 등으로 구성될 수 있는 음성 인식 알림부(433)는 음성 인식 서버로부터 수신한 음성 인식 결과 등을 음성 또는 시각 표현으로 알려줄 수도 있다.The
아래에서는 본 발명의 일실시예에 따른 음성 인식 서버에 대하여 설명하도록 한다.Hereinafter, a speech recognition server according to an embodiment of the present invention will be described.
도 5는 본 발명의 일실시예에 따른 음성 인식 서버의 구성을 도시한 도면이다.5 is a diagram illustrating a configuration of a speech recognition server according to an embodiment of the present invention.
도 5를 참조하면, 본 발명의 일실시예에 따른 음성 인식 서버는 음성 수신부(510), 및 음성 인식 처리부(520)를 포함한다.Referring to FIG. 5, the speech recognition server according to an embodiment of the present invention includes a
음성 수신부(510)는 음석 인식 장치로부터 음성 정보를 수신한다.The
음성 인식 처리부(520)는 음성 정보가 하나 이상의 호출어인 경우, 하나 이상의 호출어를 기반으로 하나 이상의 호출어에 대한 우선 순위를 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택하며, 선택된 장치가 음성 수신 대기 하도록 제어한다.The speech
예를 들어, 음성 인식 처리부(520)는 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 우선 순위를 결정할 수 있다.For example, the
음성 인식 처리부(520)는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 되도록 제어할 수도 있다.The voice
아래에서는 본 발명의 일실시예에 따른 음성 인식 방법에 대하여 설명하도록 한다.Hereinafter, a speech recognition method according to an embodiment of the present invention will be described.
본 발명의 일실시예에 따른 음성 인식 방법은 전술한 음성 인식 시스템의 음성 인식 장치에 의하여 수행될 수 있는 바, 음성 인식 장치의 관점에서 설명하도록 한다.The speech recognition method according to an embodiment of the present invention can be performed by the speech recognition apparatus of the speech recognition system described above, and will be described from the viewpoint of the speech recognition apparatus.
도 6은 본 발명의 일실시예에 따른 음성 인식 방법을 도시한 흐름도이다.6 is a flowchart illustrating a speech recognition method according to an embodiment of the present invention.
도 6을 참조하면, 음성 인식 장치는 미리 설정된 하나 이상의 영역으로부터 음성 정보를 직접 수신하거나(610), 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치로부터 음성 정보를 수신하고(520), 음성 정보를 음성 인식 서버로 전송한다(630).Referring to FIG. 6, the speech recognition apparatus directly receives (610) voice information from one or more preset areas, receives voice information from at least one voice collection device installed in one or more areas (520) To the recognition server (630).
여기서, 음성 인식 서버는 음성 정보를 기반으로 제어 대상 기기를 제어한다.Here, the voice recognition server controls the control target device based on the voice information.
하나 이상의 음성 수집 장치는 무선 통신 방식으로 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 다른 음성 수집 장치는 릴레이된 음성 정보를 음성 인식 장치로 전송할 수 있다. One or more voice collection devices may relay voice information to other voice collection devices in a wireless communication manner and other voice collection devices may transmit relayed voice information to voice recognition devices.
음성 인식 장치는 음성 인식 서버로부터 하나 이상의 음성 정보를 기반으로 제어 대상 기기의 제어 여부에 대응하는 음성 인식 결과를 수신하고, 음성 인식 결과를 출력할 수도 있다.The speech recognition apparatus may receive a speech recognition result corresponding to whether or not the control object device is controlled based on one or more pieces of speech information from the speech recognition server, and may output a speech recognition result.
음성 인식 장치는 미리 설정된 범위 내에 사용자가 위치하는 경우, 하나 이상의 음성 정보를 직접 수신할 수도 있다.The speech recognition apparatus may directly receive one or more pieces of voice information when the user is located within a preset range.
아래에서는 본 발명의 다른 실시예에 따른 음성 인식 방법에 대하여 설명하도록 한다.Hereinafter, a speech recognition method according to another embodiment of the present invention will be described.
본 발명의 다른 실시예에 따른 음성 인식 방법은 전술한 음성 인식 시스템의 음성 인식 장치에 의하여 수행될 수 있는 바, 음성 인식 장치의 관점에서 설명하도록 한다.The speech recognition method according to another embodiment of the present invention can be performed by the speech recognition apparatus of the speech recognition system described above, and will be described from the viewpoint of the speech recognition apparatus.
도 7은 본 발명의 다른 실시예에 따른 음성 인식 방법을 도시한 흐름도이다.7 is a flowchart illustrating a speech recognition method according to another embodiment of the present invention.
도 7을 참조하면, 음성 인식 장치는 하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신한다(710).Referring to FIG. 7, the voice recognition apparatus receives voice information from one or more voice collection devices or receives voice information directly (710).
음성 인식 장치는 수신된 하나 이상의 호출어를 인식하여, 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하도록 제어한다(720).The speech recognition device recognizes the received one or more call words and controls to receive voice information from the voice collection device or directly receive voice information (720).
음성 인식 장치는 음성 정보를 음성 인식 서버로 전송한다(730).The speech recognition apparatus transmits the speech information to the speech recognition server (730).
음성 인식 장치는 하나 이상의 호출어를 기반으로 하나 이상의 호출어에 대한 우선 순위를 결정할 수 있으며, 우선 순위에 따라 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택할 수도 있다.The speech recognition apparatus may determine a priority for one or more callers based on the one or more callers and may select one of the one or more voice collection devices and the speech recognition device according to the priority.
음성 인식 장치는 선택된 장치로부터 음성 정보를 수신하고, 선택된 장치로부터 수신된 음성 정보를 음성 인식 서버로 전송할 수 있다.The speech recognition apparatus may receive the speech information from the selected apparatus and transmit the speech information received from the selected apparatus to the speech recognition server.
음성 인식 장치는 하나 이상의 호출어를 기반으로 하나 이상의 호출어에 대한 우선 순위를 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택하며, 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청할 수도 있다.The speech recognition apparatus determines a priority for one or more callers based on the one or more callers and selects one of the one or more voice collecting apparatuses and voice recognition apparatuses corresponding to the caller according to the priority, It is possible to request the voice collection apparatus and the voice recognition apparatus to deactivate the voice reception standby for the unselected apparatus.
아래에서는 본 발명의 또 다른 실시예에 따른 음성 인식 방법에 대하여 설명하도록 한다.Hereinafter, a speech recognition method according to another embodiment of the present invention will be described.
본 발명의 또 다른 실시예에 따른 음성 인식 방법은 전술한 음성 인식 시스템의 음성 수집 장치에 의하여 수행될 수 있는 바, 음성 인식 장치의 관점에서 설명하도록 한다.The speech recognition method according to another embodiment of the present invention can be performed by the speech collection apparatus of the speech recognition system described above, and will be described from the viewpoint of the speech recognition apparatus.
도 8은 본 발명의 다른 실시예에 따른 음성 인식 방법을 도시한 흐름도이다.8 is a flowchart illustrating a speech recognition method according to another embodiment of the present invention.
도 8을 참조하면, 음성 수집 장치는 호출어를 수신한다(810).Referring to FIG. 8, the voice collection device receives a call word (810).
음성 수집 장치는 호출어가 인식된 경우, 음성 정보를 수신한다(820).If the caller is recognized, the voice collection device receives the voice information (820).
음성 수집 장치는 음성 정보를 음성 인식 장치로 전송한다(830).The voice collection device transmits the voice information to the voice recognition device (830).
음성 수집 장치는 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 음성 인식 장치로부터 대기 명령 또는 비활성화 명령을 수신하고, 대기 명령 또는 비활성화 명령에 따라 대기 또는 비활성화될 수 있다.The voice collection device may receive a standby command or a deactivation command from the voice recognition device according to the priority determined by the voice recognition device, and may be standby or deactivated according to the standby command or the deactivation command.
음성 수집 장치는 다른 음성 수집 장치와 서로 다른 호출어를 인식하여 음성 정보를 수신하도록 제어할 수도 있다.The voice collecting device may control different voice collecting devices to recognize different call words and receive voice information.
음성 수집 장치는 무선 통신 방식으로 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 할 수 있으며, 다른 음성 수집 장치는 릴레이된 음성 정보를 음성 인식 장치로 전송할 수 있다.The voice collecting apparatus can relay the voice information to the other voice collecting apparatus using a wireless communication system and the other voice collecting apparatus can transmit the relayed voice information to the voice recognizing apparatus.
본 발명의 일측에 따르면, 하나 이상의 음성 수집 장치, 음성 인식 장치, 음성 인식 서버로 구성되는 네트워크 기반 실내 음성 인식 시스템을 제공할 수 있다.According to an aspect of the present invention, a network-based indoor speech recognition system including at least one of a sound collection device, a speech recognition device, and a speech recognition server can be provided.
본 발명의 일측에 따르면, 음성 수집 장치는 서로 릴레이 기능을 통하여 음성 인식 거리를 확장하여 제공할 수 있다. According to one aspect of the present invention, the voice collecting apparatus can extend the voice recognition distance through mutual relay functions.
본 발명의 일측에 따르면, 음성 수집 장치는 배터리 충전 및 배터리 소모 시간을 늘릴 수 있도록 태양광, 형광등, 진동, 열 등으로부터 전력을 모아 수집하거나 저장할 수 있다.According to one aspect of the present invention, a sound collection device collects and stores electric power from sunlight, fluorescent light, vibration, heat, etc. so as to increase battery charging time and battery consumption time.
본 발명의 일측에 따르면, 음성 수집 장치는 음성 인식을 시작할 수 있는 호출어와 같은 간단한 음성 명령으로 음성 인식을 시작할 수도 있다.According to one aspect of the present invention, the voice collection device may begin voice recognition with a simple voice command, such as a call word, which may initiate voice recognition.
음성 수집 장치 및 음성 인식 장치는 장치 별로 서로 다른 호출어로 음성 인식을 시작하도록 설정할 수 있다.The voice collecting device and the voice recognizing device can be set to start voice recognition with different call words for each device.
음성 수집 장치 및 음성 인식 장치가 동일한 호출어로 음성 인식을 시작하는 경우 또는 2대 이상의 장치에서 호출어를 인식하는 경우 음성 인식 장치에서 시간 순 또는 음성 상태를 기반으로 우선 순위를 정하여 가장 효율적인 장치를 통해 음성 인식이 시작되도록 할 수도 있다.When a voice recognition apparatus and a voice recognition apparatus start voice recognition with the same voice call or when two or more voice recognition apparatuses recognize a voice call, the voice recognition apparatus sets priorities based on a time order or a voice state, The voice recognition may be started.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the apparatus and components described in the embodiments may be implemented within a computer system, such as, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA) , A programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to execution of the software. For ease of understanding, the processing apparatus may be described as being used singly, but those skilled in the art will recognize that the processing apparatus may have a plurality of processing elements and / As shown in FIG. For example, the processing unit may comprise a plurality of processors or one processor and one controller. Other processing configurations are also possible, such as a parallel processor.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the foregoing, and may be configured to configure the processing device to operate as desired or to process it collectively or collectively Device can be commanded. The software and / or data may be in the form of any type of machine, component, physical device, virtual equipment, computer storage media, or device , Or may be permanently or temporarily embodied in a transmitted signal wave. The software may be distributed over a networked computer system and stored or executed in a distributed manner. The software and data may be stored on one or more computer readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to an embodiment may be implemented in the form of a program command that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions to be recorded on the medium may be those specially designed and configured for the embodiments or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments. For example, it is to be understood that the techniques described may be performed in a different order than the described methods, and / or that components of the described systems, structures, devices, circuits, Lt; / RTI > or equivalents, even if it is replaced or replaced.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.
110: 음성 수집 장치
120: 음성 인식 장치
130: 음성 인식 서버110: Voice collecting device
120: Speech recognition device
130: Speech recognition server
Claims (23)
상기 음성 정보를 직접 수신하거나 상기 음성 수집 장치로부터 상기 음성 정보를 수신하는 음성 인식 장치; 및
상기 음성 인식 장치로부터 상기 음성 정보를 수신하고, 상기 음성 정보를 기반으로 제어 대상 기기를 제어하는 음성 인식 서버
를 포함하는 음성 인식 시스템.At least one voice collection device installed in at least one predetermined area for collecting voice information from the at least one area;
A voice recognition device for directly receiving the voice information or receiving the voice information from the voice collection device; And
A voice recognition server for receiving the voice information from the voice recognition device and controlling the control target device based on the voice information,
And a speech recognition system.
상기 하나 이상의 음성 수집 장치는,
무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고,
상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송하는,
음성 인식 시스템.The method according to claim 1,
Wherein the at least one sound collection device comprises:
Relaying the voice information to another voice collection device in a wireless communication manner,
And the other voice collection device transmits the relayed voice information to the voice recognition device,
Speech recognition system.
상기 음성 수신부를 통하여 수신된 하나 이상의 호출어를 인식하여, 상기 음성수집 장치로부터 상기 음성 정보를 수신하거나 직접 상기 음성 정보를 수신하도록 제어하는 음성 인식 처리부; 및
상기 음성 정보를 음성 인식 서버로 전송하는 음성 전송부
를 포함하는 음성 인식 장치.A voice receiving unit for receiving voice information from at least one voice collecting device or for receiving voice information directly;
A voice recognition processor recognizing one or more call words received through the voice receiver and receiving the voice information from the voice collection device or directly receiving the voice information; And
A voice transmission unit for transmitting the voice information to the voice recognition server,
And a voice recognition device.
상기 음성 인식 처리부는,
상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고,
상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며,
상기 음성 수신부는,
상기 선택된 장치로부터 상기 음성 정보를 수신하고,
상기 음성 전송부는,
상기 선택된 장치로부터 수신된 상기 음성 정보를 상기 음성 인식 서버로 전송하는,
음성 인식 장치.The method of claim 3,
The speech recognition processing unit,
Determine a priority for the one or more callers based on the one or more callers,
Selecting one of the one or more voice collecting apparatuses corresponding to the call word and the voice recognition apparatus according to the priority,
Wherein the voice receiving unit comprises:
Receiving the voice information from the selected device,
Wherein the voice transmission unit comprises:
And transmitting the voice information received from the selected device to the voice recognition server,
Voice recognition device.
상기 음성 인식 처리부는,
둘 이상의 호출어가 수신되는 경우, 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 상기 우선 순위를 결정하고,
상기 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하여 상기 음성 정보를 수신하도록 제어하는,
음성 인식 장치.5. The method of claim 4,
The speech recognition processing unit,
Determining, when two or more callers are received, the priority based on at least one of caller reception time or speech recognition quality,
Selecting one of the one or more voice collecting apparatuses corresponding to the call word and the voice recognition apparatus according to the priority order to receive the voice information,
Voice recognition device.
상기 음성 인식 처리부는,
상기 하나 이상의 호출어에 대한 우선 순위를 결정하고,
상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며,
상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청하는,
음성 인식 장치.The method of claim 3,
The speech recognition processing unit,
Determine a priority for the one or more callers,
Selecting one of the one or more voice collecting apparatuses corresponding to the call word and the voice recognition apparatus according to the priority,
Requesting a non-selected device of the at least one voice collecting device and the voice recognizing device to deactivate a voice receiving standby,
Voice recognition device.
상기 음성 정보를 수신하는 음성 수신부;
상기 음성 수신부를 통하여 수신된 호출어를 인식하여, 상기 음성 정보를 수신하도록 제어하는 음성 인식 처리부; 및
상기 음성 정보를 상기 음성 인식 장치로 전송하는 음성 전송부
를 포함하는 음성 수집 장치.1. A voice collection device installed in at least one predetermined area to collect voice information,
A voice receiving unit for receiving the voice information;
A voice recognition processing unit for recognizing a call word received through the voice receiving unit and controlling to receive the voice information; And
A voice transmission unit for transmitting the voice information to the voice recognition device,
Lt; / RTI >
상기 음성 인식 처리부는,
상기 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 상기 음성 인식 장치로부터 음성 수신 대기 명령 또는 수신 대기 비활성화 명령을 수신하고,
상기 수신 대기 명령 또는 상기 수신 대기 비활성화 명령에 따라 수신 대기 또는 수신 대기 비활성화되도록 제어하는,
음성 수집 장치.8. The method of claim 7,
The speech recognition processing unit,
Receiving a voice reception standby command or a reception standby inactivation command from the voice recognition device in accordance with a priority determined by the voice recognition device,
Wherein the control unit controls the reception standby or reception standby to be deactivated according to the reception standby command or the reception standby inactivation command,
Voice collection device.
상기 음성 인식 처리부는,
다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 음성 정보를 수신하도록 제어하는,
음성 수집 장치.8. The method of claim 7,
The speech recognition processing unit,
And a voice recognition unit for recognizing different call words from the other voice collection units and controlling the voice recognition unit to receive the voice information,
Voice collection device.
상기 음성 전송부는,
무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고,
상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송하는,
음성 수집 장치.8. The method of claim 7,
Wherein the voice transmission unit comprises:
Relaying the voice information to another voice collection device in a wireless communication manner,
And the other voice collection device transmits the relayed voice information to the voice recognition device,
Voice collection device.
음성 정보를 직접 수신하거나 상기 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치로부터 상기 음성 정보를 수신하는 단계; 및
상기 음성 정보를 음성 인식 서버로 전송하는 단계;
를 포함하고,
상기 음성 인식 서버는 상기 음성 정보를 기반으로 제어대상기기를 제어하는,
음성 인식 방법.A speech recognition method using a speech recognition apparatus,
Directly receiving voice information or receiving the voice information from one or more voice collection devices installed in the one or more areas; And
Transmitting the voice information to a voice recognition server;
Lt; / RTI >
Wherein the voice recognition server controls the control target device based on the voice information,
Speech recognition method.
상기 하나 이상의 음성 수집 장치는,
무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고,
상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송하는,
음성 인식 방법.12. The method of claim 11,
Wherein the at least one sound collection device comprises:
Relaying the voice information to another voice collection device in a wireless communication manner,
And the other voice collection device transmits the relayed voice information to the voice recognition device,
Speech recognition method.
하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하는 단계;
수신된 하나 이상의 호출어를 인식하여, 상기 음성 수집 장치로부터 상기 음성 정보를 수신하거나 직접 상기 음성정보를 수신하도록 제어하는 단계; 및
상기 음성 정보를 음성 인식 서버로 전송하는 단계
를 포함하는 음성 인식 방법.A method for speech recognition of a speech recognition apparatus,
Receiving voice information from one or more voice collection devices or receiving voice information directly;
Recognizing the received one or more call words to receive the voice information from the voice collection device or to directly receive the voice information; And
Transmitting the voice information to a voice recognition server
And a speech recognition method.
상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하는 단계; 및
상기 우선 순위에 따라 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 단계
를 더 포함하고,
상기 음성 정보를 수신하는 단계는,
상기 선택된 장치로부터 상기 음성 정보를 수신하는 단계를 포함하고,
상기 음성 정보를 전송하는 단계는,
상기 선택된 장치로부터 수신된 상기 음성 정보를 상기 음성 인식 서버로 전송하는 단계를 포함하는,
음성 인식 방법.14. The method of claim 13,
Determining a priority for the one or more callers based on the one or more callers; And
Selecting one of the one or more voice acquisition devices and the voice recognition device according to the priority order
Further comprising:
Wherein the step of receiving the voice information comprises:
And receiving the voice information from the selected device,
Wherein the step of transmitting the voice information comprises:
And transmitting the voice information received from the selected device to the voice recognition server.
Speech recognition method.
상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하는 단계;
상기 우선 순위에 따라 상기 호출어에 대응하는 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 단계; 및
상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청하는 단계
를 더 포함하는,
음성 인식 방법.14. The method of claim 13,
Determining a priority for the one or more callers based on the one or more callers;
Selecting one of the one or more voice collecting apparatuses and the voice recognition apparatus corresponding to the call word according to the priority order; And
Requesting a non-selected one of the one or more voice collecting apparatuses and the voice recognizing apparatus to deactivate a voice receiving standby
≪ / RTI >
Speech recognition method.
호출어를 수신하는 단계;
상기 호출어가 인식된 경우, 음성 정보를 수신하는 단계; 및
상기 음성 정보를 상기 음성 인식 장치로 전송하는 단계
를 포함하는 음성 인식 방법.A method for speech recognition using one or more speech collection devices installed in one or more predetermined areas,
Receiving an invocation word;
Receiving voice information when the caller is recognized; And
Transmitting the voice information to the voice recognition device
And a speech recognition method.
상기 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 상기 음성 인식 장치로부터 수신 대기 명령 또는 수신 대기 비활성화 명령을 수신하는 단계; 및
상기 수신 대기 명령 또는 상기 수신 대기 비활성화 명령에 따라 수신 대기 또는 수신 대기 비활성화되는 단계
를 더 포함하는,
음성 인식 방법.17. The method of claim 16,
Receiving a reception standby command or a reception standby inactivation command from the speech recognition apparatus according to a priority determined by the speech recognition apparatus; And
A step of waiting for reception or deactivating reception in response to the reception standby command or the reception standby inactivation command
≪ / RTI >
Speech recognition method.
상기 음성 정보를 수신하는 단계는,
다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 음성 정보를 수신하도록 제어하는 단계
를 포함하는,
음성 인식 방법.17. The method of claim 16,
Wherein the step of receiving the voice information comprises:
Recognizing different call words from other voice collection devices and controlling to receive the voice information
/ RTI >
Speech recognition method.
무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하는 단계
를 더 포함하고,
상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송하는,
음성 인식 방법.17. The method of claim 16,
Relaying the voice information to another voice collection device in a wireless communication manner;
Further comprising:
And the other voice collection device transmits the relayed voice information to the voice recognition device,
Speech recognition method.
상기 음성 정보가 하나 이상의 호출어인 경우, 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며, 상기 선택된 장치가 음성 수신 대기 하도록 제어하는 음성 인식 처리부
를 포함하는 음성 인식 서버.A voice receiving unit for receiving voice information from the voice recognition device; And
Determining, based on the one or more callers, a priority for the one or more callers if the voice information is one or more callers, and determining one or more voice collecting devices corresponding to the caller and the voice A voice recognition processing unit for selecting any one of the voice recognition apparatuses and the voice recognition apparatuses,
And a voice recognition server.
상기 음성 인식 처리부는,
상기 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 상기 우선 순위를 결정하는
음성 인식 서버.22. The method of claim 21,
The speech recognition processing unit,
And determines the priority based on at least one of the call-word reception time or the voice recognition quality
Speech Recognition Server.
상기 음성 인식 처리부는,
상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 되도록 제어하는,
음성 인식 서버.22. The method of claim 21,
The speech recognition processing unit,
A voice recognition device, and a speech recognition device,
Speech Recognition Server.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020160066579A KR101832058B1 (en) | 2016-05-30 | 2016-05-30 | System and method for voice recognition |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020160066579A KR101832058B1 (en) | 2016-05-30 | 2016-05-30 | System and method for voice recognition |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20170135133A true KR20170135133A (en) | 2017-12-08 |
| KR101832058B1 KR101832058B1 (en) | 2018-04-04 |
Family
ID=60919621
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020160066579A Active KR101832058B1 (en) | 2016-05-30 | 2016-05-30 | System and method for voice recognition |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR101832058B1 (en) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20200050152A (en) * | 2018-11-01 | 2020-05-11 | 현대자동차주식회사 | System for recognizing voice using multiple devices and method of controlling the same |
| WO2020175802A1 (en) * | 2019-02-27 | 2020-09-03 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
| KR20210035570A (en) * | 2019-09-24 | 2021-04-01 | 주식회사 엘지유플러스 | Method and apparatus for emergency reporting using iot devices |
| KR20210043902A (en) * | 2019-10-14 | 2021-04-22 | 주식회사 아이포바인 | Method for processing voice commands using bluetooth mesh network |
| CN113519022A (en) * | 2019-02-27 | 2021-10-19 | 三星电子株式会社 | Electronic equipment and control method thereof |
| US11710498B2 (en) | 2019-02-11 | 2023-07-25 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
| US12406671B2 (en) | 2021-10-27 | 2025-09-02 | Samsung Electronics Co., Ltd. | Method of identifying target device based on reception of utterance and electronic device therefor |
| WO2025183426A1 (en) * | 2024-02-26 | 2025-09-04 | 주식회사 리턴제로 | Apparatus and method for recognizing user speech through speaker separation in speech data |
| KR102870697B1 (en) * | 2024-11-28 | 2025-10-14 | 주식회사 플렉스오더 | Call Event-Based AI Device and Intelligent Service Providing System |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102792944B1 (en) * | 2018-12-17 | 2025-04-11 | 삼성전자주식회사 | Terminal device and method for controlling thereof |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100769156B1 (en) * | 2007-04-20 | 2007-10-22 | 주식회사 서비전자 | Home network system and its control method |
| KR101072709B1 (en) * | 2009-06-15 | 2011-10-11 | 브이 앤드 씨 컴퍼니 리미티드 | Home network system based on voice recognition having region prefer mode |
-
2016
- 2016-05-30 KR KR1020160066579A patent/KR101832058B1/en active Active
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20200050152A (en) * | 2018-11-01 | 2020-05-11 | 현대자동차주식회사 | System for recognizing voice using multiple devices and method of controlling the same |
| US11710498B2 (en) | 2019-02-11 | 2023-07-25 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
| WO2020175802A1 (en) * | 2019-02-27 | 2020-09-03 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
| CN113519022A (en) * | 2019-02-27 | 2021-10-19 | 三星电子株式会社 | Electronic equipment and control method thereof |
| US11417323B2 (en) | 2019-02-27 | 2022-08-16 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
| KR20210035570A (en) * | 2019-09-24 | 2021-04-01 | 주식회사 엘지유플러스 | Method and apparatus for emergency reporting using iot devices |
| KR20210043902A (en) * | 2019-10-14 | 2021-04-22 | 주식회사 아이포바인 | Method for processing voice commands using bluetooth mesh network |
| US12406671B2 (en) | 2021-10-27 | 2025-09-02 | Samsung Electronics Co., Ltd. | Method of identifying target device based on reception of utterance and electronic device therefor |
| WO2025183426A1 (en) * | 2024-02-26 | 2025-09-04 | 주식회사 리턴제로 | Apparatus and method for recognizing user speech through speaker separation in speech data |
| KR102870697B1 (en) * | 2024-11-28 | 2025-10-14 | 주식회사 플렉스오더 | Call Event-Based AI Device and Intelligent Service Providing System |
Also Published As
| Publication number | Publication date |
|---|---|
| KR101832058B1 (en) | 2018-04-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101832058B1 (en) | System and method for voice recognition | |
| US11521614B2 (en) | Device with voice command input capabtility | |
| EP3734596B1 (en) | Determining target device based on speech input of user and controlling target device | |
| JP6739907B2 (en) | Device specifying method, device specifying device and program | |
| EP2926502B1 (en) | Voice-controlled configuration of an automation system | |
| US11354089B2 (en) | System and method for dialog interaction in distributed automation systems | |
| KR102429260B1 (en) | Apparatus and method for processing control command based on voice agent, agent apparatus | |
| US10057125B1 (en) | Voice-enabled home setup | |
| US10984799B2 (en) | Hybrid speech interface device | |
| US20170289582A1 (en) | Device control method and electric device | |
| US20170133013A1 (en) | Voice control method and voice control system | |
| CN118347156A (en) | Equipment control system | |
| CN104505092B (en) | Air conditioner sound control method and system | |
| KR101965880B1 (en) | Method for voice recognition | |
| KR20210116671A (en) | A method for controlling a device using voice recognition and an apparatus implementing the same | |
| KR20170051994A (en) | speech recognition device and here of control Method | |
| US20220122600A1 (en) | Information processing device and information processing method | |
| KR102052510B1 (en) | Voice bridge appratus and voice recognition apparatus, and control method thereof | |
| KR102487078B1 (en) | The hub device, multi device system comprising the hub device and a plurality of devices and method operating the same | |
| KR20190015792A (en) | IoT HUB AND THE OPERATING METHOD THEREOF | |
| KR102486912B1 (en) | System and server for controlling operation of voice processing device | |
| US11477297B2 (en) | Headless device installations | |
| JP2019068321A (en) | Consumer-electronics system | |
| TW202526911A (en) | Proximity-based multi-device control method for voice-controlled home appliance capable of preventing home appliances from performing false actions | |
| KR20210125619A (en) | Modular Adapter for Providing Voice Recognition and Method Thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20160530 |
|
| PA0201 | Request for examination | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20170628 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20171207 |
|
| PG1501 | Laying open of application | ||
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20180219 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20180219 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20210119 Start annual number: 4 End annual number: 6 |
|
| PR1001 | Payment of annual fee |
Payment date: 20240109 Start annual number: 7 End annual number: 9 |