KR101699720B1 - 음성명령 인식 장치 및 음성명령 인식 방법 - Google Patents
음성명령 인식 장치 및 음성명령 인식 방법 Download PDFInfo
- Publication number
- KR101699720B1 KR101699720B1 KR1020100075038A KR20100075038A KR101699720B1 KR 101699720 B1 KR101699720 B1 KR 101699720B1 KR 1020100075038 A KR1020100075038 A KR 1020100075038A KR 20100075038 A KR20100075038 A KR 20100075038A KR 101699720 B1 KR101699720 B1 KR 101699720B1
- Authority
- KR
- South Korea
- Prior art keywords
- command
- instruction
- probability distribution
- probability
- voice command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
Abstract
Description
도 2a는 일 실시에에 따른 음성명령 인식 장치에 포함된 명령의도 확률분포 생성부에서 생성된 명령의도 확률분포의 예시도이고, 도 2b는 명령의도 확률분포 생성부에서 생성된 재확인 확률분포의 예시도,
도 3은 일 실시예에 따른 음성명령 인식 장치에 포함된 명령의도 확률분포 업데이트부의 구성도,
도 4는 일 실시예에 따른 음성명령 인식 방법의 순서도,
도 5a는 일 실시예에 따른 음성명령 인식 방법 중 대화에 따른 명령의도 확률분포의 엔트로피 변화 예시도, 도 5b는 명령의도 확률분포의 엔트로피를 이용한 명령의도 변화시점을 파악하는 예시도이다.
110 : 명령의도 확률분포 생성부
111 : 제1 음성명령의 명령의도 확률분포
113 : 제2 음성명령의 명령의도 확률분포 중 명령의도가 유지되는 경우
115 : 제2 음성명령의 명령의도 확률분포 중 명령의도가 수정되는 경우
117 : 제2 음성명령의 명령의도 확률분포 중 명령의도가 새로운 경우
119 : 제3 음성명령의 명령의도 확률분포
130 : 명령의도 확률분포 업데이트부
131 : 제2 음성명령 인식부
133 : 명령의도 변화 검출부
135 : 확률분포 재설정부
137 : 업데이트 실행부
150 : 명령의도 확률분포 선택부
170 : 동작신호 출력부
191 : 명령의도 확률분포 데이터 저장부
193 : 응답 데이터 저장부
Claims (20)
- 입력된 제1 음성명령을 인식하여, 기 설정된 하나 이상의 상황별로 명령의도 확률분포를 생성하는 명령의도 확률분포 생성부;
상기 제1 음성명령에 대응하여 출력된 응답과 그 응답에 대응하여 입력된 제2 음성명령을 이용하여 상기 생성된 명령의도 확률분포를 업데이트하는 명령의도 확률분포 업데이트부;
상기 업데이트된 하나 이상의 명령의도 확률분포들 중에서 하나의 명령의도 확률분포를 선택하는 명령의도 확률분포 선택부;
상기 선택된 명령의도 확률분포로부터 최종 명령의도를 선택하여 그에 대응하는 동작신호를 출력하는 동작신호 출력부를 포함하는 음성명령 인식 장치. - 제1항에 있어서,
상기 명령의도 확률분포 업데이트부는,
상기 제2 음성명령의 명령의도를 인식하는 제2 음성명령 인식부;
상기 출력된 응답과 상기 인식된 제2 음성명령의 명령의도를 비교하여 상기 제1 음성명령의 명령의도의 변화 여부를 검출하는 명령의도 변화 검출부;
상기 검출된 명령의도의 변화 여부에 따라 상기 제1 음성명령의 상황별 명령의도 확률분포를 재설정하는 확률분포 재설정부; 및
상기 재설정된 확률분포에 따라 상기 제1 음성명령의 상황별 명령의도 확률분포의 업데이트를 수행하는 업데이트 실행부를 포함하는 음성명령 인식 장치. - 제1항에 있어서,
상기 명령의도 확률분포 생성부는 상기 제1 음성명령에 대해 명령의도가 유지되는 경우, 명령의도가 수정되는 경우 및 명령의도가 새로운 경우의 상황별로 나누어 서로 다른 명령의도 확률분포를 동시에 생성하고,
상기 명령의도 확률분포 업데이트부는 상기 제2 음성명령의 명령의도 변화여부에 따라 상기 제1 음성명령의 상황별 명령의도 확률분포를 다시 명령의도가 유지되는 경우, 명령의도가 수정되는 경우, 명령의도가 새로운 경우의 상황별로 나누어 계층적으로 업데이트하는 음성명령 인식 장치. - 제1항에 있어서,
상기 명령의도 확률분포는,
상기 음성명령의 명령의도, 상기 음성명령에 대한 재확인 여부, 상기 응답의 출력여부, 상기 동작신호의 출력여부 중 적어도 하나의 정보를 포함하는 음성명령 인식 장치. - 제1항에 있어서,
상기 명령의도 확률분포 업데이트부는,
상기 동작신호 출력부가 최종 명령의도를 선택할 때까지 상기 명령의도 확률분포를 업데이트하는 음성명령 인식 장치. - 제1항에 있어서,
상기 명령의도 확률분포 선택부는,
상기 업데이트된 하나 이상의 명령의도 확률분포들 중 엔트로피가 가장 낮은 것을 하나의 명령의도 확률분포로 선택하는 음성명령 인식 장치. - 제4항에 있어서,
상기 명령의도 확률분포 선택부는,
상기 업데이트된 하나 이상의 명령의도 확률분포들의 특정 정보 값을 기준으로 하나의 명령의도를 선택하는 음성명령 인식 장치. - 제4항에 있어서,
상기 명령의도 확률분포 선택부는,
상기 업데이트된 하나 이상의 명령의도 확률분포의 특정 정보에 가중치를 부여하여 그 가중치의 평균값을 계산하여 하나의 명령의도로 선택하는 음성명령 인식 장치. - 제1항에 있어서,
상기 동작신호 출력부는,
상기 선택된 명령의도 확률분포 중 가장 높은 확률을 가지는 하나 이상의 명령의도에 기초하여 최종의도를 선택하여 그에 대응하는 동작신호를 출력하는 음성명령 인식 장치. - 제1항에 있어서,
상기 동작신호 출력부는,
상기 선택된 명령의도 확률분포의 명령의도 중 명령의도에 부합하는 동작신호가 출력되면 양의 보상값을 적용하고, 상기 명령의도에 부합하지 않는 동작신호가 출력되면 음의 보상값을 적용하여, 상기 보상값이 최대가 되는 동작을 동작신호로 출력하는 음성명령 인식 장치. - 입력된 제1 음성명령을 인식하여, 기 설정된 하나 이상의 상황별로 명령의도 확률분포를 생성하는 단계;
상기 제1 음성명령에 대응하여 출력된 응답과 그 응답에 대응하여 입력된 제2 음성명령을 이용하여 상기 명령의도 확률분포를 업데이트하는 단계;
상기 업데이트된 하나 이상의 명령의도 확률분포들 중에서 하나의 명령의도 확률분포를 선택하는 단계;
상기 선택된 명령의도 확률분포로부터 최종 명령의도를 선택하여 그에 대응하는 동작신호를 출력하는 단계를 포함하는 음성명령 인식 방법. - 제11항에 있어서,
상기 명령의도 확률분포 업데이트 단계는,
상기 제2 음성명령의 명령의도를 인식하는 단계;
상기 출력된 응답과 상기 인식된 제2 음성명령의 명령의도를 비교하여 상기 제1 음성명령의 명령의도의 변화 여부를 검출하는 단계;
상기 검출된 명령의도의 변화 여부에 따라 상기 제1 음성명령의 상황별 명령의도 확률분포를 재설정하는 단계; 및
상기 재설정된 확률분포에 따라 상기 제1 음성명령의 상황별 명령의도 확률분포의 업데이트를 수행하는 단계를 포함하는 음성명령 인식 방법. - 제11항에 있어서,
상기 명령의도 확률분포 생성단계는 상기 제1 음성명령에 대해 명령의도가 유지되는 경우, 명령의도가 수정되는 경우 및 명령의도가 새로운 경우의 상황별로 나누어 서로 다른 명령의도 확률분포를 동시에 생성하고,
상기 명령의도 확률분포 업데이트 단계는 상기 제2 음성명령의 명령의도 변화여부에 따라 상기 제1 음성명령의 상황별 명령의도 확률분포를 다시 명령의도가 유지되는 경우, 명령의도가 수정되는 경우, 명령의도가 새로운 경우의 상황별로 나누어 계층적으로 업데이트하는 음성명령 인식 방법. - 제11항에 있어서,
상기 명령의도 확률분포는,
상기 음성명령의 명령의도, 상기 음성명령에 대한 재확인 여부, 상기 응답의 출력여부, 상기 동작신호의 출력여부 중 적어도 하나의 정보를 포함하는 음성명령 인식 방법. - 제11항에 있어서,
상기 명령의도 확률분포 업데이트 단계는,
동작신호 출력부가 최종 명령의도를 선택할 때까지 상기 명령의도 확률분포를 업데이트하는 음성명령 인식 방법. - 제11항에 있어서,
상기 명령의도 확률분포 선택 단계는,
상기 업데이트된 하나 이상의 명령의도 확률분포들 중 엔트로피가 가장 낮은 것을 하나의 명령의도 확률분포로 선택하는 음성명령 인식 방법. - 제14항에 있어서,
상기 명령의도 확률분포 선택 단계는,
상기 업데이트된 하나 이상의 명령의도 확률분포들의 특정 정보 값을 기준으로 하나의 명령의도를 선택하는 음성명령 인식 방법. - 제14항에 있어서,
상기 명령의도 확률분포 선택 단계는,
상기 업데이트된 하나 이상의 명령의도 확률분포의 특정 정보에 가중치를 부여하여 그 가중치의 평균값을 계산하여 하나의 명령의도로 선택하는 음성명령 인식 방법. - 제11항에 있어서,
상기 동작신호 출력 단계는,
상기 선택된 명령의도 확률분포 중 가장 높은 확률을 가지는 하나 이상의 명령의도에 기초하여 최종의도를 선택하여 그에 대응하는 동작신호를 출력하는 음성명령 인식 방법. - 제11항에 있어서,
상기 동작신호 출력 단계는,
상기 선택된 명령의도 확률분포의 명령의도 중 명령의도에 부합하는 동작신호가 출력되면 양의 보상값을 적용하고, 상기 명령의도에 부합하지 않는 동작신호가 출력되면 음의 보상값을 적용하여, 상기 보상값이 최대가 되는 동작을 동작신호로 출력하는 음성명령 인식 방법.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020100075038A KR101699720B1 (ko) | 2010-08-03 | 2010-08-03 | 음성명령 인식 장치 및 음성명령 인식 방법 |
| US13/093,919 US9142212B2 (en) | 2010-08-03 | 2011-04-26 | Apparatus and method for recognizing voice command |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020100075038A KR101699720B1 (ko) | 2010-08-03 | 2010-08-03 | 음성명령 인식 장치 및 음성명령 인식 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20120012919A KR20120012919A (ko) | 2012-02-13 |
| KR101699720B1 true KR101699720B1 (ko) | 2017-01-26 |
Family
ID=45556783
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020100075038A Expired - Fee Related KR101699720B1 (ko) | 2010-08-03 | 2010-08-03 | 음성명령 인식 장치 및 음성명령 인식 방법 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US9142212B2 (ko) |
| KR (1) | KR101699720B1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20190041264A (ko) | 2017-10-12 | 2019-04-22 | 에스케이텔레콤 주식회사 | 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법 |
Families Citing this family (141)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
| US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
| US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
| US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
| US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
| US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
| US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
| US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
| US8793136B2 (en) * | 2012-02-17 | 2014-07-29 | Lg Electronics Inc. | Method and apparatus for smart voice recognition |
| US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
| US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
| CN104756100B (zh) * | 2012-11-30 | 2017-07-28 | 三菱电机株式会社 | 意图估计装置以及意图估计方法 |
| US10199051B2 (en) | 2013-02-07 | 2019-02-05 | Apple Inc. | Voice trigger for a digital assistant |
| US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
| US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
| WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
| DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
| US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
| KR101749009B1 (ko) | 2013-08-06 | 2017-06-19 | 애플 인크. | 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화 |
| CN105493180B (zh) | 2013-08-26 | 2019-08-30 | 三星电子株式会社 | 用于语音识别的电子装置和方法 |
| US10430024B2 (en) * | 2013-11-13 | 2019-10-01 | Microsoft Technology Licensing, Llc | Media item selection using user-specific grammar |
| EP3525206B1 (en) | 2013-12-02 | 2021-09-08 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
| US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
| US9837075B2 (en) * | 2014-02-10 | 2017-12-05 | Mitsubishi Electric Research Laboratories, Inc. | Statistical voice dialog system and method |
| KR102216048B1 (ko) | 2014-05-20 | 2021-02-15 | 삼성전자주식회사 | 음성 명령 인식 장치 및 방법 |
| EP3480811A1 (en) | 2014-05-30 | 2019-05-08 | Apple Inc. | Multi-command single utterance input method |
| US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| KR102261552B1 (ko) | 2014-06-30 | 2021-06-07 | 삼성전자주식회사 | 음성 명령어 제공 방법 및 이를 지원하는 전자 장치 |
| US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
| US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
| US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
| US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
| US9472196B1 (en) * | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
| US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
| US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
| US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
| US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
| US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
| US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
| US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
| US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
| US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
| US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
| US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
| CN105959761A (zh) * | 2016-04-28 | 2016-09-21 | 京东方科技集团股份有限公司 | 一种支持语音控制osd菜单的显示器 |
| US11222633B2 (en) * | 2016-05-20 | 2022-01-11 | Nippon Telegraph And Telephone Corporation | Dialogue method, dialogue system, dialogue apparatus and program |
| US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
| US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
| US12223282B2 (en) | 2016-06-09 | 2025-02-11 | Apple Inc. | Intelligent automated assistant in a home environment |
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
| DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
| KR102795172B1 (ko) | 2016-09-01 | 2025-04-15 | 삼성전자주식회사 | 음성 인식 장치 및 방법 |
| US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
| US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
| US10311856B2 (en) * | 2016-10-03 | 2019-06-04 | Google Llc | Synthesized voice selection for computational agents |
| US11663535B2 (en) | 2016-10-03 | 2023-05-30 | Google Llc | Multi computational agent performance of tasks |
| US10853747B2 (en) | 2016-10-03 | 2020-12-01 | Google Llc | Selection of computational agent for task performance |
| KR102502220B1 (ko) * | 2016-12-20 | 2023-02-22 | 삼성전자주식회사 | 전자 장치, 그의 사용자 발화 의도 판단 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
| WO2018117608A1 (ko) * | 2016-12-20 | 2018-06-28 | 삼성전자 주식회사 | 전자 장치, 그의 사용자 발화 의도 판단 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
| US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
| KR102859554B1 (ko) | 2017-01-20 | 2025-09-16 | 삼성전자주식회사 | 전자장치, 전자장치의 제어방법 및 기록매체 |
| US10643609B1 (en) * | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Selecting speech inputs |
| US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
| DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
| US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
| DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
| US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
| DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
| DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
| US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
| DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Multi-modal interfaces |
| US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
| DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
| US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
| US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
| US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
| US10636428B2 (en) | 2017-06-29 | 2020-04-28 | Microsoft Technology Licensing, Llc | Determining a target device for voice command interaction |
| WO2019107145A1 (ja) * | 2017-11-28 | 2019-06-06 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
| US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
| US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
| US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
| US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
| US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
| US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
| US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
| US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
| US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
| DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
| DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
| DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
| US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
| US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
| US11848016B2 (en) | 2018-08-07 | 2023-12-19 | Huawei Technologies Co., Ltd. | Voice control command generation method and terminal |
| US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
| US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
| US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
| US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
| US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
| US11367441B2 (en) | 2018-11-01 | 2022-06-21 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
| KR102857227B1 (ko) | 2018-11-01 | 2025-09-09 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
| KR102692775B1 (ko) * | 2018-12-28 | 2024-08-08 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
| US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
| US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
| US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
| US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
| US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
| DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
| US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
| US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
| US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
| DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
| DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | User activity shortcut suggestions |
| US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
| US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
| WO2021040092A1 (ko) * | 2019-08-29 | 2021-03-04 | 엘지전자 주식회사 | 음성 인식 서비스 제공 방법 및 장치 |
| US11935521B2 (en) * | 2019-09-12 | 2024-03-19 | Oracle International Corporation | Real-time feedback for efficient dialog processing |
| WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
| KR20210042520A (ko) | 2019-10-10 | 2021-04-20 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
| US11749281B2 (en) * | 2019-12-04 | 2023-09-05 | Soundhound Ai Ip, Llc | Neural speech-to-meaning |
| US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
| US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
| US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
| US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
| US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
| JP7731435B2 (ja) * | 2021-03-23 | 2025-08-29 | ヒタチ・エナジー・リミテッド | コマンド生成システムおよびコマンドの発行方法 |
| US11620993B2 (en) * | 2021-06-09 | 2023-04-04 | Merlyn Mind, Inc. | Multimodal intent entity resolver |
| US12190872B2 (en) * | 2021-08-10 | 2025-01-07 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
| US12159628B1 (en) * | 2021-12-10 | 2024-12-03 | Amazon Technologies, Inc. | Natural language interactions with interactive visual content |
| KR20250041820A (ko) * | 2023-09-19 | 2025-03-26 | 현대자동차주식회사 | 차량 음성인식 시스템에서의 사용자 의도를 추론하기 위한 방법 및 장치 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008514983A (ja) * | 2004-09-27 | 2008-05-08 | ロバート ボッシュ コーポレーション | デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話 |
| US20080247519A1 (en) * | 2001-10-15 | 2008-10-09 | At&T Corp. | Method for dialog management |
Family Cites Families (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3194719B2 (ja) | 1998-07-17 | 2001-08-06 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 対話システム |
| JP2001188784A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 会話処理装置および方法、並びに記録媒体 |
| WO2002060162A2 (en) * | 2000-11-30 | 2002-08-01 | Enterprise Integration Group, Inc. | Method and system for preventing error amplification in natural language dialogues |
| US6826316B2 (en) | 2001-01-24 | 2004-11-30 | Eastman Kodak Company | System and method for determining image similarity |
| US20040120472A1 (en) * | 2001-04-19 | 2004-06-24 | Popay Paul I | Voice response system |
| US20090164215A1 (en) * | 2004-02-09 | 2009-06-25 | Delta Electronics, Inc. | Device with voice-assisted system |
| JP3923513B2 (ja) * | 2004-06-08 | 2007-06-06 | 松下電器産業株式会社 | 音声認識装置および音声認識方法 |
| US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
| KR100755677B1 (ko) * | 2005-11-02 | 2007-09-05 | 삼성전자주식회사 | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 |
| US8681778B2 (en) * | 2006-01-10 | 2014-03-25 | Ingenio Llc | Systems and methods to manage privilege to speak |
| JP5248867B2 (ja) * | 2006-01-31 | 2013-07-31 | 本田技研工業株式会社 | 会話システムおよび会話ソフトウェア |
| JP2010020273A (ja) | 2007-12-07 | 2010-01-28 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
| JP2009157905A (ja) | 2007-12-07 | 2009-07-16 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
| US8077836B2 (en) * | 2008-07-30 | 2011-12-13 | At&T Intellectual Property, I, L.P. | Transparent voice registration and verification method and system |
| US8520808B2 (en) * | 2008-10-08 | 2013-08-27 | Synchronoss Technologies | System and method for robust evaluation of the user experience in automated spoken dialog systems |
| US8140328B2 (en) | 2008-12-01 | 2012-03-20 | At&T Intellectual Property I, L.P. | User intention based on N-best list of recognition hypotheses for utterances in a dialog |
| TWI420433B (zh) * | 2009-02-27 | 2013-12-21 | Ind Tech Res Inst | 語音互動系統與方法 |
| US20100332287A1 (en) * | 2009-06-24 | 2010-12-30 | International Business Machines Corporation | System and method for real-time prediction of customer satisfaction |
| JP2011033680A (ja) * | 2009-07-30 | 2011-02-17 | Sony Corp | 音声処理装置及び方法、並びにプログラム |
| US8509396B2 (en) * | 2009-09-24 | 2013-08-13 | International Business Machines Corporation | Automatic creation of complex conversational natural language call routing system for call centers |
| KR101612788B1 (ko) * | 2009-11-05 | 2016-04-18 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
| US8457968B2 (en) * | 2009-12-08 | 2013-06-04 | At&T Intellectual Property I, L.P. | System and method for efficient tracking of multiple dialog states with incremental recombination |
| US8626511B2 (en) * | 2010-01-22 | 2014-01-07 | Google Inc. | Multi-dimensional disambiguation of voice commands |
-
2010
- 2010-08-03 KR KR1020100075038A patent/KR101699720B1/ko not_active Expired - Fee Related
-
2011
- 2011-04-26 US US13/093,919 patent/US9142212B2/en not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080247519A1 (en) * | 2001-10-15 | 2008-10-09 | At&T Corp. | Method for dialog management |
| JP2008514983A (ja) * | 2004-09-27 | 2008-05-08 | ロバート ボッシュ コーポレーション | デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20190041264A (ko) | 2017-10-12 | 2019-04-22 | 에스케이텔레콤 주식회사 | 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| US9142212B2 (en) | 2015-09-22 |
| US20120035935A1 (en) | 2012-02-09 |
| KR20120012919A (ko) | 2012-02-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101699720B1 (ko) | 음성명령 인식 장치 및 음성명령 인식 방법 | |
| KR101828273B1 (ko) | 결합기반의 음성명령 인식 장치 및 그 방법 | |
| US11238845B2 (en) | Multi-dialect and multilingual speech recognition | |
| EP2028645B1 (en) | Method and system of optimal selection strategy for statistical classifications in dialog systems | |
| KR102117574B1 (ko) | 자기-학습 자연 언어 이해를 갖는 다이얼로그 시스템 | |
| US8024188B2 (en) | Method and system of optimal selection strategy for statistical classifications | |
| CN111164676B (zh) | 经由环境语境采集进行的语音模型个性化 | |
| JP6538779B2 (ja) | 音声対話システム、音声対話方法、および音声対話システムを適合させる方法 | |
| US20090119103A1 (en) | Speaker recognition system | |
| CN111159364B (zh) | 对话系统、对话装置、对话方法以及存储介质 | |
| EP3207507B1 (en) | Augmenting neural networks with external memory | |
| US20160035344A1 (en) | Identifying the language of a spoken utterance | |
| US10152298B1 (en) | Confidence estimation based on frequency | |
| KR102485342B1 (ko) | 차량의 환경에 기반한 추천 신뢰도 판단 장치 및 방법 | |
| KR20100115093A (ko) | 음성 검출 장치 및 방법 | |
| US20170061958A1 (en) | Method and apparatus for improving a neural network language model, and speech recognition method and apparatus | |
| US20200395042A1 (en) | Learning device, voice activity detector, and method for detecting voice activity | |
| US20180350358A1 (en) | Voice recognition device, voice emphasis device, voice recognition method, voice emphasis method, and navigation system | |
| EP3501024B1 (en) | Systems, apparatuses, and methods for speaker verification using artificial neural networks | |
| KR20240068723A (ko) | Rnn-T로 구현된 자동 음성 인식 시스템에서 음향과 텍스트 표현의 융합 | |
| CN101123090B (zh) | 通过使用平方根折扣的统计语言的语音识别 | |
| KR20250026933A (ko) | 다중 도메인 대화 상태 추적 장치 및 방법 | |
| CN110334244B (zh) | 一种数据处理的方法、装置及电子设备 | |
| CN113241060B (zh) | 一种安保预警方法及系统 | |
| CN117933229A (zh) | 一种文本修正方法、装置、设备及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-2-2-P10-P22-nap-X000 |
|
| A201 | Request for examination | ||
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-2-2-P10-P22-nap-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| P14-X000 | Amendment of ip right document requested |
St.27 status event code: A-5-5-P10-P14-nap-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| P16-X000 | Ip right document amended |
St.27 status event code: A-5-5-P10-P16-nap-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R14-asn-PN2301 |
|
| FPAY | Annual fee payment |
Payment date: 20200218 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20240120 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20240120 |