KR102817836B1 - 자동화된 어시스턴트에 의한 응답 액션을 트리거하기 위한 핫 명령의 검출 및/또는 등록 - Google Patents
자동화된 어시스턴트에 의한 응답 액션을 트리거하기 위한 핫 명령의 검출 및/또는 등록 Download PDFInfo
- Publication number
- KR102817836B1 KR102817836B1 KR1020227001309A KR20227001309A KR102817836B1 KR 102817836 B1 KR102817836 B1 KR 102817836B1 KR 1020227001309 A KR1020227001309 A KR 1020227001309A KR 20227001309 A KR20227001309 A KR 20227001309A KR 102817836 B1 KR102817836 B1 KR 102817836B1
- Authority
- KR
- South Korea
- Prior art keywords
- command
- automated assistant
- text
- user
- hot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/19—Sensors therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Ophthalmology & Optometry (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
도 2a 및 도 2b는 다양한 구현에 따라 자동화된 어시스턴트를 호출하기 위해 발화가 어떻게 처리될 수 있는지에 대한 2개의 상이한 예를 개략적으로 도시한다.
도 3a, 3b, 및 3c는 다양한 구현들에 따른, 자동화된 어시스턴트 및/또는 본 개시의 선택된 양태들로 구성된 어시스턴트 장치에 의해 구현될 수 있는 예시적인 상태 머신의 단계(스테이지)들을 개략적으로 도시한다.
도 4a 및 4b는 본 개시의 선택된 양태들로 구성된 자동화된 어시스턴트와 사용자 사이의 예시적인 대화들을 도시한다.
도 5a 및 5b는 본 개시의 선택된 양태들로 구성된 자동화된 어시스턴트와 사용자 사이의 더 많은 예시적인 대화들을 도시한다.
도 6은 여기에 개시된 구현들에 따른 예시적인 방법을 예시하는 흐름도를 도시한다.
도 7은 여기에 개시된 구현들에 따른 예시적인 방법을 예시하는 흐름도를 도시한다.
도 8은 컴퓨팅 장치의 예시적인 아키텍처를 도시한다.
Claims (20)
- 하나 이상의 프로세서를 사용하여 구현되는 방법으로서,
하나 이상의 프로세서를 사용하여 자동화된 어시스턴트를 동작시키는 단계;
트리거 이벤트에 응답하여 자동화된 어시스턴트를 제한된 청취 상태에서 전체 음성 인식 상태로 전환하는 단계;
상기 전체 음성 인식 상태에서, 자동화된 어시스턴트가 사용자로부터 음성 명령을 수신하는 단계;
텍스트 명령을 생성하기 위해 상기 음성 명령에 대해 음성 인식 프로세싱을 수행하는 단계;
상기 텍스트 명령이 텍스트 명령 코퍼스에서 빈도 임계치를 충족한다고 결정하는 단계;
상기 결정에 응답하여, 상기 텍스트 명령을 나타내는 데이터를 핫 명령으로 등록하는 단계; 그리고
상기 등록하는 것에 응답하여, 자동화된 어시스턴트를 적어도 부분적으로 구현하는 컴퓨팅 장치의 로컬 메모리에 텍스트 명령을 나타내는 데이터를 캐시(cache)하는 단계를 포함하며,
상기 등록하는 단계 후에, 상기 텍스트 명령과 의미론적으로 일치하는 다른 텍스트 명령의 발화는 상기 자동화된 어시스턴트의 명시적 호출을 요구하지 않고, 상기 자동화된 어시스턴트에 의한 응답 액션의 수행을 트리거하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법. - 제1항에 있어서, 상기 트리거 이벤트는 마이크로폰에 의해 캡처된 오디오 데이터에서 하나 이상의 디폴트 핫 워드의 검출을 포함하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법.
- 제1항에 있어서, 상기 텍스트 명령 코퍼스는 사용자에 의해 생성된 텍스트 명령 코퍼스를 포함하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법.
- 제1항에 있어서, 상기 텍스트 명령 코퍼스는 사용자를 포함하는 사용자 집단에 의해 생성된 텍스트 명령 코퍼스를 포함하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법.
- 제1항에 있어서, 상기 방법은,
출력을 생성하기 위해 기계 학습 모델에 걸쳐 입력으로서 텍스트 명령을 적용하는 단계를 더 포함하고, 상기 출력은 텍스트 명령이 자동화된 어시스턴트로 지시되었을 확률을 나타내고, 상기 등록하는 단계는 임계치를 충족하는 확률에 더 응답하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법. - 제1항에 있어서, 상기 방법은,
하나 이상의 카메라에 의해 캡처된 비전 데이터에 기초하여, 사용자의 시선이 자동화된 어시스턴트가 적어도 부분적으로 구현되는 컴퓨팅 장치를 향하고 있음을 검출하는 단계를 더 포함하고, 상기 등록하는 단계는 상기 검출에 더 응답하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법. - 제1항에 있어서, 상기 등록하는 단계는 음성 명령 후 미리 결정된 시간 간격 동안 추가적인 발화가 검출되지 않는다는 결정에 더 응답하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법.
- 제1항에 있어서, 상기 등록하는 단계는 음성 명령 이후에 미리 결정된 시간 간격 동안 사람에 의해 어떠한 응답 액션도 취해지지 않았다는 결정에 더 응답하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법.
- 삭제
- 제1항에 있어서, 상기 방법은,
상기 텍스트 명령에 응답하는 정보를 캐시하기 위해, 상기 텍스트 명령이 명시적으로 호출되지 않고, 상기 캐시된 데이터를 기초로 상기 등록에 후속하여 상기 텍스트 명령을 트리거하는 단계를 더 포함하고,
상기 트리거하는 단계 이후, 상기 캐시된 정보는 텍스트 명령이 트리거되는 대신에 상기 텍스트 명령의 후속 호출에 응답하여 출력되는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법. - 제1항에 있어서, 상기 캐시하는 단계 이후에,
텍스트 명령의 호출(invocation)은 텍스트 명령을 나타내는 데이터가 근거리 통신망("LAN") 및 개인 영역 네트워크("PAN") 중 하나 또는 둘 다를 통해 스마트 기기에 직접 전송되게 하고, 상기 텍스트 명령을 나타내는 데이터의 수신은 상기 스마트 기기가 응답 액션을 수행하게 하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법. - 제1항에 있어서, 텍스트 명령을 나타내는 데이터는 사용자로부터 수신된 음성 명령에 제공된 하나 이상의 파라미터와 의미론적으로 일치하는 하나 이상의 후속 파라미터를 수신하도록 하나 이상의 슬롯을 포함하는 템플릿을 포함하는 것을 특징으로 하는 하나 이상의 프로세서를 사용하여 구현되는 방법.
- 하나 이상의 프로세서에 의한 명령의 실행에 응답하여 하나 이상의 프로세서로 하여금 자동화된 어시스턴트를 구현하게 하는 명령을 저장하는 메모리 및 하나 이상의 프로세서를 포함하는 시스템으로서, 자동화된 어시스턴트는,
하나 이상의 마이크로폰에서 캡처된 오디오 데이터를 수신하고 -오디오 데이터는 제1 및 제2 음성 발화를 포함함-;
오디오 데이터에 대해 음성 인식 프로세싱을 수행하여 제1 및 제2 음성 발화에 대응하는 제1 및 제2 텍스트 스니펫(snippet)을 생성하고;
하나 이상의 카메라에 의해 캡처된 비전 데이터에 기초하여, 사용자가 제1 음성 발화를 제공하는 동안 사용자의 제1 시선 및 사용자가 제2 음성 발화를 제공하는 동안 사용자의 제2 시선을 검출하고;
제1 텍스트 스니펫이 하나 이상의 핫 명령 기준을 충족한다는 결정에 응답하여, 제1 텍스트 스니펫에 기초하여 응답 액션을 수행하고;
제2 텍스트 스니펫이 하나 이상의 핫 명령 기준을 충족하지 못한다는 결정에 응답하여, 다른 응답 액션을 수행하지 않고 상기 제2 텍스트 스니펫을 폐기하거나 무시하는 것을 특징으로 하는 시스템. - 제13항에 있어서, 상기 하나 이상의 핫 명령 기준은 핫 명령 라이브러리에서 고려 중인 텍스트 스니펫의 등록을 포함하고, 상기 핫 명령 라이브러리는, 말했을 때, 하나 이상의 디폴트 핫 워드의 검출 또는 자동화된 어시스턴트의 활성 청취 상태로의 전환을 요구하지 않고, 자동화된 어시스턴트에 의한 응답 액션의 수행을 트리거하는 텍스트 스니펫을 포함하는 것을 특징으로 하는 시스템.
- 삭제
- 제13항에 있어서, 상기 하나 이상의 핫 명령 기준은 자동화된 어시스턴트가 적어도 부분적으로 구현되는 컴퓨팅 장치를 향한 시선를 포함하는 것을 특징으로 하는 시스템.
- 하나 이상의 프로세서에 의한 명령의 실행에 응답하여, 하나 이상의 프로세서로 하여금 동작들을 수행하게 하는 명령을 포함하는 적어도 하나의 비일시적 컴퓨터 판독 가능 매체로서, 상기 동작들은,
하나 이상의 프로세서를 사용하여 자동화된 어시스턴트를 동작시키는 동작;
트리거 이벤트에 응답하여 자동화된 어시스턴트를 제한된 청취 상태에서 전체 음성 인식 상태로 전환하는 동작;
전체 음성 인식 상태에서, 자동화된 어시스턴트가 사용자로부터 음성 명령을 수신하는 동작;
텍스트 명령을 생성하기 위해 음성 명령에 대해 음성 인식 프로세싱을 수행하는 동작;
텍스트 명령이 텍스트 명령 코퍼스에서 빈도 임계치를 충족한다고 결정하는 동작;
상기 결정에 응답하여, 텍스트 명령을 나타내는 데이터를 핫 명령으로 등록하는 동작; 그리고
상기 등록하는 것에 응답하여, 자동화된 어시스턴트를 적어도 부분적으로 구현하는 컴퓨팅 장치의 로컬 메모리에 텍스트 명령을 나타내는 데이터를 캐시(cache)하는 동작을 포함하며,
상기 등록 후에, 텍스트 명령과 의미론적으로 일치하는 다른 텍스트 명령의 발화는 자동화된 어시스턴트의 명시적 호출을 요구하지 않고, 자동화된 어시스턴트에 의한 응답 액션의 수행을 트리거하는 것을 특징으로 하는 비일시적 컴퓨터 판독 가능 매체. - 제17항에 있어서, 상기 트리거 이벤트는 마이크로폰에 의해 캡처된 오디오 데이터에서 하나 이상의 디폴트 핫워드의 검출을 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독 가능 매체.
- 제17항에 있어서, 상기 텍스트 명령 코퍼스는 사용자에 의해 생성된 텍스트 명령 코퍼스를 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독 가능 매체.
- 제17항에 있어서, 상기 텍스트 명령 코퍼스는 사용자를 포함하는 사용자 집단에 의해 생성된 텍스트 명령 코퍼스를 포함하는 것을 특징으로 하는 비일시적 컴퓨터 판독 가능 매체.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962915248P | 2019-10-15 | 2019-10-15 | |
| US62/915,248 | 2019-10-15 | ||
| PCT/US2019/065656 WO2021076164A1 (en) | 2019-10-15 | 2019-12-11 | Detection and/or enrollment of hot commands to trigger responsive action by automated assistant |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20220024557A KR20220024557A (ko) | 2022-03-03 |
| KR102817836B1 true KR102817836B1 (ko) | 2025-06-09 |
Family
ID=69106202
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227001309A Active KR102817836B1 (ko) | 2019-10-15 | 2019-12-11 | 자동화된 어시스턴트에 의한 응답 액션을 트리거하기 위한 핫 명령의 검출 및/또는 등록 |
Country Status (6)
| Country | Link |
|---|---|
| US (3) | US11948556B2 (ko) |
| EP (1) | EP3970139B1 (ko) |
| JP (3) | JP7354301B2 (ko) |
| KR (1) | KR102817836B1 (ko) |
| CN (1) | CN114207710A (ko) |
| WO (1) | WO2021076164A1 (ko) |
Families Citing this family (52)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
| US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
| US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
| KR20250004158A (ko) | 2013-02-07 | 2025-01-07 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
| US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
| US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
| US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
| US12197817B2 (en) | 2016-06-11 | 2025-01-14 | Apple Inc. | Intelligent device arbitration and control |
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
| US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
| DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
| DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
| DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Multi-modal interfaces |
| US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
| DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
| US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
| US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
| DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
| DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
| US10929097B2 (en) * | 2018-06-26 | 2021-02-23 | ROVl GUIDES, INC. | Systems and methods for switching operational modes based on audio triggers |
| US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
| US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
| DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
| US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
| US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
| JP7354301B2 (ja) | 2019-10-15 | 2023-10-02 | グーグル エルエルシー | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
| WO2021080033A1 (ko) * | 2019-10-23 | 2021-04-29 | 엘지전자 주식회사 | 음성 분석 방법 및 장치 |
| US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
| US12301635B2 (en) | 2020-05-11 | 2025-05-13 | Apple Inc. | Digital assistant hardware abstraction |
| US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
| US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
| US11783805B1 (en) * | 2020-09-21 | 2023-10-10 | Amazon Technologies, Inc. | Voice user interface notification ordering |
| US12175968B1 (en) * | 2021-03-26 | 2024-12-24 | Amazon Technologies, Inc. | Skill selection for responding to natural language inputs |
| US12266354B2 (en) * | 2021-07-15 | 2025-04-01 | Apple Inc. | Speech interpretation based on environmental context |
| US12020704B2 (en) * | 2022-01-19 | 2024-06-25 | Google Llc | Dynamic adaptation of parameter set used in hot word free adaptation of automated assistant |
| DE102022112444A1 (de) * | 2022-05-18 | 2023-11-23 | Bayerische Motoren Werke Aktiengesellschaft | Spracherkennungssystem |
| US12423917B2 (en) | 2022-06-10 | 2025-09-23 | Apple Inc. | Extended reality based digital assistant interactions |
| US12266358B2 (en) * | 2022-08-08 | 2025-04-01 | Google Llc | Dynamically determining whether to perform candidate automated assistant action determined from spoken utterance |
| WO2024035424A1 (en) * | 2022-08-08 | 2024-02-15 | Google Llc | Dynamically determining whether to perform candidate automated assistant action determined from spoken utterance |
| KR102486120B1 (ko) | 2022-10-13 | 2023-01-09 | (주)액션파워 | 음성 신호와 연관된 컨텐츠를 결정하는 방법 |
| WO2024225827A1 (ko) * | 2023-04-26 | 2024-10-31 | 삼성전자 주식회사 | 지식그래프를 이용하여 개체명을 포함하는 발화를 보정하는 전자 장치, 동작 방법, 및 저장 매체 |
| WO2025023451A1 (ko) * | 2023-07-21 | 2025-01-30 | 삼성전자주식회사 | 사용자 시선과의 인터랙션을 위한 웨어러블 장치, 방법, 및 비-일시적 컴퓨터 판독 가능 저장 매체 |
| US12444418B1 (en) | 2023-09-05 | 2025-10-14 | Amazon Technologies, Inc. | Device selection for outputting content |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150112690A1 (en) | 2013-10-22 | 2015-04-23 | Nvidia Corporation | Low power always-on voice trigger architecture |
| US20180182390A1 (en) * | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
Family Cites Families (46)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002082748A (ja) | 2000-09-06 | 2002-03-22 | Sanyo Electric Co Ltd | ユーザ支援装置 |
| JP3920097B2 (ja) * | 2002-01-08 | 2007-05-30 | 三菱電機株式会社 | 車載機器用音声認識装置 |
| JP4144443B2 (ja) * | 2003-06-19 | 2008-09-03 | 富士通株式会社 | 対話装置 |
| JP2008145989A (ja) | 2006-12-13 | 2008-06-26 | Fujitsu Ten Ltd | 音声識別装置および音声識別方法 |
| JP2011003066A (ja) | 2009-06-19 | 2011-01-06 | Ntt Docomo Inc | 情報取得装置、情報取得プログラム |
| JP5466436B2 (ja) | 2009-06-19 | 2014-04-09 | 本田技研工業株式会社 | ペダル装置 |
| KR101605347B1 (ko) * | 2009-12-18 | 2016-03-22 | 삼성전자주식회사 | 휴대단말의 외부 출력 제어 방법 및 장치 |
| JP2011253374A (ja) * | 2010-06-02 | 2011-12-15 | Sony Corp | 情報処理装置、および情報処理方法、並びにプログラム |
| US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
| KR101330671B1 (ko) | 2012-09-28 | 2013-11-15 | 삼성전자주식회사 | 전자장치, 서버 및 그 제어방법 |
| US9275637B1 (en) | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
| US20150279351A1 (en) * | 2012-12-19 | 2015-10-01 | Google Inc. | Keyword detection based on acoustic alignment |
| US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
| US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
| CN104700832B (zh) * | 2013-12-09 | 2018-05-25 | 联发科技股份有限公司 | 语音关键字检测系统及方法 |
| US10048748B2 (en) | 2013-11-12 | 2018-08-14 | Excalibur Ip, Llc | Audio-visual interaction with user devices |
| US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
| US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
| US9715875B2 (en) * | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9792901B1 (en) * | 2014-12-11 | 2017-10-17 | Amazon Technologies, Inc. | Multiple-source speech dialog input |
| US10867606B2 (en) * | 2015-12-08 | 2020-12-15 | Chian Chiu Li | Systems and methods for performing task using simple code |
| JP6447578B2 (ja) * | 2016-05-27 | 2019-01-09 | トヨタ自動車株式会社 | 音声対話装置および音声対話方法 |
| CN106157512A (zh) * | 2016-07-11 | 2016-11-23 | 天津艾思科尔科技有限公司 | 一种具有火灾检测功能的家用服务机器人 |
| US9691384B1 (en) | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
| US10043516B2 (en) * | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
| KR102409303B1 (ko) * | 2016-12-15 | 2022-06-15 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
| WO2018205083A1 (zh) | 2017-05-08 | 2018-11-15 | 深圳前海达闼云端智能科技有限公司 | 机器人唤醒方法、装置和机器人 |
| US10580098B2 (en) | 2017-05-29 | 2020-03-03 | Virtual OnQ Systems, LLC | Voice activated hotel room monitor |
| US10832668B1 (en) * | 2017-09-19 | 2020-11-10 | Amazon Technologies, Inc. | Dynamic speech processing |
| US10515637B1 (en) * | 2017-09-19 | 2019-12-24 | Amazon Technologies, Inc. | Dynamic speech processing |
| JP6929960B2 (ja) | 2017-11-24 | 2021-09-01 | 株式会社Nttドコモ | 情報処理装置及び情報処理方法 |
| US10510340B1 (en) * | 2017-12-05 | 2019-12-17 | Amazon Technologies, Inc. | Dynamic wakeword detection |
| US10679615B2 (en) * | 2018-04-16 | 2020-06-09 | Google Llc | Adaptive interface in a voice-based networked system |
| EP3723082B1 (en) * | 2018-04-16 | 2023-09-06 | Google LLC | Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface |
| KR102599607B1 (ko) * | 2018-08-21 | 2023-11-07 | 구글 엘엘씨 | 자동화된 어시스턴트를 호출하기 위한 다이내믹 및/또는 컨텍스트 특정 핫워드 |
| JP7322076B2 (ja) * | 2018-08-21 | 2023-08-07 | グーグル エルエルシー | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
| CN109410952B (zh) * | 2018-10-26 | 2020-02-28 | 北京蓦然认知科技有限公司 | 一种语音唤醒方法、装置及系统 |
| WO2020131681A1 (en) * | 2018-12-18 | 2020-06-25 | Knowles Electronics, Llc | Audio level estimator assisted false wake abatement systems and methods |
| US20200202843A1 (en) * | 2018-12-21 | 2020-06-25 | Knowles Electronics, Llc | Unwanted keyword detection abatement systems and methods |
| CN109493849A (zh) * | 2018-12-29 | 2019-03-19 | 联想(北京)有限公司 | 语音唤醒方法、装置及电子设备 |
| CN110045830A (zh) * | 2019-04-17 | 2019-07-23 | 努比亚技术有限公司 | 应用操作方法、装置及计算机可读存储介质 |
| US11521599B1 (en) * | 2019-09-20 | 2022-12-06 | Amazon Technologies, Inc. | Wakeword detection using a neural network |
| JP7354301B2 (ja) | 2019-10-15 | 2023-10-02 | グーグル エルエルシー | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
| US11289086B2 (en) * | 2019-11-01 | 2022-03-29 | Microsoft Technology Licensing, Llc | Selective response rendering for virtual assistants |
| US11694682B1 (en) * | 2019-12-11 | 2023-07-04 | Amazon Technologies, Inc. | Triggering voice control disambiguation |
| WO2022100283A1 (zh) * | 2020-11-13 | 2022-05-19 | 海信视像科技股份有限公司 | 显示设备、控件触发方法及滚动文本检测方法 |
-
2019
- 2019-12-11 JP JP2021574854A patent/JP7354301B2/ja active Active
- 2019-12-11 WO PCT/US2019/065656 patent/WO2021076164A1/en not_active Ceased
- 2019-12-11 KR KR1020227001309A patent/KR102817836B1/ko active Active
- 2019-12-11 US US16/973,384 patent/US11948556B2/en active Active
- 2019-12-11 CN CN201980097616.6A patent/CN114207710A/zh active Pending
- 2019-12-11 EP EP19832259.6A patent/EP3970139B1/en active Active
-
2023
- 2023-09-19 JP JP2023151488A patent/JP7581454B2/ja active Active
-
2024
- 2024-02-19 US US18/581,286 patent/US12217740B2/en active Active
- 2024-10-28 JP JP2024189109A patent/JP7767556B2/ja active Active
-
2025
- 2025-01-02 US US19/008,048 patent/US20250140240A1/en active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150112690A1 (en) | 2013-10-22 | 2015-04-23 | Nvidia Corporation | Low power always-on voice trigger architecture |
| US20180182390A1 (en) * | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20220024557A (ko) | 2022-03-03 |
| US12217740B2 (en) | 2025-02-04 |
| JP7767556B2 (ja) | 2025-11-11 |
| JP2025020226A (ja) | 2025-02-12 |
| WO2021076164A1 (en) | 2021-04-22 |
| US20250140240A1 (en) | 2025-05-01 |
| US20240194190A1 (en) | 2024-06-13 |
| JP7354301B2 (ja) | 2023-10-02 |
| JP2023169309A (ja) | 2023-11-29 |
| JP2022539675A (ja) | 2022-09-13 |
| CN114207710A (zh) | 2022-03-18 |
| EP3970139B1 (en) | 2025-04-09 |
| EP3970139A1 (en) | 2022-03-23 |
| US11948556B2 (en) | 2024-04-02 |
| JP7581454B2 (ja) | 2024-11-12 |
| US20210335342A1 (en) | 2021-10-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102817836B1 (ko) | 자동화된 어시스턴트에 의한 응답 액션을 트리거하기 위한 핫 명령의 검출 및/또는 등록 | |
| JP7700087B2 (ja) | 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード | |
| US12272356B2 (en) | Dynamic and/or context-specific hot words to invoke automated assistant | |
| EP3895161B1 (en) | Utilizing pre-event and post-event input streams to engage an automated assistant |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
Patent event date: 20220113 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20241028 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20250314 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20250602 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20250604 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |