JP7010073B2 - 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム - Google Patents
出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム Download PDFInfo
- Publication number
- JP7010073B2 JP7010073B2 JP2018044598A JP2018044598A JP7010073B2 JP 7010073 B2 JP7010073 B2 JP 7010073B2 JP 2018044598 A JP2018044598 A JP 2018044598A JP 2018044598 A JP2018044598 A JP 2018044598A JP 7010073 B2 JP7010073 B2 JP 7010073B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- voice
- output
- word
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/65—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
最初に、第1実施形態について説明する。図1は、第1実施形態に係る出力内容制御装置の模式図である。図1に示すように、第1実施形態に係る出力内容制御装置1は、ユーザHが発する音声V1を音声検出部10で検出し、検出した音声V1を解析して所定の処理を行って、音声出力部12により、音声V2を出力するものである。ここで、音声V2は、ユーザHに向かって出力されるが、出力内容制御装置1の周囲に他の人がいる場合、その人にも届く場合がある。この場合、ユーザHにとって、他の人に知られたくない情報が音声V2に含まれている場合であっても、ユーザH以外にも音声V2が聞こえ、情報を知られてしまうおそれがある。本実施形態に係る出力内容制御装置1は、音声V1を解析して、音声V2として出力される文章などを調整することで、音声V2の内容をユーザHにのみ適切に理解することを可能とし、さらにユーザH以外のユーザには理解させ難くすることを可能としている。
次に、第2実施形態について説明する。第1実施形態に係る出力内容制御装置1は、音声検出部10及び音声出力部12を有しているが、第2実施形態に係る出力内容制御装置1Aは、音声検出部10及び音声出力部12を有していない。第2実施形態において第1実施形態と構成が共通する箇所は、説明を省略する。
10 音声検出部
12 音声出力部
16 制御部
30 音声取得部
32 音声解析部
34 意図解析部
36 通知情報取得部
40 出力内容生成部(音声内容生成部)
44 出力制御部
50 属性情報取得部
52 取得情報取得部
A 取得情報
E 属性情報
H ユーザ
I 意図情報
V1、V2 音声
V1A 第1音声
V1B 第2音声
Claims (9)
- 音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類部と、
前記音声取得部が取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を検出する意図解析部と、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得部と、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成部と、を有し、
前記出力内容生成部は、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記通知情報取得部は、前記通知情報として、前記ユーザへ通知する情報の内容である
内容情報と、前記内容情報の種類を示す種類情報とを取得し、
前記出力内容生成部は、前記内容情報に含まれる単語とその内容情報に紐付けられた前記種類情報とに基づき、他の単語に置換する単語を選択する、
出力内容制御装置。 - 前記出力内容生成部は、所定の単語である第1単語と前記第1単語に紐付けられた第2単語との情報を有する関係情報を読み出し、前記通知情報に含まれる単語が前記第1単語と一致する場合に、前記通知情報に含まれる単語を、前記第2単語に置換する、請求項1に記載の出力内容制御装置。
- 前記関係情報は、前記第1単語の種類を示す種類情報の情報も含んでおり、
前記出力内容生成部は、前記通知情報に含まれる単語の種類情報と前記第1単語の種類情報とが一致し、かつ、前記通知情報に含まれる単語が前記第1単語と一致する場合に、前記通知情報に含まれる単語を、他の単語に置換する単語として選択する、請求項2に記載の出力内容制御装置。 - 前記音声分類部は、前記ユーザが発する音声がささやき声である場合に、前記所定の音声として判定する、請求項1から請求項3のいずれか1項に記載の出力内容制御装置。
- 音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類部と、
前記音声取得部が取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を検出する意図解析部と、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得部と、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成部と、を有し、
前記出力内容生成部は、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記音声分類部は、前記ユーザが発する音声がささやき声である場合に、前記所定の音声として判定する、
出力内容制御装置。 - 音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、
前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成ステップと、を有し、
前記出力内容生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記通知情報取得ステップにおいて、前記通知情報として、前記ユーザへ通知する情報の内容である内容情報と、前記内容情報の種類を示す種類情報とを取得し、
前記出力内容生成ステップにおいて、前記内容情報に含まれる単語とその内容情報に紐付けられた前記種類情報とに基づき、他の単語に置換する単語を選択する、
出力内容制御方法。 - 音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、
前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成ステップと、をコンピュータに実行させ、
前記出力内容生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記通知情報取得ステップにおいて、前記通知情報として、前記ユーザへ通知する情報の内容である内容情報と、前記内容情報の種類を示す種類情報とを取得し、
前記出力内容生成ステップにおいて、前記内容情報に含まれる単語とその内容情報に紐付けられた前記種類情報とに基づき、他の単語に置換する単語を選択する、
出力内容制御プログラム。 - 音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、
前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成ステップと、を有し、
前記出力内容生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記音声分類ステップにおいて、前記ユーザが発する音声がささやき声である場合に、前記所定の音声として判定する、
出力内容制御方法。 - 音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、
前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成ステップと、をコンピュータに実行させ、
前記出力内容生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記音声分類ステップにおいて、前記ユーザが発する音声がささやき声である場合に、前記所定の音声として判定する、
出力内容制御プログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018044598A JP7010073B2 (ja) | 2018-03-12 | 2018-03-12 | 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム |
| CN201910168326.8A CN110265005B (zh) | 2018-03-12 | 2019-03-06 | 输出内容控制装置、输出内容控制方法以及存储介质 |
| US16/295,034 US11244675B2 (en) | 2018-03-12 | 2019-03-07 | Word replacement in output generation for detected intent by voice classification |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018044598A JP7010073B2 (ja) | 2018-03-12 | 2018-03-12 | 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019159060A JP2019159060A (ja) | 2019-09-19 |
| JP7010073B2 true JP7010073B2 (ja) | 2022-01-26 |
Family
ID=67843388
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018044598A Active JP7010073B2 (ja) | 2018-03-12 | 2018-03-12 | 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11244675B2 (ja) |
| JP (1) | JP7010073B2 (ja) |
| CN (1) | CN110265005B (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7010073B2 (ja) * | 2018-03-12 | 2022-01-26 | 株式会社Jvcケンウッド | 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム |
| KR20220057249A (ko) | 2020-10-29 | 2022-05-09 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치, 및 그 전자 장치의 제어 방법 |
| JP7032681B1 (ja) | 2020-12-10 | 2022-03-09 | 富士通クライアントコンピューティング株式会社 | 情報処理装置及びプログラム |
| JP7420109B2 (ja) * | 2021-04-08 | 2024-01-23 | トヨタ自動車株式会社 | 情報出力システム、サーバ装置および情報出力方法 |
| KR102704929B1 (ko) * | 2021-04-30 | 2024-09-10 | 주식회사 다비다 | IoT 스타네트워크를 기반으로 스마트펜과 인공지능 스피커를 이용한 영어 학습 플랫폼 시스템 및 서비스 제공 방법 |
| DE112021008256T5 (de) * | 2021-10-25 | 2024-07-04 | Lg Electronics Inc. | Anzeigevorrichtung |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016136062A1 (ja) | 2015-02-27 | 2016-09-01 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07109560B2 (ja) | 1990-11-30 | 1995-11-22 | 富士通テン株式会社 | 音声認識装置 |
| JP3994368B2 (ja) * | 2000-01-25 | 2007-10-17 | ソニー株式会社 | 情報処理装置および情報処理方法、並びに記録媒体 |
| US9355092B2 (en) * | 2006-02-01 | 2016-05-31 | i-COMMAND LTD | Human-like response emulator |
| US7983910B2 (en) * | 2006-03-03 | 2011-07-19 | International Business Machines Corporation | Communicating across voice and text channels with emotion preservation |
| ATE555433T1 (de) * | 2007-04-26 | 2012-05-15 | Ford Global Tech Llc | Emotives beratungssystem und verfahren |
| US8401848B2 (en) * | 2009-12-15 | 2013-03-19 | At&T Intellectual Property I, L.P. | System and method for audible text center subsystem |
| JP6031761B2 (ja) * | 2011-12-28 | 2016-11-24 | 富士ゼロックス株式会社 | 音声解析装置および音声解析システム |
| KR102129786B1 (ko) * | 2013-04-03 | 2020-07-03 | 엘지전자 주식회사 | 단말기 및 이의 제어방법 |
| US9607630B2 (en) * | 2013-04-16 | 2017-03-28 | International Business Machines Corporation | Prevention of unintended distribution of audio information |
| US9384751B2 (en) * | 2013-05-06 | 2016-07-05 | Honeywell International Inc. | User authentication of voice controlled devices |
| CN103928025B (zh) * | 2014-04-08 | 2017-06-27 | 华为技术有限公司 | 一种语音识别的方法及移动终端 |
| JP6440513B2 (ja) * | 2014-05-13 | 2018-12-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
| US9542929B2 (en) * | 2014-09-26 | 2017-01-10 | Intel Corporation | Systems and methods for providing non-lexical cues in synthesized speech |
| CN109313902A (zh) * | 2016-06-06 | 2019-02-05 | 思睿逻辑国际半导体有限公司 | 语音用户接口 |
| JP6655835B2 (ja) * | 2016-06-16 | 2020-02-26 | パナソニックIpマネジメント株式会社 | 対話処理方法、対話処理システム、及びプログラム |
| US9680983B1 (en) * | 2016-06-16 | 2017-06-13 | Motorola Mobility Llc | Privacy mode detection and response over voice activated interface |
| US10552781B2 (en) * | 2016-10-24 | 2020-02-04 | Accenture Global Solutions Limited | Task transformation responsive to confidentiality assessments |
| US10733989B2 (en) * | 2016-11-30 | 2020-08-04 | Dsp Group Ltd. | Proximity based voice activation |
| JP7092108B2 (ja) * | 2017-02-27 | 2022-06-28 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| US10460748B2 (en) * | 2017-10-04 | 2019-10-29 | The Toronto-Dominion Bank | Conversational interface determining lexical personality score for response generation with synonym replacement |
| US10418023B2 (en) * | 2017-10-17 | 2019-09-17 | International Business Machines Corporation | Automatic answer rephrasing based on talking style |
| US10713423B2 (en) * | 2017-10-25 | 2020-07-14 | International Business Machines Corporation | Content adjustment and display augmentation for communication |
| US10706846B1 (en) * | 2018-01-12 | 2020-07-07 | Amazon Technologies, Inc. | Question answering for a voice user interface |
| JP7000924B2 (ja) * | 2018-03-06 | 2022-01-19 | 株式会社Jvcケンウッド | 音声内容制御装置、音声内容制御方法、及び音声内容制御プログラム |
| JP7010073B2 (ja) * | 2018-03-12 | 2022-01-26 | 株式会社Jvcケンウッド | 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム |
-
2018
- 2018-03-12 JP JP2018044598A patent/JP7010073B2/ja active Active
-
2019
- 2019-03-06 CN CN201910168326.8A patent/CN110265005B/zh active Active
- 2019-03-07 US US16/295,034 patent/US11244675B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016136062A1 (ja) | 2015-02-27 | 2016-09-01 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| US20190279631A1 (en) | 2019-09-12 |
| CN110265005B (zh) | 2023-05-30 |
| CN110265005A (zh) | 2019-09-20 |
| JP2019159060A (ja) | 2019-09-19 |
| US11244675B2 (en) | 2022-02-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7010073B2 (ja) | 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム | |
| US11356730B2 (en) | Systems and methods for routing content to an associated output device | |
| US20240152319A1 (en) | Systems and methods for providing supplemental information with a response to a command | |
| US11887590B2 (en) | Voice enablement and disablement of speech processing functionality | |
| EP3676831B1 (en) | Natural language user input processing restriction | |
| US9875740B1 (en) | Using voice information to influence importance of search result categories | |
| EP3190512B1 (en) | Display device and operating method therefor | |
| US10931999B1 (en) | Systems and methods for routing content to an associated output device | |
| CN109643548B (zh) | 用于将内容路由到相关联输出设备的系统和方法 | |
| US10796689B2 (en) | Voice processing methods and electronic devices | |
| US11574637B1 (en) | Spoken language understanding models | |
| EP2963644A1 (en) | Audio command intent determination system and method | |
| TWI638352B (zh) | 可調整輸出聲音之電子裝置及調整輸出聲音之方法 | |
| CN110232915B (zh) | 声音内容控制装置、声音内容控制方法以及存储介质 | |
| CN109326284A (zh) | 语音搜索的方法、装置和存储介质 | |
| WO2019073669A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
| KR20220064868A (ko) | 음성 비서를 통해 광고를 제공하는 전자 장치 및 그 제어 방법 | |
| US10957313B1 (en) | System command processing | |
| US20210241755A1 (en) | Information-processing device and information-processing method | |
| US12267286B1 (en) | Sharing of content | |
| US20250316268A1 (en) | Apparatus and Method and for Correcting Result of Speech Recognition by Using Camera | |
| JP2020184183A (ja) | 情報処理装置、情報処理システム、情報処理装置の制御方法 | |
| US12494200B1 (en) | Natural language interactions using visual understanding | |
| JP2017151931A (ja) | 対話決定システム、対話決定方法、対話決定プログラム、及び端末装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200831 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210628 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210706 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210830 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211214 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211227 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7010073 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |