JP7197259B2 - 情報処理方法、情報処理装置およびプログラム - Google Patents
情報処理方法、情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP7197259B2 JP7197259B2 JP2017162841A JP2017162841A JP7197259B2 JP 7197259 B2 JP7197259 B2 JP 7197259B2 JP 2017162841 A JP2017162841 A JP 2017162841A JP 2017162841 A JP2017162841 A JP 2017162841A JP 7197259 B2 JP7197259 B2 JP 7197259B2
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- utterance
- language
- translation
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- Machine Translation (AREA)
Description
<概要>
図1は、実施の形態1における翻訳装置の外観の一例を示す図である。
図4は、本実施の形態における翻訳装置100の構成を示すブロック図である。
図5は、本実施の形態における翻訳装置100の全体的な処理動作を示すフローチャートである。
図7は、実施の形態1の変形例1における翻訳装置の構成を示すブロック図である。
図9は、実施の形態1の変形例2における翻訳装置の構成を示すブロック図である。
本変形例における翻訳装置は、変形例2における翻訳装置100bと同様の構成を有するが、翻訳の言語が誤っていると判定したときには、逆翻訳を行うとともに、発話に対して認識された話者と異なる話者に対応するモデルを、その発話を用いて生成または更新する。
図12は、実施の形態1の変形例4における翻訳装置の構成を示すブロック図である。
図14は、実施の形態1の変形例5における翻訳装置の構成を示すブロック図である。
図16は、実施の形態1の変形例6における翻訳装置の構成を示すブロック図である。
本実施の形態における翻訳装置は、実施の形態1のように会話開始前に第1話者モデル111aを生成することなく、会話開始後に第1話者モデル111aおよび第2話者モデル111bを生成する。そのため、本実施の形態における翻訳装置では、会話開始前に、第1話者と第2話者のうち、会話において最初に発話する話者を設定しておく。
以上、一つまたは複数の態様に係る翻訳装置について、各実施の形態および各変形例に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を上記各実施の形態および変形例に施したものや、異なる実施の形態または変形例における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれてもよい。
101 収音部
102 言語設定部
103 特徴量抽出部
104 話者認識部
105 言語決定部
106 音声認識部
107 翻訳部
108 音声合成部
109 再生部
110 表示部
111 モデル格納部
111a 第1話者モデル
111b 第2話者モデル
112 モデル更新部
113 誤り判定部
114 発話長判定部
115 雑音判定部
116 発話順設定部
S1100 設定処理
S1200 会話開始処理
S1300 モデル生成翻訳処理
S1400 翻訳処理
Claims (10)
- 第1言語で発話する第1話者と、第2言語で発話する第2話者との間の会話をコンピュータが翻訳する情報処理方法であって、
前記第1話者の言語および前記第2話者の言語として設定された前記第1言語および前記第2言語を示す言語設定情報を生成し、
ユーザによる操作に応じて、前記会話において最初に発話する話者として設定された前記第1話者を示す発話順情報を生成し、
会話開始の操作を受け付け、
前記操作の受け付け後の最初の発話である第1発話を取得し、
前記発話順情報に基づいて、取得された前記第1発話の話者が前記第1話者であると判定し、取得された前記第1発話から、前記第1話者の発話の特徴量のモデルである第1話者モデルを生成し、
前記言語設定情報および前記発話順情報に基づいて、取得された前記第1発話を前記第1言語から前記第2言語に翻訳し、
第2発話を取得し、
取得された前記第2発話の特徴量と前記第1話者モデルとを比較することによって、取得された前記第2発話の話者が前記第1話者であるか否かを認識し、
前記第1話者であると認識された場合には、前記言語設定情報に基づいて、取得された前記第2発話を前記第1言語から前記第2言語に翻訳し、
前記第1話者でないと認識された場合には、前記言語設定情報に基づいて、取得された前記第2発話を前記第2言語から前記第1言語に翻訳する
情報処理方法。 - 前記情報処理方法は、さらに、
前記第2発話が前記第1言語から前記第2言語に翻訳される場合には、
前記第1話者モデルを、前記第2発話を用いて更新する
請求項1に記載の情報処理方法。 - 前記情報処理方法は、さらに、
前記第2発話が前記第1言語から前記第2言語に翻訳される場合には、
前記第2発話の翻訳の言語が誤っているか否かを判定し、
前記第2発話の翻訳の言語が誤っていないと判定されたときに、前記第1話者モデルを、前記第2発話を用いて更新する
請求項1に記載の情報処理方法。 - 前記情報処理方法は、さらに、
前記第2発話の翻訳の言語が誤っていると判定されたときには、
前記第2発話の翻訳における翻訳元の言語と翻訳先の言語とが入れ換えられた逆翻訳を実行し、
取得された前記第2発話から、前記第2話者の発話の特徴量のモデルである第2話者モデルを生成する
請求項3に記載の情報処理方法。 - 前記第1発話の取得または前記第2発話の取得では、
前記第1話者または前記第2話者の発話の時間長が閾値以上か否かを判定し、前記閾値以上と判定された時間長の発話を、前記第1発話または前記第2発話として取得する
請求項1に記載の情報処理方法。 - 前記第1発話の取得または前記第2発話の取得では、
前記第1話者または前記第2話者の周囲の音が発話か否かを判定し、発話であると判定された前記音を、前記第1発話または前記第2発話として取得する
請求項1に記載の情報処理方法。 - 前記情報処理方法は、さらに、
前記第2発話の話者が前記第1話者でないと認識された場合には、
取得された前記第2発話から、前記第2話者の発話の特徴量のモデルである第2話者モデルを生成し、
第3発話を取得し、
取得された前記第3発話の特徴量と、前記第1話者モデルおよび前記第2話者モデルのそれぞれとを比較することによって、取得された前記第3発話の話者が前記第1話者であるか、前記第2話者であるかを認識し、
前記第1話者であると認識された場合には、前記言語設定情報に基づいて、取得された前記第3発話を前記第1言語から前記第2言語に翻訳し、
前記第2話者であると認識された場合には、前記言語設定情報に基づいて、取得された前記第3発話を前記第2言語から前記第1言語に翻訳する
請求項1に記載の情報処理方法。 - 前記情報処理方法は、さらに、
前記第3発話の特徴量と、前記第1話者モデルおよび前記第2話者モデルのそれぞれとを比較することによって、前記第3発話の話者が前記第1話者および前記第2話者の何れでもないと認識した場合には、
前記第3発話を棄却することによって、前記第3発話の翻訳を行わない
請求項7に記載の情報処理方法。 - 第1言語で発話する第1話者と、第2言語で発話する第2話者との間の会話を翻訳する情報処理装置であって、
処理回路と、
前記処理回路に接続された記録媒体とを備え、
前記処理回路は、前記記録媒体を用いて、
前記第1話者の言語および前記第2話者の言語として設定された前記第1言語および前
記第2言語を示す言語設定情報を生成し、
ユーザによる操作に応じて、前記会話において最初に発話する話者として設定された前記第1話者を示す発話順情報を生成し、
会話開始の操作を受け付け、
前記操作の受け付け後の最初の発話である第1発話を音声信号として取得し、
前記発話順情報に基づいて、取得された前記第1発話の話者が前記第1話者であると判定し、取得された前記第1発話から、前記第1話者の発話の特徴量のモデルである第1話者モデルを生成し、
前記言語設定情報および前記発話順情報に基づいて、取得された前記第1発話を前記第1言語から前記第2言語に翻訳し、
第2発話を音声信号として取得し、
取得された前記第2発話の特徴量と前記第1話者モデルとを比較することによって、取得された前記第2発話の話者が前記第1話者であるか否かを認識し、
前記第1話者であると認識された場合には、前記言語設定情報に基づいて、取得された前記第2発話を前記第1言語から前記第2言語に翻訳し、
前記第1話者でないと認識された場合には、前記言語設定情報に基づいて、取得された前記第2発話を前記第2言語から前記第1言語に翻訳する、
情報処理装置。 - 第1言語で発話する第1話者と、第2言語で発話する第2話者との間の会話を翻訳するためのプログラムであって、
前記第1話者の言語および前記第2話者の言語として設定された前記第1言語および前記第2言語を示す言語設定情報を生成し、
ユーザによる操作に応じて、前記会話において最初に発話する話者として設定された前記第1話者を示す発話順情報を生成し、
会話開始の操作を受け付け、
前記操作の受け付け後の最初の発話である第1発話を音声信号として取得し、
前記発話順情報に基づいて、取得された前記第1発話の話者が前記第1話者であると判定し、取得された前記第1発話から、前記第1話者の発話の特徴
量のモデルである第1話者モデルを生成し、
前記言語設定情報および前記発話順情報に基づいて、取得された前記第1発話を前記第1言語から前記第2言語に翻訳し、
第2発話を音声信号として取得し、
取得された前記第2発話の特徴量と前記第1話者モデルとを比較することによって、取得された前記第2発話の話者が前記第1話者であるか否かを認識し、
前記第1話者であると認識された場合には、前記言語設定情報に基づいて、取得された前記第2発話を前記第1言語から前記第2言語に翻訳し、
前記第1話者でないと認識された場合には、前記言語設定情報に基づいて、取得された前記第2発話を前記第2言語から前記第1言語に翻訳する、
ことをコンピュータに実行させるプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017162841A JP7197259B2 (ja) | 2017-08-25 | 2017-08-25 | 情報処理方法、情報処理装置およびプログラム |
| US16/058,271 US10664667B2 (en) | 2017-08-25 | 2018-08-08 | Information processing method, information processing device, and recording medium having program recorded thereon |
| CN201810953465.7A CN109426669B (zh) | 2017-08-25 | 2018-08-21 | 信息处理方法、信息处理装置以及记录有程序的记录介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017162841A JP7197259B2 (ja) | 2017-08-25 | 2017-08-25 | 情報処理方法、情報処理装置およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019040106A JP2019040106A (ja) | 2019-03-14 |
| JP7197259B2 true JP7197259B2 (ja) | 2022-12-27 |
Family
ID=65437256
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017162841A Active JP7197259B2 (ja) | 2017-08-25 | 2017-08-25 | 情報処理方法、情報処理装置およびプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US10664667B2 (ja) |
| JP (1) | JP7197259B2 (ja) |
| CN (1) | CN109426669B (ja) |
Families Citing this family (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019002831A1 (en) | 2017-06-27 | 2019-01-03 | Cirrus Logic International Semiconductor Limited | REPRODUCTIVE ATTACK DETECTION |
| GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
| GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
| GB201801532D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for audio playback |
| GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
| GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
| GB201801528D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
| GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
| GB201801663D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
| GB2567503A (en) | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
| GB201801661D0 (en) * | 2017-10-13 | 2018-03-21 | Cirrus Logic International Uk Ltd | Detection of liveness |
| GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
| GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
| GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
| US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
| US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
| US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
| US10692490B2 (en) | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
| US10915614B2 (en) | 2018-08-31 | 2021-02-09 | Cirrus Logic, Inc. | Biometric authentication |
| US11037574B2 (en) | 2018-09-05 | 2021-06-15 | Cirrus Logic, Inc. | Speaker recognition and speaker change detection |
| US11100926B2 (en) * | 2018-09-27 | 2021-08-24 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
| US11087754B2 (en) | 2018-09-27 | 2021-08-10 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
| CN108986793A (zh) * | 2018-09-28 | 2018-12-11 | 北京百度网讯科技有限公司 | 翻译处理方法、装置及设备 |
| CN109558597B (zh) * | 2018-12-17 | 2022-05-24 | 北京百度网讯科技有限公司 | 文本翻译方法及装置、设备及存储介质 |
| US11159597B2 (en) * | 2019-02-01 | 2021-10-26 | Vidubly Ltd | Systems and methods for artificial dubbing |
| US11202131B2 (en) | 2019-03-10 | 2021-12-14 | Vidubly Ltd | Maintaining original volume changes of a character in revoiced media stream |
| JP7429107B2 (ja) * | 2019-03-25 | 2024-02-07 | パナソニックホールディングス株式会社 | 音声翻訳装置、音声翻訳方法及びそのプログラム |
| JP7266448B2 (ja) * | 2019-04-12 | 2023-04-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 話者認識方法、話者認識装置、及び話者認識プログラム |
| JP7327475B2 (ja) * | 2019-05-30 | 2023-08-16 | 日本電信電話株式会社 | 表示情報生成装置、表示情報生成方法及び表示情報生成プログラム |
| JP7650132B2 (ja) * | 2019-08-23 | 2025-03-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 学習方法、話者識別方法、及び、プログラム |
| CN113014986A (zh) * | 2020-04-30 | 2021-06-22 | 北京字节跳动网络技术有限公司 | 互动信息处理方法、装置、设备及介质 |
| US12282755B2 (en) | 2022-09-10 | 2025-04-22 | Nikolas Louis Ciminelli | Generation of user interfaces from free text |
| US12380736B2 (en) | 2023-08-29 | 2025-08-05 | Ben Avi Ingel | Generating and operating personalized artificial entities |
| WO2025224928A1 (ja) * | 2024-04-25 | 2025-10-30 | Ntt株式会社 | 音声認識推定装置、音声認識システム、音声認識推定方法、音声認識モデル学習装置、音声認識モデル学習方法、およびプログラム |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007264473A (ja) | 2006-03-29 | 2007-10-11 | Toshiba Corp | 音声処理装置、音声処理方法および音声処理プログラム |
| JP2009139390A (ja) | 2007-12-03 | 2009-06-25 | Nec Corp | 情報処理システム、処理方法及びプログラム |
| JP2011248002A (ja) | 2010-05-25 | 2011-12-08 | Fujitsu Toshiba Mobile Communications Ltd | 翻訳装置 |
| JP2014123072A (ja) | 2012-12-21 | 2014-07-03 | Nec Corp | 音声合成システム及び音声合成方法 |
Family Cites Families (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62109099A (ja) * | 1985-11-08 | 1987-05-20 | 沖電気工業株式会社 | 音声区間検出方式 |
| JP3034773B2 (ja) * | 1994-12-27 | 2000-04-17 | シャープ株式会社 | 電子通訳機 |
| US6292769B1 (en) * | 1995-02-14 | 2001-09-18 | America Online, Inc. | System for automated translation of speech |
| US20020032564A1 (en) * | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
| US6687671B2 (en) * | 2001-03-13 | 2004-02-03 | Sony Corporation | Method and apparatus for automatic collection and summarization of meeting information |
| US7668718B2 (en) * | 2001-07-17 | 2010-02-23 | Custom Speech Usa, Inc. | Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile |
| AUPR956901A0 (en) * | 2001-12-17 | 2002-01-24 | Jayaratne, Neville | Real time translator |
| US7457745B2 (en) * | 2002-12-03 | 2008-11-25 | Hrl Laboratories, Llc | Method and apparatus for fast on-line automatic speaker/environment adaptation for speech/speaker recognition in the presence of changing environments |
| US7593842B2 (en) * | 2002-12-10 | 2009-09-22 | Leslie Rousseau | Device and method for translating language |
| US20070016401A1 (en) * | 2004-08-12 | 2007-01-18 | Farzad Ehsani | Speech-to-speech translation system with user-modifiable paraphrasing grammars |
| US8265933B2 (en) * | 2005-12-22 | 2012-09-11 | Nuance Communications, Inc. | Speech recognition system for providing voice recognition services using a conversational language model |
| US20070255570A1 (en) * | 2006-04-26 | 2007-11-01 | Annaz Fawaz Y | Multi-platform visual pronunciation dictionary |
| US9128926B2 (en) * | 2006-10-26 | 2015-09-08 | Facebook, Inc. | Simultaneous translation of open domain lectures and speeches |
| US8364485B2 (en) * | 2007-08-27 | 2013-01-29 | International Business Machines Corporation | Method for automatically identifying sentence boundaries in noisy conversational data |
| US7953590B2 (en) * | 2007-10-02 | 2011-05-31 | International Business Machines Corporation | Using separate recording channels for speech-to-speech translation systems |
| EP2485212A4 (en) * | 2009-10-02 | 2016-12-07 | Nat Inst Inf & Comm Tech | LANGUAGE TRANSLATION SYSTEM, FIRST END DEVICE, VOICE RECOGNITION SERVER, TRANSLATION SERVER AND LANGUAGE SYNTHESIS SERV |
| US8279861B2 (en) * | 2009-12-08 | 2012-10-02 | International Business Machines Corporation | Real-time VoIP communications using n-Way selective language processing |
| US20120330645A1 (en) * | 2011-05-20 | 2012-12-27 | Belisle Enrique D | Multilingual Bluetooth Headset |
| US20130030789A1 (en) * | 2011-07-29 | 2013-01-31 | Reginald Dalce | Universal Language Translator |
| US9053096B2 (en) * | 2011-12-01 | 2015-06-09 | Elwha Llc | Language translation based on speaker-related information |
| US9245254B2 (en) * | 2011-12-01 | 2016-01-26 | Elwha Llc | Enhanced voice conferencing with history, language translation and identification |
| US20130144619A1 (en) * | 2011-12-01 | 2013-06-06 | Richard T. Lord | Enhanced voice conferencing |
| US9257115B2 (en) * | 2012-03-08 | 2016-02-09 | Facebook, Inc. | Device for extracting information from a dialog |
| JP6289448B2 (ja) * | 2012-04-25 | 2018-03-07 | コピン コーポレーション | 即時翻訳システム |
| JP6098072B2 (ja) | 2012-08-31 | 2017-03-22 | 日本電気株式会社 | 音声認識装置、音声認識方法及びプログラム |
| US9600474B2 (en) * | 2013-11-08 | 2017-03-21 | Google Inc. | User interface for realtime language translation |
| JP6148163B2 (ja) * | 2013-11-29 | 2017-06-14 | 本田技研工業株式会社 | 会話支援装置、会話支援装置の制御方法、及び会話支援装置のプログラム |
| KR20150085145A (ko) * | 2014-01-13 | 2015-07-23 | 한국전자통신연구원 | 사용자 반응 기반 통역 시스템 및 그 방법 |
| JP2015153108A (ja) * | 2014-02-13 | 2015-08-24 | 株式会社東芝 | 音声会話支援装置、及び音声会話支援方法及びプログラム |
| JP6334354B2 (ja) * | 2014-09-30 | 2018-05-30 | 株式会社東芝 | 機械翻訳装置、方法およびプログラム |
| JP6303971B2 (ja) | 2014-10-17 | 2018-04-04 | 富士通株式会社 | 話者交替検出装置、話者交替検出方法及び話者交替検出用コンピュータプログラム |
| CN105512113B (zh) * | 2015-12-04 | 2019-03-19 | 青岛冠义科技有限公司 | 交流式语音翻译系统及翻译方法 |
| JP2017120616A (ja) * | 2015-12-25 | 2017-07-06 | パナソニックIpマネジメント株式会社 | 機械翻訳方法、及び、機械翻訳システム |
| US20170235724A1 (en) * | 2016-02-11 | 2017-08-17 | Emily Grewal | Systems and methods for generating personalized language models and translation using the same |
-
2017
- 2017-08-25 JP JP2017162841A patent/JP7197259B2/ja active Active
-
2018
- 2018-08-08 US US16/058,271 patent/US10664667B2/en active Active
- 2018-08-21 CN CN201810953465.7A patent/CN109426669B/zh active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007264473A (ja) | 2006-03-29 | 2007-10-11 | Toshiba Corp | 音声処理装置、音声処理方法および音声処理プログラム |
| JP2009139390A (ja) | 2007-12-03 | 2009-06-25 | Nec Corp | 情報処理システム、処理方法及びプログラム |
| JP2011248002A (ja) | 2010-05-25 | 2011-12-08 | Fujitsu Toshiba Mobile Communications Ltd | 翻訳装置 |
| JP2014123072A (ja) | 2012-12-21 | 2014-07-03 | Nec Corp | 音声合成システム及び音声合成方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN109426669A (zh) | 2019-03-05 |
| US10664667B2 (en) | 2020-05-26 |
| CN109426669B (zh) | 2023-03-24 |
| JP2019040106A (ja) | 2019-03-14 |
| US20190065478A1 (en) | 2019-02-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7197259B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
| JP4478939B2 (ja) | 音声処理装置およびそのためのコンピュータプログラム | |
| US8560326B2 (en) | Voice prompts for use in speech-to-speech translation system | |
| CN108242238B (zh) | 一种音频文件生成方法及装置、终端设备 | |
| JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
| JP5731998B2 (ja) | 対話支援装置、対話支援方法および対話支援プログラム | |
| WO2005069171A1 (ja) | 文書対応付け装置、および文書対応付け方法 | |
| JP2009047920A (ja) | ユーザと音声により対話する装置および方法 | |
| CN101636732A (zh) | 用于语言独立语音索引和搜索的方法和装置 | |
| JP2016502157A (ja) | 単語自動翻訳に基づく唇形状変更装置および方法 | |
| KR102208387B1 (ko) | 음성 대화 재구성 방법 및 장치 | |
| WO2004066271A1 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
| EP2947658A1 (en) | Memory control device, playback control device, and recording medium | |
| CN110992984A (zh) | 音频处理方法及装置、存储介质 | |
| JP2016109784A (ja) | 情報処理装置、情報処理方法、対話システム、および制御プログラム | |
| US8060368B2 (en) | Speech recognition apparatus | |
| JP2001272990A (ja) | 対話記録編集装置 | |
| JP2010128766A (ja) | 情報処理装置、情報処理方法、プログラム及び記憶媒体 | |
| JP6044490B2 (ja) | 情報処理装置、話速データ生成方法、及びプログラム | |
| US20250273203A1 (en) | Information processing device, information processing method, and computer program | |
| US11632345B1 (en) | Message management for communal account | |
| CN114467141A (zh) | 语音处理方法、装置、设备以及存储介质 | |
| JP2015200913A (ja) | 話者分類装置、話者分類方法および話者分類プログラム | |
| KR102471678B1 (ko) | 음향 신호를 사용자 인터페이스에 시각적으로 표시하는 사용자 인터페이싱 방법 및 장치 | |
| JP4235635B2 (ja) | データ検索装置及びその制御方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200728 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210824 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211208 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220726 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221129 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221215 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7197259 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |