JP6496030B2 - 音声処理装置、音声処理方法及び音声処理プログラム - Google Patents
音声処理装置、音声処理方法及び音声処理プログラム Download PDFInfo
- Publication number
- JP6496030B2 JP6496030B2 JP2017540402A JP2017540402A JP6496030B2 JP 6496030 B2 JP6496030 B2 JP 6496030B2 JP 2017540402 A JP2017540402 A JP 2017540402A JP 2017540402 A JP2017540402 A JP 2017540402A JP 6496030 B2 JP6496030 B2 JP 6496030B2
- Authority
- JP
- Japan
- Prior art keywords
- group delay
- phase
- band
- parameter
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Stereophonic System (AREA)
- Complex Calculations (AREA)
Description
次に、添付図面を参照して、実施形態にかかる第1の音声処理装置、すなわち、音声分析装置について説明する。図1は、実施形態にかかる音声分析装置100の構成例を示すブロック図である。図1に示すように、音声分析装置100は、抽出部(音声フレーム抽出部)101、スペクトルパラメータ算出部102、位相スペクトル算出部103、群遅延スペクトル算出部104、帯域群遅延パラメータ算出部105、帯域群遅延補正パラメータ算出部106を有する。
次に、実施形態にかかる第2の音声処置装置、すなわち、音声合成装置について説明する。図11は、音声合成装置の第1実施形態(音声合成装置1100)を示すブロック図である。図11に示すように、音声合成装置1100は、振幅情報生成部1101、位相情報生成部1102及び音声波形生成部1103を有し、スペクトルパラメータ系列、帯域群遅延パラメータ系列、帯域群遅延補正パラメータ系列及びパラメータ系列の時刻情報を受入れて音声波形(合成音声)を生成する。音声合成装置1100に入力される各パラメータは、音声分析装置100により算出されたものである。
Claims (14)
- 入力音声の各音声フレームに対し、スペクトルパラメータを算出するスペクトルパラメータ算出部と、
前記各音声フレームに対し、第1位相スペクトルを算出する位相スペクトル算出部と、
前記第1位相スペクトルの周波数成分に基づいて、前記第1位相スペクトルから群遅延スペクトルを算出する群遅延スペクトル算出部と、
前記群遅延スペクトルから所定の周波数帯域における帯域群遅延パラメータを算出する帯域群遅延パラメータ算出部と、
前記帯域群遅延パラメータから再構築した第2位相スペクトルと、前記第1位相スペクトルとの差を補正する帯域群遅延補正パラメータを算出する帯域群遅延補正パラメータ算出部と、
を有する音声処理装置。 - 前記帯域群遅延パラメータ算出部は、
所定の周波数帯域における群遅延の平均値、又はスペクトル若しくはパワースペクトルで重み付けした群遅延の平均値を周波数帯域それぞれの帯域群遅延パラメータとして算出し、
前記帯域群遅延補正パラメータ算出部は、
低域から前記帯域群遅延パラメータに基づいて前記第2位相スペクトルを再構築し、前記第2位相スペクトルと、前記位相スペクトル算出部が算出した各周波数帯域の境界周波数における前記第1位相スペクトルとの差を補正する帯域群遅延補正パラメータを算出する
請求項1に記載の音声処理装置。 - 入力音声の各音声フレームに対して算出されたスペクトルパラメータ系列に基づいて、振幅情報を生成する振幅情報生成部と、
前記各音声フレームの位相スペクトルから算出された群遅延スペクトルの所定の周波数帯域における帯域群遅延パラメータ系列、及び前記帯域群遅延パラメータ系列から生成される位相スペクトルを補正する帯域群遅延補正パラメータ系列から位相情報を生成する位相情報生成部と、
各パラメータの時刻情報であるパラメータ系列時刻情報によって定まる各時刻において、前記振幅情報及び前記位相情報から音声波形を生成する音声波形生成部と、
を有する音声処理装置。 - 前記位相情報生成部は、
時間領域の処理のみで位相制御された音源信号を生成する
請求項3に記載の音声処理装置。 - 前記振幅情報生成部は、
各時刻における前記スペクトルパラメータ系列から振幅スペクトルを算出し、
前記位相情報生成部は、
前記帯域群遅延パラメータ系列及び前記帯域群遅延補正パラメータ系列から位相スペクトルを算出し、
前記音声波形生成部は、
前記振幅スペクトル及び前記位相スペクトルに基づいて、各時刻の音声波形を生成し、生成した各時刻の前記音声波形を重畳合成することによって音声波形を生成する
請求項3に記載の音声処理装置。 - 前記振幅情報と、所定の周波数帯域の雑音成分の比率を表す帯域雑音強度パラメータ系列から各周波数の雑音強度とに基づいて雑音成分スペクトルを算出する雑音成分スペクトル算出部と、
前記振幅情報と、前記帯域雑音強度パラメータ系列から各周波数の周期成分スペクトルを算出する周期成分スペクトル算出部と、
前記周期成分スペクトルと、前記帯域群遅延パラメータ系列及び前記帯域群遅延補正パラメータ系列から構築した位相スペクトルから周期成分波形を生成する周期波形生成部と、
前記雑音成分スペクトルと、雑音信号に対応する位相スペクトルから雑音成分波形を生成する雑音成分波形生成部と、
を有し、
前記音声波形生成部は、
前記周期成分波形及び前記雑音成分波形に基づいて、各時刻の音声波形を生成し、生成した各時刻の前記音声波形を重畳合成することによって音声波形を生成する
請求項5に記載の音声処理装置。 - 位相シフトしたパルス信号を帯域分割した位相シフト帯域パルス信号を記憶する記憶部と、
各時刻における音声フレームの位相スペクトルから算出された群遅延スペクトルの所定の周波数帯域における帯域群遅延パラメータから、位相シフト帯域パルス信号の遅延時間を算出する遅延時間算出部と、
前記帯域群遅延パラメータ、及び前記帯域群遅延パラメータから生成される位相情報を補正する帯域群遅延補正パラメータから境界周波数における位相を算出する位相算出部と、
算出された各帯域の位相に基づいて、前記記憶部から対応する位相シフト帯域パルス信号を選択する選択部と、
選択された位相シフト帯域パルス信号を、前記遅延時間に従って遅延させて重畳させることにより、位相シフトされた音源信号を生成する重畳部と、
入力音声の各音声フレームに対して算出されたスペクトルパラメータに対応する声道フィルタを適用し、音声波形を出力する声道フィルタ部と
を有する音声処理装置。 - 前記記憶部は、
位相の主値を所定の段階に量子化した各位相による帯域パルス信号である位相シフト帯域パルス信号を記憶し、
前記選択部は、
前記帯域群遅延パラメータの各周波数帯域において、当該帯域の開始周波数における位相を前記帯域群遅延パラメータ及び前記帯域群遅延補正パラメータから算出し、前記帯域群遅延パラメータから整数化した遅延量を算出して、前記遅延量から群遅延を算出し、前記遅延量から算出した群遅延を傾きとして、前記開始周波数における位相を通る直線の周波数原点における位相値を算出し、算出した位相値の主値に対応する位相シフト帯域パルス信号を選択し、
前記重畳部は、
前記遅延量によって遅延させた位相ソフト帯域パルス信号を重畳する
請求項7に記載の音声処理装置。 - 帯域分割された帯域雑音信号を記憶する帯域雑音信号記憶部
をさらに有し、
前記声道フィルタ部は、
所定の周波数帯域の雑音成分の比率を表す帯域雑音強度パラメータの各帯域の強度に基づいて、前記帯域雑音信号から生成される各帯域の雑音信号、及び前記位相シフト帯域パルス信号を混合した混合音源信号に対し、スペクトルパラメータに対応する声道フィルタを適用する
請求項7に記載の音声処理装置。 - 入力音声の各音声フレームに対して算出されたスペクトルパラメータ、前記各音声フレームの位相スペクトルから算出された群遅延スペクトルの所定の周波数帯域における帯域群遅延パラメータ、及び前記帯域群遅延パラメータから生成される位相スペクトルを補正する帯域群遅延補正パラメータを用いて学習した統計モデルを記憶する統計モデル記憶部と、
任意の入力テキストに対応するコンテキスト情報、及び前記統計モデル記憶部に記憶されている統計モデルに基づいて、入力テキストに対応するスペクトルパラメータ、帯域群遅延パラメータ、及び帯域群遅延補正パラメータを生成するパラメータ生成部と、
前記パラメータ生成部が生成したスペクトルパラメータ、帯域群遅延パラメータ、及び帯域群遅延補正パラメータから波形を生成する波形生成部と、
を有する音声処理装置。 - 入力音声の各音声フレームに対し、スペクトルパラメータを算出する工程と、
前記各音声フレームに対し、第1位相スペクトルを算出する工程と、
前記第1位相スペクトルの周波数成分に基づいて、前記第1位相スペクトルから群遅延スペクトルを算出する工程と、
前記群遅延スペクトルから所定の周波数帯域における帯域群遅延パラメータを算出する工程と、
前記帯域群遅延パラメータから再構築した第2位相スペクトルと、前記第1位相スペクトルとの差を補正する帯域群遅延補正パラメータを算出する工程と、
を含む音声処理方法。 - 入力音声の各音声フレームに対し、スペクトルパラメータを算出するステップと、
前記各音声フレームに対し、第1位相スペクトルを算出するステップと、
前記第1位相スペクトルの周波数成分に基づいて、前記第1位相スペクトルから群遅延スペクトルを算出するステップと、
前記群遅延スペクトルから所定の周波数帯域における帯域群遅延パラメータを算出するステップと、
前記帯域群遅延パラメータから再構築した第2位相スペクトルと、前記第1位相スペクトルとの差を補正する帯域群遅延補正パラメータを算出するステップと、
をコンピュータに実行させるための音声処理プログラム。 - 入力音声の各音声フレームに対して算出されたスペクトルパラメータ系列に基づいて、振幅情報を生成する工程と、
前記各音声フレームの位相スペクトルから算出された群遅延スペクトルの所定の周波数帯域における帯域群遅延パラメータ系列、及び前記帯域群遅延パラメータ系列から生成される位相スペクトルを補正する帯域群遅延補正パラメータ系列から位相情報を生成する工程と、
各パラメータの時刻情報であるパラメータ系列時刻情報によって定まる各時刻において、前記振幅情報及び前記位相情報から音声波形を生成する工程と、
を含む音声処理方法。 - 入力音声の各音声フレームに対して算出されたスペクトルパラメータ系列に基づいて、振幅情報を生成するステップと、
前記各音声フレームの位相スペクトルから算出された群遅延スペクトルの所定の周波数帯域における帯域群遅延パラメータ系列、及び前記帯域群遅延パラメータ系列から生成される位相スペクトルを補正する帯域群遅延補正パラメータ系列から位相情報を生成するステップと、
各パラメータの時刻情報であるパラメータ系列時刻情報によって定まる各時刻において、前記振幅情報及び前記位相情報から音声波形を生成するステップと、
をコンピュータに実行させるための音声処理プログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2015/076361 WO2017046904A1 (ja) | 2015-09-16 | 2015-09-16 | 音声処理装置、音声処理方法及び音声処理プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2017046904A1 JPWO2017046904A1 (ja) | 2018-03-22 |
| JP6496030B2 true JP6496030B2 (ja) | 2019-04-03 |
Family
ID=58288321
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017540402A Active JP6496030B2 (ja) | 2015-09-16 | 2015-09-16 | 音声処理装置、音声処理方法及び音声処理プログラム |
Country Status (4)
| Country | Link |
|---|---|
| US (3) | US10650800B2 (ja) |
| JP (1) | JP6496030B2 (ja) |
| CN (3) | CN114464208B (ja) |
| WO (1) | WO2017046904A1 (ja) |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016200391A1 (en) * | 2015-06-11 | 2016-12-15 | Interactive Intelligence Group, Inc. | System and method for outlier identification to remove poor alignments in speech synthesis |
| CN114464208B (zh) * | 2015-09-16 | 2025-11-14 | 株式会社东芝 | 语音处理装置、语音处理方法以及存储介质 |
| EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
| EP3850870A1 (de) * | 2018-09-12 | 2021-07-21 | ASK Industries GmbH | Verfahren zum betrieb einer kraftfahrzeugseitigen audioausgabeeinrichtung |
| CN109727604B (zh) * | 2018-12-14 | 2023-11-10 | 上海蔚来汽车有限公司 | 用于语音识别前端的频域回声消除方法及计算机储存介质 |
| KR102520240B1 (ko) * | 2019-03-18 | 2023-04-11 | 한국전자통신연구원 | 비음수 행렬 인수분해를 이용하는 데이터 증강 방법 및 장치 |
| JP2020194098A (ja) * | 2019-05-29 | 2020-12-03 | ヤマハ株式会社 | 推定モデル確立方法、推定モデル確立装置、プログラムおよび訓練データ準備方法 |
| CN110415722B (zh) * | 2019-07-25 | 2021-10-08 | 北京得意音通技术有限责任公司 | 语音信号处理方法、存储介质、计算机程序和电子设备 |
| CN110535575B (zh) * | 2019-08-01 | 2021-05-14 | 电子科技大学 | 一种计算并补偿i/q信号线性相位失衡的方法 |
| DE102019220091A1 (de) * | 2019-12-18 | 2021-06-24 | GiaX GmbH | Vorrichtung und verfahren zum erfassen von gruppenlaufzeitinformationen und vorrichtung und verfahren zum senden eines messsignals über ein übertragungsmedium |
| CN111833843B (zh) * | 2020-07-21 | 2022-05-10 | 思必驰科技股份有限公司 | 语音合成方法及系统 |
| CN112634914B (zh) * | 2020-12-15 | 2024-03-29 | 中国科学技术大学 | 基于短时谱一致性的神经网络声码器训练方法 |
| CN112949294B (zh) * | 2021-02-05 | 2022-09-30 | 国家基础地理信息中心 | 湿延迟数据文本的生成方法、装置、设备及存储介质 |
| US12198673B2 (en) * | 2021-11-12 | 2025-01-14 | Lemon Inc. | Differentiable wavetable synthesizer using plurality of machine learning models to reduce computational complexity of audio synthesis |
| CN114358026B (zh) * | 2021-12-23 | 2025-09-23 | 中国科学技术大学 | 语音翻译方法、装置、设备和计算机可读存储介质 |
| CN115295024B (zh) * | 2022-04-11 | 2024-12-27 | 维沃移动通信有限公司 | 信号处理方法、装置、电子设备及介质 |
| CN114678037B (zh) * | 2022-04-13 | 2022-10-25 | 北京远鉴信息技术有限公司 | 一种重叠语音的检测方法、装置、电子设备及存储介质 |
| CN116129934B (zh) * | 2023-02-02 | 2025-09-30 | 北京达佳互联信息技术有限公司 | 音频分析方法、装置、设备及存储介质 |
| CN119785805B (zh) * | 2025-03-10 | 2025-06-13 | 深圳瑞利声学技术股份有限公司 | 基于soc芯片的音频数字信号处理方法及装置 |
Family Cites Families (40)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2170377B (en) * | 1985-01-29 | 1988-12-14 | Plessey Co Plc | Voice synthesis module |
| US5701390A (en) | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
| CN1204924A (zh) * | 1997-04-04 | 1999-01-13 | 哈里公司 | 对数字数据流编码的格形编码器 |
| JPH11219200A (ja) * | 1998-01-30 | 1999-08-10 | Sony Corp | 遅延検出装置及び方法、並びに音声符号化装置及び方法 |
| AU6900900A (en) * | 1999-08-11 | 2001-03-05 | Pacific Microsonics, Inc. | Compensation system and method for sound reproduction |
| NL1013500C2 (nl) * | 1999-11-05 | 2001-05-08 | Huq Speech Technologies B V | Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving. |
| EP1104101A3 (en) * | 1999-11-26 | 2005-02-02 | Matsushita Electric Industrial Co., Ltd. | Digital signal sub-band separating / combining apparatus achieving band-separation and band-combining filtering processing with reduced amount of group delay |
| JP4166405B2 (ja) * | 2000-03-06 | 2008-10-15 | 独立行政法人科学技術振興機構 | 駆動信号分析装置 |
| JP2002268660A (ja) * | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
| JP2003044098A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
| JP2005184040A (ja) * | 2003-12-15 | 2005-07-07 | Sony Corp | 音声信号処理装置及び音声信号再生システム |
| LV13342B (en) * | 2005-05-18 | 2005-10-20 | Real Sound Lab Sia | Method and device for correction of acoustic parameters of electro-acoustic transducers |
| FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
| US7548593B2 (en) * | 2005-09-15 | 2009-06-16 | Qualcomm Incorporated | Baseband compensation of an offset phase locked loop |
| JP4241736B2 (ja) * | 2006-01-19 | 2009-03-18 | 株式会社東芝 | 音声処理装置及びその方法 |
| JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
| JP4406440B2 (ja) * | 2007-03-29 | 2010-01-27 | 株式会社東芝 | 音声合成装置、音声合成方法及びプログラム |
| CN101589430B (zh) * | 2007-08-10 | 2012-07-18 | 松下电器产业株式会社 | 声音分离装置、声音合成装置及音质变换装置 |
| JP5159279B2 (ja) * | 2007-12-03 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそれを用いた音声合成装置。 |
| DE112008003305B4 (de) * | 2008-01-31 | 2015-02-19 | Mitsubishi Electric Corp. | Bandaufteilungs-Zeitausgleich-Signalverarbeitungs-Vorrichtung |
| JP5038995B2 (ja) | 2008-08-25 | 2012-10-03 | 株式会社東芝 | 声質変換装置及び方法、音声合成装置及び方法 |
| JP4516157B2 (ja) * | 2008-09-16 | 2010-08-04 | パナソニック株式会社 | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム |
| US8626809B2 (en) * | 2009-02-24 | 2014-01-07 | Samsung Electronics Co., Ltd | Method and apparatus for digital up-down conversion using infinite impulse response filter |
| US9031834B2 (en) | 2009-09-04 | 2015-05-12 | Nuance Communications, Inc. | Speech enhancement techniques on the power spectrum |
| CN101854154B (zh) * | 2010-06-22 | 2012-07-04 | 长沙理工大学 | 数字直流陷波器设计方法 |
| BE1019445A3 (fr) * | 2010-08-11 | 2012-07-03 | Reza Yves | Procede d'extraction d'information audio. |
| JP5085700B2 (ja) * | 2010-08-30 | 2012-11-28 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
| WO2012109227A2 (en) * | 2011-02-07 | 2012-08-16 | Rf Micro Devices, Inc. | Group delay calibration method for power amplifier envelope tracking |
| JP5926490B2 (ja) * | 2011-02-10 | 2016-05-25 | キヤノン株式会社 | 音声処理装置 |
| US8891699B2 (en) * | 2011-03-25 | 2014-11-18 | Broadcom Corporation | Characterization and assessment of communication channel average group delay variation |
| JP6011039B2 (ja) | 2011-06-07 | 2016-10-19 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
| JP5717097B2 (ja) * | 2011-09-07 | 2015-05-13 | 独立行政法人情報通信研究機構 | 音声合成用の隠れマルコフモデル学習装置及び音声合成装置 |
| JP2013057895A (ja) * | 2011-09-09 | 2013-03-28 | Research Organization Of Information & Systems | 音声再生装置、音声再生方法及びコンピュータプログラム |
| JP2013164572A (ja) | 2012-01-10 | 2013-08-22 | Toshiba Corp | 音声特徴量抽出装置、音声特徴量抽出方法及び音声特徴量抽出プログラム |
| JP5898534B2 (ja) * | 2012-03-12 | 2016-04-06 | クラリオン株式会社 | 音響信号処理装置および音響信号処理方法 |
| JP5631915B2 (ja) * | 2012-03-29 | 2014-11-26 | 株式会社東芝 | 音声合成装置、音声合成方法、音声合成プログラムならびに学習装置 |
| WO2014021318A1 (ja) * | 2012-08-01 | 2014-02-06 | 独立行政法人産業技術総合研究所 | 音声分析合成のためのスペクトル包絡及び群遅延の推定システム及び音声信号の合成システム |
| US8744854B1 (en) | 2012-09-24 | 2014-06-03 | Chengjun Julian Chen | System and method for voice transformation |
| JP6347536B2 (ja) * | 2014-02-27 | 2018-06-27 | 学校法人 名城大学 | 音合成方法及び音合成装置 |
| CN114464208B (zh) * | 2015-09-16 | 2025-11-14 | 株式会社东芝 | 语音处理装置、语音处理方法以及存储介质 |
-
2015
- 2015-09-16 CN CN202210141126.5A patent/CN114464208B/zh active Active
- 2015-09-16 CN CN202210403587.5A patent/CN114694632B/zh active Active
- 2015-09-16 CN CN201580082452.1A patent/CN107924686B/zh active Active
- 2015-09-16 WO PCT/JP2015/076361 patent/WO2017046904A1/ja not_active Ceased
- 2015-09-16 JP JP2017540402A patent/JP6496030B2/ja active Active
-
2018
- 2018-02-16 US US15/898,337 patent/US10650800B2/en active Active
-
2020
- 2020-04-07 US US16/841,839 patent/US11348569B2/en active Active
- 2020-04-07 US US16/841,833 patent/US11170756B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US20200234692A1 (en) | 2020-07-23 |
| JPWO2017046904A1 (ja) | 2018-03-22 |
| CN114464208A (zh) | 2022-05-10 |
| CN114464208B (zh) | 2025-11-14 |
| CN114694632B (zh) | 2025-08-19 |
| CN114694632A (zh) | 2022-07-01 |
| WO2017046904A1 (ja) | 2017-03-23 |
| CN107924686A (zh) | 2018-04-17 |
| US11170756B2 (en) | 2021-11-09 |
| US10650800B2 (en) | 2020-05-12 |
| US20180174571A1 (en) | 2018-06-21 |
| US20200234691A1 (en) | 2020-07-23 |
| CN107924686B (zh) | 2022-07-26 |
| US11348569B2 (en) | 2022-05-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6496030B2 (ja) | 音声処理装置、音声処理方法及び音声処理プログラム | |
| US11423874B2 (en) | Speech synthesis statistical model training device, speech synthesis statistical model training method, and computer program product | |
| JP5038995B2 (ja) | 声質変換装置及び方法、音声合成装置及び方法 | |
| US9058807B2 (en) | Speech synthesizer, speech synthesis method and computer program product | |
| JP5958866B2 (ja) | 音声分析合成のためのスペクトル包絡及び群遅延の推定システム及び音声信号の合成システム | |
| Toda et al. | Statistical mapping between articulatory movements and acoustic spectrum using a Gaussian mixture model | |
| US10529314B2 (en) | Speech synthesizer, and speech synthesis method and computer program product utilizing multiple-acoustic feature parameters selection | |
| US9343060B2 (en) | Voice processing using conversion function based on respective statistics of a first and a second probability distribution | |
| Yu et al. | Probablistic modelling of F0 in unvoiced regions in HMM based speech synthesis | |
| Espic Calderón | In search of the optimal acoustic features for statistical parametric speech synthesis |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171207 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190205 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190307 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6496030 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |