Text-to-Speech の料金は、音声への合成のためにサービスに送信された文字数に基づいて、月単位で請求されます。Text-to-Speech を使用するには課金を有効にする必要があります。使用量が 1 か月間に無料で使用できる文字数を超えると、自動的に課金されます。合計文字数を追跡する方法については、API 使用状況のモニタリングをご覧ください。料金は文字ごとに計算されます。
入力文字列の合計文字数は、課金を目的としてカウントされます。これにはスペースと改行文字も含まれます。すべての音声合成マークアップ言語(SSML)タグ(<mark> タグを除く)も文字数に含まれます。
テキストベースのプロンプトを使用して生成音声を細かく制御できる、Google の Text-to-Speech テクノロジーの最新の進化形。
| モデル | 無料使用量上限 | 無料の使用量上限に到達した場合の料金 | 
|---|---|---|
| Gemini 2.5 Flash TTS | 利用不可 | 入力トークン: テキスト トークン 100 万個あたり $0.50 (sku: 242A-EA16-C1EC) 出力トークン: 音声トークン 100 万個あたり $10.00* (sku: 9228-79EF-B162) | 
| Gemini 2.5 Pro TTS | 利用不可 | 入力トークン: テキスト トークン 100 万個あたり $1.00 (sku: 8FF1-7E5B-5BB7) 出力トークン: 音声トークン 100 万個あたり $20.00* (sku: DCF3-CB17-8262) | 
* 音声トークンは、音声 1 秒あたり 25 トークンに相当します
最先端の LLM によって生成される Google の最新の TTS モデルは、あらゆるユースケースで他に類を見ないほどのリアリティと感情的な響きをすぐに実現します。
| モデル | 無料使用量上限 | 無料の使用量上限に到達した場合の料金 | 
|---|---|---|
| Chirp 3: HD 音声 (sku:F977-2280-6F1B) | 0〜100 万文字 | 1 文字あたり 0.00003 米ドル(100 万文字あたり 30 米ドル) | 
| (sku:A247-37D7-C094) | 利用できません | 1 文字あたり 0.00006 米ドル(100 万文字あたり 60 米ドル) | 
| モデル | 無料使用量上限 | 無料の使用量上限に到達した場合の料金 | 
|---|---|---|
| WaveNet 音声 (sku:9D01-5995-B545) | 0〜400 万文字 | 1 文字あたり 0.000004 米ドル(100 万文字あたり 4 米ドル) | 
| スタジオ音声 (sku:84AB-48C0-F9C3) | 0〜100 万文字 | 1 文字あたり 0.00016 米ドル(100 万文字あたり 160 米ドル) | 
| 標準音声 (sku:9D01-5995-B545) | 0〜400 万文字 | 1 文字あたり 0.000004 米ドル(100 万文字あたり 4 米ドル) | 
| Neural2 音声 (sku:FEBD-04B6-769B) | 0〜100 万文字 | 1 文字あたり 0.000016 米ドル(100 万文字あたり 16 米ドル) | 
| (sku:FEBD-04B6-769B) | 0〜100 万文字 | 1 文字あたり 0.000016 米ドル(100 万文字あたり 16 米ドル) | 
注: WaveNet と標準の音声の場合、文字数はテキストで表されるバイト数以下になります。これには英数字、句読点、空白文字が含まれます。一部の文字セットでは、1 文字を表すのに複数バイトが使用されます。たとえば UTF-8 の日本語文字(ja-JP)の場合、通常、1 文字に必要なバイト数は 1 バイトを上回ります。この場合、複数バイトではなく 1 文字に対してのみ課金されます。
他の Google Cloud リソース(Google App Engine インスタンスなど)を Text-to-Speech と併用する場合は、そのサービスの利用料も請求の対象となります。現在の料金に基づいてその他の費用を試算するには、Google Cloud の料金計算ツールをご利用ください。