テキスト読み上げ(Text To Speech / TTS)

TTS は、ローカルの音声合成か、NovelAI のストリーミング TTS を使って本文を音声化します。

TTS の種類

TTS Streamed or Local

  • Streamed: NovelAI のリモート TTS。高品質で多機能(トライアルでも一定回数利用可)。
  • Local: ブラウザの音声合成機能を使用。品質や機能は環境依存。

注: 一部ブラウザではストリーミング再生に遅延が出ることがあります。選択時に警告が出たら該当します。

TTS Warning

自動読み上げ

TTS Speech Select

  • Speak Outputs: AI の出力を自動で読み上げ
  • Speak Inputs: 次の出力の直前にある自分の入力(青文字)を読み上げ
  • Speak HypeBot Comments: HypeBot のコメントも読み上げ

複数オンの場合は「入力 → 出力 → コメント」の順に一つの音声で再生されます。右クリックメニューから、本文の任意範囲を オンデマンド で読み上げることも可能です。

TTS right-click menu

を押すとファイル保存、 は即時再生です。

ストリーミング TTS 設定

モデル

v1 と v2 を選べます。v1 はシンプル、v2 は高機能。試すなら v2 を推奨。

で試聴、 で保存。

v1 の設定

TTS v1 Settings

既定の声を選ぶか、seed を入力できます(右のテキスト欄で試聴文を編集)。

TTS v1 Seed

一番下の Custom Seed を選ぶと任意の seed を文字列で指定できます。Randomize でランダム。一般的な名前はピッチやイントネーションに安定した影響があります(例: Maria は女性的な声に)。

Volume / Speed で音量・速度を調整します(音量は既定で最大、速度は保存ファイルには影響しません)。

v2 の設定

TTS v2 Settings

v2 は機能が豊富で、既定の声に加え「自作の声」を保存して再利用できます。さらに seedmix 記法で複数 seed を組み合わせて、Style / Intonation / Cadence を個別にコントロールできます。

Seedmix(シードの合成)

先頭に seedmix: を付け、+ で加算、- で減算する書式です。例:

seedmix:Kayra+Clio-Calliope

TTS v2 seedmix

各声は実際には3要素:

  • Style: 全体のトーン(高低など)。効果は比較的控えめ。
  • Intonation: 声そのものの質感。人物が変わるレベルで最も影響が大きい。
  • Cadence: 発話の抑揚・間。疑問文や感嘆で違いが出やすい。

それぞれを |style: |intonation: |cadence: で個別指定できます。例:

seedmix:|style:Kayra+Clio-Calliope|intonation:Krake+Euterpe-Sigurd|cadence:Genji+Snek

TTS v2 seedmix separated

注意: seedmix は「空白」を含む seed を扱えません。単独 seed でも将来の合成に備え、空白なしを推奨します。

Volume / Speed も利用可能です(v1 と同様の制限)。

Goose Tip: 合成の総和が中和〜マイナスになる組み合わせ(例: seedmix:Goose-Goose)は不自然になります。

ローカル TTS 設定

Local TTS Settings

ローカル再生はシンプルで、Voice の選択・試聴・スライダー調整(ローカル固有の Pitch を含む)のみです。ローカル TTS では音声ファイル保存はできません。