翻訳(Translate)

設定:音声認識/合成

このページでは右クリックメニューの「設定」サブメニューにある項目「本体設定」で開くダイアログの、「音声認識/合成」ページについて解説しています。

このページではSSPの音声認識・合成機能の設定を行います。

各項目の解説

音声認識

機能→音声認識 メニューをONにして使用してください。

認識エンジン
音声認識エンジンを変更します。(System Default)で音声認識コントロールパネルで選択したものが使用されます。
プロファイル
認識精度を高めるための学習情報を切り替えます。(System Default)で音声認識コントロールパネルで選択したものが使用されます。
認識エンジンの設定・マイクの設定・トレーニング
それぞれ、認識エンジンによっては設定可能になります。通常はすべて無効です。
音声入力元
音声入力元となるマイク端子やヘッドセットなどを切り替えます。(System Default)で音声認識コントロールパネルで選択したものが使用されます。

音声合成

機能→音声合成 メニューをONにして使用してください。

\0(メインキャラクター)
メインキャラクター(\0)の音声を設定します。音声の選択、ピッチの調整、設定ボタンから詳細設定が行えます。
\1(サブキャラクター)
サブキャラクター(\1)の音声を設定します。音声の選択(\0や\2と同じでも可)、ピッチの調整、設定ボタンから詳細設定が行えます。
\2~(その他のキャラクター)
\2以降の追加キャラクターの音声を設定します。音声の選択(\0や\1と同じでも可)、ピッチの調整、設定ボタンから詳細設定が行えます。
音声出力先
音声を出力するスピーカーやイヤホン端子等の出力先を切り替えます。設定ボタンから詳細設定が行えます。
喋る速度
音声合成の読み上げスピードを調整します。スライダーで「遅い」から「速い」まで設定できます。標準位置から調整してください。
音量
音声合成の音量レベルを調整します。スライダーで0%から100%まで設定できます。
音声合成の進行速度に合わせてスクリプトの再生待ちを行う
音声合成の読み上げ速度に合わせて、スクリプトの表示タイミングを同期させます。

音声合成の詳細設定ダイアログ (右側の設定ボタン)

LocalAPI

VOICEVOX,VOICEVOX Nemo,SHAREVOX,AivisSpeech
ボイスIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
COEIROINK v2
ボイスIDとスタイルIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
スタイルIDにはスタイル名(「れいせい」など)を入力してください。IDが分かっている方はIDも通ります。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
Style-BERT-VITS2
ボイスIDとスタイルIDは参照ボタンでキャラクター名を見ながら選択できます。IDが分かっている方はそのまま入力しても構いません。
スタイルIDにはスタイル名を入力してください。IDが分かっている方はIDも通ります。
ホスト名・ポート番号は同じPC内で動かすなら空欄で問題ありません。
Server.bat(server_fastapi.py)を起動してください。

CloudAPI

Aivis Cloud API
ボイスIDには「モデル UUID」をコピーして入力してください。注意!話者UUIDではありません。
スタイルIDはボイスの詳細ページに書いてあります。
ピッチは0が推奨です。それ以外だと合成スピードが落ちるそうです。
APIキーはこちらのダッシュボードから取得できますので、キー欄に貼りつけてください。

下部のボタン

ヘルプ
本体設定ダイアログの、設定中のページのヘルプ(つまりこのページ)を開きます。
ダイアログ右上の「?」マークも同様です。
閉じる
本体設定ダイアログを閉じます。
ダイアログ右上の「×」マークも同様です。