











仕事でYouTubeやInstagram, TwitterなどのSNSに動画を投稿しなくてはならない人も結構増えています。
そんなときの悩みが、「解説などのナレーション音声を入れなきゃいけない」けど、ナレーションを頼むような予算がないことではないでしょうか?
1万円程度から音声合成ツールもありますが、個人用途には使えても商用利用には別途ライセンスが必要と分かって、がっかりした経験はありませんか? そして結局、テレワーク用のヘッドセットで録音し、ノイズだらけの音で社内からの評判もイマイチ……なんてこともありますよね。
そんな中、無料で、商用利用も可能なAI 音声合成ソフト VOICEVOX(ボイスボックス)が公開されました。
今回は、ダウンロードから簡単に使う方法・使ってみた上でのTIPSなどをご紹介します。
- 仕事、趣味を問わず、無料で高品質なナレーションを入れた動画を作ってみたい人
- 動画にかぎらず、音声案内を無料で作ってみたい人
- ニコニコ動画などで合成音声を利用した動画を作成していた。
- 中小企業診断士(登録予定)者として業務支援のために活動。
- 元専業エンジニア、現在も半エンジニアとして最新技術、AI技術の導入支援、指導を行っている。
無料で動画に音声を入れられるAI音声合成ツール「VOICEVOX」を使って見た
VOICEVOX の特徴
2021年8月現在、添付されている音声ライブラリ2種については、Voice:ずんだもん、Voice:四国めたん のようにクレジット記入すれば無料で使用できます。
ライブラリ:ずんだもん については可愛らしいアニメ声で堅い感じの商用利用は少し難しいように思える声質です。
ライブラリ:四国めたん については、落ち着いた音声で、こちらは商用動画のナレーションなどに向いているように思えます。
また、VOICEVOX で使われているこれらのキャラクターは、東日本大震災の東北復興支援を目指して作られたキャラクターおよびプロジェクトの「東北ずん子」のリソースを用いて開発されています。
とくに、最近ではAI(ディープラーニング)の発展のために、クラウドファンディングを通じて積極的にコミュニティにリソースを提供しており、VOICEVOXでもそれらが用いられているようです。
- 商用・非商用問わず無料(音声ライブラリごとにライセンス条件あり)
- ディープラーニング(AI)技術を使った音声合成ソフト
- 入力したテキストを音声に変換してくれる(一般的な文章・漢字ならそのまま対応)
- アクセントの他、イントネーションの細かな調整が可能
- その他、話速、音声のピッチ(音高)、抑揚の調整が可能
- 音声ライブラリを切り替えながら、1つの画面で複数のセリフを作成できる
- 音声が短い場合などで、出力される音声が小さくなる場合がある
- 同じく語尾が切れてしまって聞こえる場合がある
- 発声間隔の細かい調整ができないところ
- クレジット表記が難しい場合に使いづらいことがある(店舗内アナウンスや、電話案内などには使えない? 問い合わせようとしたが該当窓口が見つからず)
まだリリースされたばかりなので、使っていてちょっと使いづらいな! というところは正直ありました。
しかし、無料で、まだまだ精力的に開発が進められているのでいずれ解消されるでしょう。
また、音声合成で不満に感じた部分は「短い場合」なので、発声間隔の調整は音声編集ソフトや動画編集ソフトで直接、間隔をあけるようにして、極力短い音声を作らないことで対応できます。
どうしても短い音声になってしまう場合は、ダミーテキストを貼り付けて、長い音声として出力した後にカット編集するなどの工夫をすると、ある程度対応できます。
VOICEVOX のダウンロードからインストール、初回起動まで
ダウンロード
VOICEVOXはGoogle ドライブ経由で配布されています。ダウンロードの際は、VOICEVOX の公式ページから「ダウンロード」ボタンをクリックし、更にファイル一覧が表示されるので、「VOICEVOX-x.x.x-win.zip」ファイルをダブルクリックします。
x.x.xのところには、バージョンの数値が入ります。8月現在では、0.2.0が最新版ですね。
ダブルクリックすると、下記のようなメッセージが表示されるので、「ダウンロード」をクリックします。