ゆっくりボイスの読み上げを使ってDiscordで話した話

ひょんなことから電車の中からDiscordのミーティングに参加したくなったので、ゆっくり音声合成をDiscordに流し込むことで、移動中からでも音声ミーティングで発言できるようにしてみました。今回はDiscordを使いましたが、ZoomやTeamsでも同じようなことができるはずです。

動かした環境

今回は macOS 15.3.1 で動かしました。LinuxやWindowsでは全体的に別のツールを使う必要があるはずです。Homebrew は導入済なことを仮定しています。

使ったツール

今回は以下のツールを使いました。

  • MYukkuriVoice: AquesTalkをベースにした音声合成アプリケーション。Intel CPU用のバイナリのみが頒布されているみたいですが、RosettaがえらいのでApple M2のCPUでも動いています。えらい。

  • BlackHole: システムの仮想オーディオデバイスとして利用します。これで MYukkuriVoice で合成した音声を Discord に流し込みます。

動かし方

BlackHole のインストール

Homebrew を使って、 brew install blackhole-2ch で Blackhole をインストールします。 色々なものがありますが一番簡素なような気がする blackhole-2ch を使いました。 ちなみにインストール後はシステムを再起動する必要があります。 これで、 BlackHole が有効になり、システムのオーディオ入出力デバイスとして利用可能になるはずです。

システムオーディオの設定

MYukkuriVoice では出力オーディオデバイスの指定ができないみたいなので、システムレベルでのオーディオ設定で BlackHole を指定する必要があります。具体的には、システム設定で入出力のオーディオデバイスを両方とも BlackHole-2ch に設定しました。出力さえ BlackHole-2ch になっていれば入力は何でも大丈夫だと思います。

Discordの音声設定

Discordの設定画面から、音声入力デバイスを BlackHole-2ch に設定します。システムレベルの音声入力が BlackHole-2ch になっていれば改めて指定する必要はないような気がします。一方でDiscordの音声出力はヘッドフォンにしないと会話を聞くことができないので、何かしら実機のオーディオデバイスに設定します。ZoomやTeamsも同様にオーディオデバイスを指定できるので、同じようなことができるはずです。

MYukkuriVoiceの導入と使いかた

https://taku-o.github.io/myukkurivoice/ から適当に辿って、 MYukkuriVoice-darwin-x64.zip をダウンロードして起動します。メッセージ入力欄に読み上げさせたいことを入力して、左上にある再生ボタンを押すと読み上げてくれます。

まとめ

何か喋りたいときに毎回キーボードで入力する必要があるという点で、流石に普通に喋るのと比べると何かと辛いですが、この設定をすると一応電車などでも読み上げで音声ミーティングで発話できてちょっと便利です。ちなみにこの設定だと良くも悪くも自分では読み上げた音声を聞くことができないです。 BlackHole だと音声の分岐ができないみたいですが、別の仮想オーディオデバイスだとその辺りも上手くできるかもしれないです。