Terminal (macOS): Julius で音声認識をする

Julius は音声認識エンジンです。
音声で話した内容をテキストにすることができます。

公式サイトもありますが、現在は GitHub のレポジトリを追うのが良さそうです。

 

まず Julius 本体をここからダウンロードします。
今回は Release 4.4.2 を使用します。

$ tar xvzf julius-4.4.2.tar.gz
$ ./configure
$ make
$ sudo make install

これで Julius のコマンドがインストールされます。
ヘルプコマンドを実行してみて表示されれば完了です。

$ julius --help

 

Julius を実際に使用するために、単語辞書・言語・音響モデルが必要です。
標準で「Julius ディクテーション実行キット」が提供されていますのでこれを使用します。

GitHub にある別レポジトリここからダウンロードします。
今回は dictation-kit-v4.3.1 を使用します。

 

Mac のシステム環境設定を調整します。

audiosetting_for_julius

1. 入力装置を内蔵マイクに(正しく受け取れる入力デバイスに)
2. 入力音量を最大に
3. 環境ノイズリダクションをオフ

 

準備ができたので、実際に実行してみます。

ディクテーションキットに含まれる jconf ファイル main.jconf / am-gmm.jconf を使用します。

$ julius -C main.jconf -C am-gmm.jconf -nostrip

<<< please speak >>> と出たら、何かを喋ってみます。

pass1_best:  もし か し て 、 給料 日 。
pass1_best_wordseq: <s> もし+副詞 か+助詞 し+動詞 て+助詞 、+補助記号 給料+名詞 日+名詞 </s>
pass1_best_phonemeseq: silB | m o sh i | k a | sh i | t e | sp | ky u: ry o: | b i | silE
pass1_best_score: -6501.311523
### Recognition: 2nd pass (RL heuristic best-first)
STAT: 00 _default: 58258 generated, 2731 pushed, 662 nodes popped in 247
sentence1:  もし か し て 、 給料 日 。
wseq1: <s> もし+副詞 か+助詞 し+動詞 て+助詞 、+補助記号 給料+名詞 日+名詞 </s>
phseq1: silB | m o sh i | k a | sh i | t e | sp | ky u: ry o: | b i | silE
cmscore1: 0.285 0.827 0.241 0.507 0.321 0.878 0.720 0.155 1.000
score1: -6515.337402

正しくしゃべっている内容が検出されました。給料日は嬉しいですね。