Terminal (macOS): SPTK でスピーチ音声処理をする

SPTK (Speech Signal Processing Toolkit) は、UNIX 環境用のスピーチ音声処理ツールです。
公式サイト

音声分析(ケプストラム分析や線形予測分析LPC)、フィルタ、波形処理、FFT、 などができます。
参考:やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析

 

インストール

SPTK の公式サイトから SPTK-3.9.tar.gz をダウンロードします。

tar xvzf SPTK-3.9.tar.gz
cd SPTK-3.9
./configure
make
sudo make install

ヘルプメッセージが出るか確認

impulse -h

 

公式サイトではリファレンス、サンプルのドキュメント、サンプル音声データも手に入ります。

SPTKexamples-data-3.9.tar.gz を展開して data.short ファイルを確認します。

data.short は、音声の raw ファイルデータです。
音声波形の振幅(short int型、-32768〜32767)が配列で表示されています。

 

dmp コマンドでデータの中身を確認できます。

dmp +s SPTKexamples-data-3.9/data.short | less

 

raw2wav コマンドで wav に変換できます。

raw2wav data.short

data.short.wav を再生すると「青い植木鉢」というセリフが聞こえました。