configure オプションの詳解

Julius-3.3 のコンパイル時に "configure" に与えられる全オプションを解説します.

Julius / Julian 切り替え

"--enable-julian" で,Julius の代わりに Julian をコンパイルします.

エンジン設定変更オプション

"--enable-setup=..." で認識アルゴリズムを以下の3種類のプリセットから選択できます. 1) standard: 標準版 最高精度だが低速 2) fast : 高速版 高速,高精度 (デフォルト) 3) v2.1 : rev.2.1互換 全オプション OFF 実行バイナリのアルゴリズム設定は下記のようにオプション "-version" をつ けて起動することで確認できます.
% julius -version
###### booting up system
Julius rev.3.2 (fast)
built on jale at Sun Aug 12 20:58:44 JST 2001
 - compiler: gcc -O6 -fomit-frame-pointer
 - options: UNIGRAM_FACTORING LOWMEM2 PASS1_IWCD SCAN_BEAM GPRUNE_DEFAULT_BEAM
以下に詳しく説明します. 1) 標準版:--enable-setup=standard 精度を特に重視した設定です. triphoneモデル使用時に第2パスで厳密な単語間triphoneを計算 するようになります.精度は 1% 弱改善されますが, 第2パスの処理速度は大幅に増加します. また TM, PTM モデルにおける Gaussian Pruning [3] は エラーを生じない safe pruning がデフォルトになります. (実行時に -gprune で他のpruning法に切り替えられます) 2) 高速版:--enable-setup=fast (default) 速度と精度のバランスを取った設定です. Gaussian pruning 法のデフォルトは最も足切り性能の高い beam pruning となります.無指定時のデフォルトです. 3) rev.2.1互換:--enable-setup=v2.1 Rev.2.1 と同じアルゴリズムに戻します. 1-gram factoring と第1パスでの単語間triphoneの扱いを行わなく なります. 上記を表にまとめると以下のようになります.表中の ○ の オプションが実際に configure 内で enable されます. |1-gram 1st pass 2nd pass tree Gauss. pruning |factoring IWCD strict IWCD separation default method ===========+=========================================================== --enable- | factor1 iwcd1 strict-iwcd2 lowmem2 -----------+----------------------------------------------------------- standard | ○ ○ ○ × safe fast | ○ ○ × ○ beam v2.1 | × × × × safe -----------------------------------------------------------------------

Julius 第1パス重視の設定

Julius において,デフォルト設定では、第1パスにおいて 1-gram factoring や 1-best 近似などの速度を重視した近似計算を行うため、 第1パスの時点での認識精度は近似の誤差を多く含み、高くはありません。 (この誤差は第2パスで解消する仕組みです) 一方、2-gram のみを用いる場合など、第1パスの精度を重視したい場合も あります。この場合、以下の設定が有効です。
% ./configure --enable-setup=v2.1 --enable-iwcd1 --enable-wpair
上記の設定によって、第1パスで 2-gram factoring を行い、単語間triphone を計算し、かつ1-best近似の代わりに単語対近似を用います。これによって 計算コストはかなり高くなりますが、第1パスの精度を上げることができます。

オプション詳細

個々の configure オプションの詳細です. ○コンパイル・インストール環境 --prefix=dir インストール先のディレクトリを変更します. 実行ファイルは ${dir}/bin, マニュアルは ${dir}/man/{man1,cat1} にインストールされます. デフォルトは /usr/local/bin です. --with-netaudio-dir=dir DatLink を使用する際に,DatLink付属のNetAudioライブラリの include と lib があるディレクトリを指定します. ○マイク関連 --disable-pthread 音声入力の取り込みに POSIX thread を使用しないようにします. --with-mictype=TYPE ドライバタイプを指定します. alsa, oss, sol2, sun4, irix のどれかを指定します. デフォルトは自動判別です. ○アルゴリズム関連 --enable-sp-segment (Julius) ショートポーズセグメンテーションによる逐次デコーディングを ON にします.第1パスを短いポーズでより細かく区分化しながら、 逐次第2パスを実行・確定していきます. 長文の入力に対して人手による発話切出が不要となります。 また、無限長のファイルを扱うことができます。 ※現時点ではファイル入力のみ対応です.  マイク入力には対応していないのでご注意下さい --enable-words-int 単語IDの変数型を unsigned short から int に変更します. 使用メモリ量が増えますが,65535 語以上の語彙数が扱えるようになります. なお現在のところ動作は保証しません. --enable-factor1 (Julius) 第1パスで1-gram factoringを行います.デフォル ト(2-gram factoring)に比べ処理速度が大幅に 向上しますが,第1パスの精度は下がります. --enable-lowmem2 (Julius) 高頻度語のみ木から分離することで,1-gram factoring 時に少ないビーム幅でも認識精度を落ちにくくします. --enable-iwcd1 第1パスで単語間triphoneを扱います.処理量は増えま すが,精度は良くなります. --enable-strict-iwcd2 第2パスで単語間triphoneを厳密に扱います. 処理量が劇的に増える分,精度は僅かに良くな ることがあります. --disable-score-beam 第2パスでスコアに基づくビームの設定をOFFにします. 通常は ON のままにしておいてください. --enable-wpair (Julius) 第1パスで単語対近似を用います。デフォルトの 1-best 近似に比べて第1パスの精度は高くなりま すが、計算コストが増大します。 以上

$Id: configure.html,v 1.8 2002/09/11 21:00:39 ri Exp $