configure オプションの詳解
Julius-3.3 のコンパイル時に "configure" に与えられる全オプションを解説します.
Julius / Julian 切り替え
"--enable-julian" で,Julius の代わりに Julian をコンパイルします.
エンジン設定変更オプション
"--enable-setup=..." で認識アルゴリズムを以下の3種類のプリセットから選択できます.
1) standard: 標準版 最高精度だが低速
2) fast : 高速版 高速,高精度 (デフォルト)
3) v2.1 : rev.2.1互換 全オプション OFF
実行バイナリのアルゴリズム設定は下記のようにオプション "-version" をつ
けて起動することで確認できます.
% julius -version
###### booting up system
Julius rev.3.2 (fast)
built on jale at Sun Aug 12 20:58:44 JST 2001
- compiler: gcc -O6 -fomit-frame-pointer
- options: UNIGRAM_FACTORING LOWMEM2 PASS1_IWCD SCAN_BEAM GPRUNE_DEFAULT_BEAM
以下に詳しく説明します.
1) 標準版:--enable-setup=standard
精度を特に重視した設定です.
triphoneモデル使用時に第2パスで厳密な単語間triphoneを計算
するようになります.精度は 1% 弱改善されますが,
第2パスの処理速度は大幅に増加します.
また TM, PTM モデルにおける Gaussian Pruning [3] は
エラーを生じない safe pruning がデフォルトになります.
(実行時に -gprune で他のpruning法に切り替えられます)
2) 高速版:--enable-setup=fast (default)
速度と精度のバランスを取った設定です.
Gaussian pruning 法のデフォルトは最も足切り性能の高い
beam pruning となります.無指定時のデフォルトです.
3) rev.2.1互換:--enable-setup=v2.1
Rev.2.1 と同じアルゴリズムに戻します.
1-gram factoring と第1パスでの単語間triphoneの扱いを行わなく
なります.
上記を表にまとめると以下のようになります.表中の ○ の
オプションが実際に configure 内で enable されます.
|1-gram 1st pass 2nd pass tree Gauss. pruning
|factoring IWCD strict IWCD separation default method
===========+===========================================================
--enable- | factor1 iwcd1 strict-iwcd2 lowmem2
-----------+-----------------------------------------------------------
standard | ○ ○ ○ × safe
fast | ○ ○ × ○ beam
v2.1 | × × × × safe
-----------------------------------------------------------------------
Julius 第1パス重視の設定
Julius において,デフォルト設定では、第1パスにおいて 1-gram factoring や
1-best 近似などの速度を重視した近似計算を行うため、
第1パスの時点での認識精度は近似の誤差を多く含み、高くはありません。
(この誤差は第2パスで解消する仕組みです)
一方、2-gram のみを用いる場合など、第1パスの精度を重視したい場合も
あります。この場合、以下の設定が有効です。
% ./configure --enable-setup=v2.1 --enable-iwcd1 --enable-wpair
上記の設定によって、第1パスで 2-gram factoring を行い、単語間triphone
を計算し、かつ1-best近似の代わりに単語対近似を用います。これによって
計算コストはかなり高くなりますが、第1パスの精度を上げることができます。
オプション詳細
個々の configure オプションの詳細です.
○コンパイル・インストール環境
--prefix=dir インストール先のディレクトリを変更します.
実行ファイルは ${dir}/bin,
マニュアルは ${dir}/man/{man1,cat1}
にインストールされます.
デフォルトは /usr/local/bin です.
--with-netaudio-dir=dir DatLink を使用する際に,DatLink付属のNetAudioライブラリの
include と lib があるディレクトリを指定します.
○マイク関連
--disable-pthread 音声入力の取り込みに POSIX thread を使用しないようにします.
--with-mictype=TYPE ドライバタイプを指定します.
alsa, oss, sol2, sun4, irix のどれかを指定します.
デフォルトは自動判別です.
○アルゴリズム関連
--enable-sp-segment (Julius) ショートポーズセグメンテーションによる逐次デコーディングを
ON にします.第1パスを短いポーズでより細かく区分化しながら、
逐次第2パスを実行・確定していきます.
長文の入力に対して人手による発話切出が不要となります。
また、無限長のファイルを扱うことができます。
※現時点ではファイル入力のみ対応です.
マイク入力には対応していないのでご注意下さい
--enable-words-int 単語IDの変数型を unsigned short から int に変更します.
使用メモリ量が増えますが,65535 語以上の語彙数が扱えるようになります.
なお現在のところ動作は保証しません.
--enable-factor1 (Julius) 第1パスで1-gram factoringを行います.デフォル
ト(2-gram factoring)に比べ処理速度が大幅に
向上しますが,第1パスの精度は下がります.
--enable-lowmem2 (Julius) 高頻度語のみ木から分離することで,1-gram factoring
時に少ないビーム幅でも認識精度を落ちにくくします.
--enable-iwcd1 第1パスで単語間triphoneを扱います.処理量は増えま
すが,精度は良くなります.
--enable-strict-iwcd2 第2パスで単語間triphoneを厳密に扱います.
処理量が劇的に増える分,精度は僅かに良くな
ることがあります.
--disable-score-beam 第2パスでスコアに基づくビームの設定をOFFにします.
通常は ON のままにしておいてください.
--enable-wpair (Julius) 第1パスで単語対近似を用います。デフォルトの
1-best 近似に比べて第1パスの精度は高くなりま
すが、計算コストが増大します。
以上
$Id: configure.html,v 1.8 2002/09/11 21:00:39 ri Exp $