本家 http://www.cl.ecei.tohoku.ac.jp/~katsuma/software/normalizeNumexp/- 本家 http://www.cl.ecei.tohoku.ac.jp/index.php?Open%20Resources%2FnormalizeNumexp
- GitHub https://github.com/nullnull/normalizeNumexp
性能
手順
まずはpficommonをビルドする.rootになるのに抵抗があるのでhomeに入れる.
$ git clone https://github.com/pfi/pficommon.git $ cd pficommon $ ./waf configure --prefix=~/opt/pficommon $ ./waf $ ./waf install
次にux-trieをビルドする.googlecodeがそろそろ閉鎖されそうですが,そうなったら hillbig/ux-trie から落としてください.
$ svn checkout http://ux-trie.googlecode.com/svn/trunk/ ux-trie $ cd ux-trie $ ./waf configure --prefix=~/opt/ux-trie $ ./waf $ ./waf install
そしてnormalizeNumexpをビルドする.ライブラリをhomeに入れたせいで,PKG_CONFIG_PATHの設定がちょっと面倒.
$ git clone https://github.com/nullnull/normalizeNumexp.git $ cd normalizeNumexp $ PKG_CONFIG_PATH=~/opt/pficommon/lib/pkgconfig:~/opt/ux-trie/lib/pkgconfig ./waf configure --prefix=~/opt/normalizeNumexp
テストしたいときは次のようにする
$ LD_LIBRARY_PATH=~/opt/pficommon/lib:~/opt/ux-trie/lib ./waf --checkall
インストールする
$ ./waf install
実行するたびにLD_LIBRARY_PATHを設定するのが面倒なので,シェルスクリプトに書いておく.
$ echo 'LD_LIBRARY_PATH=~/opt/pficommon/lib:~/opt/ux-trie/lib:~/opt/normalizeNumexp/lib ./normalizeNumexp $@' > ~/bin/normalizeNumexp $ chmod +x ~/bin/normalizeNumexp
知っておいたほうが良さそうなこと
テストとしてこの記事を入力してみたら,"月額 980 円"とか"最初の 30 日間"が取れていなかった.
空白があるとルールにマッチしないみたいなので前処理しないとダメっぽい.NEologdの正規化とかが良さそう? (数字の前後の空白を除いてくれそうなので)