2013/05/23

mecab を ruby で使う

mecab を ruby で使えるようにするおはなし。

環境

  • Mac OS X Mountain Lion
  • Homebrew 0.9.4
  • ruby 2.0.0-p195

brew で mecab の install

$ brew install mecab
$ brew install mecab-ipadic
mecab本体と一緒に辞書である ipadic を入れます。
デフォルトで UTF8 なのでこのままでおそらく大丈夫です。


mecab-ruby の install

mecab-ruby は gem にも brew にも無いので、ソースを落としてビルドします。
2013/05/23 時点での最新版は 0.996 なので
$ wget https://mecab.googlecode.com/files/mecab-ruby-0.996.tar.gz
$ tar xzf mecab-ruby-0.996.tar.gz
$ cd mecab-ruby-0.996
くらいで落として解凍します。

ここで、Macにはデフォルトでmecabが入っているせいで mecab-ruby が見るライブラリのパスが違ってしまう問題があるので、brew でインストールした方を使うように extconf.rb を修正する必要があります。

具体的には
dir_config('mecab',
`mecab-config --inc-dir`.strip,
`mecab-config --libs-only-L`.strip)
を $CFLAGS += の上くらいに入れます。

その後、mecab-ruby を build して install します。
$ gem build mecab-ruby.gemspec
$ gem install mecab-ruby-0.99.gem
きちんとインストールできたかは、gemspec と同じディレクトリにある test.rb を実行して、文が分解されているかを見てみると良いと思います。

mecab-ruby のテスト

$ ruby test.rb
を打ってばーっといろいろ分解された品詞とかが出たら成功だと思います。たぶん。
あとは require 'MeCab' とかしていろいろすると良いんじゃないかなー。

0 件のコメント:

コメントを投稿