nifuba - tag: MeCab (1/1)

20050502

Tigerに形態素解析ソフトをインストールしたよ。

ようやくSpotLight索引作成が終了してMailへの移行も完了。なのでいろいろ検索してみたら、どーもやっぱりUTF-8とかEUCなファイルが検索できてない。あー。ファイルタイプの設定を自分で増やせたりするならば、「国際化HTML」みたいな名前で文字コード自動判別&分かち書きフィルタを書いてみたいところではある。つーかこのままじゃみんな困るのは目に見えてるわけだし、そのうちAppleもなんとかするだろう…。

あきらめてEstraierとかインストールするか…どうせニュースメモ変換君に必要だしな…とchasen-2.3.3をコンパイル。これはgcc4で素通り。次にipadic2.7.0をコンパイル。ここでchasenrcが無いと言われるので、落ち着いてipadicを展開したディレクトリ内のchasenrcを/usr/local/etc/にコピー後コンパイル。とりあえずこれでEUCで書いてたずいぶん前のスクリプトに関しては万全。

しかし最近はMeCabを結構使ってた(索引スクリプトとか)ので、こっちも必要になってくる。よってmecab-0.81をコンパイル…通らねえー。こんな時は冷静にgcc_select 3.3…--disable-shared…通らねえー。あきらめて推奨バージョンのipadic-2.5.1をダウンロードし直してきて--disable-sharedで再コンパイル…通ったーていうか最初からこうやれよ。ともかくようやくこれで当面の活動は再開できそうだ。

posted by ec / □ permalink / CC:BY / Mac, Tiger, 自然言語処理, 情報検索, Chasen, MeCab / 2005/05/02 06:57:00

1998- ec some rights reserved.