nifuba

20040702064307

各所より第6回セマンティックウェブとオントロジー研究会が本日行われる様子。行きたいなぁー行けないよぉーということで、今日は公開原稿を慰みに読むことにする。

とりあえず気になってたblogページの自動収集と監視に基づくテキストマイニングを読んでみた。これもGETA使ってるのな。結局OS X 10.3にはインストールできないで放置しているけど、NetBSDマシンとか用意すべきなのだろうか。

実装上の最重要ポイントであるところのblog判定部についての記述が一切なくてがっかり。と思ったらblogWatcherサイトの方にまさにそのものの論文があった。実際に使ったと思われるヒューリスティクスも詳細まで書かれてて、これさえあれば今にも実装できそうな雰囲気。エントリ切り出しはかなり欲しいなあ。

posted by ec / △ permalink / CC:BY / / 2004/07/02 06:43:07