各所より第6回セマンティックウェブとオントロジー研究会が本日行われる様子。行きたいなぁー行けないよぉーということで、今日は公開原稿を慰みに読むことにする。
とりあえず気になってたblogページの自動収集と監視に基づくテキストマイニングを読んでみた。これもGETA使ってるのな。結局OS X 10.3にはインストールできないで放置しているけど、NetBSDマシンとか用意すべきなのだろうか。
実装上の最重要ポイントであるところのblog判定部についての記述が一切なくてがっかり。と思ったらblogWatcherサイトの方にまさにそのものの論文があった。実際に使ったと思われるヒューリスティクスも詳細まで書かれてて、これさえあれば今にも実装できそうな雰囲気。エントリ切り出しはかなり欲しいなあ。