blogWatcherがようやく公開されたのだけど、想像以上に使いにくくて大変だ。いまどき要約文が素で表示されない検索結果ってのも非常にアレだし、GETAによるランキングの閾値評価なんて素人にさせるようなもんじゃないだろー。今の所の想定ユーザはblog+検索技術の研究者のみといった感じだ。
JavaScriptを情報系暇学生の個人サイトのごとくむやみやたらと使用したUIは、同じGETAを使用して特殊なUIを採用した新書マップと比べると、あまりに洗練されなさすぎて大爆笑ものではあるものの、まったく専門外のことを言語処理の研究者が頑張ったんだと思うとそれなりに納得はできた。たいへんな割に実入りが無いんだよねあれ。しかしポップアップで引用文を表示させるというアイディアは、学内サーバの超低Ping値でしか当面通用しないアプローチだということを再認識してほしいと思った。上位数件のサマリは一瞥するだけでわかるようにしてほしい。
キーワードのBurst値や評判情報はタダでこの規模の統計データに触れられること自体が非常にうれしいのだけど、形態素解析精度が悪めなせいで、どうも信憑性に欠ける感じになってるな。まーしかし大まかな傾向が掴めれば個人による非商用文書の裏付け程度には役に立ちそうだし、小規模なマーケティングの参考にはなりそうだ。まさにこのへんこそが無料blogサービスを企業が提供する意義であるわけなので、下手したらblogWatcherのせいで無料blogサービス敗者が次々と撤退することになるかもしれない。個人的にはいっこうにかまわないけど。
あと、今はまだ数日前のエントリまでしか検索できないってところが古き良き学術目的検索エンジンっぽくて懐かしかった。まっとうなスパイダーを使ってHTML解析してるから当然なんだけど、そう考えるとRSSはそれなりに偉大なんだな、と改めて思った。