投稿フォームにタグ候補自動生成機能を付けてみた。中身はほとんどキーワード抽出君の流用だけど、それなりに動作してるっぽいね。5秒ごとに更新があれば通信するようにしといたのだけど、Safariで日本語の入った正規表現を使うとすごくスマートに死んでくれる(Safari専用のブラクラを作れと言われたらすぐにできるよ!)ので、とりあえずuserAgentを見て弾いておいた。ここんところが修正されないと、Javascriptによる日本語処理の未来は暗いと思う。もしかして文字コードを直書きすればいいのかしら。
あとこういう本文からタグを抽出するアプローチって正直あんまりつかえない気がする。本文から類似記事を抽出して、そのクラスタから代表的な語、もしくはよく使われてるタグを出すのがよさげ。ただ、openfbの検索システムはgrepベースなので無理なのではあった。Estraierあたり勝手にブチ込めるサーバがほしいなー。
なんかブックマークされてるので心配になって改めてSafariでキーワード抽出君の動作確認をしてみると、とりあえず落ちなくなってた。もうSafari向けのブラクラは作れない! Impact: Processing a regular expressions may result in arbitrary code executionってことで一昨日のセキュリティアップデートで直ったみたいね。期せずしてものすごくタイムリー。でも日本語は通んないみたいなので、あいかわらず未来は暗いまま。