nifuba

20051202081459

タグとキーワード抽出君エンジンを使った類似商品提示アサマシステムを作って、ここの単記事ページに試験的に組み込んでみた。今までやりたいなーと思ってたのだけどSafariが落ちるなら使えないなあ、と思ってたのが例のアレで解決したから一気に作ってみたよ。例のごとくFirefoxのみテスト済み。つーかすごく眠いのでFirefoxのテストもあやしい。もしかしたらまたブラクラになってるかもしれません。このページを開いてからしばらく経つと、右側サイドバーに表示されてるはず。

機能としては、Blog本文に類似したAmazonの商品を表示するってやつだ。Drk7.jpのAmazon Searchとコスメティックな部分ではおそらく同等(ECSではレビュー本文がインデックスされてないっぽいので再現率でちょっと劣るか)だけど、ブラウザがDF値用のJSON APIと話すだけの通信量で実現できているので老いたs7.xrea.comサーバにも非常にやさしい。流れはこう。

  1. キーワード抽出君で本文(id="article_body")からトークン文字列を抽出。ついでにタグもトークンとして(かなり大きめの重みを与えてから)取得。
  2. TF-IDF値の大きいトークン1つを検索キーワードとして、Amazon ECSで検索。
  3. Amazon ECSの検索結果はXSLTとCSSで整形され、iframe内に表示。

例のごとくめんどくさいので、ツールとして提供する気はありません。ソース読んでください…とも正直言いがたい完成度だし、そんなに難しいものでもないので本気の人はこの流れから解釈して適当にフルスクラッチしてください。

あとはSearchIndexとしてBlendedしか選べないのがちょっと問題か。ここんとこは検索CGIで使ってる手製クラスタ表を使うべきだろうか。あとXSLTは使い回しなので、Blogのサイドバーとしては分量が多すぎるのもアレ。検索結果が無いとまぬけだし、書き直しておきたいというところでおやすみなさい(´ー`)zzz

posted by ec / ■△ permalink / CC:BY / Javascript, Amazon, ECS / 2005/12/02 08:14:59 / references: 20051202050043 20051202190648