nifuba - tag: tag (1/1)

20051016

キーワード抽出君をいじってTagCloudっぽい見た目にしてみた。もういいかなとは思ってたのだけど、なんだかあれだけじゃ動く人も動けなさそうなので蛇足をモリモリと。数値は出ないものの、tag入力支援としてはまずまず悪くないコスメティックじゃなかろうか。もちろん実用においてはキー入力回数&放置時間を確認した自動処理は必須だけど、これ以上は眠いのでパス。寝て起きたらここにも実装してみよ。

TagCloudの綴りを間違っていた。ありがち。

posted by ec / □△ permalink / CC:BY / 自然言語処理, tag, 形態素解析, TagCloud / 2005/10/16 06:36:06 / references: 20051013004534

20051013

textareaに対するキーワード抽出ができるスクリプトを書いて簡易インターフェイスつけてみた。2-4gramは助詞を認識できない限り微妙としか言いようがないな。テンプレートでおおざっぱな形態素解析ができるようなスキルがあればよかったのだけど、寝不足なのでパス。Yahoo!のSearch APIを使うともっとまともな計算ができるみたいだけど、これもめんどくさいから放置。

つーか類似記事のタグを引っ張ってくるほうがタグ入力支援には役立つ気がした。このアプローチはもういいかな。

posted by ec / □△ permalink / CC:BY / 自然言語処理, tag, 形態素解析 / 2005/10/13 00:45:34 / references: 20051012114435 20051015210330 20051016063606

20051012

なんかtag入力支援のためのtextareaに対するキーワード抽出が流行ってるみたいだな。だけどどーせJavascriptを使うなら、日本語なら2-4gram、半角英数なら1単語を切り出してDF値をどっかから取ってきて使うってのがエコロジカルだと思う。コード書いてみるか。

posted by ec / □△ permalink / CC:BY / 自然言語処理, tag, 形態素解析 / 2005/10/12 11:44:35 / references: 20051013004534

20050623

日本のソーシャルブックマークサービス黎明期から今までtagが革命的に書きやすいMM/Memoに閉じこもっていたのだけど、はてなブックマーク界を見ていなければ文脈を見失うことが増えてきたので、仕方なくお気に入りを整備中。はてなダイアリー界でいざこざやもめごとが起こっていてもそれははてな内のことと割り切れたのだけど、ブックマーカーが加速させるいざこざやもめごとははてな外に拡散していくので手に負えなく、結局大元となるブックマークの時点でキャッチしておく必要があるわけだ。はてなのサービスは全部結局は情報集約の方向に向かうのかもしれず、だとしたらそれはたいへん腹立たしいな。

つーか自分のブックマーク自体もはてなに移行しちゃうかなと一瞬思っていろいろ試してみたのだけど、tag周りの実装の貧弱さからまだ微妙だとしか言わざるをえない。tagに多様性が生まれないので結局横断検索の必要性も薄れるし。それ以前に、結局taggingは日本のアルファギークには馴染まなかったって認識すら生まれつつあるような気もする。なので日本におけるtaggingをベースとした舶来ソーシャルブックマークは終わった! と絶望…してしまうのは簡単だけど、「舶来ソーシャルブックマーク的な何か」をなんらかの形で数ヵ月後、もしくは数年後に再発見させるという戦略で地下活動をするのが生産的だと思った。かといってJBAのようなアクロバティックはもはや通用しないだろうし、難しい。

posted by ec / △ permalink / CC:BY / web, SBS, tag, はてな, はてなブックマーク / 2005/06/23 04:18:57

20050531

tagによる情報検索の問題点は類似度を算出するのがむずかしー点にあるのだけど、共起頻度とかつかってtagそれぞれ一つ一つに多次元のベクトルを与えることができればなんとかなりそうな気もしてきた。LSIっぽいソリューションで…なんともならないか。

posted by ec / △ permalink / CC:BY / web, tag, Folksonomy, 情報検索 / 2005/05/31 16:30:36 / references: 20050531063827

1998- ec some rights reserved.