1000通近く溜まっていたニュースメールをジェノサイドしてから月火曜のニュースを読んでメモを作ったんだけど、これをネタにして日記を書くのが面倒だ(末期的)。CGIでも書いてリンクだけ抽出して本日のメモっぽくindex.shtmlに埋め込んでみるかー、なんだか個人ニュースサイトっぽいぞ!
ひまなときに実装するメモ:記事本体を読んで単語頻度取って記事間距離算出→なんとかハクして一次元化(羅列)。
単語頻度っていうかtfidf値取ったら上位キーワードだけ出力して記事名代わりにならないかな、titleだとアレだし。