« Orkutは自宅鯖で動いているらしい… | メイン | CodeCon2004 »

2004年02月22日

Bulkfeeds: Similarity Searchを入れてみました.

Miyagawaさんのところで公開されているSimilarity Search機能を個別のエントリ画面に付けてみました.

わかりやすく言うと、「おとなり Blog」とか呼ばれるようなものです。Blog エントリに含まれる文章を形態素解析し、特徴的単語を抜き出して、それらの単語で Bulkfeeds の RSS Item 全文検索します。結果、話題の関連性が高いエントリが検索できます。また、Blog ツールの permalink (Individual Entries) に javascript を使って関連記事の見出しを埋め込むこともできます(「くっつきおとなり Blog」みたいなもの)。

なるほど,ちょっと触ってみると,なぜみんなが興奮して「面白い!」と騒いでいるのかよくわかりました.書くのが楽しくなるからなんでしょうね.私もありがたく利用させていただきます.

それから,ここを半年以上も放置している間にスパムコメントが死ぬほど(200件以上)ついていて,すっかり手入れをする気も失せていたのですが,いくつか便利なツールを見つけたので雑草駆除の手段として入れてみました.

一つはMT-Blacklist.よくある,Penis EnlargementとかViagra, Pheromon, Prozac, lolitaなどのヤバい単語やよく知られたスパム業者のURLやIPアドレスからのコメントやトラックバックをブロックするというもの.すでに付いてしまったスパムコメントやトラックバックの一斉駆除もできます.MTも2.66からは同一IPからのコメントが設定時間内には繰り返しできないようにするなど,対策が進んでいるようなので,これもアップデート.あと,他にいま検討しているのはscode.数字の羅列の画像を表示させてそれを再度入力させることで相手が人であることを認証するというもの.入力する人に手間をかけてしまうのはあまり気が進まないのですが,様子をみながら導入を検討しようかと思います.

トラックバックURL

このエントリーのトラックバックURL:
http://abacus.servehttp.com/mt/mt-tb.cgi/371

トラックバック

» Similarity Search の負荷軽減に jscache from blog.bulknews.net
Similarity Search の負荷が気になる場合は、jscache を利用してみてください。 [Read More]

» Similarity Search の負荷軽減に jscache from blog.bulknews.net
Similarity Search の負荷が気になる場合は、jscache を利用してみてください。 [Read More]

コメントする