キーワードモデレーションシステムについて

先日より、キーワードの評価を行うモデレーションシステムや、自動リンクのためのしきい値設定機能、全キーワードのスコア分布を閲覧する機能等の実装を行ってきましたが、現状にて、キーワードモデレーションシステムはひとまず完成であると考えております。
キーワードモデレーションシステム案」キーワードにて、さらに進んだユーザー評価システムやキーワード削除機能等を考案しておりましたが、これらの実装予定は現在ありません。
はてなダイアリーのキーワードは、昨年1月にはてなダイアリーベータテストを開始した時から、「日記中の言葉をキーワード化すること により、共有の辞書のように使う事もでき」る仕組みとして運用を行ってきました。
この際、キーワードとして登録可能かどうかを明確に判断できる基準が必要であると考え、

キーワードに登録できるのは、「普通名詞」と「キーワードに適した固有名詞」、および「多くのユーザーにとって有益であるため固有名詞化 されたキーワード」のみです

とするルールを作成しました。これは、キーワードとして有益であるのは名詞であるだろうという予測の上に立つものです。
しかし、このルールにのっとり1年あまり運用を行う中で、さまざまな問題が発生しました。

  • 名詞の中には、キーワードとして不適切であると多くのユーザーが考える言葉が含まれる(あまりに一般的な普通名詞など)
    • キーワード作成の際に、そのキーワードを作成可能かどうかを判断するのが難しい
    • 解釈が分かれることにより、多くの議論が発生した
    • この問題の解決方法として、はてなダイアリー評議会を設置し、投票にてキーワードの存在を問うことができるものとした
  • 名詞以外にもキーワードとして有益な言葉が存在する

キーワード不要論の中で、はてなが対応をすべきであると考える問題の多くは、「キーワードが名詞でない」という点と、「キーワードの自動リンクが邪魔である」ということを根拠とするものでした。キーワードの本来の有用性とは別の部分で、キーワードの存続について議論が盛んに起こるのは、当初に策定を行った名詞ルールや、システムが実体と合わないからであり、早急なルールやシステムの改訂が必要であると判断しました。
また、5万人近いユーザーがはてなダイアリーを利用する状態となり、現在も毎日数百人のユーザーが増加を続ける中で、ユーザー規模に応じたシステムが必要であると考えました。キーワードは、コメント欄や日記にて議論を行う中で、より質の高い情報を蓄積していくべきものだと考えており、これは今後も変わりませんが、一方で、全ての問題を議論によって解決することの限界も感じてきました。
こうした課題を解決するため、より実態に近いキーワードシステムはどうあるべきかを考え、今回の実装に至りました。
キーワードの意義について、多くのユーザーが感じているものと近いと思われる2点、

  1. 同じキーワードを使っている日記を探しだすことができる(自動リンクシステム的側面
  2. キーワードについての有益な情報を得ることができる(辞書・百科事典的側面)

とし、名詞、非名詞とは関係なく、前述の意義を満たすものが登録可能であるとしました。
自動リンクが邪魔である、という問題を解決するため、キーワードのスコアを導入しました。各ユーザーがそれぞれのキーワードに対して、「リンクがあっても構わない」「リンクはいらない」という意思表示を行うことができ、これに応じてそれぞれのキーワードにスコアがつくようになりました。このスコアによって、各日記でどのスコアからのキーワードを自動的にリンクするかを設定することができます。
また、特定のユーザーのみで独立したキーワード空間を持つことのできるはてなグループhttp://g.hatena.ne.jp/)のリリースを行い、こちらも無料で利用を可能としました。はてなグループ内のキーワードについては、独自のルールで好きなキーワードを登録することができます。
はてなダイアリーは「自動的に現れるキーワードのリンクを楽しんで頂ける方々にご利用頂きたい」と考えて運用を行っておりますが、この原則の上で、たくさんの皆さんが、様々なスタイルで快適にご利用頂けるよう、今後も改善を続けていきたいと思います。どうぞよろしくお願いします。