キーワード自動リンクのためのキーワード抽出アルゴリズムについて

先日、当日記にてはてなダイアリーのキーワード抽出アルゴリズムについてアンケートを行いました。
http://d.hatena.ne.jp/hatenadiary/20060130/1138593398
このアンケートを参考に、はてなダイアリーのキーワード抽出のアルゴリズムについては、当面「最左最長優先」方式で運用を継続したいと考えております。


前回のご説明では、

という2つのキーワードを例として掲げたため、2つ目のキーワードの鍵括弧"["の有無が分かりづらく、不適切な説明であったかと思っております。
ただ、そうした誤解がある中でも、「どちらでもよい」や「最左最長優先で構わない」といった意見が多い結果でした。


その他の意見として、「おかしなますだおかだ」と書いた場合に「ますだおかだ」よりも「なます」が優先的に抽出されてしまう弊害などの指摘がございましたが、こうした本来の意図と違う抽出はどちらの方式を採用しても起こり得ること、また、「最左最長優先」方式がサーバーの処理としては行いやすく、動作も軽くすることができるため、当面「最左最長優先」にて運用、とさせて頂きます。


多数のご意見を頂き有難うございました。