「ちさ」を通じた誤爆に関するコメント

id:mitty:20041024#p1さんへの返信です。
まず、根本的に誤解していらっしゃるようなのですが(誤解していらっしゃらなかったらすみません)私が今回「ちさ」を削除した理由は捕捉誤爆ではなく、「非常に多くの『複数の文節にまたがる誤爆』を生んでおり、しかも私が調べた限りで当該キーワードの意味でのヒットが存在していなかったから」です。
前者はキーワード登録による誤爆回避が不可能であることを意味し、後者は言い換えれば誤爆率100%です。この現状を見るに、「ちさ」がキーワードの自動リンク的側面を満たしていないのは明らかです。
また、これはキーワードコメントには書いていないのですが、「百科辞書的側面」に目を向けると、当該キーワードはほぼ「岡井千聖」の丸写しで(違う所は画像くらいなのですが、これは肖像権侵害という別問題をはらんでいます)、この点においても、現状でキーワードの要件を満たしていません。*1
いわば「のの」や「でつ」と似た状態を生み出しており、私の日記にも火の粉が降りかかってきた(どこが誤爆していたかは忘れてしまいましたが)ので、やむなく削除した次第です。


で、今回私が言いたいのは、「キーワードの要件を全然満たしていないので『ちさ』は削除しますが、必要ならば括弧付きで「ちさ」を作成してはどうですか」ということなのです。括弧付きでも必要な人がいれば登録されるでしょうし、必要とされていなければそのまま消えるでしょう。現状を放置して誤爆を量産させるよりかは、リーズナブルな解決法ではないでしょうか。


ところで、私としてはあくまで捕捉誤爆は付随的な被害であり、やはり根源的問題は自動リンク誤爆だと考えています。なぜなら捕捉誤爆というのははっきり言ってどのキーワードでも起こることであり、その根絶は不可能だからです。従って、私は捕捉誤爆を理由に削除することは基本的にしていません。「あぁ」の時に二の足を踏んでいたのもそのためです*2
また、私が書いた「誤爆の考察」を読んで頂いたと思うので分かると思うのですが、そもそも「キーワードモデレーションシステムが導入されたので、自動リンク誤爆を理由にした削除はもはや通用しない」という主張自体に私は異論を唱えています。ここがmittyさんと意見が分かれる所でしょう。
つまり「モデレーションシステムが導入されてなお、自動リンク誤爆を理由にした削除は(場合によっては)通用する」と考えます。もちろん削除の発動条件のハードルはかなり高めに設定していますが、それでも削除という解決手段を完全に禁じてしまうべきではないと思います。現状では、モデレーションシステムで誤爆の問題を完全に解決することはできていないのですから。


なお、私は「捕捉誤爆を理由にした削除の是非」を問う前に、「自動リンク誤爆を理由にした削除の是非」を改めて問うべきと考えます。「はてなダイアラーへの意識調査」*3では誤爆肯定派・否定派がほぼ拮抗しています(比率にして6:4)が、その後かなりシステムが変更されているので、今一度一般的な「誤爆」に対するアンケートを行うべきなのではないでしょうか。はてなアンケート辺りで是非やってみたいのですが、準備が大変そう*4なので脳内で構想練ってる所です。

追記

「文節にまたがる誤爆」が存在しているが誤爆率が高くないキーワードは、「誤爆の問題はあるが、キーワードとして有効に利用されている」と推測されます。そのようなキーワードを誤爆を理由として削除するのは適切ではないので、キーワードが有効利用されている可能性を考えるために誤爆率の検討を行わなければなければならないと私は考えます。
つまり「削除理由としての誤爆率」ではなく、「存続理由を探すための誤爆率」というわけです。
参考:「いぬ」http://d.hatena.ne.jp/n_kakka/20040920#1095660267
「いぬ」は「形容詞+別単語の頭文字」というような「複数の文節にまたがる誤爆」を発生させていますが、正しいヒットも多く、キーワードとして非常に有効に機能しています。このようなキーワードを「複数の文節にまたがる誤爆」の発生を理由として削除するのは不適当です。
従って誤爆状況を調査する場合は、

  1. 言及全体にしめる誤爆の割合(誤爆率)
  2. どのような種類の文字列に誤爆しているか(誤爆の種類)

の二点について検討し、「誤爆率が高く」かつ「複数の文節にまたがる誤爆」を多数発生させている場合にのみ、削除による解決を図るようにすれば良いとおもいます。

蛇足

ただ現実には「スト」「あぁ」のような、キーワードとしての有効性に非常に疑問がありそうなのに、この論法では削除できなくなるものも出てくるんですけどね…。
両者とも誤爆率はほぼ100%であり、「スト」は膨大な数(1日あたり約300)の部分一致誤爆を生む例、「あぁ」は膨大な数(1日あたり約200)の同文字列異義語への誤爆を生む例です。


あと、「ちさ」は「名詞サ変」のど真ん中に誤爆する例も多々あるのだが、これは厳密には「文節にまたがる誤爆」じゃないよなあ、と思った。しかし性質としては「文節にまたがる誤爆」に限りなく近いので、広義の「文脈破壊誤爆」として繰り込むか。

*1:百科辞書的側面のみによるキーワード存続は、「暑い」の評議会を見る限り、解説がかなり充実していても反対意見は多いようですね

*2:「あぁ」は正確には「同文字列異義語に対する誤爆」ですが、感動詞として別キーワードを登録した場合に捕捉誤爆の問題が発生します

*3:http://d.hatena.ne.jp/./calmzone/20030912#1063298288

*4:選択肢を考えるだけで一苦労です