今日の誤爆

スク続き

このキーワード、誤爆率調査は誰かしてましたかねえ。捕捉された日記数ぐらいしかチェックされてない気がします。昔の含む日記をしらべてもいいのだが、現在誤爆回避キーワードがいくつか登録されてるので、なるべくは最新の含む日記で調査したい。でも多分誤爆率高いだろうなあ。
ちなみに、Yahoo!辞書の「スク」を含む単語は311個。ひらがなとかも混ざってるので一概には言えないが、少なくとも100個は超えてるだろう。*1
常識的に考えると、100個誤爆回避キーワードを登録するより、1個のキーワードを括弧付きに移動させる方がリーズナブル。
もうちょっとリンクスコアが下がってくれればなあと思う。5未満になればキーワード解説で自動リンクしなくなるのに。


と言うわけでやりますよ誤爆率調査。日記とヒット数が合わないのは、1つの日記で複数ヒットしていたり、捕捉後に該当文字列を削除してたりする場合があるためです。なお調査結果は本日12時現在のものです。

9/10 日記7件 誤爆5:誤爆以外2:正解0
  • キーワードに対する言及
  • 同文字列異義語
9/9 日記21件 誤爆17:誤爆以外4:正解0
  • ケーニヒスクローネ2
  • パスクワル
  • ビクスク
  • チョ・ウンスク
  • スクッリオ(スポーツ選手)
  • ヨロスク(「よろしく」の意)
  • スクー○○着
  • フロントスクェーカー
  • スクワット2(日記捕捉時は未登録)
  • スクバ
  • ローズ&ムスク
  • スクータ
  • カスクストレングス
  • スキャンディスク2
  • キーワードに対する言及
  • 同文字列異義語3
9/8 33件 誤爆29:誤爆以外3:正解0
  • 同文字列異義語3


キーワードに対する言及、同文字列異義語を誤爆からのぞくと、51/60で誤爆率は85%。正解はゼロでした。非常に多くの種類の言葉に誤爆していることから、誤爆回避キーワードが網羅されているとはとても言えない状況です。

21:23追記

どうやら見て頂けていないようなので、id:LNM氏にトラックバックします。上の調査結果を見れば、「キーワード登録されたものがほとんど」と言ってしまうのは明らかにおかしいと思うのですが…。
あと、自動リンクしない誤爆について。防爆処理が既になされているということもさることながら、キーワードのコメントでnaka64氏も指摘しているが、LNM氏はおそらく「スク」が削除予定になっている間に自動リンクをチェックしたのではないだろうか。キーワードが削除予定である間は、二重大括弧([[]])による明示的リンク以外は自動リンクが張られないので、それで誤解してしまったのかも知れない。

*1:根拠としては、前方一致でも77個の単語がヒットすることが挙げられる。「すく」で始まる日本語はほとんどない。語中や語尾に「スク」がついている単語は30個はあるだろう、と推測。