0-03-01から1ヶ月間の記事一覧

リンク・メモ

二文字キーワード 二文字キーワード(英数・記号) 二文字キーワード(括弧付き) 一文字キーワード リスト::用言 キーワードルール改定に関する意見 サイエンスキーワード リスト::天文学 アニメソング、アニソン、リスト::アニソン歌手 「なっち」に関する…

小技

複数あるキーワードの内の一つに強制リンクさせたい時は、 <A class="keyword" href="/keyword/○○?kid=_____">□□</A>とする。「○○」にはキーワード名、「kid=_____」にはそのキーワードのidを入れる。 例 マリア様がみてる(全表示) マリア様がみてる(小説) マリア様がみてる(アニメ) マリア様がみてる(漫画…

linux/UNIXのコマンド

uname -a linuxのバージョンを知る。 psnup - postscriptファイルの複数ページを1つのページにまとめる

参考

二文字キーワード(英数・記号) 三文字キーワード(英数・記号) http://d.hatena.ne.jp/./lawquality/20051222#1135263432(802について) http://hpk.g.hatena.ne.jp/./nozorinne/20051223(三文字の半角英数キーワード、802について)

三文字の数字キーワード

二文字の数字キーワードと異なり、各キーワードへの対応はまちまちである。現状では存続しているものが多い。このようにユーザー間の合意が見られない現状では、三文字の数字キーワード全体に対する是非を論じることは、無意味であると考えられる。 従って、…

二文字の数字キーワード

過去に18、19、24、42、69というキーワードが作成されたが、いずれも誤爆多数として削除された。実際、19のようにバンドの正式名称であるキーワードでさえも容認されなかったことを考えると、ユーザー間で「二文字の数字キーワードは登録すべきでない」とい…

文字種による分類

用いられている文字種によっても、分類することができる。 英字のみ 最も種類が多い。文字列の長さに比例して、誤爆が減少する。 数字のみ "555", "802"など、数字のみで構成されるキーワード。二文字キーワードは存続が容認された例はない。三文字キーワー…

半角英数キーワードのパターン

作成されうる半角英数キーワードは、いくつかの代表的パターンが存在する。 略語 "NHK"や"JR"など、別の言葉の略語として用いられる場合である。多くの場合、キーワード解説は誘導となっており、実質的な解説は誘導先のキーワードに記載されている。略称が正…

誤爆回避の手法

発生する誤爆の種類が、ほとんど同文字列異義語誤爆であるため、誤爆回避は主として括弧付きでの登録が用いられる。 誤爆が著しい場合には、当該キーワードの削除が行われることもある。

一般論

半角英数キーワードは、「単語一致の法則」が適用されるため、文字列の一部に誤爆する「部分一致誤爆*1」の発生頻度は通常のキーワードよりも低い。 しかし、文字列によっては、日記での使用頻度が高いために、「同文字列異義語誤爆*2」が多数発生するおそれ…

半角英数キーワードの定義

「半角英数キーワード」とは、半角英字および半角数字のみで構成されるキーワードであって、「単語一致の法則」が適用されるキーワードのことを言う。 単語一致の法則 半角英数キーワードは、前後に半角英数の文字種が連続している文字列を別の単語として認…

私の意見

id:n_kakka:20040630#1088566269などから加筆再掲。実際はこんなにうまくいかないのが現状なんですがね。 要するに双方とも誤爆状況を調べるべき、ということが言いたいわけです。いきなり削除は険がたちすぎる。 誤爆を理由に削除しようとする人へ まず誤爆…

次回改版予定

「おとなり日記」への誤爆の影響 「質問モデレーションシステム」への誤爆の影響 はてなグループキーワードへの自動リンク機能について 利害関係 文法概念を入れずに簡潔に説明する おとなり日記について http://d.hatena.ne.jp/n_kakka/20041022#1098420669…

注意

この文章では、誤爆の性質がほとんど同じであることから、形容動詞語幹を名詞として扱っている。

参考文献

キーワード作成ガイドライン キーワード削除ガイドライン キーワードモデレーションシステム 二文字キーワード 二文字キーワード(英数・記号) はてなダイアリー評議会議題3号:キーワード「喜ん」について はてなダイアリー評議会議題4号:キーワード「暑い…

自動リンクの性質

状態1 状態2 状態1は月ごとの表示、状態2は1日だけ表示した状態である。それぞれ別ウインドウで開いてみると意味が分かる。詳しい説明はリンク先に(まだ未完成)。

二文字キーワードについて

キーワードは、その性質上文字数が少ないほど自動リンクが発生しやすいのは明らかである。文字種の使用頻度を考慮すると、ひらがなやカタカナだけで構成される(または含まれる)二文字キーワードは、文字数の多いキーワードよりも誤爆可能性が格段に高くな…

「喜ん」「暑い」についての考察

先般、「喜ん」「暑い」についてはてなダイアリー評議会が開催され、投票の結果両者とも削除されることが決定した。これを誤爆という観点から考察する。 「喜ん」と「暑い」はともに活用する自立語(つまり用言)であるが、前者は連用形撥音便、後者は終止形…

「あまりに一般的なキーワード」による誤爆

単独では抽象的な辞書的意味しか持たない単語が、各日記で使われることによって、個々の文脈に即した特別な意味を付加されることをいう。主に非物質名詞で起こる。 ただし、そもそもこれが誤爆であるかどうかについて議論があることを付け加えておく。ここで…

「同文字列異義語」への誤爆

同じ文字列でありながら、異なる意味を複数持つキーワードにおいて起こる誤爆のことである。主に固有名詞が同じ文字列を持つ普通名詞に誤爆することが多い。(例:「人生」「次元」) キーワードの名詞制限が撤廃された現在では、文または語句に対してこのタ…

別の単語への誤爆

別の単語への誤爆は、さらに分類することができる。 まず、どのような形態で誤爆するかで分類できる。 1つの単語への部分一致誤爆 複数の単語にまたがる誤爆 また、誤爆対象によっても分類できる。 活用しない自立語への誤爆(名詞・形容動詞語幹・代名詞な…

自動リンク誤爆の種類

自動リンク誤爆には様々な種類があるが、大きく分けると次の3種類に分類される。 別の単語への誤爆 「同文字列異義語」への誤爆 いわゆる「あまりに一般的なキーワード」による誤爆

誤爆回避を図る上での留意点

まず第一に、誤爆キーワードにも存在意義があるということを留意しなければならない。(誤爆の程度にもよるが)あまり効果が期待できないものの自動リンクシステム的側面を持っている場合もあるし、辞書・百科事典的側面については誤爆と関係なく存在意義が…

キーワードモデレーションシステムによる誤爆回避の有効性

キーワードに関するいろいろな意見の住み分けを図る目的で、キーワードモデレーションシステムが導入された。キーワードモデレーションシステム導入時のはてなのアナウンス(id:hatenadiary:20040607#1086579423)によれば、問題点として以下の2点が挙げられ…

誤爆回避策

現在提唱されている誤爆回避策としては、次の方法がある。 被誤爆語のキーワード登録 誤爆キーワードを削除+括弧付きでの再登録 誤爆キーワードの削除 誤爆キーワードのスコアを0にする 自動リンクを許可するスコアを、誤爆キーワードがリンクされない値ま…

誤爆の問題点

誤爆によって生じる弊害については、以下のものが挙げられる。 正しいキーワードによる自動リンクを阻害する(自動リンク誤爆) 各ダイアリーの見栄えを悪くする(自動リンク誤爆) 「〜含む日記」に誤爆キーワードによるリンクが含まれてしまう(捕捉誤爆)…

文章中の用語の定義

誤爆キーワード 誤爆を発生させているキーワードのこと 被誤爆語 誤爆キーワードによって誤爆が発生している単語・文。誤爆対象とも表現する。 誤爆回避キーワード 誤爆を回避するために新たに登録された(またはしようとする)キーワード 自動リンク誤爆 キ…

誤爆の定義

誤爆(ミスヒット)とは、文字列の部分一致などの理由により、日記の執筆者が意図しないキーワードリンクが発生することを言う。

誤爆に関する考察 第二版

誤爆というものを考えてみる。この文章は私の個人的解釈です。 ちなみに私はキーワードによる自動リンクができるだけ多い方がいい、すなわちキーワードは多ければ多いほど良いと思っています。それらの自動リンクがより正しく正確に働くために、誤爆による意…

編集履歴

暑い@20040818164054 (2004/08/18 16:40:54) popona 0a1,4 暑い@20040818134651 (2004/08/18 13:46:51) hatenadiary change category to 削除予定キーワード 暑い@20040818025916 (2004/08/18 02:59:16) kxh edit 暑い@20040817173943 (2004/08/17 17:39:43)…