ジップの法則

ジップの法則は、ある確率で、特定のイベントの頻度fがランクrに反比例するという主張です。この法律は、アメリカの言語学者であるジョージキングスレージップ(1902〜50)によって、英語でのさまざまな単語の使用頻度について提案されました。この周波数は、およそfr)≅0.1 / rで与えられます。したがって、ある英語で最も一般的な単語(ランク1)、一般的なテキストの時間の10分の1について起こります。次の最も一般的な単語(ランク2)、約20分の1の時間です。など。これを見る別の方法は、ランクrの単語が1 /最も頻度の高い単語のr倍の頻度で、ランク2の単語はランク1の単語の半分の頻度で、ランク3の単語は3分の1の頻度で、ランク4の単語は4分の1の頻度で出現します。ランク1,000を超えると、法律は完全に破綻します。

Zipfの法則は、指数分布に従う他の多くの統計でも守られているとされています。たとえば、1949年にZipfは、国で最大の都市は、次に大きい都市の約2倍、3番目に大きい都市の3倍というように広がっていると主張しました。言語、母集団、またはその他のデータには当てはまりませんが、Zipfの法則の基本的な考え方は、データ圧縮のスキームや都市計画者によるリソースの割り当てに役立ちます。

ウィリアム・L・ホッシュ