Второй закон Зипфа

Рассматривая первый закон, мы отмахнулись от факта, что разные слова входят в текст с одинаковой частотой. Зипф установил, что частота и количество слов, входящих в текст с этой частотой, тоже связаны между собой. Если построить график, отложив по оси абсцисс частоту вхождения слова, а по оси ординат - количество слов в группе с данной частотой, то получившаяся кривая будет сохранять свои параметры в пределах одного языка для всех созданных человеком текстов. Однако и межъязыковые различия невелики. На каком бы языке текст ни был написан, форма кривой Зипфа останется неизменной. Могут немного отличаться лишь коэффициенты, определяющие параметры кривой. Сказанное иллюстрируется кривыми, представленными на рис. 2, на котором показаны кривые для английского (самая нижняя), французского и русского языков (самая верхняя). (Числа на шкалах рис. 2 приведены для частного примера).

 

 

Рисунок 2 - Зависимость Количества слов в тексте от Частоты вхождения слова

Законы Зипфа универсальны. В принципе, они применимы не только к текстам. В аналогичную форму выливается, например, зависимость количества городов от числа проживающих в них жителей. Характеристики популярности узлов в сети Интернет - тоже отвечают законам Зипфа. Не исключено, что в законах отражается "человеческое" происхождение объекта.