Закон Зіпфа

Закон Ципфа , ймовірно, стверджує, що частоти f певних подій обернено пропорційні їхньому рангу r . Спочатку закон був запропонований американським лінгвістом Джорджем Кінгслі Ціпфом (1902–50) щодо частоти вживання різних слів в англійській мові; ця частота задається приблизно f ( r ) ≅ 0,1 / r . Таким чином, найбільш загальне слово (ранг 1) англійською мовою, який є , відбувається близько однієї десятої від часу в типовому тексті; Наступний найбільш поширене слово (ранг 2), що з , відбувається близько однієї двадцятого часу; і так далі. Інший спосіб дивитись на це полягає в тому, що слово рангу r зустрічається 1 /r разів частіше, ніж найпоширеніше слово, тому слово рангу 2 зустрічається вдвічі частіше, ніж слово рангу 1, слово рангу 3 - на третину частіше, слово рангу 4 - на чверть так часто, і так далі. Понад 1000 рангів закон повністю руйнується.

Закон Зіпфа нібито дотримувався для багатьох інших статистичних даних, які слідують за експоненціальним розподілом. Наприклад, у 1949 р. Ціпф стверджував, що найбільше місто в країні приблизно вдвічі більше за розмір наступного за величиною, втричі більше за розмір третього за величиною тощо. Хоча відповідність не ідеальна для мов, населення чи будь-яких інших даних, основна ідея закону Зіпфа корисна в схемах стиснення даних та розподілі ресурсів містобудівниками.

Вільям Л. Хош