齐夫定律
例子
最简单的齐夫定律的例子是“1/ f function”。给出一组齐夫分布的频率,按照从最常见到非常见排列,第二常见的频率是最常见频率的出现次数的½,第三常见的频率是最常见的频率的1/3,第n常见的频率是最常见频率出现次数的1/n。然而,这并不精确,因为所有的项必须出现一个整数次数,一个单词不可能出现2.5次。
在 Brown语料库 ( 俄语 : Brown Corpus ) 中,“the”、“of”、“and”是出现频率最前的三个单词,其出现的频数分别为69971次、36411次、28852次,大约占整个语料库100万个单词中的7%、3.6%、2.9%,其比例约为6:3:2。大约占整个语料库的7%(100万单词现69971次)。满足齐夫定律中的描述。仅仅前135个字汇就占了Brown语料库的一半。
齐夫定律是一个实验定律,而非理论定律,可以在很多非语言学排名中被观察到,例如不同国家中城市的数量、公司的规模、收入排名等。但它的起因是一个争论的焦点。齐夫定律很容易用点阵图观察,坐标分别为排名和频率的自然对数(log)。比如,“the”用上述表述可以描述为x = log(1), y = log(69971)的点。如果所有的点接近一条直线,那么它就遵循齐夫定律。
遵循该定律的现象
单词的出现频率:不仅适用于语料全体,也适用于单独的一篇文章
网页访问频率
城市人口
收入前3%的人的收入
地震震级
固体破碎时的碎片大小
参见
经验公式
延伸阅读
主要: 次要:
外部链接
Steven, Strogatz.Guest Column: Math and the City. The New York Times. 2009-05-29 [ 2009-05-29 ] . —An article on Zipf"s law applied to city populations
Seeing Around Corners (Artificial societies turn up Zipf"s law)
PlanetMath article on Zipf"s law
Distributions de type "fractal parabolique" dans la Nature (French, with English summary)
An analysis of income distribution
Zipf List of French words
Zipf list for English, French, Spanish, Italian, Swedish, Icelandic, Latin, Portuguese and Finnish from Gutenberg Project and online calculator to rank words in texts
Citations and the Zipf–Mandelbrot"s law
Zipf"s Law for U.S. Citiesby Fiona Maclachlan, Wolfram Demonstrations Project.
MathWorld上 Zipf"s Law 的资料,作者:埃里克·韦斯坦因。
Zipf"s Law examples and modelling (1985)
Complex systems: Unzipping Zipf"s law (2011)
Benford’s law, Zipf’s law, and the Pareto distributionby Terence Tao.
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值