短文详情

语言中的数学规律

无论是各版《红楼梦》,莎士比亚的剧作,还是维基百科,甚至在海豚的鸣叫声中,都隐藏着一个诡异的数学规律:齐夫定律(Zipf's Law)。

在任何语言资料库中,如果将单词按出现频率排序,排在第 n 位的词出现的频率总是大约等于第一名频率的 1/n。


e.g. 在大多数大型英文语料库中:Top1 "the" 约占7%;Top2 "of"约占3.5%;Top3 "and"约占2.3%齐夫本人将其解释为“最省力原则” ...

秩序并非总是人为设计的,而是从随机性中自然涌现的,是这样的吗?
0
0