文件名称:最常用单词-三菱数控指导手册api
文件大小:1.91MB
文件格式:PDF
更新时间:2024-07-03 00:32:36
python
13.4 最常用单词 为了找到最常用的单词,我们可以使用元组列表,其中每个元组包含单词和它的频率, 然后排序这个列表。 下面的函数接受一个直方图并且返回一个单词-频率的元组列表:� def most_common(hist): t = [] for key , value in hist.items(): t.append ((value , key)) t.sort(reverse=True) return t � 每一个元组中,频率在前,所以这个列表是按照频率排序。下面是输出最常用的十个单 词的循环:� t = most_common(hist) print('The␣most␣common␣words␣are:') for freq , word in t[:10]: print(word , freq , sep='\t') � 这里我通过关键词参数 sep,让 print 使用一个制表符 (Tab) 而不是空格键作为分隔符, 所以第二行将对齐。下面是对《Emma》的分析结果:� The most common words are: to 5242 the 5205 and 4897 of 4295 i 3191 a 3130 it 2529 her 2483 was 2400 she 2364 � 当然,这段代码也可以通过 sort函数的参数 key进行简化。如果你感兴趣,可以阅读这 篇文章。