jieba库及词频统计

 import jieba

 txt = open("C:\\Users\\Administrator\\Desktop\\流浪地球.txt", "r", encoding='utf-8').read()

 words  = jieba.lcut(txt)

 counts = {}

 for word in words:

     if len(word) == 1:  #排除单个字符的分词结果

         continue

     else:

         counts[word] = counts.get(word,0) + 1

 items = list(counts.items())

 items.sort(key=lambda x:x[1], reverse=True)

 for i in range(10):

     word, count = items[i]

     print ("{0:<10}{1:>5}".format(word, count))

jieba库及词频统计

秒客网

jieba库及词频统计

相关文章