7.1文件的使用
1.1文本类型
文本文件:由单一特定编码组成的文件,如.txt
二进制文件:如.png,.avi
1.2文件的打开和关闭
打开-操作-关闭
<变量名> = open(<文件名和路径>,<打开模式>)
打开模式:'r' 只读模式,默认值,如果文件不存在,返回FileNotFoundError
'w' 覆盖写模式,文件不存在则创建,存在则完全覆盖
'x' 创建写模式,文件不存在则创建,存在则FileExistsError
'a'追加写模式,文件不存在则创建,存在则在文件最后追加内容
'b'二进制文件模式
't'文本文件模式,默认值
'+' 与r/w/x/a一同使用,增加读写功能
<变量名>.close()
1.3文件内容的读取
<f>.read(size=) 读入全部内容,如果给出参数,读入前size长度
<f>.readline(size=) 读入一行内容,如果给出参数,读入该行前size长度s
<f>.readlines(hint=) 读入文件所有行,以每行为元素列表,如果给出参数,读入该行前hint行
1.4数据的文件写入
<f>.write(s) 文件写入一个字符串或字节流
<f>.writelines(lines) 将一个元素全为字符串的列表写入文件
<f>.seek(offset) 改变当前文件操作指针的位置,offset:0-文件开头,1-当前位置,2-文件结尾
7.2自动轨迹绘制实例
#AutoTraceDraw.py
import turtle as t
t.title('自动轨迹绘制')
t.setup(800,600,0,0)
t.pencolor("red")
t.pensize(5)
#数据读取
datals =[]
f = open("data.txt")
for line in f:
line = line.replace("\n","")
datals.append(list(map(eval,line.split(","))))
f.close()
#自动绘制
for i in range(len(datals)):
t.pencolor(datals[i][3],datals[i][4],datals[i][5]) #RGB颜色
t.fd(datals[i][0])
if datals[i][1]:
t.right(datals[i][2])
else:
t.left(datals[i][2])
7.3一维数据的格式化和处理
数据组织的维度
操作周期:存储格式、表示数据类型、操作
一维数据的表示:有序-列表,for循环遍历;无序-集合,for循环遍历;
存储:空格分隔,不换行;逗号分隔,不换行;特殊符号
处理:
f.write(' '.join(ls))#把空格放置在每个元素之间
7.4二维数据的格式化和处理
二维数据的表示:二维列表;
CSV数据存储格式:
二维数据的存储
二维数据的处理:
ls = [[],[],[]]
f = open("1806.csv",'w')
for item in ls:
f.write(','.join(item)+"\n")
f.close()
7.5Wordcloud库
w = wordcloud.WordCloud()
w.generate(txt) 向WordCloud对象w中加载文本txt
w.to_file(filename)将词云输出为图像文件,.png或.jpg格式
width:默认400
height:默认200
min_font_size:指定词云中字体最小号,默认4号
max_font_size:。。。。。。。最大号,根据高度自动调节
eg: w = wordcloud.WordCloud(min_font_size=20)
font_step 指定词云中字体字号的步进间隔,默认为1
font_path :指定字体文件的路径,默认None
max_words :指定词云显示的最大单词量,默认200
stop_words:指定词云的排除词列表,即不显示的单词列表
mask:
from scipy.misc import imread
mk = imread("pic.png")
w = wordcloudWordCloud(mask=mk)
background_color:指定词云的背景颜色,默认为黑色
import wordcloud
txt = "life is short,you need python"
w = wordcloud.WordCloud(\
background_color = "white")
w.generate(txt)
w.to_file("pywcloud.png")
import jieba
import wordcloud
txt = "这个问题困扰了我一年。我一直不敢和他提。\
甚至有时候我会很难受,不行我就辞职吧。\
虽然工作不错、公司不错,但是这个吸二手烟是硬伤啊!\
看吧,这就是我原来的思维。因为不敢提这件事情,甚至想到用辞职去解决。\
进行了心灵强大的刻意练习之后,我在他一次开会抽烟的时候,发了微信,和善而坚定,告诉他不要在我面前吸烟了,电子烟可以。\
结果他爽快的答应了。之后再也没犯过。"
w = wordcloud.WordCloud(width = 1000,font_path="msyh.ttc",height = 700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pycloudcloud.png")
7.6“*工作报告”词云实例
step1:读取文件、分词整理
step2:设置并输出词云
step3:观察结果,优化迭代
#CovRptWordCloudv1.py
import jieba
import wordcloud
f = open("关于实施乡村振兴战略的意见1.txt","r",encoding="utf-8")#gb2312
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path="msyh.ttc",width=1000,height=700,\
background_color="white",max_words = 15)
w.generate(txt)
w.to_file("grwordcloud.png")