饮冰三年-人工智能-Python-17Python基础之模块与包

时间:2021-12-24 18:40:25

一、模块(modue)

  简单理解一个.py文件就称之为一个模块。

  1.1 模块种类:  

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
         python标准库
    第三方模板
    应用程序自定义模块(尽量不要与内置函数重名)    
View Code

  1.2 模块导入方法  

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
# import cul #第一种写法
from pkage11.cul import add #第二种写法
if __name__=='__main__':
    print(add()) 
# import 语句的搜索路径
# ['', '/usr/lib/python3.4', '/usr/lib/python3.4/plat-x86_64-linux-gnu','/usr/lib/python3.4/lib-dynload', '/usr/local/lib/python3.4/dist-packages', '/usr/lib/python3/dist-packages']
# 区别:
# 无论1还是2,首先通过sys.path找到cul.py,然后执行cul脚本(全部执行),
# 区别是1会将cul这个变量名加载到名字空间,而2只会将add这个变量名加载进来。
常用的两种导入方法

   if __name__=='__main__':  #主要作用是测试当前模块,不被被调用处运行

  2.1 包

  下面有__init__.py文件的

  3 常用模块

  3.1 时间模块

  饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import time
#毫秒值--开始
print(time.time())
#输出结果 1538533474.3565
#毫秒值--结束

#结构化时间--开始
print(time.localtime())
#输出结果 time.struct_time(tm_year=2018, tm_mon=10, tm_mday=3, tm_hour=11, tm_min=5, tm_sec=21, tm_wday=2, tm_yday=276, tm_isdst=0)
print(time.gmtime())
#输出结果 time.struct_time(tm_year=2018, tm_mon=10, tm_mday=3, tm_hour=3, tm_min=8, tm_sec=19, tm_wday=2, tm_yday=276, tm_isdst=0)
#结构化时间--结束

#结构化时间==》毫秒值--开始
print(time.mktime(time.localtime()))
#结构化时间==》毫秒值--结束

#结构化时间==》格式化时间--开始
print(time.strftime('%Y-%m-%d %X',time.localtime()))
#结构化时间==》格式化时间--结束

#格式化时间==》结构化时间-开始
print(time.strptime('2018-10-03 11:18:37','%Y-%m-%d %X'))
#格式化时间==》结构化时间-结束

#固定格式的时间-开始
print(time.asctime())
print(time.ctime())
#固定格式的时间-结束
time
饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import datetime
print(datetime.datetime.now())
datetime

 3.2 随机函数

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import random
ret = random.random()
print(ret)
ret1 = random.randint(1,3) #[1,3]
print(ret1)
ret1 = random.randrange(1,3) #[1,3)
print(ret1)
ret1 = random.choice([1,3,5]) #从1,3,5中获取数据
print(ret1)
ret1 = random.sample([1,3,5],2) #从1,3,5中获取2个数据
print(ret1)
ret1=[1,3,5]
random.shuffle(ret1) #重新洗牌
print(ret1)
randomTest
饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
def v_code():
    ret=""
    for i in range(5):
        num= random.randint(0,9)
        alf=chr(random.randint(65,122))
        s=str(random.choice([num,alf]))
        ret+=s
    return ret
print(v_code())
生成验证码

 3.3 OS

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import os

os.getcwd() # 获取当前工作目录,即当前python脚本工作的目录路径
print(os.getcwd()) # D:\Code\venv1
 # 改变当前脚本工作目录;相当于shell下cd
os.chdir("..")
print(os.getcwd())
# os.curdir  返回当前目录: ('.')
print(os.curdir)
# os.pardir  获取当前目录的父目录字符串名:('..')
print(os.pardir)
# os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.makedirs('dirname1/dirname2')
# os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.removedirs('dirname1/dirname2')
# os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
os.mkdir('dirname')
# os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.listdir('dirname')
# os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.rmdir('dirname')
# os.remove()  删除一个文件
# os.rename("oldname","newname")  重命名文件/目录
os.mkdir('dirname')
os.rename('dirname','newname')
os.rmdir('newname')
# os.stat('path/filename')  获取文件/目录信息
os.mkdir('dirname')
print(os.stat('D:\Code\dirname'))
os.rmdir('dirname')
# os.sep    输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
# os.linesep    输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"
# os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
# os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
# os.system("bash command")  运行shell命令,直接显示
# os.environ  获取系统环境变量
print(os.environ)
# os.path.abspath(path)  返回path规范化的绝对路径
print(os.path.abspath('dirname'))
# os.path.split(path)  将path分割成目录和文件名二元组返回
print(os.path.split('D:\Code\dirname'))
# os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
print(os.path.dirname('D:\Code\dirname') )
# os.path.basename(path)  返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
print(os.path.basename('dirname') )
os.mkdir('dirname')
# os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
print(os.path.exists('D:\Code\dirname') )
# os.path.isabs(path)  如果path是绝对路径,返回True
print(os.path.exists('D:\Code\dirname') )
# os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
print(os.path.isfile('D:\Code\dirname') )
# os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
print(os.path.isdir('D:\Code') )
os.rmdir('dirname')
# os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
s="D:\Code"
n="dirname"
print(os.path.join(s,n) )
os.mkdir('dirname')
# os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
print(os.path.getatime('D:\Code\dirname') )
# os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
print(os.path.getmtime('D:\Code\dirname') )
os.rmdir('dirname')
os

 3.4 Json

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
# ----------------------------序列化
import json

dic = {'name': 'alvin', 'age': 23, 'sex': 'male'}
print(type(dic))  # <class 'dict'>
j = json.dumps(dic)
print(type(j))  # <class 'str'>
print(j) #{"name": "alvin", "age": 23, "sex": "male"} 把单引号修改成了双引号

data=json.loads(j)
print(data)
#{'name': 'alvin', 'age': 23, 'sex': 'male'}
json

3.5 pickle

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
##----------------------------序列化
import pickle
 
dic={'name':'alvin','age':23,'sex':'male'}
 
print(type(dic))#<class 'dict'>
 
j=pickle.dumps(dic)
print(type(j))#<class 'bytes'>
 
 
f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'
f.write(j)  #-------------------等价于pickle.dump(dic,f)
 
f.close()
#-------------------------反序列化
import pickle
f=open('序列化对象_pickle','rb')
 
data=pickle.loads(f.read())#  等价于data=pickle.load(f)
 
 
print(data['age'])  
pickle

 3.6 shelve

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import shelve

f=shelve.open(r'shelve2') #目的:将一个字典放入到文本中,二进制,是二进制啊
f["stu1_info"]={'name':'ajax','age':'12'}
f["school_info"]={'name':'北大青鸟','city':'beijing'}
f.close()
f=shelve.open(r'shelve2')
print(f.get('stu1_info')['age'])

#会生成3个文件
# shelve2.bak
# shelve2.dat
# shelve2.dir
shelve

 3.7 xml

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
<data>
    <country name="Liechtenstein">
        <rank updated="yes">2</rank>
        <year updated="yes">2013</year>
        <gdppc>141100</gdppc>
        <neighbor direction="E" name="Austria" />
        <neighbor direction="W" name="Switzerland" />
    </country>
    <country name="Singapore">
        <rank updated="yes">5</rank>
        <year updated="yes">2016</year>
        <gdppc>59900</gdppc>
        <neighbor direction="N" name="Malaysia" />
    </country>
    <country name="China">
        <rank updated="yes" />
        <year>2018</year><gdppc />
        <neighbor />
    </country>
</data>
htmlContent.html
饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
#操作xml
import xml.etree.ElementTree as ET
# 1加载xml数据
tree = ET.parse("htmlContent.html")
# 2获取根节点
root = tree.getroot();
print(root.tag) #data
#3 查询
#3.1 遍历xml文档
for child in root:
    print(child.tag,child.attrib) #country {'name': 'Liechtenstein'}
    for i in child:
        print(i.tag,i.attrib,i.text)
#3.2 只遍历year 节点
for node in root.iter('year'):
    print(node.tag,node.attrib,node.text)
#4  修改
for node in root.iter('year'):
    new_year = int(node.text)+1
    node.text=str(new_year)
    node.set("updated","yes")
tree.write("htmlContent.html")
#5 删除
for node in root.findall('country'):
    rank = int(node.find("rank").text)
    if rank > 50:
        root.remove(node)
tree.write("htmlContent.html")
#6 添加节点
country = ET.SubElement(root,"country",attrib={"name":"China"})
rank = ET.SubElement(country,"rank",attrib={"updated":"yes"})
year=ET.SubElement(country,"year")
gdppc=ET.SubElement(country,"gdppc")
neighbor=ET.SubElement(country,"neighbor")
year.text="2018"
tree.write("htmlContent.html")
#7 新建文件
new_xml = ET.Element("nameList")
name = ET.SubElement(new_xml,"name",attrib={"enrolled":"yes"})
age = ET.SubElement(name,"age",attrib={"enecked":"no"})
sex=ET.SubElement(name,"sex")
age.text='33'
st=ET.ElementTree(new_xml)
st.write("test.xml",encoding="utf-8",xml_declaration=True)
htmltest.py

 3.8 re正则匹配

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import re
#1 元字符 . ^ $ * + ? ( ) [] {} \ |
#1.1 通配符.表示任意字符
ret=re.findall('a..in','helloalvin')
print(ret)#['alvin']
#1.2 ^ 表示以。。。开头
ret=re.findall('^a...n','alvinhelloawwwn')
print(ret)#['alvin']
#1.3 \$ 表示以。。。结尾
ret=re.findall('a...n$','alvinhelloawwwn')
print(ret)#['awwwn']
#1.4 * 表示#贪婪匹配[0,+∞]
ret = re.findall('abc*', 'abcccc')
print(ret)  # ['abcccc']
#1.5 +表示#贪婪匹配[1,+∞]
ret = re.findall('abc+', 'abccc')
print(ret)  # ['abccc']
#1.6 +表示贪婪匹配[0,1]
ret = re.findall('abc?', 'abccc')
print(ret)  # ['abc']
# 注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配
#1.7 ?还可以表示取消贪婪模式
ret=re.findall('abc+?','abccc')
print(ret)#['abc']
#1.8 {}表示贪婪匹配可以指定次数
ret=re.findall('abc{1,4}','abccc')
print(ret)#['abccc'] 贪婪匹配
#1.9 []表示自定义字符集
ret = re.findall('[a-z]', 'acd')
print(ret)  # ['a', 'c', 'd']
ret = re.findall('[.*+]', 'a.cd+')
print(ret)  # ['.', '+']
#1.10 在字符集里有功能的符号: - ^ \
#- 表示范围
ret = re.findall('[1-9]', '45dha3')
print(ret)  # ['4', '5', '3']
#^ 表示取反
ret = re.findall('[^ab]', '45bdha3')
print(ret)  # ['4', '5', 'd', 'h', '3']
#\ 表示转义
ret = re.findall('[\d]', '45bdha3')
print(ret)  # ['4', '5', '3']

# 1.11 元字符之转义符\
# 反斜杠后边跟元字符去除特殊功能,比如\.
# 反斜杠后边跟普通字符实现特殊功能,比如\d
# \d  匹配任何十进制数;它相当于类 [0-9]。
# \D 匹配任何非数字字符;它相当于类 [^0-9]。
# \s  匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。
# \S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。
# \w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
# \W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
# \b  匹配一个特殊字符边界,比如空格 ,&,#等
ret=re.findall('I\b','I am LIST')
print(ret)#[]
ret=re.findall(r'I\b','I am LIST')
print(ret)#['I']

# -----------------------------eg1:
ret = re.findall('c\\\\l', 'abc\le')
print(ret)  # ['c\\l']
ret = re.findall(r'c\\l', 'abc\le')
print(ret)  # ['c\\l']

# -----------------------------eg2:
# 之所以选择\b是因为\b在ASCII表中是有意义的
m = re.findall('\bblow', 'blow')
print(m)
m = re.findall(r'\bblow', 'blow')
print(m)
# 1.12元字符之分组()
m=re.findall('(ad)+','adadad')
print(m) # 输出结果['ad'],()中有优先级,只匹配输出第一个
ret=re.search('(?P<id>\d{2})/(?P<name>\w{3})','23/com')
print(ret.group('id'))
# 输出结果 23

# 1.13元字符之|
ret = re.search('(ab)|\d',"ababababcdabc123123")
print(ret.group())# 输出结果    ab

#2  re模块下的常用方法
#2.1 findall方法  返回所有满足匹配条件的结果,放到列表中
print(re.findall('a','apple append')) #['a', 'a']
#2.2 search方法
# 只找到第一个匹配的结果,然后返回一个包含匹配信息的对象
# 该对象可以通过调用group()方法得到匹配的字符串,如果没有匹配到,返回None
print(re.search('a','apple append').group()) #a
#2.3 match方法
# 与search方法类似,但是只匹配首字母开头
print(re.match('a','isapple append')) #None

#2.4 split方法
print(re.split('[ap]','isaple append')) #['is', '', 'le ', '', '', 'end']
#先按照a分割 'is'  'pple' '' 'ppend'
#再按照p分割 'is' '' 'le' '' '' 'end'

#2.5 sub方法 替换 把数字替换成*保密
ret = re.sub('\d+','*','我的年龄是18岁')
print(ret) #我的年龄是*岁
#现在只隐藏年龄中的第一位置的数
ret = re.sub('\d','*','我的年龄是18岁',1)
print(ret) #我的年龄是*8岁

#2.5 compile方法
obj=re.compile('\d{2}') #可以多次使用
ret = obj.search("abc123def45ghi6789")
print(ret.group()) #12

#2.6 finditer方法
ret = re.finditer('\d','ds3sy4784a')
print(ret) #<callable_iterator object at 0x000000000257F198>
print(next(ret).group()) #3

#2.7 findall会优先把匹配结果组里内容返回
ret = re.findall('www.(baidu|yangke).com','www.baidu.com')
print(ret) #['baidu']
# 如果想取消优先级,需要添加?:
ret = re.findall('www.(?:baidu|yangke).com','www.baidu.com')
print(ret) #['www.baidu.com']
#2.8 补充
print(re.findall("<(?P<tag_name>\w+)>\w+</(?P=tag_name)>","<h1>hello</h1>"))
print(re.search("<(?P<tag_name>\w+)>\w+</(?P=tag_name)>","<h1>hello</h1>"))
print(re.search(r"<(\w+)>\w+</\1>","<h1>hello</h1>"))
# 2.9 练习
#匹配出所有的整数
ret=re.findall(r"-?\d+\.\d*|(-?\d+)","1-2*(60+(-40.35/5)-(-4*3))")
ret.remove("")
print(ret) #['1', '-2', '60', '5', '-4', '3']
#匹配出最里层的()
ret=re.findall("\([^()]+\)","1-2*(60+(-40.35/5)-(-4*3))")
print(ret) #['(-40.35/5)', '(-4*3)']
re

3.9 logging

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import logging

#基础设置
logging.basicConfig(
    level=logging.DEBUG,  #设置级别
    filename="loggger.log", #保存文件名
    filemode="w",   #设置读写方式
    format="%(asctime)s %(filename)s [%(lineno)d]" #时间格式 和 行号

)
logging.debug('debug message')
logging.info('info message')
logging.warning('warning message')
logging.error('error message')
logging.critical('critical message')

'''
2018-10-05 10:40:01,092 logTest.py [11]
2018-10-05 10:40:01,092 logTest.py [12]
2018-10-05 10:40:01,092 logTest.py [13]
2018-10-05 10:40:01,092 logTest.py [14]
2018-10-05 10:40:01,092 logTest.py [15]
'''
View Code
饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import logging
#1 创建对象logger
logger = logging.getLogger()
#1.1 创建文件对象和屏幕对象
fm = logging.FileHandler("logInfo.log")
sm = logging.StreamHandler()
#1.2 创建信息格式
ff = logging.Formatter("%(asctime)s,%(message)s")
#2.1 把格式添加到fm和sm上
fm.setFormatter(ff)
sm.setFormatter(ff)
#3.1 把fm和sm添加到logger上
logger.addHandler(fm)
logger.addHandler(sm)
#4设置打印级别
logger.setLevel("DEBUG")
#被调用处
logger.debug('logger debug message')
logger.info('logger info message')
logger.warning('logger warning message')
logger.error('logger error message')
logger.critical('logger critical message')
View Code

3.10 configparser

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import configparser
#创建文档
config = configparser.ConfigParser() #创建文档
#默认文档,比较特殊。1创建以后其他版块默认拥有DEFULT的属性值
# 方式一,直接赋值
config["DEFULT"]={
    "ServerAliveInterval" : "45",
    "Compression" : "yes",
    "CompressionLevel" : "9"
}
config["DEFULT"]["ForwardX11"]="yes"
# 方式二,创建一个空字典,然后给空字典赋值
config["bitbucket.org"]={}
config["bitbucket.org"]["user"]="hg"
# 方式三,创建一个空字典,然后给空字典赋值给变量,然后通过变量赋值
config["topsecret.server.com"]={}
topsecret=config["topsecret.server.com"]
topsecret["Port"] = "50022"
topsecret["ForwardX11"] = "no"
#最后统一写文件
with open("configparserContent1.ini","w") as f:
    config.write(f)








import configparser
#创建对象
config = configparser.ConfigParser()
#加载内容
config.read("configparserContent1.ini")
#
# 1.1 查看所有的key值
print(config.sections()) #['DEFULT', 'bitbucket.org', 'topsecret.server.com']
#1.2 判断某个key值是否存在
print("abc" in config) #False
# 1.3 查看某个key值中的具体内容
print(config["topsecret.server.com"]["ForwardX11"]) #no
#1.4 遍历
print("-----")
for key in config["topsecret.server.com"]:
    print(key)
#1.5 查找一个根节点的key值
print(config.options('bitbucket.org'))      #['user']
#1.6 查找一个根节点的键值对
print(config.items('bitbucket.org'))        #[('user', 'hg')]
#1.7 查找某一个具体指
print(config.get('bitbucket.org','user'))   #hg

#2 删除
#2.1 删除节点下的某个键值对
config.remove_option('bitbucket.org','user')
print(config.options('bitbucket.org'))      #[]
#2.2 删除某个节点
config.remove_section("bitbucket.org")
print(config.sections())      #['DEFULT', 'topsecret.server.com']

#3 添加
#3.1 添加某个节点
config.add_section("Aaron")
#4 修改
config.set("Aaron","age","18")
config.write(open("configparserContent1.ini","w"))
configparser

 3.11 hashlib

饮冰三年-人工智能-Python-17Python基础之模块与包饮冰三年-人工智能-Python-17Python基础之模块与包
import hashlib

m=hashlib.md5()
m.update("admin".encode("utf-8"))
print(m.hexdigest()) #21232f297a57a5a743894a0e4a801fc3
m.update("root".encode("utf-8")) #注意,其实这里是对“adminroot”加密
print(m.hexdigest()) #4b3626865dc6d5cfe1c60b855e68634a

# 为了防止撞库,我们需要对加密方式进行强化
hash = hashlib.sha256('abcd'.encode('utf8'))
hash.update('Aaron'.encode('utf8'))
print (hash.hexdigest())#c8d25a6e22ce56ec653978bc31f6006f2f3a2850cc01cfa9f509d49264705aab
hashlibTest