
本节内容
- 模块初识
- .pyc简介
- 数据类型初识
- 数据运算
- 列表、元组操作
- 字符串操作
- 字典操作
- 集合操作
- 字符编码与转码
一、模块初识
Python的强大之处在于他有非常丰富和强大的标准库和第三方库,几乎你想实现的任何功能都有相应的Python库支持,让我们先来象征性的学2个简单的。
sys
#!/usr/bin/env python # -*- coding: utf-8 -*- import sys print(sys.argv) #输出 $ python test.py helo world ['test.py', 'helo', 'world'] #把执行脚本时传递的参数获取到了
os
#!/usr/bin/env python # -*- coding: utf-8 -*- import os os.system("df -h") #调用系统命令
完美结合一下
import os,sys os.system(''.join(sys.argv[1:])) #把用户输入的参数当作一条命令交给os.system执行
自己写个模块
python tab补全模块
1 #!/usr/bin/env python 2 # python startup file 3 import sys 4 import readline 5 import rlcompleter 6 import atexit 7 import os 8 # tab completion 9 readline.parse_and_bind('tab: complete') 10 # history file 11 histfile = os.path.join(os.environ['HOME'], '.pythonhistory') 12 try: 13 readline.read_history_file(histfile) 14 except IOError: 15 pass 16 atexit.register(readline.write_history_file, histfile) 17 del os, histfile, readline, rlcompleter
写完保存后就可以使用了,但是自己写的tab.py模块只能在当前目录下导入,如果想在系统的何何一个地方都使用怎么办呢? 此时你就要把这个tab.py放到python全局环境变量目录里啦,基本一般都放在一个叫 Python/2.7/site-packages 目录下,这个目录在不同的OS里放的位置不一样,用 print(sys.path) 可以查看python环境变量列表。
二、.pyc简介
c是compiled的缩写。
1、解释型语言和编译型语言
编译型语言在程序执行之前,先会通过编译器对程序执行一个编译的过程,把程序转变成机器语言,最典型的例子就是C语言。
解释型语言就没有这个编译的过程,而是在程序运行的时候,通过解释器对程序逐行作出解释,然后直接运行,最典型的例子是Ruby。
2、Python到底是什么
其实Python和Java/C#一样,也是一门基于虚拟机的语言,我们先来了解一下Python程序的运行过程吧。
当我们在命令行中输入python hello.py时,其实是激活了Python的“解释器”,告诉“解释器”:你要开始工作了。可是在“解释”之前,其实执行的第一项工作和Java一样,是编译。其实Python也一样,当我们执行python hello.py时,他也一样执行了这么一个过程,所以我们应该这样来描述Python,Python是一门先编译后解释的语言。
3、简述Python的运行过程
我们先来说两个概念,PyCodeObject和pyc文件。我们看到的pyc自然不必多说,而其实PyCodeObject则是Python编译器真正编译成的结果。当python程序运行时,编译的结果则是保存在位于内存中的PyCodeObject中,当Python程序运行结束时,Python解释器则将PyCodeObject写回到pyc文件中。当python程序第二次运行时,首先程序会在硬盘中寻找pyc文件,如果找到,则直接载入,否则就重复上面的过程。
所以我们应该这样来定位PyCodeObject和pyc文件,我们说pyc文件其实是PyCodeObject的一种持久化保存方式。
三、数据类型初识
1、数字
int(整型)
在32位机器上,整数的位数为32位,取值范围为-2**31~2**31-1,即-2147483648~2147483647
在64位系统上,整数的位数为64位,取值范围为-2**63~2**63-1,即-9223372036854775808~
自从Python2.2起,如果整数发生溢出,Python会自动将整数数据转换为长整数,所以如今在长整数数据后面不加字母L也不会导致严重后果了。
浮点数用来处理实数,即带有小数的数字。类似于C语言中的double类型,占8个字节(64位),其中52位表示底,11位表示指数,剩下的一位表示符号。
2、布尔值
真或假
1 或 0
四、数据运算
算数运算:
比较运算:
赋值运算:
逻辑运算:
成员运算:
身份运算:
位运算:
五、再述数据类型
1. 列表、元祖操作
列表:列表是我们以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储、修改等操作。
定义列表
names = ['Tom',"Jack",'Rose']
通过下标访问列表中的元素,下标从0开始计数
>>> names[0] 'Tom' >>> names[2] 'Rose' >>> names[-1] 'Rose' >>> names[-2] #还可以倒着取 'Jack'
切片:取多个元素
>>> names = ['Tom','Jack','Rose','Lucy','Lilei','Green'] >>> names[1:4] #取下标1至下标4之间的数字,包括1,不包括4 ['Jack', 'Rose', 'Lucy'] >>> names[1:-1] #取下标1至-1的值,不包括-1 ['Jack', 'Rose', 'Lucy', 'Lilei'] >>> names[0:3] ['Tom', 'Jack', 'Rose'] >>> names[:3] #如果是从头开始取,0可以忽略,跟上句效果一样 ['Tom', 'Jack', 'Rose'] >>> names[3:] #如果想取最后一个,必须不能写-1,只能这么写 ['Lucy', 'Lilei', 'Green'] >>> names[0::2] #后面的2是代表,每隔一个元素,就取一个 ['Tom', 'Rose', 'Lilei'] >>> names[::2] #和上句效果一样 ['Tom', 'Rose', 'Lilei']
追加
>>> names = ['Tom','Jack','Rose','Lucy','Lilei','Green'] >>>names.append(“NEW”) >>>names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green', 'NEW']
插入
>>>names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green', 'NEW'] >>>names.insert(2,"从Jack后面插入") >>>names ['Tom', 'Jack', '从Jack后面插入', 'Rose', 'Lucy', 'Lilei', 'Green', 'NEW'] >>>names.insert(7,"再从Green后面插入") >>>names ['Tom', 'Jack', '从Jack后面插入', 'Rose', 'Lucy', 'Lilei', 'Green', '再从Green后面插入', 'NEW']
修改
>>>names ['Tom', 'Jack', '从Jack后面插入', 'Rose', 'Lucy', 'Lilei', 'Green', '再从Green后面插入', 'NEW'] >>> names[2] = "该换人了" >>> names ['Tom', 'Jack', '该换人了', 'Rose', 'Lucy', 'Lilei', 'Green', '再从Green后面插入', 'NEW']
删除
>>> del names[2] >>> names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green', '再从Green后面插入', 'NEW'] >>> names.remove(""再从Green后面插入"") #删除指定元素 >>> names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green', 'NEW'] >>> names.pop() #删除列表最后一个值 ‘NEW’ >>>names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green']
扩展
>>> del names[2] >>> names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green', '再从Green后面插入', 'NEW'] >>> names.remove(""再从Green后面插入"") #删除指定元素 >>> names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green', 'NEW'] >>> names.pop() #删除列表最后一个值 ‘NEW’ >>>names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green']
拷贝
>>> names ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green', 1, 2, 3] >>> name_copy = names.copy() >>> name_copy ['Tom', 'Jack', 'Rose', 'Lucy', 'Lilei', 'Green', 1, 2, 3]
上面这种copy叫浅copy,深入了解一下浅copy
names = ['Tom','Jack',['Rose','James'],'Lucy','Lilei','Green'] names_copy = names.copy() print(names) print(names_copy) names[1] = "苍老师" names[2][0] = "乔丹" print(names) print(names_copy)
程序输出:
['Tom', 'Jack', ['Rose', 'James'], 'Lucy', 'Lilei', 'Green'] ['Tom', 'Jack', ['Rose', 'James'], 'Lucy', 'Lilei', 'Green'] ['Tom', '苍老师', ['乔丹', 'James'], 'Lucy', 'Lilei', 'Green'] ['Tom', 'Jack', ['乔丹', 'James'], 'Lucy', 'Lilei', 'Green']
对,只copy了一层列表的元素,列表中如果再有列表的话,copy前后的两个列表的内层列表指向的是同一个内存地址,即 将names的Rose改成 乔丹 后,names_copy的Rose也跟着改了。
再来看看深copy
import copy names = ['Tom','Jack',['Rose','James'],'Lucy','Lilei','Green'] names_copy = copy.deepcopy(names) print(names) print(names_copy) names[1] = "苍老师" names[2][0] = "乔丹" print(names) print(names_copy)
程序输出:
['Tom', 'Jack', ['Rose', 'James'], 'Lucy', 'Lilei', 'Green'] ['Tom', 'Jack', ['Rose', 'James'], 'Lucy', 'Lilei', 'Green'] ['Tom', '苍老师', ['乔丹', 'James'], 'Lucy', 'Lilei', 'Green'] ['Tom', 'Jack', ['Rose', 'James'], 'Lucy', 'Lilei', 'Green']
看出区别了吧,深copy是将内层列表也copy了,深copy在创建联合账号时可以用到。
统计
>>>names = ['Tom','Jack','Rose','Tom','Lucy','Tom','Lilei','Green'] >>>names.count("Tom")
排序&翻转
>>> names = ['Tom','Jack','Rose','Lucy','Lilei','Green',1,2,3] >>> names.sort() #排序 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unorderable types: int() < str() #3.0里不同数据类型不能放在一起排序了,擦 >>> names[-3] = ' >>> names[-2] = ' >>> names[-1] = ' >>>names ['] >>> names.sort() >>>names [', 'Green', 'Jack', 'Lilei', 'Lucy', 'Rose', 'Tom'] >>>names.reverse() [', 'Green', 'Lilei', 'Lucy', 'Rose', 'Jack', 'Tom']
获取下标
>>>names = ['Tom','Jack','Rose','Lucy','Lilei','Green',1,2,3] >>>names.index("Jack")
元组:元组其实跟列表差不多,也是存一组数,只不是它一旦创建,便不能再修改,所以又叫只读列表
语法
names = ("tom","jack","rose")
它只有2个方法,一个是count,一个是index,完毕。
2. 字符串操作
a.count() #判断某元素在字符串中的个数
>>>a = ‘abacdaefg’ >>>a.count(‘a’)
a.capitalize() #把字符串首字母变为大写
>>>a = ‘abacdaefg’ >>>a. capitalize () ‘Abacdaefg’
a.casefold() #汉语 & 英语环境下面,继续用 lower()没问题;要处理其它语言且存在大小写情况的时候再用casefold()
>>>a = "this is A testing" >>>a.casefold() this is a testing a.center() # a = "this is A testing" print(a.center(40,"-")) -----------this is A testing------------ a.encode() #默认是UTF-8格式 msg = " 好好学习,天天向上" #print(msg.encode().decode(encoding='utf-8')) print(msg.encode()) print(msg.encode().decode()) b'\xe5\xa5\xbd\xe5\xa5\xbd\xe5\xad\xa6\xe4\xb9\xa0\xef\xbc\x8c\xe5\xa4\xa9\xe5\xa4\xa9\xe5\x90\x91\xe4\xb8\x8a'#编码 好好学习,天天向上 #解码
a.endswith() #判断字符串是否以指定字符或子字符串结尾,常用于判断文件类型
a = "this is A testing" print(a.endswith("ing")) True
a.expandtabs() #把字符串中的 tab 符号('\t')转为空格,返回字符串中的 tab 符号('\t')转为空格后生成的新字符串
a = "---\tthis is A testing" print(a) print(a.expandtabs()) --- this is A testing --- this is A testing
a.format() #格式化字符串
a = "this is A testing" print("----->{test}".format(test=a))
a.find() #返回参数在字符串中首次出现的位置
a = "this is A testing" print(a.find("s"))
a.format_map() #传入的参数是字典
a.index() #同find()方法
a.isalnum() #检测字符串是否由字母和数字组成
a.isalpha() #检测字符串是否只由字母组成
a.isdigit() #判断字符串是不是数字
a.isidentifier() #判断字符串是否是合法的标识符
a.islower() #判断是不是小写
a.isnumeric() #检测字符串是否只由数字组成
a.isspace() #判断字符串是否仅包含空格或制表符。注意:空格字符与空白是不同的
a.istitle() #判断字符串是不是标题格式
a.isupper() #判断是不是大写
a.join() #连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串
a.ljust() #返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。
a.lower() #把大写转成小写
a.lstrip() #去掉字符串左边的空格
a.maketrans() #将左右参数对应,用右边参数替换左边参数
a.replace() #把字符串中的 old(旧字符串) 替换成 new(新字符串)
a.rfind() #返回字符串最后一次出现的位置,如果没有匹配项则返回-1
a.rindex() #返回子字符串 str 在字符串中最后出现的位置
a.rjust() #返回一个原字符串右对齐,并使用空格填充至指定长度的新字符串
a.rsplit() #去掉右边空格或换行符
a.rstrip() #去掉字符串右边的空格
a.strip() #去掉字符串中的空格
a.split() #字符串切片
a.splitlines() #按行分隔,返回一个包含各行作为元素的列表,如果 num 指定则仅切片 num 个行.
a.startswith() #判断是不是以参数中内容开头
a.swapcase() #对字符串的大小写字母进行转换
a.title() #把字符串转成标题格式
a = "MY NAME Is TOM" print(a.title()) My Name Is Tom a.translate() #
a.translate() # 根据参数table给出的表(包含 256 个字符)转换字符串的字符, 要过滤掉的字符放到 del 参数中
a.upper() #把小写转成大写
3. 字典操作
字典一种key - value 的数据类型,使用就像我们上学用的字典,通过笔划、字母来查对应页的详细内容。
语法:
a = "MY NAME Is TOM" print(a.title()) My Name Is Tom a.translate() #
字典的特性:
- ·dict是无序的
- ·key必须是唯一的, 天生去重
增加
>>> info["stu04"] = "苍老师" >>> info {'stu04': '苍老师', 'stu01': 'Tom', 'stu02': 'Jack', 'stu03': 'Rose'}
修改
>>> info['stu01'] = "Lily" >>> info {'stu02': 'Jack', 'stu01': 'Lily', 'stu04': '苍老师', 'stu03': 'Rose'}
删除
>>> info {'stu01': 'Tom', 'stu03': 'Rose', 'stu04': 'Lilei', 'stu02': 'Jack'} >>>info.pop(‘stu02’) #标准删除 >>>info {'stu01': 'Tom', 'stu04': 'Lilei', 'stu03': 'Rose'} >>>del info['stu01'] #另外一种删除方式 >>>info {'stu02': 'Jack', 'stu03': 'Rose', 'stu04': 'Lilei'} >>> info.popitem() #随机删除
查找
>>> info = {'stu02': 'Tom', 'stu03': 'Jack'} >>> >>> "stu02" in info #标准用法 True >>> info.get("stu02") #获取 'Tom' >>> info["stu02"] #同上,但是看下面 'Tom' >>> info["stu05"] #如果一个key不存在,就报错,get不会,不存在只返回None Traceback (most recent call last): File "<stdin>", line 1, in <module> KeyError: 'stu05'
多级字典嵌套及操作
V = { 'car':{ 'BMW':['X5','M3'], "BenZ":['GLK','S300'], "Audi":['A8','Q7'], }, 'motorcycle':{ "川崎":["很贵","好看"], "庞巴迪":["也很贵","霸气"] }, 'bike':{ "捷安特":["不错","*产"], "永久":["便宜","国产"] } } V['car']['BMW'][1] += ":$500" print(V['car']['BMW'][1]) M3:$500
其它
info = { 'stu01':'Tom', 'stu02':'Jack', 'stu03':'Rose', 'stu04':'Lilei' }
#values
>>> info.values() dict_values(['Jack', 'Tom', 'Rose', 'Lilei'])
#keys
>>> info.keys() dict_keys(['stu01', 'stu03', 'stu04', 'stu02'])
#setdefault
>>>info.setdefault('stu05','Lily') ‘Lily’ >>>info {'stu01': 'Tom', 'stu02': 'Jack', 'stu04': 'Lilei', 'stu03': 'Rose', 'stu05': 'Lily'} >>> info.setdefault('stu02','fengjie') #已经存在的value不会被setdefault改变 ‘jack’ >>>info {'stu05': 'Lily', 'stu03': 'Rose', 'stu02': 'Jack', 'stu04': 'Lilei', 'stu01': 'Tom'}
#update
>>> info {'stu03': 'Rose', 'stu01': 'Tom', 'stu02': 'Jack', 'stu04': 'Lilei'} >>> b = {1: 2, 3: 4, 'stu02': '苍老师'} >>> info.update(b) >>> info {'stu03': 'Rose', 3: 4, 'stu02': '苍老师', 1: 2, 'stu04': 'Lilei', 'stu01': 'Tom'}
#items
info.items() #以列表返回可遍历的(键, 值) 元组数组 dict_items([(1, 2), ('stu01', 'Tom'), (3, 4), ('stu02', '苍老师'), ('stu03', 'Rose'), ('stu04', 'Lilei')])
循环dict
#方法1
for key in info: print(key,info[key])
#方法2
for k,v in info.items(): #会先把dict转成list,数据里大时莫用 print(k,v)
六、字符编码与转换
msg = " 好好学习,天天向上" print(msg.encode('utf-8')) print(msg.encode('utf-8').decode('utf-8')) 程序输出: b'\xe5\xa5\xbd\xe5\xa5\xbd\xe5\xad\xa6\xe4\xb9\xa0\xef\xbc\x8c\xe5\xa4\xa9\xe5\xa4\xa9\xe5\x90\x91\xe4\xb8\x8a' 好好学习,天天向上