常用数据类型操作
数字(整形,长整形,浮点型,复数)
字符串
列表
元组
字典
集合
数字(int,float,complex)
作用:年纪,等级,薪资,身份证号,qq号等数字相关
定义:
age=10 #本质age=int(10)
salary=3000.3 #本质salary=float(3000.3)
二进制,十进制,八进制,十六进制
长整形(了解)
在python2中(python3中没有长整形的概念):
>>> num=2L
>>> type(num)
<type 'long'>
复数(了解)
>>> x=1-2j
>>> x.real
1.0
>>> x.imag
-2.0
########int整数########View Code
#1.显示当前整数的二进制
# age=15
# print(age.bit_length())
#2.获取当前数字的字节
# age=1
# v=age.to_bytes(1,byteorder='big')
# print(v)
########bool布尔值########只有为0时false
# v=0
# print(v.__bool__())
字符串
作用:名字,性别,国籍,地址等描述信息
定义:在单引号\双引号\三引号内,由一串字符组成
name='Tianle'
常用操作:
移除空白strip
切分split
长度len
索引
切片
示例:
#stripView Code
name='*egon**'
print(name.strip('*'))
print(name.lstrip('*'))
print(name.rstrip('*'))
#startswith,endswith
name='alex_SB'
print(name.endswith('SB'))
print(name.startswith('alex'))
#replace
name='alex say :i have one tesla,my name is alex'
print(name.replace('alex','SB',1))
#format的三种玩法
res='{} {} {}'.format('egon',18,'male')
res='{1} {0} {1}'.format('egon',18,'male')
res='{name} {age} {sex}'.format(sex='male',name='egon',age=18)
#find,rfind,index,rindex,count
name='egon say hello'
print(name.find('o',1,3)) #顾头不顾尾,找不到则返回-1不会报错,找到了则显示索引
# print(name.index('e',2,4)) #同上,但是找不到会报错
print(name.count('e',1,3)) #顾头不顾尾,如果不指定范围则查找所有
#split
name='root:x:0:0::/root:/bin/bash'
print(name.split(':')) #默认分隔符为空格
name='C:/a/b/c/d.txt' #只想拿到*目录
print(name.split('/',1))
name='a|b|c'
print(name.rsplit('|',1)) #从右开始切分
#join
tag=' '
print(tag.join(['egon','say','hello','world'])) #可迭代对象必须都是字符串
#center,ljust,rjust,zfill
name='egon'
print(name.center(30,'-'))
print(name.ljust(30,'*'))
print(name.rjust(30,'*'))
print(name.zfill(50)) #用0填充
#expandtabs
name='egon\thello'
print(name)
print(name.expandtabs(1))
#lower,upper
name='egon'
print(name.lower())
print(name.upper())
#captalize,swapcase,title
print(name.capitalize()) #首字母大写
print(name.swapcase()) #大小写翻转
msg='egon say hi'
print(msg.title()) #每个单词的首字母大写
#is数字系列
#在python3中
num1=b'4' #bytes
num2=u'4' #unicode,python3中无需加u就是unicode
num3='四' #中文数字
num4='Ⅳ' #罗马数字
#isdigt:bytes,unicode
print(num1.isdigit()) #True
print(num2.isdigit()) #True
print(num3.isdigit()) #False
print(num4.isdigit()) #False
#isdecimal:uncicode
#bytes类型无isdecimal方法
print(num2.isdecimal()) #True
print(num3.isdecimal()) #False
print(num4.isdecimal()) #False
#isnumberic:unicode,中文数字,罗马数字
#bytes类型无isnumberic方法
print(num2.isnumeric()) #True
print(num3.isnumeric()) #True
print(num4.isnumeric()) #True
#三者不能判断浮点数
num5='4.3'
print(num5.isdigit())
print(num5.isdecimal())
print(num5.isnumeric())
'''
总结:
最常用的是isdigit,可以判断bytes和unicode类型,这也是最常见的数字应用场景
如果要判断中文数字或罗马数字,则需要用到isnumeric
'''
#is其他
print('===>')
name='egon123'
print(name.isalnum()) #字符串由字母和数字组成
print(name.isalpha()) #字符串只由字母组成
print(name.isidentifier())
print(name.islower())
print(name.isupper())
print(name.isspace())
print(name.istitle())
#str操作练习题View Code
# 写代码,有如下变量,请按照要求实现每个功能 (共6分,每小题各0.5分)
# name = " aleX"
# # 1) 移除 name 变量对应的值两边的空格,并输出处理结果
# print(name.strip())
# # 2) 判断 name 变量对应的值是否以 "al" 开头,并输出结果
# print(name.startswith('al'))
# # 3) 判断 name 变量对应的值是否以 "X" 结尾,并输出结果
# print(name.endswith('X'))
# # 4) 将 name 变量对应的值中的 “l” 替换为 “p”,并输出结果
# print(name.replace('l','p'))
# # 5) 将 name 变量对应的值根据 “l” 分割,并输出结果。
# print(name.split('l'))
# # 6) 将 name 变量对应的值变大写,并输出结果
# print(name.upper())
# # 7) 将 name 变量对应的值变小写,并输出结果
# print(name.lower())
# # 8) 请输出 name 变量对应的值的第 2 个字符?
# print(name[1])
# # 9) 请输出 name 变量对应的值的前 3 个字符?
# print(name[0:3])
# # 10) 请输出 name 变量对应的值的后 2 个字符?
# print(name[-2:])
# # 11) 请输出 name 变量对应的值中 “e” 所在索引位置?
# print(name.find('e'))
# # 12) 获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo。
# print(name[:-1])
元组
作用:存多个值,对比列表来说,元组不可变,主要是用来读
定义:与列表类型,只不过[]换成()
可以当做字典的key
age=(11,22,33,44,55)本质age=tuple((11,22,33,44,55))
常用操作:
索引
切片
循环
长度
包含in
练习:简单购物车
实现打印商品详细信息,用户输入商品名和购买个数,则将商品名,价格,购买个数加入购物列表,如果输入为空或其他非法输入则要求用户重新输入
msg_dic={View Code
'apple':10,
'tesla':10000,
'mac':3000,
'lenovo':5000,
'chicken':10,
}
user_choice_list=[]
tag=True
while tag:
for i in msg_dic:
print('Name:{name} Price:{price}'.format(name=i,price=msg_dic[i]))
choice=input('plz choice:').strip()
if len(choice)==0 or choice not in msg_dic:continue
count=input('plz input numbers:')
if not count.isdigit():continue
user_choice_list.append((choice,msg_dic[choice],count))
print(user_choice_list)
if input('是否继续,Y or N:')!='Y':
tag=False
字典
作用:存多个值,key-value存取,取值速度快
定义:key必须是不可变类型,value可以是任意类型
info={'name':'egon','age':18,'sex':'male'} #本质info=dict({....})
或
info=dict(name='egon',age=18,sex='male')
或
info=dict([['name','egon'],('age',18)])
或
{}.fromkeys(('name','age','sex'),None)
常用操作:
存/取
删除
键s,值s,键值对
长度
循环
包含in
练习
1 有如下值集合 [11,22,33,44,55,66,77,88,99,90...],将所有大于 66 的值保存至字典的第一个key中,将小于 66 的值保存至第二个key的值中。(2分)
即: {'k1': 大于66的所有值, 'k2': 小于66的所有值}
dic={'k1':[],'k2':[]}View Code
l=[11,22,33,44,55,66,77,88,90,99]
for i in l:
if i<66:
dic['k1'].append(i)
else:
dic['k2'].append(i)
print(dic)
2 统计s='hello alex alex say hello sb sb'中每个单词的个数
结果如:{'hello': 2, 'alex': 2, 'say': 1, 'sb': 2}
s='hello hi xixi hi haha wow'View Code
l=s.split()
d1={}
for i in l:
if i in d1:
d1[i]+=1
continue
d1[i]=1
print(d1)
集合
作用:去重,关系运算,
定义:由不同元素组成的集合,集合中是一组无序排列的可hash值,可以作为字典的key
集合的目的是将不同的值存放到一起,不同的集合间用来做关系运算,无需纠结于集合中单个值
常用方法:
in 和 not in
|合集
&交集
-差集
^对称差集
==
>,>= ,<,<= 父集,子集
练习:
一.关系运算
有如下两个集合,pythons是报名python课程的学员名字集合,linuxs是报名linux课程的学员名字集合
pythons={'alex','egon','yuanhao','wupeiqi','gangdan','biubiu'}
linuxs={'wupeiqi','oldboy','gangdan'}
1. 求出即报名python又报名linux课程的学员名字集合
2. 求出所有报名的学生名字集合
3. 求出只报名python课程的学员名字
4. 求出没有同时这两门课程的学员名字集合
集合练习View Code
pythons={'alex','egon','yuanhao','wupeiqi','gangdan','bubu'}
linuxs={'wupeiqi','oldboy','gangdan'}
俩班都报名了的学生
print(pythons&linuxs)
俩班所有学生
print(pythons|linuxs)
只报名了python班的学生
print(pythons-linuxs)
没有同时报班的学生
print(pythons^linuxs)
二.去重
1. 有列表l=['a','b',1,'a','a'],列表元素均为可hash类型,去重,得到新列表,且新列表无需保持列表原来的顺序
2.在上题的基础上,保存列表原来的顺序
3.去除文件中重复的行,肯定要保持文件内容的顺序不变
4.有如下列表,列表元素为不可hash类型,去重,得到新列表,且新列表一定要保持列表原来的顺序
l=[
{'name':'egon','age':18,'sex':'male'},
{'name':'alex','age':73,'sex':'male'},
{'name':'egon','age':20,'sex':'female'},
{'name':'egon','age':18,'sex':'male'},
{'name':'egon','age':18,'sex':'male'},
]
#去重,无需保持原来的顺序View Code
l=['a','b',1,'a','a']
print(set(l))
#去重,并保持原来的顺序
#方法一:不用集合
l=[1,'a','b',1,'a']
l1=[]
for i in l:
if i not in l1:
l1.append(i)
print(l1)
#方法二:借助集合
l1=[]
s=set()
for i in l:
if i not in s:
s.add(i)
l1.append(i)
print(l1)
#同上方法二,去除文件中重复的行
import os
with open('db.txt','r',encoding='utf-8') as read_f,\
open('.db.txt.swap','w',encoding='utf-8') as write_f:
s=set()
for line in read_f:
if line not in s:
s.add(line)
write_f.write(line)
os.remove('db.txt')
os.rename('.db.txt.swap','db.txt')
#列表中元素为可变类型时,去重,并且保持原来顺序
l=[
{'name':'egon','age':18,'sex':'male'},
{'name':'alex','age':73,'sex':'male'},
{'name':'egon','age':20,'sex':'female'},
{'name':'egon','age':18,'sex':'male'},
{'name':'egon','age':18,'sex':'male'},
]
# print(set(l)) #报错:unhashable type: 'dict'
s=set()
l1=[]
for item in l:
val=(item['name'],item['age'],item['sex'])
if val not in s:
s.add(val)
l1.append(item)
print(l1)
数据类型总结
按存值个数区分
标量/原子类型 | 数字,字符串 |
容器类型 | 列表,元组,字典 |
按可变不可变区分
可变 | 列表,字典 |
不可变 | 数字,字符串,元组 |
按访问顺序区分
直接访问 | 数字 |
顺序访问(序列类型) | 字符串,列表,元组 |
key值访问(映射类型) | 字典 |