Python 学习之路 (一):基础

时间:2022-06-22 16:31:41

  

数据类型和变量

整数

在Python3中,整数可以处理任意大小的整数,不分长整型和整型, 十六进制用0x开头或者H结尾表示:0x2af ,2afH

用函数 int() 来转换字符串中的数字,里面不能包含除数字以外的字符,例如 int('123')

浮点数

浮点数也就是小数,除了数学表示法表示外,较大的浮点数用科学计数法表示:1.23e9 ,1.2e-4

用函数 float() 来转换字符串中的浮点数,如果字符串里是整数,也会被转换成浮点数,字符串中可以是科学计数法,例如 float('2.24e-5')+1 输出1.000024

字符串

字符串用单引号或者双引号括起来表示,两者没有区别

'abc' , "abc" 是一样的,"I'm Jack",如果字符串中包含',则需要用""括起来,如果一个字符串两个引号都有,则需要用转义字符 \ 表示,'I\' m \"OK\"' 输出 I'm "OK"

转义字符可以转义很多字符,比如\n表示换行,\t表示制表符,字符\本身也要转义,所以\\表示的字符就是\

r'abc\[]' 表示里面的字符串原样输出,但是不能再包含单引号

'''!@#$%^v' "\\\f''' 表示里面的字符串原样输出,任何字符串都行,并且可以分成多行

字符串的一些常用方法:

'  abc\n '.strip(),# 清除空格,输出abc

'abc'.upper(),#转大写,输出ABC

'ABC'.lower(),#转小写,输出abc

'alEx'.swapcase(),# 反转大小写,输出ALeX

'abc'.capitalize(),#首字母大写,输出Abc

'abbbc'.count('a'),#计算字符出现个数,输出3

'abc'.center(50,'*'),#输出50个字符,abc居中,其余用*填充,输出*********************abc************************

'abc.py'.endswith('.py'),#判断是否以.py结尾的字符串,输出True

'abc'.isdigit(),# 是否是数字,False

'abc'.istitle(),# 是否首字母大写, False

'abc'.find('bc'),#返回子字符串在字符串出现的位置,如果不存在返回-1

'abc'.index('bc'),#同上,但是找不到字符不会返回-1,而是报错

'+'.join(''),#输出1+2+3,既把字符串中每个字符用+连接

'alex'.translate(str.maketrans('abcdef','')),#字符转义,可用作生成密码,输出:1l5x

'alexx'.replace('x','b'),#替换字符,输出alebb,还可以'alexx'.replace('x','b',1)输出alebx

'123:passwd:root'.split(':'),#分割,输出列表['123', 'passwd', 'root']   

(1)输出格式化字符串:    

print('''name:{name}

     age:{age}

     job:{job}

    '''.format(name='Jack', age=18,  job='IT'))

    输出:

    name:Jack

    age:18

    job:IT

(2)第二种方式   

print('name:%s\nage:%d\njob:%s' % ('Jack', 18, 'IT'))

布尔值

布尔值用True, False 表示,用and、or、not作与或非运算

空值

空值用None表示,它不是0

变量

大小写,数字,下划线的组合,且不能以数字开头。注意不能与Python的保留字重名例如def,if while break等等

理解变量在内存中的表示:

a = 'abc'

b = a

a = 'def'

a指向'abc'所在的内存,b = a 实际上就是b也指向了'abc'的内存,a指向新的内存'def'后,b的指向并不会变

常量

在Python中并没有正真的常量,要修改也是一样的修改的,只是说用大写的字母表示这个是常量,不要去修改,例如PI = 3.14159

字符编码

编码问题

字符编码问题是程序员都会面临的一个问题,是个很大的坑,但又绕不过去,必须弄明白了,特别是python ,在2.x版本中默认编码是ascii,处理中文是有问题的,而且字符串是unicode,字节串才是str类型,搞得很抓狂,so,忘记他吧!

我们来看python3 的编码,在python3中,字符全部用两个字节的unicode表示,type('中国')  和 type(u'中国')  输出的都是str ,全部给弄成unicode 了,这里有很多同学有误解,说unicode不是个码表吗?能用来编码?不是要用utf8或者utf16\32表示unicode? 千万不要有这样的误解,unicode称为万国码包含了全球的字符集,两个字节就能表示一个字符,所以python3用unicode来表示str类型,不管输入什么字符,都给你转成两个字节的unicode。但是因为考虑到网络传输和文件保存的问题,需要在输出时转成utf8的编码格式(或者其他格式),英文一个字节,中文两个字节,方便传输和保存。

反正记住一个道理,数据在计算机中都是0101,不同的编码方式决定的只是这些01代码的排列顺序而已,如果出现乱码不要慌,只有两种可能,要么是进来的字节流用了错误的格式解析,要么就是显示的时候用了错误的格式解析,字节还是那些字节,不会变的。但是转之前请注意备份,要不然转不回来了。

这时候来个图什么的最好理解:

Python 学习之路 (一):基础

字节和字符的转换

在python3中,用b'abc'来表示bytes 数组,既字节数组,注意前面的字母b

再注意'abc'和b'abc'的区别,前一个是str,每个字母在内存中都占了两个字节(因为是unicode),后面的b'abc'里面的每个字母是一个字节的ascii码

用'abc'.encode()形式将字符串转为bytes字节数组,参数可以填不同的编码方式'utf8','gbk'等等

用 b'abc'.decode('ascii')形式将bytes字节数组按照编码形式转换成str类型

集合

list 和 tuple

list是有序列表,定义方式: []

eg_list = ['apple', 'banner', 18, 12.33, True, ['list2', 'list2']]

可以看到,list可以存储任意类型的数据,如果里面还包含列表,则变成了一个二维的列表

list的访问和增删改查:

eg_list2 = ['jerry', 'tom', 'mike']

eg_list2[0]#访问第一个元素

eg_list2[-1]#访问最后一个元素

eg_list2.append('jack')#向列表尾部增加一个元素

eg_list2.insert(1, 'jack')#在列表指定索引后增加一个元素

eg_list2.pop()#删除并返回列表末尾的元素

eg_list2.pop(1)#删除并返回指定索引的元素

eg_list2[1] = 'merry'#直接修改列表元素

tuple,又叫元组,是另一种有序列表,但是一旦定义了就不能修改了,定义方式:()

classmates = ('Michael', 'Bob', 12) # 定义

classmates[0] #访问第一个元素

classmates[-1] #访问最后一个元素   

除了不能增删改查,其他的都和list 一样的,但这里有个特殊的点需要注意

 #如果要定义一个空的tuple,可以写成():
t = ()
print(t)
()
#但是,要定义一个只有1个元素的tuple,如果你这么定义:
t = (1)
print(t)
1
#定义的不是tuple,是1这个数!这是因为括号()既可以表示tuple,又可以表示数学公式中的小括号,这就产生了歧义,因此,Python规定,这种情况下,按小括号进行计算,计算结果自然是1。 #所以,只有1个元素的tuple定义时必须加一个逗号,,来消除歧义:
t = (1,)
print(t)
(1,)

另外,如果tuple 里有list元素,则list中的数据是可以变的,不变的是tuple对这个List元素的指向。

切片

这是Python的高级特性,非常有用

eg_lists = ['jack', 'mike', 'tom', 'apple']
# 切片包含开始索引,但不包含结束索引
print(eg_lists[1:2]) # 输出 ['mike ']
print(eg_lists[:3]) # 输出 ['jack', 'mike ', 'tom']
print(eg_lists[-2:]) # 输出 ['tom', 'apple']
print(eg_lists[:]) # 输出 ['jack', 'mike', 'tom', 'apple'] eg_lists2 = list(range(0, 100))
# 切片可以有步长step
print(eg_lists2[:10:2]) # 前面10个数,每两个取一个
print(eg_lists2[::2]) # 所有数,每两个取一个
print(eg_lists2[-10::2]) # 后10个数,每两个取一个

tuple的切片操作也是一样的。另外字符串也可以切片 

"abcdef"[:3] # 'abc'
"abcdef"[-3:] #'def' 

dict和set

Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度

定义方式:{}   

#判断dict中有没有key
d.get('Bob', -1) # 输出75
d.get('not', -1) #输出-1
'Bob' in d # True # 增加键值对
d['newKey'] = 'newValue'
# 删除并返回键值对
print(d.pop('Tracy'))
print(d.popitem()) # 随机删除并返回键值对 # key不能是可变的对象

set 就是没有重复元素的dict,而且没有value

定义方式:set(list) 

s = set([1, 2, 2, 3])
print(s) # 输出 {1, 2, 3} # 添加元素,多次添加同一个元素无效
s.add(4)
s.add(4)
print(s) # 输出 {1, 2, 3, 4} # 删除元素
s.remove(2)
print(s) # 输出 {1, 3, 4} #set可以看成数学意义上的无序和无重复元素的集合,因此,两个set可以做数学意义上的交集、并集等操作: s1 = set([1, 2, 3])
s2 = set([2, 3, 4])
s1 & s2 #{2, 3}
s1 | s2 #{1, 2, 3, 4}

遍历集合

如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们称为迭代(Iteration) 

eg_lists = ['jack', 'mike', 'tom', 'apple']

for x in eg_lists:
print(x) # 如果需要访问下标 则需要用下面方法 for i, value in enumerate(eg_lists):
print(i, value)

dic和字符串都可以迭代

#  默认情况下,dict迭代的是key。如果要迭代value,
# 可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()
d = {'a': 1, 'b': 2, 'c': 3}
for key in d:
print(key)

条件判断和循环

条件判断

python是没有{}代码块的,用缩进表示,4个空格

age = 3
if age >= 18:
print('adult')
elif age >= 6:
print('teenager')
else:
print('kid')

循环

其实上面的集合遍历都已经用到了循环,Python中的循环就两种:   

for x in list
  print(x)
while True:
  print('over')

控制循环的语句有break 和 continue 分别表示跳出循环和跳到下次循环

总结

其实每种语言的学习都是从数据类型、数组,控制语句等学起的,这些是基础,后面的函数,特性什么的都是要建立在这上面的,如果自己本身有过其他语言的编程经验,学起来会快一些,说白了就是要习惯另一种表达方式,多敲几遍代码,多做几个例子就习惯了,习惯了就掌握了。