数据类型和变量

整数

在Python3中，整数可以处理任意大小的整数，不分长整型和整型，十六进制用0x开头或者H结尾表示：0x2af ，2afH

用函数 int() 来转换字符串中的数字，里面不能包含除数字以外的字符，例如 int('123')

浮点数

浮点数也就是小数，除了数学表示法表示外，较大的浮点数用科学计数法表示：1.23e9 ,1.2e-4

用函数 float() 来转换字符串中的浮点数，如果字符串里是整数，也会被转换成浮点数，字符串中可以是科学计数法，例如 float('2.24e-5')+1 输出1.000024

字符串

字符串用单引号或者双引号括起来表示，两者没有区别

'abc' , "abc" 是一样的，"I'm Jack",如果字符串中包含'，则需要用""括起来，如果一个字符串两个引号都有，则需要用转义字符 \ 表示，'I\' m \"OK\"' 输出 I'm "OK"

转义字符可以转义很多字符，比如\n表示换行，\t表示制表符，字符\本身也要转义，所以\\表示的字符就是\

r'abc\[]' 表示里面的字符串原样输出，但是不能再包含单引号

'''!@#$%^v' "\\\f''' 表示里面的字符串原样输出，任何字符串都行，并且可以分成多行

字符串的一些常用方法：

'  abc\n '.strip(),# 清除空格，输出abc

'abc'.upper(),#转大写，输出ABC

'ABC'.lower(),#转小写，输出abc

'alEx'.swapcase(),# 反转大小写,输出ALeX

'abc'.capitalize(),#首字母大写，输出Abc

'abbbc'.count('a'),#计算字符出现个数，输出3

'abc'.center(50,'*'),#输出50个字符，abc居中，其余用*填充，输出*********************abc************************

'abc.py'.endswith('.py'),#判断是否以.py结尾的字符串，输出True

'abc'.isdigit(),# 是否是数字，False

'abc'.istitle(),# 是否首字母大写， False

'abc'.find('bc'),#返回子字符串在字符串出现的位置，如果不存在返回-1

'abc'.index('bc'),#同上，但是找不到字符不会返回-1，而是报错

'+'.join(''),#输出1+2+3,既把字符串中每个字符用+连接

'alex'.translate(str.maketrans('abcdef','')),#字符转义，可用作生成密码，输出：1l5x

'alexx'.replace('x','b'),#替换字符，输出alebb,还可以'alexx'.replace('x','b',1)输出alebx

'123:passwd:root'.split(':'),#分割，输出列表['123', 'passwd', 'root']

(1)输出格式化字符串：　　　　

print('''name:{name}

　　　　　age:{age}

　　　　　job:{job}

　　　　'''.format(name='Jack', age=18,  job='IT'))

　　　　输出：

　　　　name:Jack

　　　　age:18

　　　　job:IT

(2)第二种方式　　　

print('name:%s\nage:%d\njob:%s' % ('Jack', 18, 'IT'))

布尔值

布尔值用True, False 表示，用and、or、not作与或非运算

空值

空值用None表示，它不是0

变量

大小写，数字，下划线的组合，且不能以数字开头。注意不能与Python的保留字重名例如def,if while break等等

理解变量在内存中的表示：

a = 'abc'

b = a

a = 'def'

a指向'abc'所在的内存，b = a 实际上就是b也指向了'abc'的内存，a指向新的内存'def'后，b的指向并不会变

常量

在Python中并没有正真的常量，要修改也是一样的修改的，只是说用大写的字母表示这个是常量，不要去修改，例如PI = 3.14159

字符编码

编码问题

字符编码问题是程序员都会面临的一个问题，是个很大的坑，但又绕不过去，必须弄明白了，特别是python ，在2.x版本中默认编码是ascii，处理中文是有问题的，而且字符串是unicode，字节串才是str类型，搞得很抓狂，so，忘记他吧！

我们来看python3 的编码，在python3中，字符全部用两个字节的unicode表示，type('中国') 和 type(u'中国') 输出的都是str ，全部给弄成unicode 了，这里有很多同学有误解，说unicode不是个码表吗？能用来编码？不是要用utf8或者utf16\32表示unicode? 千万不要有这样的误解，unicode称为万国码包含了全球的字符集，两个字节就能表示一个字符，所以python3用unicode来表示str类型，不管输入什么字符，都给你转成两个字节的unicode。但是因为考虑到网络传输和文件保存的问题，需要在输出时转成utf8的编码格式（或者其他格式），英文一个字节，中文两个字节，方便传输和保存。

反正记住一个道理，数据在计算机中都是0101，不同的编码方式决定的只是这些01代码的排列顺序而已，如果出现乱码不要慌，只有两种可能，要么是进来的字节流用了错误的格式解析，要么就是显示的时候用了错误的格式解析，字节还是那些字节，不会变的。但是转之前请注意备份，要不然转不回来了。

这时候来个图什么的最好理解:

Python 学习之路（一）：基础

字节和字符的转换

在python3中，用b'abc'来表示bytes 数组，既字节数组，注意前面的字母b

再注意'abc'和b'abc'的区别，前一个是str，每个字母在内存中都占了两个字节（因为是unicode），后面的b'abc'里面的每个字母是一个字节的ascii码

用'abc'.encode()形式将字符串转为bytes字节数组，参数可以填不同的编码方式'utf8','gbk'等等

用 b'abc'.decode('ascii')形式将bytes字节数组按照编码形式转换成str类型

集合

list 和 tuple

list是有序列表，定义方式: []

eg_list = ['apple', 'banner', 18, 12.33, True, ['list2', 'list2']]

可以看到，list可以存储任意类型的数据，如果里面还包含列表，则变成了一个二维的列表

list的访问和增删改查：

eg_list2 = ['jerry', 'tom', 'mike']

eg_list2[0]#访问第一个元素

eg_list2[-1]#访问最后一个元素

eg_list2.append('jack')#向列表尾部增加一个元素

eg_list2.insert(1, 'jack')#在列表指定索引后增加一个元素

eg_list2.pop()#删除并返回列表末尾的元素

eg_list2.pop(1)#删除并返回指定索引的元素

eg_list2[1] = 'merry'#直接修改列表元素

tuple，又叫元组，是另一种有序列表，但是一旦定义了就不能修改了,定义方式：()

classmates = ('Michael', 'Bob', 12) # 定义

classmates[0] #访问第一个元素

classmates[-1] #访问最后一个元素

除了不能增删改查，其他的都和list 一样的，但这里有个特殊的点需要注意

 #如果要定义一个空的tuple，可以写成()：

  t = ()

  print(t)

  ()

 #但是，要定义一个只有1个元素的tuple，如果你这么定义：

  t = (1)

  print(t)

  1

 #定义的不是tuple，是1这个数！这是因为括号()既可以表示tuple，又可以表示数学公式中的小括号，这就产生了歧义，因此，Python规定，这种情况下，按小括号进行计算，计算结果自然是1。

 #所以，只有1个元素的tuple定义时必须加一个逗号,，来消除歧义：

  t = (1,)

  print(t)

  (1,)

另外，如果tuple 里有list元素，则list中的数据是可以变的，不变的是tuple对这个List元素的指向。

切片

这是Python的高级特性，非常有用

eg_lists = ['jack', 'mike', 'tom', 'apple']

#  切片包含开始索引，但不包含结束索引

print(eg_lists[1:2]) #  输出 ['mike ']

print(eg_lists[:3])  #  输出 ['jack', 'mike ', 'tom']

print(eg_lists[-2:])  #  输出 ['tom', 'apple']

print(eg_lists[:])  #  输出  ['jack', 'mike', 'tom', 'apple']

eg_lists2 = list(range(0, 100))

#  切片可以有步长step

print(eg_lists2[:10:2]) #  前面10个数，每两个取一个

print(eg_lists2[::2]) #  所有数，每两个取一个

print(eg_lists2[-10::2]) #  后10个数，每两个取一个

tuple的切片操作也是一样的。另外字符串也可以切片　

"abcdef"[:3] # 'abc'

"abcdef"[-3:] #'def'

dict和set

Python内置了字典：dict的支持，dict全称dictionary，在其他语言中也称为map，使用键-值（key-value）存储，具有极快的查找速度

定义方式：{}　　　

#判断dict中有没有key

d.get('Bob', -1)  # 输出75

d.get('not', -1)  #输出-1

'Bob' in d  # True

#  增加键值对

d['newKey'] = 'newValue'

#  删除并返回键值对

print(d.pop('Tracy'))

print(d.popitem())  #  随机删除并返回键值对

#  key不能是可变的对象

set 就是没有重复元素的dict,而且没有value

定义方式：set(list)　

s = set([1, 2, 2, 3])

print(s)  # 输出 {1, 2, 3}

#  添加元素,多次添加同一个元素无效

s.add(4)

s.add(4)

print(s)  # 输出 {1, 2, 3, 4}

#  删除元素

s.remove(2)

print(s)  # 输出 {1, 3, 4}

#set可以看成数学意义上的无序和无重复元素的集合，因此，两个set可以做数学意义上的交集、并集等操作：

s1 = set([1, 2, 3])

s2 = set([2, 3, 4])

s1 & s2  #{2, 3}

s1 | s2  #{1, 2, 3, 4}

遍历集合

如果给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历我们称为迭代（Iteration）　

eg_lists = ['jack', 'mike', 'tom', 'apple']

for x in eg_lists:

    print(x)

#  如果需要访问下标 则需要用下面方法

for i, value in enumerate(eg_lists):

    print(i, value)

dic和字符串都可以迭代

#  默认情况下，dict迭代的是key。如果要迭代value，

#  可以用for value in d.values()，如果要同时迭代key和value，可以用for k, v in d.items()

d = {'a': 1, 'b': 2, 'c': 3}

for key in d:

    print(key)

条件判断和循环

条件判断

python是没有{}代码块的，用缩进表示，4个空格

age = 3

if age >= 18:

    print('adult')

elif age >= 6:

    print('teenager')

else:

    print('kid')

循环

其实上面的集合遍历都已经用到了循环，Python中的循环就两种:　　　

for x in list

　　print(x)

while True:

　　print('over')

控制循环的语句有break 和 continue 分别表示跳出循环和跳到下次循环

总结

其实每种语言的学习都是从数据类型、数组，控制语句等学起的，这些是基础，后面的函数，特性什么的都是要建立在这上面的，如果自己本身有过其他语言的编程经验，学起来会快一些，说白了就是要习惯另一种表达方式，多敲几遍代码，多做几个例子就习惯了，习惯了就掌握了。

秒客网

Python 学习之路（一）：基础

数据类型和变量

整数

浮点数

字符串

布尔值

空值

变量

常量

字符编码

编码问题

字节和字符的转换

集合

list 和 tuple

切片

dict和set

遍历集合

条件判断和循环

条件判断

循环

总结

相关文章

Python 学习之路 （一）：基础

数据类型和变量

整数

浮点数

字符串

布尔值

空值

变量

常量

字符编码

编码问题

字节和字符的转换

集合

list 和 tuple

切片

dict和set

遍历集合

条件判断和循环

条件判断

循环

总结

相关文章

Python 学习之路（一）：基础