
一、字符串和字符编码
字符 | ASCII | Unicode | UTF-8 |
---|---|---|---|
A | 01000001 | 00000000 01000001 | 01000001 |
中 | x | 01001110 00101101 | 11100100 10111000 10101101 |
从上面的表格可以发现,UTF-8编码有一个额外的好处,就是ASCII编码实际上可以被看成是UTF-8编码的一部分。
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。
用记事本编辑的时候,从文本读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:
浏览页面的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器:
对于单个字符的编码,Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符。
由于Python源代码也是一个文本文件,所以,当你的源代码中包含中文的时候,在保存源代码时,就需要务必制定保存为UTF-8编码。当Python解释器读取源代码时,为了让它按UTF-8编码读取,我们通常在文件开头写上这两行:
#/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行注释是为了告诉Python编辑器,按照UTF-8编码读取源代码,否则,你在源代码中邪的中文输出可能会出现乱码。
二、格式化
>>> 'Hello, %s' % 'world'
'Hello, world'
>>> 'Hi, %s, you have $%d.' % ('Michael', 1000000)
'Hi, Michael, you have $1000000.'
常用的占位符有:
%d 整数
%f 浮点数
%s 字符串
%x 十六进制整数
其中,格式化整数和浮点数还可以指定是否补0和整数与小数的位数:
>>> '%2d-%02d' % (3, 1)
' 3-01'
>>> '%.2f' % 3.1415926
'3.14'
若不确定应该用什么,%s永远起作用,它会把任何数据类型转换为字符串:
>>>'Age: %s. Gender: %s' % (25,True)
'Age:25. Gender : True'
若字符串里面的%是一个普通字符,这个需要转移,用%%来表示一个%:
>>>'grouwth rate: %d %%' % 7
'growth rate: 7 %'
%d | 整数 |
%f | 浮点数 |
%s | 字符串 |
%x | 十六进制整数 |
三、list和tuple
序列有两种:tuple(定值表; 也有翻译为元组) 和 list (表),tuple和list的主要区别在于,tuple的各个元素不可再变更,而list的各个元素可以再变更。
1、list
Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时添加和删除其中的元素。
比如,列表班里所有同学的名字,就可以用一个list表示:
>>>classmates['Michael','Bob','Tracy']
>>>classmates
['Michael','Bob','Tracy']
变量classmates就是一个list。用len()函数可以获得list元素的个数:
>>>len(classmates)
3
用索引来访问list中每一个位置的元素,索引是从0开始的:
>>>len[0]
'Michael'
若要取最后一个元素,除了计算索引位置外,还可以用-1做索引,直接获取最后一个元素:
>>>classmates[-1]
'Tracy'
以此类推,可以获取倒数第2个、倒数第3个:
>>>classmates[-2]
'Bob'
>>>classmates[-3]
'Michael'
list是一个可变的有序表,所以,可以往list中追加元素到末尾:
>>>classmates.append('Adam')
>>>classmates
['Michael','Bob','Tracy','Adam']
把元素插入到制定的位置,比如索引号为1的位置:
>>>classmates.insert(1,'Jack')
>>>classmates
['Michael', 'Jack', 'Bob', 'Tracy', 'Adam']
要删除指定位置的元素,用pop(i)方法,其中i是索引位置:
>>>classmates.pop(1)
'Jack'
>>>classmates
['Michael','Bob','Tracy']
要把某个元素替换成别的元素,可以直接赋值给对应的索引位置:
>>>classmates[1] = 'Sarah'
>>>classmates
['Michael','Sarah','Tracy']
list里面的元素的数据类型也可以不同,比如:
>>>L = ['Apple',123,True]
list元素也可以是另一个list,比如:
>>>s = ['python',‘java’,['asp','php'],'scheme']
>>>len(s)
4
2、tuple
tuple和list非常类似,但是tuple一旦初始化就不能修改,比如:
>>>classmats = ('Michael','Bob','Tracy')
classmates这个tuple不能变,它也没有append(),insert(),获取元素的方法和list一样,可以使用classmates[0],classmates[-1],但不能复制成另外的元素。
因tuple不可变,所以代码更安全。如果可能,能用tuple代替list就尽量用tuple。
tuple陷阱:当你定义一个tuple时,在定义的时候,tuple的元素就必须确定下来。
若定义只有1个元素的tuple:
>>>t = (1)
>>>t
1
定义的不是tuple,是这个数,因为括号()既可以表示tuple,又可以表示数学公式中的小括号,为避免歧义,Python规定,这种情况下,按小括号进行计算,因此结果为1。
当需要定义只有1个元素的tuple时必须加一个逗号,,来消除歧义:
>>>t = (1,)
>>>t
(1,)
tuple中的元素可以为一个list。