Python自动化开发 - 字符串, 列表, 元组, 字典和和文件操作

时间:2021-06-01 19:17:50
一、字符串

特性:字符串本身不可修改,除非字符串变量重新赋值。Python3中所有字符串都是Unicode字符串,支持中文。

>>> name  = "Jonathan"

>>> name = "Jonathan" + "Ni"

>>>print(name)

Jonathan Ni  # name 被重新赋值,并不是改变原先字符串 "Joanthan"

字符串运算符

实例 a = "Hello"; b = "Python"

操作符 描述 实例
+ 字符串连接 a + b输出结果 HelloPython
[] 通过索引获取字符串中字符 a[1]输出结果 e
[:] 截取字符串中一部分 a[0:2]输出结果 He
in 成员运算符 - 如果字符串中包含给定的字符返回 True H in a 输出结果 True
not in 成员运算符 - 如果字符串中不包含给定的字符返回 True N not a 输出结果 True
格式化字符串 “%s World!"%a 输出结果 Hello World!

字符常用方法

print("jonathan".capitalize()) # 首字母大写,其余小写

print("JonaThan".casefold()) # 转为小写字符,lower() 只是ASCII编码大写转小写

print("Jonathan".center(20, "*")) # 居中,两侧填充指定字符到指定宽度

print("Jonathan".count("an")) # 统计指定字符出现次数

print("Jonathan".endswith("a")) # 判断是否以指定字符结尾

print("Joanthan".startswith("Jo")) # 判断是否以指定字符开始

print("Jonathan".replace("J", "j")) # 替换指定字符

msg = "My name is {) # 格式化

print(msg)

二、列表

列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储、修改等操作。

更改本身与字符串对比分析

定义列表

names = []

通过下标访问列表中的元素,下标从0开始计数

names[0] = "Jonathan"   # 修改元素

names.append("Jim")   >>>      ["Jonathan", "Alex", "Tom", "Catherine", "Jim"]    # 在列表最后附件元素

names.insert(2, "Linda")  >>>  ["Jonathan", "Alex", "Linda",  "Tom", "Catherine", "Jim"]     # 在下标为2的地方插入元素,其他元素后移动

names.remove("Linda")   >>>  ["Jonathan", "Alex", "Tom", "Catherine", "Jim"]   # 删除第一个检索到的元素

del names[4]    >>>   ["Jonathan", "Alex", "Tom", "Catherine"]   # 按下标删除元素

names.index(   # 返回下标

names.sort()    >>> ["Alex", "Catherine", "Jonathan", "Tom"]     #  按照ASCII正序排列

names.reverse()   >>>   ["Tom", "Jonathan", "Catherine", "Alex"]  # 元素反转

names.count("Tom")   >>>  1  # 返回出现次数

 

 

三、元组

元组其实跟列表差不多,也是存一组数,只不是它一旦创建,便不能再修改,所以又叫只读列表

names = ()

它只有2个方法,一个是count,一个是index

四、字典

字典一种key - value 的数据类型,使用就像我们上学用的字典,通过笔划、字母来查对应页的详细内容。

构成:字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格式如下所示:

d = { key1 : value1, key2 : value2 }

特性:

1) 键必须是唯一的,但值则不必

2) 值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组

3) 字典是无序的

4)字典是另一种可变容器模型,且可存储任意类型对象

5) 字典内部构成 Hash算法,查询效率高

使用字典:

import copy

# 定义字典

names = {

"stu1101": "001",

"stu1102": "002",

"stu1103": "003"

}

# 查找

print(names)  # 字典无序,每次输出结果顺序不同

print(names["stu1101"])   # 把相应的键放入方括弧

print(names["stu1104"])   # 不存在该键名时,返回KeyError: 'stu1104'

print(names.get("stu1104","000")) # 不存在该键名时,返回默认值 '000'

# 修改,定位键名则修改,无该键值则添加该键值对

names["stu1101"] = {

"name": "Jack",

,

"address": "Beijing China"

}

print(names["stu1101"]["name"]

# 删除 pop()  del

print(names.pop(names["1103"])  # 删除键名为"1103"的键值对元素,并返回该值 "003"

del names["stu1102"]

# 复制

credit_card1 = {

  "name": "Jonathan"

  "card": {

    "id": "1101",

    

  }

}

credit_card2 = credit_card1  # 前复制

credit_card3 = copy.deepcopy(credit_card2) #深复制

credit_card2["name"] = "Rose"     # credit_card2的"name"更新为"Rose",credit_card1的"name"保持不变

credit_card3["name"] = "Linda"   # credit_card2的"name"更新为"Linda",credit_card1的"name"保持不变

credit_card1[   # credit_card1的"balance" 与 credit_card2的"balance" 同步变化

credit_card2[   # credit_card2的"balance" 与 credit_card1的"balance" 同步变化

credit_card3[    # credit_card3的"balance" 与 credit_card1的"balance" 是两份不同的变量空间

五、文件操作

1、IO简介

IO - Input/Output,也就是输入和输出。程序和运行时数据都是在内存中驻留,由CPU来执行,通常需要与磁盘、网络等进行数据交换,就

需要IO接口。

IO编程中,Stream(流)是一个很重要的概念,可以把流想象成一个水管,数据就是水管里的水,但是只能单向流动。

Input Stream就是数据从外面(磁盘、网络)流进内存,Output Stream就是数据从内存流到外面去。对于浏览网页来说,

浏览器和服务器之间至少需要建立两根水管,才可以既能发数据,又能收数据。

由于CPU和内存的速度远远高于外设的速度,所以,在IO编程中,就存在速度严重不匹配的问题。比如要把100M的数据写入磁盘,

CPU输出100M的数据只需要0.01秒,可是磁盘要接收这100M数据可能需要10秒,有两种办法可以解决:

  • 第一种是CPU等着,程序暂停执行后续代码,等100M的数据在10秒后写入磁盘,再接着往下执行,这种模式称为同步IO

  • 另一种是CPU不等待,只是告诉磁盘写入,后续代码可以立刻接着执行,这种模式称为异步IO

总结:

使用异步IO来编写程序性能会远远高于同步IO,但是异步IO的缺点是编程模型复杂。

操作IO的能力都是由操作系统提供的,每一种编程语言都会把操作系统提供的低级C接口封装起来方便使用,Python也是。

2、文件操作

在磁盘上读写文件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘,

所以,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),

  • 通过操作系统提供的接口从这个文件对象中读取数据(读文件)
  • 把数据写入这个文件对象(写文件)

对文件操作流程

1) 打开文件,得到文件句柄并赋值给一个变量

2) 通过句柄对文件进行操作

3) 关闭文件

f = open("lyrics", encoding="utf-8", mode="r")     # 打开文件

first_line = f.readline()  # 读一行

print("first line:",first_line) # 打印该行

print("我是分割线".center(,"*"))  # 读取剩下的所有内容,文件大时不要用

data = f.read()  # 打印文件

print(data)

f.close() # 关闭文件

打开文件的模式有:

r, 只读模式 (默认)

w,只写模式 (不可读;不存在则创建;存在则删除内容)

a,追加模式 (可读; 不存在则创建;存在则只追加内容)

"+" 表示可以同时读写某个文件

r+,可读写文件。(可读;可写;可追加)

w+,写读

a+,同a

"b"表示处理二进制文件 (如:FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)

rb、wb、ab