Python全栈【socket网络编程】 |
本章内容:
- Socket
- 基于TCP的套接字
- 基于UDP的套接字
- TCP粘包
- SocketServer 模块(ThreadingTCPServer源码剖析)
Socket |
1、socket通常也称作"套接字"
用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。
socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)
socket和file的区别:
- file模块是针对某个指定文件进行【打开】【读写】【关闭】
- socket模块是针对 服务器端 和 客户端Socket 进行【打开】【读写】【关闭】
为何学习socket一定要先学习互联网协议:
1.首先:本节课程的目标就是教会你如何基于socket编程,来开发一款自己的C/S架构软件
2.其次:C/S架构的软件(软件属于应用层)是基于网络进行通信的
3.然后:网络的核心即一堆协议,协议即标准,你想开发一款基于网络通信的软件,就必须遵循这些标准。
2、socket层
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
所以,我们无需深入理解tcp/udp协议,socket已经为我们封装好了,我们只需要遵循socket的规定去编程,写出的程序自然就是遵循tcp/udp标准的。
3、套接字有两种(或者称为有两个种族),分别是基于文件型的和基于网络型的。
1)基于文件类型的套接字家族
套接字家族的名字:AF_UNIX
unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信
2)基于网络类型的套接字家族
套接字家族的名字:AF_INET
(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)
4、套接字工作流程
服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接。在这时如果有个客户端初始化一个Socket,然后连接服务器(connect),如果连接成功,这时客户端与服务器端的连接就建立了。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,一次交互结束。
★★★★★★TCP套接字工作流程(牢记)
复习三次握手与四次挥手
socket类
sk = socket.socket(socket.AF_INET,socket.SOCK_STREAM,0) 参数一:地址簇 socket.AF_INET IPv4(默认) socket.AF_INET6 IPv6 socket.AF_UNIX 只能够用于单一的Unix系统进程间通信 参数二:类型 socket.SOCK_STREAM 流式socket , for TCP (默认) socket.SOCK_DGRAM 数据报式socket , for UDP 参数三:协议 0 (默认)与特定的地址家族相关的协议,如果是 0 ,则系统就会根据地址格式和套接类别,自动选择一个合适的协议 sk.bind(address) s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。 sk.listen(backlog) 开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。 backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5 这个值不能无限大,因为要在内核中维护连接队列 sk.setblocking(bool) 是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。 sk.accept() 接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。 接收TCP 客户的连接(阻塞式)等待连接的到来 sk.connect(address) 连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。 sk.connect_ex(address) 同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061 sk.close() 关闭套接字 sk.recv(bufsize[,flag]) 接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。 sk.recvfrom(bufsize[.flag]) 与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。 sk.send(string[,flag]) 将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。即:可能未将指定内容全部发送。 sk.sendall(string[,flag]) 将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。 内部通过递归调用send,将所有内容发送出去。 sk.sendto(string[,flag],address) 将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。 sk.settimeout(timeout) 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如 client 连接最多等待5s ) sk.getpeername() 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。 sk.getsockname() 返回套接字自己的地址。通常是一个元组(ipaddr,port) sk.fileno() 套接字的文件描述符
基于TCP的套接字 |
举例学习:模拟FTP文件上传及断点续传
#tcp_server.py from socket import * ip_port = ('127.0.0.1',8000) buffer_size = 1024 back_log = 5 server = socket(AF_INET,SOCK_STREAM) server.bind(ip_port) server.listen(back_log) conn,addr = server.accept() f_size = int(str(conn.recv(buffer_size).decode('utf-8'))) conn.send(bytes(str(f_size).encode('utf-8'))) recv_size=0 with open('2.txt', 'wb') as f: while True: if recv_size ==f_size: break else: recv_msg = conn.recv(buffer_size) f.write(recv_msg) recv_size += len(recv_msg)
#tcp_client.py from socket import * import os ip_port = ('127.0.0.1',8000) buffer_size = 1024 back_log = 5 client = socket(AF_INET,SOCK_STREAM) client.connect(ip_port) file_size=os.stat('1.txt').st_size client.send(str(file_size).encode('utf-8')) #先发送文件大小,解决粘包问题 msg = client.recv(buffer_size) have_rec = 0 if int(str(msg.decode('utf-8'))) ==file_size: with open('1.txt', 'rb') as f: for line in f: client.send(line) have_rec+=len(line) print('模拟断点出现') break # 模拟出现断点的情况再续传 with open('1.txt', 'rb') as f: f.seek(have_rec) # 文件指针指到已经上传完成的部分 for line in f: client.send(line)
基于UDP的套接字 |
服务端
from socket import * import time ip_port=('127.0.0.1',9000) BUFSIZE=1024 udp_server=socket(AF_INET,SOCK_DGRAM) #面向信息 #UDP无连接,所以可以同时多个客户端去跟服务端通信 udp_server.bind(ip_port) #需要绑定地址与端口号 while True: msg,addr=udp_server.recvfrom(BUFSIZE) print(msg.decode('utf-8'),addr) #hello ('127.0.0.1', 49448) if not msg: fmt ='%Y-%m-%d %X' else: fmt ='%Y:%m:%d %X' back_time = time.strftime(fmt) udp_server.sendto(back_time.encode('utf-8'),addr) #发送信息时需要后面带目的地址信息
客户端
from socket import * ip_port=('127.0.0.1',9000) BUFSIZE=1024 udp_client=socket(AF_INET,SOCK_DGRAM) while True: msg=input('>>: ').strip() if not msg:continue udp_client.sendto(msg.encode('utf-8'),ip_port) #发送带服务端地址信息 back_msg,addr=udp_client.recvfrom(BUFSIZE) print(back_msg.decode('utf-8')) #2017:01:03 09:24:48
UDP模拟Win下cmd命令(会丢包)
from socket import * import subprocess ip_port = ('127.0.0.1',8000) back_log = 5 buffer_size = 1024 udp_server = socket(AF_INET,SOCK_DGRAM) udp_server.bind(ip_port) while True: cmd,addr = udp_server.recvfrom(buffer_size) print('新的客户端链接',addr) print('收到客户的命令是',cmd.decode('utf-8')) res = subprocess.Popen(cmd.decode('utf-8'),shell=True, stderr = subprocess.PIPE, stdout = subprocess.PIPE, stdin = subprocess.PIPE) err = res.stderr.read() if err: cmd_res =err else: cmd_res = res.stdout.read() udp_server.sendto(cmd_res,addr)
server
from socket import * ip_port = ('127.0.0.1',8000) back_log = 5 buffer_size = 1024 udp_client = socket(AF_INET,SOCK_DGRAM) while True: cmd =input('>>>').strip() if not cmd:continue if cmd =='quit':break udp_client.sendto(cmd.encode('utf-8'),ip_port) cmd_res,addr = udp_client.recvfrom(buffer_size) print('命令执行的结果是',cmd_res.decode('gbk')) udp_client.close()
client
TCP粘包 |