基于Nginx及FastDFS,完成商品图片的上传及展示
一、传统图片存储及展示方式
存在问题:
1)大并发量上传访问图片时,需要对web应用做负载均衡,但是会存在图片共享问题
2)web应用服务器的存储空间有限,它是web应用服务器,而不是存储服务器。
3)web应用服务器的本身的io读写性能不高,图片上传下载时,速度偏慢
4)web应用服务器访问图片时,由于图片内容较大,并发量大的时候,会占用web应用服务器的带宽,这样该web应用服务器的其他功能就会受到较大的影响。
解决方案:
1)将图片集中存储到IO读写性能高的图片服务器中。
2)下载访问图片时,使用http服务器直接读取图片服务器中的图片。
二、集群模式
(1)Nginx快速入门
Nginx是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器。主要应用于:HTTP服务器、反向代理服务器\负载均衡服务器、虚拟主机。
Nginx的安装(另见《电商常用软件安装篇》)
Nginx的使用(通过修改nginx.conf配置文件实现)
1)虚拟主机配置
将网络中的每一台计算机分成多个虚拟主机,每个虚拟主机可以单独对外提供www服务。
a)基于端口配置(ip地址一致,端口不一致)
#基于80端口的虚拟主机
server {
listen 80;
server_name 192.168.242.128;
location / {
root html;
index index.html index.htm;
}
}
#基于81端口的虚拟主机
server {
listen 81;
server_name 192.168.242.128;
location /{
root html81;
index index.html index.htm;
}
}
b)基于域名配置
①修改hosts文件,实现ip地址和域名的映射配置:
Hosts文件的位置:C:\Windows\System32\drivers\etc\hosts
建议使用SwitchHosts工具修改本地DNS配置。
②配置nginx.conf
#基于www.aaa.com域名的虚拟主机
server {
listen 80;
server_name www.aaa.com;
location /{
root htmlaaa;
index index.html index.htm;
}
}
#基于www.bbb.com域名的虚拟主机
server {
listen 80;
server_name www.bbb.com;
location /{
root htmlbbb;
index index.html index.htm;
}
}
2)反向代理配置
通常的代理服务器,只用于代理内部网络对Internet的连接请求;而反向代理(Reverse
Proxy)方式是指以代理服务器来接受internet上的连接请求。
简单理解:以tomcat为中心,以内外网为前提,tomcat主动出击是正向代理,而tomcat
被动接受请求就是反向代理。
3)负载均衡配置
简单理解:反向代理负载均衡技术是把将来自internet上的连接请求以反向代理的方式动态地转发给内部网络上的多台服务器进行处理,从而达到负载均衡的目的。
① 负载均衡的方式:硬负载(F5服务器)、软负载(Nginx)
② 负载均衡的策略:轮询、ip_hash等
③ 具体配置
tomcat+nginx演示:
反向代理案例中,通过域名www.tomcat1.com访问时,后台只有8080端口服务进行响应。
负载均衡配置时,通过域名www.tomcat1.com访问时,后台除了8080端口响应,再添加一台8282服务器响应服务。
修改nginx配置文件,修改如下:
upstream tomcat1{
#weight 权重,默认是1,权重越高,被分配的几率越大
server 192.168.242.128:8080 weight=2;
server 192.168.242.128:8282;
}
#配置一个虚拟主机
server {
listen 80;
server_name www.tomcat1.com;
location / {
proxy_pass http://tomcat1;
}
}
(2)FastDFS
FastDFS是用C语言编写的一款开源的分布式文件系统。FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。
1)FastDFS架构(Tracker server + Storage server)
① Tracker server作用是对Storage server进行负载均衡和调度,在文件上传时会直接请求Tracker server,然后Tracker server可以根据一些策略找到Storage server来提供文件上传服务。所以可以将tracker称为追踪服务器或调度服务器。
② Storage server作用是文件存储,客户端上传的文件最终存储在Storage服务器上,Storage server没有实现自己的文件系统而是利用操作系统的文件系统来管理文件。可以将storage称为存储服务器。
具体架构如下图:
2)Tracker 集群
FastDFS集群中的Tracker server可以有多台,Tracker server之间是相互平等关系同时提供服务,Tracker server不存在单点故障。客户端请求Tracker server采用轮询方式,如果请求的tracker无法提供服务则换另一个tracker。
3)Storage集群
Storage集群采用了分组存储方式。storage集群由一个或多个组构成,一个组由一台或多台存储服务器组成,组内的Storage server之间是平等关系,不同组的Storage server之间不会相互通信,同组内的Storage server之间会相互连接进行文件同步,从而保证同组内每个storage上的文件完全一致的。一个组的存储容量为该组内存储服务器容量最小的那个,集群存储总容量为集群中所有组的存储容量之和,由此可见组内存储服务器的软硬件配置最好是一致的。
采用分组存储方式的好处是灵活、可控性较强。比如上传文件时,可以由客户端直接指定上传到的组也可以由tracker进行调度选择。一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向扩容)。当系统容量不足时,可以增加组来扩充存储容量(横向扩容)。
4)Storage状态收集
Storage server会连接集群中所有的Tracker server,定时向他们报告自己的状态,包括磁盘剩余空间、文件同步状况、文件上传下载次数等统计信息。
5)文件上传流程
客户端上传文件后存储服务器将文件ID返回给客户端,此文件ID用于以后访问该文件的索引信息。文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名。
n 组名:文件上传后所在的storage组名称,在文件上传成功后有storage服务器返回,需要客户端自行保存。
n 虚拟磁盘路径:storage配置的虚拟路径,与磁盘选项store_path*对应。如果配置了store_path0则是M00,如果配置了store_path1则是M01,以此类推。
n 数据两级目录:storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
n 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。
6)文件下载流程
tracker根据请求的文件路径即文件ID来快速定义文件。
比如请求下边的文件:
1.通过组名tracker能够很快的定位到客户端需要访问的存储服务器组是group1,并选择合适的存储服务器提供客户端访问。
2.存储服务器根据“文件存储虚拟磁盘路径”和“数据文件两级目录”可以很快定位到文件所在目录,并根据文件名找到客户端需要访问的文件。