运维工程师一般做两个主要工作:1.数据保护。2.不间断服务。
一.数据保护.
全网数据备份解决方案:
数据保护包括:数据库,图片,程序,运维配置文件,其他相关的。
数据库数据:主从(物理故障),备机开binlog保持一天以上,按天做备份
案例百度:一主多从,M-s1(不提供服务,专做备份,实时同步,谷歌半同步插件,事物提交)
图片资源备份方式 s2
增量备份:
(1)rsync 小文件比对时间很长。
(2)drbd 浪费资源,备节点不可用。
(3)按时间增量
(4)更新资源写LOG
(5)inotify,sersync等。
全量备份:
(1)drbd
(2) 程序双写,提交数据写到两个存储
(3)分布式存储。NOSQL,mysql,mongodb同步机制做存储
(4)架构方案。
程序、配置文件按天备份即可:
办公室--IDC测试--IDC正式
程序运维配置文件都放到SVN里,向外发布。
办公室SVN-->IDC测试
-->IDC正式
备份思想:
1.需求分析:对于每一个项目或者业务点:事先定好 备份规划。
数据库:10分钟,可以丢一天。根据需求出方案。
存储备份:可以丢一天。根据需要出方案。
测试数据:运维总监,开发总监,团队讨论。30分钟内恢复。
机房迁移,OPENSLL升级,数据库升级。
二 不间断服务:
集群(lvs,nginx,haproxy,f5,netscaler)
高可用(keepalive,heartbeat,nginx,haproxy),
性能\扩展(优化,用户体验要好,业务可以扩展)
监控(运维级别,业务级别(按产品线监控,流量,负载,访问请求,错误日志50x,40x,接口存 活)以及流量)