fastdfs常见故障

时间:2024-03-19 17:47:42

1 机器故障(集群)

1.1 如果集群中,假设其他组的剩余空间都是1%,只剩下一组能够提供服务(一组中有3台机器),如果这组服务中有一台机器挂了,唯一的一个集群是否还能继续服务?

1.2 如果有2个集群可用,如果其中一个1个集群不可用,是否能够自动切换到另外一个集群?

2 磁盘故障

2.1 更换磁盘,不能写入问题

3 配置文件不正确

3.1 新加机器,更换磁盘,认为改动配置文件不正确?

3.2 reserved_storage_space = 1%
6:FastDFS 和 FastDHT 服务正常,但是添加切图任务失败,查看 debug 版的 iserver.log,日志显示“向 FastDFS 的 storageServer 上传数据 tileset_names 时,发生 MyException ,异常信息是:getStoreStorage fail, errno code: 28”,这是什么原因?

A:错误代码28表示 No space left on device。FastDFS 可在 tracker.conf 配置文件中设置 reserved_storage_sapce 参数,即 storage 的预留存储空间大小,默认为10%。如果预留空间小于该设置值,将出现28错误。

1、安装完fastdht后,启动fastdfs的storage报错fdfs_storaged: symbol lookup error: fdfs_storaged: undefined symbol: g_current_time

解决方法:重新安装libfastcommon

3.3 fastdfs故障 Idle too long, status change to offline!
是g_connection_pool_max_idle_time=3600s。应该是指,tracker会检测storage是否在线,如果超过3600s没检测到storage
则会将storage踢下线,类似于nginx的upstream。但问题是,网络恢复正常后,tracker却没有再次将storage的状态改变。。。

3.4 fdfs_trackerd或者fdfs_storaged的日志中出现:malloc task buff failed字样的错误,这是怎么回事?
出现此类信息表示已经达到最大连接数。server端支持的最大连接数可以通过max_connections这个参数来设置。
出现这样的问题,需要排查一下是否客户端使用不当导致的,比如客户端没有及时关闭无用的连接。

技术交流

CleverCode是一名架构师,技术交流,咨询问题,请加CleverCode创建的qq群(架构师俱乐部):517133582。加群和腾讯,阿里,百度,新浪等公司的架构师交流。【架构师俱乐部】宗旨:帮助你成长为架构师!
fastdfs常见故障