美文网首页存储学习空间
ceph-fuse客户端问题排查流程

ceph-fuse客户端问题排查流程

作者: relaX_2363 | 来源:发表于2019-06-13 09:55 被阅读0次

本文讲述了ceph-fuse客户端问题排查基本流程:)

首先查看集群的整体情况
ceph -s

是否有osd挂掉,是否有pg非active

ceph-fuse进程是否存在?
ps -ef |grep ceph-fuse

ceph-fuse进程不存在
需查看日志看什么原因,log文件默认为 /var/log/ceph/ceph-client.${user_id}.log

ceph-fuse进程存在,但是访问卡
ceph-fuse客户端的unix socket文件为:

/var/run/ceph/ceph-client.${user_id}.asok

其中${user_id} 一般为admin,可以通过查看ceph-fuse进程获取,或通过查看ceph.conf获得

1. 检查下该客户端与mds的连接session是否正常:

ceph daemon /var/run/ceph/ceph-client.${user_id}.asok mds_sessions 

如果mds session 的state不是open,通过netstat -anp 查看下客户端到mds的网络连接是否存在,状态是否正常,并根据情况决定是否往网络方向进行进一步检查

2. 访问卡住,说明客户端有正在进行中的请求,该请求可能是发往mds,也有可能是发往osd,通过如下命令查看:

  • 查看客户端发往mds的请求:
ceph daemon /var/run/ceph/ceph-client.${id}.asok mds_requests  
  • 查看客户端发往osd的请求:
ceph daemon /var/run/ceph/ceph-client.${id}.asok objecter_requests  
  • 如果卡住的请求是发往mds的,去到active的mds上,查看mds收到的正在处理的请求:
ceph daemon /var/run/ceph/ceph-mds.${id}.asok ops  

通过该命令可以查看卡住的op卡住哪个阶段,比如 [ initiated ]、[ failed to wrlock, waiting ]、[ failed to xlock, waiting ]等阶段

  • 如果卡住的请求是发往osd的:
    • 可以通过netstat -anp 来查看到客户端到osd的网络连接是否正常
    • 登录到osd的机子,通过osd的unix socket来查看该osd正在处理的op:
ceph daemon /var/run/ceph/ceph-osd.${osd_id}.asok dump_ops_in_flight 

通过该命令可以查看卡住的op卡住哪个阶段,可以通过iostat查看该osd的磁盘的ioutil是否高,来确定磁盘是否繁忙

关注笔者

相关文章

  • ceph-fuse客户端问题排查流程

    本文讲述了ceph-fuse客户端问题排查基本流程:) 首先查看集群的整体情况 是否有osd挂掉,是否有pg非ac...

  • 线上问题排查流程

    线上问题排查流程 线上问题的跟进,修复,排期,由测试录入Wone,记录为线上bug。然后指给产品,由产品进行排期修...

  • 一次研发类生产环境问题处理的总结

    处理流程 在问题发生后,需要及时知会相关人员问题,包括:问题发生时间、问题现象、问题影响 开始进行问题排查,记录涉...

  • Centos6启动问题排查

    开机流程 要排查问题,首先要了解启动流程。我们先看一下centos6的开机流程: 1. POST加电自检 ROM:...

  • 问题排查 java.lang.NoSuchMethodError

    问题背景 代码: 上传文件时,在 doFilter 报错,异常堆栈: 排查流程 google 搜不到任何相关信息,...

  • 日志追踪:log增加traceId

    开发中经常需要根据日志排查问题或跟踪调用流程,很多业务日志并没有考虑排查问题时的便利性,看似都记录了日志,但同一个...

  • 读书】《活得明白》第十二章快乐

    一、需要领导“表扬”的来访者 咨询流程: 首先,排查是现实问题还是心理问题。如果是现实问题,有无应对的方法。 其次...

  • 【java】Java 问题排查技术分享

    一、线上问题处理流程 二、问题排查 可从三个方面入手: 知识:有些问题,看日志,思考一下就有答案,就像传说中多隆那...

  • 收集emessage PC客户端日志

    emessage PC客户端日志一般用来排查 消息收发问题。 收集方法: 在电脑运行中,输入一下命令: %user...

  • 一次即时通讯项目TIME_WAIT过多引发的记录

    问题现象: 客户端接受用户咨询期间部分用户连接无故断开重连,导致分配到一个新的客服 问题排查 一、发现异常点 看到...

网友评论

    本文标题:ceph-fuse客户端问题排查流程

    本文链接:https://www.haomeiwen.com/subject/mbdkfctx.html