WHOAMI
Xu Jiang
技术人的日常.
  • hdfs-fuse-faild

    集群规模几百台,每天有大量的MR任务在并行跑流程。主要业务做图片流数据解密计算生成高清图像。 随着集群使用的时间增长,发现集群越来越缓慢,甚至集群压力特别大的时候,导致操作系统莫名重启。 每天都会有6~8台无规律的操作系统压力过大重启。 排查时间和周期都非常的长,用了长达1个月...

    • fuse