美文网首页BigData技术学习
Zookeeper集群循环重启

Zookeeper集群循环重启

作者: 皇甫LG | 来源:发表于2020-04-16 13:31 被阅读0次

一 故障描述

发现ZooKeeper重启,并且在选主,主成功选出来之后,集群显示正常,但数秒之后,又开始重启,进入上述现象的循环。

查看ZK日志后,发现选举出的leader节点,loadsnapshot的时候,报Java堆内存不足的错误: java.lang.OutOfMemory: Java heap space


image

与此同时,follower节点报错: Unexpected exception causing shutdown while sock ...Follower is ahead of the leader


image
image

查看ZK data目录/var/lib/zookeeper/version-2,发现snapshot文件超过3G


image

ZK的java堆内存设置的是4G,load 3G的snapshot,在内存展开之后,超出内存上限。导致出错。

二、临时解决方案(选一执行即可)

1 增大ZK堆内存大小

2 将所有ZK节点上的version-2目录重命名后,创建一个空的version-2目录,重新启动并初始化

三、最终解决方案

需分析snapshot为何突然增大,ZK空间,大部分被Hive任务创建的节点占用。需要找到存在问题的Hive SQL,并禁止业务提交不合理的SQL(如导致笛卡尔积的SQL)。

相关文章

  • Zookeeper集群循环重启

    一 故障描述 发现ZooKeeper重启,并且在选主,主成功选出来之后,集群显示正常,但数秒之后,又开始重启,进入...

  • Zookeeper高可用集群 、 分布式消息队列Kafka 、

    Hadoop Hadoop集群及组件 zookeeper集群图例 zookeeper集群 集群安装 1、重启云主机...

  • Hadoop集群及组件

    zookeeper集群 集群安装 1、重启云主机 hadoop1,node-0001,node-0002,node...

  • Kafka集群

    Kafka集群是把状态保存在Zookeeper中的,首先要搭建Zookeeper集群。Zookeeper集群部署请...

  • 启动/停止集群脚本

    启动zookeeper集群脚本 停止zookeeper集群脚本 启动Storm集群脚本 停止Storm集群脚本 提...

  • 《日子》.分布式-Kafka集群安装

    1、zookeeper集群安装 参考《日子》.分布式之开篇-Zookeeper集群安装 zookeeper 三台 ...

  • 部署经验

    zookeeper调试集群 Zookeeper源码分析(四) ----- 集群模式(replicated)运行 码...

  • 集群

    集群「ZooKeeper集群模式的特点」 在 ZooKeeper 集群中将服务器分成 「Leader 、Follo...

  • zookeeper单机模式搭建(整理)

    zookeeper简介Zookeeper集群及伪集群模式搭建 下载安装文件zookeeper-3.4.11.tar...

  • 阿里云kafka集群

    zookeeper集群 Zookeeper 使用 kafka集群 下载kafka_2.11-2.0.1.tgz包 ...

网友评论

    本文标题:Zookeeper集群循环重启

    本文链接:https://www.haomeiwen.com/subject/wcsrvhtx.html