某项目共20个节点的GBase 8a 9.5.3版本集群,发生2台服务器硬件故障,其中1台纯数据数据节点,另一台是管理gcware+调度coordinator+数据计算服务gnode的复合节点,本文记录整个操作过程。
分类: GBase8a运维案例分析
根据实际现场用户的案例,分析现象,排查问题并解决的过程
南大通用GBase 8a运维案例:一次操作系统用户安全加固导致的扩容失败
南大通用GBase 8a集群上线项目扩容操作,最终用户出于安全考虑,都会做安全加固,结果就是一些命令表面看着很正常,可是一旦远程运行,或者多几次用户su切换,就会出问题。
南大通用GBase 8a运维案例分析:扩容重分布期间,某节点性能极差,其它10分钟,其需要2-3个小时
某客户反馈,扩容操作重分布已经快1个月了,发现每天就完成十几个表,按照这个速度,需要半年以上。经过排查,发现客户是在云环境,部分计算节点之间,出现严重的网络问题,上行和下行速度都极差(500K-2MB),正常的至少150MB。
南大通用GBase 8a运维案例分析:通过sftp加载几十个300MB的文件的性能差
客户现场一般都做了安全加固,如果某些服务,有连接频率限制,可能会导致性能问题。本文介绍的一个案例是客户的sftp服务加载,导致的加载性能慢的情况。
南大通用GBase 8a运维案例分析:在机械磁盘空间快满时性能有明显下降
机械磁盘,当空间使用率超过一定比例,比如80%,会出现比较明显的性能下降,一般是由于磁盘的ZDR技术导致,以及数据文件碎片两方面的原因。