南大通用GBase 8a 默认能获得所有的故障event信息,当event比较多时,需要人工将信息进行筛选。本文通过pyton调用gcware库获得指定表的所有event信息。
标签: gcware
和GBase 8a 的gcware、corosync服务有关的问题处理经验分享
南大通用GBase 8a查看某张表当前主副本可用状态、是否存在event
南大通用GBase 8a提供了show datacopymap功能来查询指定的表,在所有的计算节点上是否有不可用的情况,比如节点离线或服务不可用,某些分片有dmlevent,ddlevent,dmlstorageevent等情况。分片状态正常为0,如果不是0,则表示该主机的该分片,当前不可用,22表示服务离线,包括主机离线;16表示有ddlevent, 2表示有dmlevent。总之,只要不是0,后续的访问就不该继续使用该分片。
南大通用GBase 8a执行节点替换replace报错current gcware version and package gcware version are not same
南大通用GBase 8a在做节点替换replace时,会检测安装版本和当前集群版本是否一致,如果不同会报如下类似错误:current gcware version (107816) and package gcware version (92755) are not same.解决方法就是采用和当前集群相同的版本进行节点替换。
南大通用GBase 8a的V9.5版本gcware服务启动检测和停止的部分日志
本文介绍GBase 8a V9.5版本的gcware服务启动和停止的日志,其中有些标志表示服务可用或已经停止。本文也提供了一种手段,循环检测gcadmin命令,直到有节点可以对外提供服务了才返回。
南大通用GBase 8a部分V95版本升级时需要gcware.flush_statemachine强行刷快照的操作
南大通用GBase 8a部分V95版本升级时需要强行刷快照的操作
南大通用GBase 8a 集群服务corosync、gcware由于其它IP干扰导致异常
南大通用GBase 8a 数据库集群,通过corosync/gcware服务维持集群一致性服务。当有其它非集群IP,向集群发送了数据包,通过tcpdump能截获,会干扰集群数据通讯的正常运行。一般出现在老环境销毁后,没有清掉服务导致。
南大通用GBase 8a数据库网卡故障导致gcware服务异常
南大通用GBase 8a数据库集群,通过gcware服务,在网络多个节点维护一致性,当网络出现故障时,会一起gcware服务异常。
南大通用GBase 8a数据库gcware/corosync服务频繁重启的原因 GC_AIS_ERR_TRY_AGAIN
南大通用GBase 8a数据库的corosync服务,如果遇到资源不足(内存,磁盘等),或者REDOLOG等重要配置文件损坏,会出现宕机或者内部主动重启情况。启动后如果资源还是不满足,就会再次停止或宕机。