本文记录清华大学开放使用的ChatGLM2-6B的完整大家过程,在本地机器32G内存,无显卡,可以缓慢运行。要求python3.7+环境,本文用的是python 3.9 + redhat 7.9。如果你没有大内存机器,就别测试了。如果没有8G显存的nvidia显卡,就别太指望性能。
作者: laozizhu
为什么客户要自己训练自己的深度学习模型(LLMs)
让客户自己训练自己的深度学习模型(LLMs)有以下几个重要原因
南大通用GCDW K8S 9.8.0.4.1多租户版本介绍
对比于9.8.0.3.5的GCDW, 9.8.0.4.1支持多租户,其配置也有了些许的变动。
Kubernets 组件 metrics 安装,监控集群CPU,内存使用情况
kubernets提供了metrics API来支持kubectl top命令,显示集群CPU和内存使用情况。如没有安装,则会报error: Metrics API not available错误。
kubectl 命令报错couldn't get current server API group list: ... connect: connection refused
kubenets在运行时,依赖环境变量。如果所有的服务都是正常的,只是kubectl命令报错,那就是环境变量没有设置导致。一般报错样例如下: memcache.go:265] couldn't get current server API group list: Get "http://localhost:8080/api?timeout=32s": dial tcp [::1]:8080: connect: connection refused。The connection to the server localhost:8080 was refused - did you specify the right host or port?
Docker命令参数详解和使用样例文章汇总
Docker命令参数详解和使用样例文章汇总
Docker load 命令参数详解和使用样例
本文记录docker load 命令各个参数的含义和使用样例。
Docker images 命令各参数详解和使用样例
本文记录在学习和使用docker过程中,常用的docker images 命令各个参数的含义和使用样例。
南大通用GBase8a运维案例分析,用操作系统root用户启动952集群后,导致gcware服务无法启动
南大通用GBase 8a从V95开始,全部运行在非操作系统root用户下,一般是gbase。但如果用户尝试用root启动,则可能生成一下root属主的日志,pid文件等,造成后续在gbase用户下,无法访问该文件,造成服务失败。
南大通用GBase 8a重分布过程中,发现总任务数量减少了?
南大通用GBase 8a在V95版本里的扩容和节点替换都是通过rebanalce重分布来实现的。在发起任务时,会将所有需要参与重分布的表都要插入到gclusterdb.rebalancing_status里。但某些情况下,比如表被删除了,则任务表的行数会减少的。