【私有GPT】CHATGLM-6B部署教程

ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。ChatGLM-6B 使用了和 ChatGLM 相同的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、

ζ荷逸こ

1969人浏览 · 2023-08-21 15:50:15

ζ荷逸こ · 2023-08-21 15:50:15 发布

【私有GPT】CHATGLM-6B部署教程

CHATGLM-6B是什么？

ChatGLM-6B是清华大学知识工程和数据挖掘小组（Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University）发布的一个开源的对话机器人。根据官方介绍，这是一个千亿参数规模的中英文语言模型。并且对中文做了优化。本次开源的版本是其60亿参数的小规模版本，约60亿参数，本地部署仅需要6GB显存。

项目地址： https://github.com/THUDM/ChatGLM-6B

我们也可以访问他的体验版

https://chatglm.cn/

ChatGLM API申请：https://open.bigmodel.cn/

算力云

注册地址：https://www.autodl.com/

注册可参考我的这篇文章

https://zhuanlan.zhihu.com/p/644911677

AutoDL是一个GPU租用平台，有各种型号的服务器可以选择。网络无要求，部署简单，比较稳定，价格也还好。

对电脑系统没有要求，无论是Mac电脑还是低配的windows电脑，完全云端部署，自己租服务器，浏览器打开即可。全部在云端完成，有很多服务器可以选择，可以根据自己需求租相应配置的服务器。

部署教程

项目硬件要求

租用一台机器

租用一台机器

这个配置按照我来说是完全够用了。配置仅供参考

不知道怎么选的话，可以看这个链接 https://www.autodl.com/docs/gpu/?spm=a2c6h.12873639.article-detail.147.11146459CRKD9O

选择镜像

选择社区镜像

CHATGLM-6B

然后点击右下角的立即创建

就会跳转到此页面，等待实例创建完成

创建实例

创建完成后

温馨提示：实例不用后一定要记得关机！！！

就会进入此页面

启动web服务

执行以下命令

cd ChatGLM-6B/

python web_demo.py

默认开放端口 6006

访问服务

然后回到上个页面

自定义服务

这样就可以看见你的服务了

使用实例

启动api服务

由于示例只会对我们开放6006端口，所以我们需要将api服务改为6006端口访问，当然你也可以采用NGINX的方式，这里就只介绍修改端口的方式了。

vi api.py

完成后保存

运行命令

python api.py

和访问web的一样操作步骤一样，参考web服务的访问服务模块

请求示例：

curl -X POST "http://127.0.0.1:8000" \
     -H 'Content-Type: application/json' \
     -d '{"prompt": "你好", "history": []}'

当前这里的 http://127.0.0.1:8000修改为你的实例地址

例如

启动cli服务

运行命令

 python cli_demo.py

cli服务

使用示例：

我是AI学习者和实践者荷逸，欢迎链接我交流AI相关知识：wx:heyi_master

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

“小满”安全车控操作系统正式在AtomGit开源

10月24日，由中国汽车工业协会指导，普华基础软件股份有限公司主办的“小满”安全车控操作系统开源发布会暨共建计划说明会成功举行。普华基础软件宣布将安全车控操作系统“小满”（简称“小满”）V24.10源代码正式在开放原子开源基金会（简称“基金会”）旗下AtomGit开源协作平台开源，并在AtomGit平