不输ChatGPT 国产AI大模型开测：为中文优化、支持国产CPU训练_ChatGPT,国产AI

ChatGPT今日晋级了GPT-4模型，AI 威力更加壮大，国内在这方面也在迅速追赶，有国歌国产版ChatGPT问世了，现在清华大学传授唐杰宣告由该校AI 成绩转化的ChatGLM开始内测。

据介绍，对话机器人 ChatGLM(alpha内测版：QAGLM)，这是一个初具问答和对话性能的千亿中英语言模型，并针对中文进行了优化，现已开启邀请制内测，后续还会逐渐扩充内测规模。

与此同时，继开源 GLM-130B 千亿基座模型之后，我们正式开源最新的中英双语对话 GLM 模型： ChatGLM-6B，联合模型量化技术，消费者能够在消费级的显卡上进行当地部署(INT4 量化级别下最低只有 6GB 显存) 。

人脸识别被破解，手机里的钱还安全吗	印度“网络禁食大赛”不许碰手机目前已有2000名年轻人参与
Win系统中怎样使用U盘分区	一组老照片带你回到从前，看互联网大佬马云的成长史

通过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 固然规模不迭千亿模型，但大大减低了消费者部署的门槛，而且已经能生成相当相符人类偏好的答复。

ChatGLM 参考了 ChatGPT 的设计思路，在千亿基座模型 GLM-130B1?中注入了代码预训练，通过有监督微调(Supervised Fine-Tuning)等技术实现人类用意对齐。

ChatGLM 目前版本模型的威力晋升重要起源于独特的千亿基座模型 GLM-130B 。它是不同于 BERT、GPT-3 以及 T5 的架构，是一个包括多指标函数的自回归预训练模型。

2022年8月，我们向探究界和工业界开放了占有1300亿参数的中英双语密集模型 GLM-130B1，该模型有一些独特的优势：

双语：?同时支撑中文和英文。

苹果公司为何屡屡成功？以摄像头升级为例，看苹果独特的组织结构	这10个iOS 13的使用技巧能让你的iPhone事半功倍
安卓清理内存空间	保温杯成奥运冠军的“秘密武器”，中国人为什么爱喝热水?

高精度(英文)：?在公开的英文自然语言榜单 LAMBADA、MMLU 和 Big-bench-lite 上优于 GPT-3 175B(API: davinci，基座模型)、OPT-175B 和 BLOOM-176B 。

高精度(中文)：?在7个零样本 CLUE 数据集和5个零样本 FewCLUE 数据集上显而易见优于 ERNIE TITAN 3.0 260B 和 YUAN 1.0-245B 。

快捷推理：?首个实现 INT4 量化的千亿模型，支撑用一台 4 卡 3090 或 8 卡 2080Ti 服务器进行快捷且根本无损推理。

可复现性：?全部后果(超过 30 个使命)均可通过我们的开源代码和模型参数复现。

跨平台：? 支撑在国产的海光 DCU、华为昇腾 910 和申威解决器及美国的英伟达芯片上进行训练与推理。

网站简单实用的SEO优化技巧	光刻机大败局：阿斯麦王座下的白骨
如何延长iphone手机电池寿命	照片歪斜、变形怎么办？分享3种好用的校正方法

2022年11月，斯坦福大学大模型核心对寰球30个主流大模型进行了全方位的测评2，GLM-130B 是亚洲唯一入选的大模型。

在与 OpenAI、谷歌大脑、微软、英伟达、脸书的各大模型对照中，测评报告显示 GLM-130B 在精确性和歹意性指标上与 GPT-3 175B (davinci) 接近或持平，鲁棒性和校准误差在全部千亿规模的基座大模型(作为公平对照，只对照无指令揭示微调模型)中体现不错(下图) 。

图1. 斯坦福大学根底模型核心对寰球 30 个大模型的测评后果(2022年11月)

免责声明：凡标注转载/编译字样内容并非本站原创，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。

不输ChatGPT 国产AI大模型开测：为中文优化、支持国产CPU训练