26 年前的古董 Win98 电脑成功运行大语言模型:搭载奔腾 II 处理器、128MB 内存

珠江路在线   2024年12月30日  【 转载 】传奇世界网页版 

  本文标签:电脑,windows 98,人工智能

12 月 30 日 信息,一个名为 EXO Labs 的组织今天在社交媒体上公布了一段视频, 展示了一台运行 Windows 98 系统的 26 年高龄的奔腾 II 电脑(128MB 内存) 顺利运行大型语言模型(LLM)的 情景 。随后,EXO Labs 在其博客上发表了一篇 详尽文章,进一步 阐述了这个项 目标细节,以及其“ 遍及人工智能”的愿景 。

留神到,视频中一台 350MHz 的 Elonex 奔腾 II 电脑启动 Windows 98 后,EXO Labs 运行了基于 Andrej Karpathy 的 Llama2.c 开发的定制纯 C 推理引擎,并让 LLM 生成了一个关于“Sleepy Joe”的故事 。不可思议的是,整个过程运行流畅,故事生成速度也相当可观 。

EXO Labs 由牛津大学的探究人员和工程师构成,于今年 9 月正式对外亮相,其使命是“ 遍及人工智能” 。该组织认为,少数大型企业操纵人工智能会对文化、真相以及社会 其余 根本方面造成负面影响 。 因而,EXO Labs 指望“构建开放的 根底设施,以训练前沿模型,并使任何人都能在任何地方运行它们”,从而让一般人也能在 几乎任何 设施上训练和运行 AI 模型 。此次在 Windows 98 上运行 LLM 的壮举,正是对这一理念的有力 证实 。

依据 EXO Labs 的博客文章,他们从 eBay 上购得了一台老式 Windows 98 电脑 。但是,将数据传输到这台老机器上却是一个 挑战,他们最后通过其以太网端口 使用“古老的 FTP” 实现了文件传输 。

更大的 挑战在于为 Windows 98 编译现代代码, 厄运的是他们找到了 Andrej Karpathy 的 llama2.c,这是一个“用 700 行纯 C 代码即可在 Llama 2 架构的模型上运行推理”的工具 。借助这一资源以及老式的 Borland C++ 5.02 IDE 和编译器(以及一些小的调整),EXO Labs 顺利将代码编译成可在 Windows 98 上运行的可执行文件 。他们还在 GitHub 上公开了最 后辈码 。

EXO Labs 的 Alex Cheema 特殊 感激了 Andrej Karpathy 的代码,并对其性能赞美不已,称其在 使用基于 Llama 架构的 26 万参数 LLM 时,在 Windows 98 上实现了“每秒 35.9 个 token”的生成速度 。值得一提的是,Karpathy 曾任特斯拉人工智能主管,也是 OpenAI 的 独创团队成员之一 。

固然 26 万参数的 LLM 规模较小,但在这台古老的 350MHz 单核电脑上运行速度相当不错 。依据 EXO Labs 的博客, 使用 1500 万参数的 LLM 时,生成速度略高于每秒 1 个 token 。而 使用 Llama 3.2 10 亿参数模型时,速度则十分 迟缓,仅为每秒 0.0093 个 token 。

EXO Labs 的 指标远不止于在 Windows 98 机器上运行 LLM 。他们在博客文章中进一步 阐述了其对 将来的 瞻望,并 指望通过 BitNet 实现人工智能的 遍及 。

据介绍,“BitNet 是一种 使用三元权重的 transformer 架构”, 使用这种架构,一个 70 亿参数的模型 只有求 1.38GB 的存储空间 。这关于一台 26 年前的奔腾 II 来说可能 依然有些吃力,但关于现代硬件甚至十年前的 设施来说,都十分轻量级的 。

EXO Labs 还强调,BitNet 是“CPU 优先”的,幸免了对高昂 GPU 的依赖 。此外,据称这 品种型的模型比全精度模型效率高 50%,而且 能够在单个 CPU 上以人类浏览速度(约每秒 5 到 7 个 token)运行一个 1000 亿参数的模型 。

免责声明:凡标注转载/编译字样内容并非本站原创,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。