微软不想被OpenAI架空 |
珠江路在线
2023年8月1日
【
转载
】单职业传奇影视网
|
本文标签:azure,微软,Meta,AI,扎克伯格 |
巨头中间的云合作 层出不穷 。但全世界都晓得,Azure可是OpenAI的御用云平台 。
在2019年微软掏出10亿美元投资OpenAI后,Azure就向来是OpenAI的独家云服务商 。而Azure为了更好地为大模型提供算力和对外服务,再一次进行了 部分架构设计 。甚至在一些 视察者眼中,当年微软拍板投资OpenAI的核心缘由,其实便是Azure的进展——
毕竟彼时Transformer还没有 彻底验证,但微软已经多年下注AI并开始将云业务的 将来愿景视作是“为AI服务的超级计算设施” 。无论是算力 支撑,还是OpenAI开放 寰球的chatbot测试,Azure都功不可没 。
Altman本人甚至还曾经专门发推对Azure团队的给力 支撑 示意 感激,高度评介微软是“世界上最好的AI 根底设施” 。
如今Sam前脚刚烧了两炷香,纳德拉转手就把这个“世界上最好的AI 根底设施”租给了扎克伯格 。
不晓得俩人是否提前商议好的 。又兴许对纳德拉来说,这大约都是 方案的一 部分 。总之扎克伯格 体现得很 庆幸 。
在扎克伯格的Instagram账号里,他贴出了一张与纳德拉的亲热合影以“ 感激纳德拉”,扎克伯格 示意:
“(Meta)将Llama2开源给了微软,而(这次开源)将成为下一代大模型建设工作的 根底 。”
微软与Meta确实是 彼此需求的 。
Meta正在走向大模型的“深水区”,在70B参数的Llama2已经达到了GPT3.0的水平, 几乎已经成为了当前口碑最好的大模型底座 。关于闭源大模型 营垒来说,Llama2 顺利带来的压力丝毫不亚于Threads关于Twitter的震慑 。
闭源公司花几千万搞不出来的东西,开源社区 能够直接用,相当于将 将来 寰球开源大模型社区的起跑线 晋升到了3.0的水平 。
最近登顶HuggingFace开源大模型榜单的Stability的Freewilly大模型,被认为接近3.5的水平,正是基于Llama2.0调教优化后的产品 。
关于Meta来说,参数规模的 晋升带来计算量的攀升、模型的逐渐成熟也让看到更好的商用潜质 。但假如要战胜这些 困苦、落实这些 后劲,扎克伯格需求一个更高效的合作 搭档 。而那些Azure已经有的、但Meta没有的东西,关于Llama来说就显得更主要了, 比方Azure的算力 教训、Azure的AI工具箱、以及Azure的云 本身……
Meta是为数不多没有公有云服务的互联网巨头 。
在过去,Meta与亚马逊都互为对方的超级大客户,包含Meta的一些AI研发算力,也都是 洽购的AWS 。而微软这次撬墙角的 方案,除了开放Windows场景以外,还开放了Azure的企业渠道 威力,将Llama2加入到自己的产品名录中 。
Azure 固然在整体市场份额中依旧落后AWS,然而在SaaS销售领域却卓著率先于同类竞争对手 。而随着云与SaaS的 交融,微软在渠道层面有卓著的差别化优势 。通过Azure,Meta和它的生态 追寻者们 能够直接通过云端来销售和 使用Llama2的产品 。
关于微软来说,大模型的 挑战则更加多元的 。
微软过去在大模型 利用层面 几乎是all in OpenAI的产品 。无论是最早接入的Bing,还是基于Windows生态的Copilot面向开发者的工具生态AI Studio、甚至是新的AI云服务品牌OpenAI Azure,背后都是OpenAI的影子 。
OpenAI是 寰球最好的大模型公司,Windows依旧是 寰球最主要的生产力软件生态 。但在大模型 寰球军备 比赛中,这两者的 联合并不 象征着绝对的胜券在握 。
与Meta和微软 联合 几乎同时“官宣”的,则是苹果的大模型 方案 。
据海外媒体报导,苹果已经 实现了名为“Ajax”的大预言模型 根底框架,将开发 类似ChatGPT的对话式AI 。而消费级产品的推出 工夫则 方案在明年公布 。
苹果的入场被认为是硅谷大模型 比赛中的主要变量 。
相比于公有云之类的互联网风口,AI是被苹果治理层高度认可的科技方向,最近治理层口风也有朝着AI加码的趋向 。
除了长 工夫关注AI科技外,苹果是 寰球最有钱、最有场景的公司 。苹果每年净利润接近1000亿美元、经营净现金流超过1200亿美元,相当于微软与Meta的总和 。苹果生态已经超过微软成为 寰球最大的 关闭操作系统,活跃 设施数量超过20亿,而微软惟独15亿 。
而相比于账面实力外,苹果更具 设想力的是它的半导体 威力 。它兴许是 寰球 参加大模型 比赛的科技企业中,为数不多 将来 能够不用外采GPU与CPU的厂商 。不只如此,苹果的芯片效率 仿佛更有 设想力 。
在2023年WWDC上,苹果推出的M2 Ultra芯片 。相比于一般厂商CPU、GPU 拆散的部署 模式,M2 Ultra统一内存架构以及随之带来的超高内存带宽,甚至 能够让开发者在一张卡上就能跑大模型 。
只管 类似的消费级芯片还 无奈和英伟达的专业芯片相媲美,但 类似小秀肌肉,也让外界对苹果 将来的GPU算力延展 威力产生了兴趣 。
以OpenAI为例,外界预估其大约同时动用了两万张显卡进行计算 。但王小川最近对媒体 示意,OpenAI正在测试1000万张显卡同时计算的模型,相当于英伟达当前10年的产能,“ 彻底是登月 方案(级别)” 。
除了苹果以外,微软、谷歌、Meta、亚马逊等巨头都有自研AI芯片的 方案,但已经有顶尖半导体开发 威力的苹果依旧是最有资格“ 大力出 奇迹”的人 。
Apple将两枚 M2 Max 的芯片衔接在一同打造出M2 Ultra
谷歌凶狠、苹果虎视眈眈,微软和Meta 取舍结盟 。
关于纳德拉来说,与Meta队形站位 能够让微软在大模型的生态战争中更加 巩固 。
首先,微软依旧需求开源,开源在 将来的大模型竞争中将 延续 表演主要的角色 。
开源天然 存在人才 参加很多、迭代速度快、垂类 遮蔽效率更高的生态 威力 。 固然OpenAI拿下头筹,但开源社区的 遍及速度依旧很可观 。 比方Llama只用了大半年的 工夫、 使用参数70B,已经赶上了175B、耗时2年的GPT3 。
尤其是假如 将来开源路线成为了行业解决 方案的主流,Llama与Azure深度 联合,兴许真的 能够协助微软云业务 实现对AWS的弯道超车(2022年底Azure市占率23%、AWS为32%) 。毕竟相比于Windows和Office,Azure才是微软最赚钱、最有 后劲的业务 。
其次,开源大模型的不停进展,必定让情愿砸钱做 关闭系统的厂家也自然会越来越少 。
比方Bard在Llama2之后就受到了不小的压力 。除了许多好事者在晚上 探讨bard 将来长 工夫进展的压力外,有媒体报导称谷歌内部人士也曾撰文称bard在 抗衡开源社区时 长处吃力,后者 遍及神速且成本更少、场景更 丰盛 。
在大模型超级投入的产业 构造没有 变迁的状况下, 关闭式大模型依旧会有其存在的 正当性,但可能将仅仅限于极少数率先者,而其中大约率会有OpenAI 。
假如OpenAI有护城河,那它的名字可能叫Llama2 。
固然,OpenAI其实也并不是微软的“亲儿子” 。
在100亿美元投资后,微软 固然 占有75%的 分成权,但实际上也只占有OpenAI 49%的股权 。换言之,微软 固然手握大量的OpenAI资源,但并不 彻底 占有OpenAI绝对的操纵权 。
但与llama合作像是一个 标记,手握OpenAI的微软其实正在成为游戏 规定的 制订者:
它既有最具 后劲的AI 根底设施Azure,也有最前沿的商业化变现接口Windows copilot 。而当最核心的 根底设施和渠道 威力在微软手上时,OpenAI也只不过微软的“超级程序员” 。
当Meta等平台成熟后,微软 能够再引入更多的“程序员”,甚至开放更多的系统级场景给开源生态、从而让Windows系统的生产力进一步 晋升 。
实际上,OpenAI原本就只不过纳德拉重注AI和语言大模型的一个选项 。
在ChatGPT之前,微软甚至和英伟达合作开发过5300亿参数的大语言模型威震天-图灵Megatron-Turing,是当年最大的基于transformer的模型,参数比GPT3多了好几倍, 讲究的是绝对的 大力出 奇迹 。
可最终威震天还是输给了奥特曼,于是威震天才 取舍了买下奥特曼 。
但微软内部其实向来没有抛弃大模型的 有关技术路线开发 。
例如6月时,微软就公布了13亿参数的“小型”大语言模型 phi-1 。有OpenAI作为核心资产,微软不走“ 大力 奇迹”模式,而是改用号称“教科书等级”的高品质 材料集训练模型,让实际 动机胜于千亿参数的 GPT 3.5 。7月时,微软还提出了新的大模型架构RetNet,称其 能够在更大数据维度 根底上,比transformer更优 。
大模型的战事还远没到中场,威震天与奥特曼们的游戏兴许才方才开始 。