首销备货3万台 豆包AI手机要卖给谁

珠江路在线   2025年12月2日  【 转载 】人人影视 

  本文标签:豆包AI手机

12月1日,字节跳动豆包团队公布豆包手机帮手技术预览版 。

据介绍,豆包手机帮手,是在豆包 APP 的 根底上,和手机厂商在操作系统层面合作的 AI 帮手软件 。基于豆包大模型的 威力和手机厂商的授权,豆包手机帮手 可 认为消费者带来更容易的交互和更 丰盛的体验 。

现阶段,开发者和科技 爱好者 能够在豆包与中兴合作的工程样机 nubia M153 上,体验豆包手机帮手的技术预览版本 。当前该版本已面向开发者和科技 爱好者少量发售,报价 3499 元 。

豆包手机帮手的浮现,是在试图用 AI Agent 买通APP 中间,重构移动互联网的交互逻辑 。

只管当前的演示仍需面对技术「不确定性」的免责申明,但这种 深刻操作系统底层、 谋求「 用意直达服务」的尝试,可能比单纯的 Chatbot 更具改造 意思 。

兴许,谁能领先解决「操作手机」的 巩固性难题,谁就能定义 AI 时代的「iPhone 时刻」 。

据业内人士向「极客公园」介绍,字节跳动与努比亚为这款工程机的首销备货量为 3 万台,并为此订购了对应数量的手机 要害元器件 。

从「对话框」到「行动派」

过去两年,我们见惯了能写诗、能画图的 Chatbot,但关于一般消费者而言,手机上最痛的痛点一般是繁琐的操作流 。豆包手机帮手这次的大看点,在于它试图从「对话」 逾越到「行动」 。

在技术预览版的演示中,豆包 展示了一种在此前 GUI Agent(图形消费者界面代理)探究中常被提及的 威力——它能像人类一样「看懂」屏幕,并直接 模仿点击操作 。

这种「看懂屏幕」并 模仿人类操作的底气,则源自豆包大模型在多模态 威力上的积存 。

据官方 透露,该模型在视觉 了解、推理以及图像创作等维度的性能已处于国际第一梯队 。正是由于模型具备了精准的图形界面(GUI) 鉴别 威力,它 能力在多项权威测评中拿到高分,从而像人类一样 了解「按钮」和「输入框」的 含意,而不只仅是 鉴别一堆代码 。

据豆包手机官方 使用文档介绍,豆包会依据 用意自动推断是不是调用 AI Agent 威力,若消费者对话开头包括「帮我操作手机」,则会 100% 通过 AI 操作手机 实现 使命 。

使命 形容越 详尽,它的执行效率越高,执行 动机越好 。例如:“ 打开美团外卖帮我把近期几个订单的好评写了” 。此外,AI 操作手机是在 虚构屏操作的,不会在前台默许铺开,也不会影响正在进行的 其余 使命,你 能够随时返回桌面 使用 其余 利用 。

消费者也 能够直接跟豆包对话,讲出需求,豆包可依据需求自动推断是不是通过操作手机 性能 实现,以及在豆包对话框底部 性能按钮中找到“操作手机”,点击按钮可手动 形容需求,也 能够设定定时等条件 使命 。

试想这样一个场景:你在社交媒体上被种草了一款好物,过去你需求截图、退出 利用、 打开电商平台、查找、比价 。

而在豆包的演示中,你 只有说一句「帮我在全平台比价下单」,AI 就能自动跨 利用跳转,查找同款、对照价格规格、领券,甚至帮你选好最 廉价的商品填入购物车 。

图片
起源:豆包手机

使用指南文档图片 起源:豆包手机 使用指南文档

固然出于安全考量, 领取环节仍需人工确认,但前面那一系列机械的点击和切换,AI 已经代劳了 。

甚至复杂 使命也 能够执行 。在官方演示的旅行规划场景中,当消费者提出「下个月去巴黎,帮我把 珍藏的餐厅标在地图上,看看哪天有展并订票」这样一句包括多重 用意的指令时,AI 能够迅速将需求拆解为 6 个子 使命:从 查问社交媒体 珍藏、到高德地图标记、再到携程订票,最后 整顿进备忘录 。

这种跨 利用、多步骤的「 使命链」执行 威力, 能够说是 AI 从「玩具」迈向「工具」的 要害分水岭之一 。

为了实现这种「类人」的交互,豆包 买通了系统层面的多项权限 。

在系统层面,豆包手机为 AI 威力设计了多种交互 模式,消费者 能够通过侧边键、语音甚至耳机唤醒它;在相册里,它能直接听懂「把路人 P 掉」的指令并执行 。

图片
起源:豆包手机

使用指南文档图片 起源:豆包手机 使用指南文档

在更复杂的「Pro 模式」下,它还能调用系统工具, 联合记忆 性能,直接 实现「推举礼物并放入购物车」这种需求多步推理的复杂 使命 。

图片
起源:豆包手机

使用指南文档图片 起源:豆包手机 使用指南文档

固然,将屏幕操纵权和个人 爱好交给 AI, 隐衷安全始终是绕不开的话题 。所以豆包团队也强调,这一 性能 支撑按需开启,并承诺严格 掩护数据 隐衷 。

作为「技术预览版」,豆包团队也在视频结尾特殊 揭示,受限于大模型技术的不确定性,演示中的「丝滑」体验当前还 无奈百分百复现,产品 间隔团队的最后预期仍有差距 。

这也体现了 AI Agent 当前最 实在的状态:方向极度性感,但落地仍需 工夫打磨 。

2 不造硬件的「第三条路」

在 AI 手机的浪潮中,向来存在两种流派:一种是像 Google / Pixel 手机这样,自研模型以及整套 AI 软件产品体验,并植入自家系统;另一种则是纯软件厂商,试图通过超级 APP 抢占入口 。

图片
起源:Google图片 起源:Google

豆包 取舍了第三条路:不做硬件,只做生态 。

在公布预览版的同时,豆包方面明确 示意「没有自研手机 方案」 。他们的策略十分 求实——通过与多家手机厂商洽谈,以「操作系统层面合作」的 模式,将豆包的大模型 威力植入不同品牌的机型中 。

这种「手机厂商 + 大模型厂商」的深度耦合,正在成为行业的一股新趋向 。

就像谷歌 Gemini 与三星的合作一样,术业有专攻正逐步成为共识 。

关于手机厂商而言,从零打造一个具备顶级推理、视觉 了解和复杂 使命规划 威力的模型成本极高;而关于字节跳动这样的互联网巨头,不足硬件载体则会让 AI 始终隔着一层 APP 的玻璃墙, 无奈触达消费者最核心的数据和场景 。

当前的 nubia M153 工程机只不过一个开始 。报价 3499 元的门槛兴许更多是面向开发者和极客人群的「邀请函」,旨在验证这种跨界合作的技术可行性与消费者反馈 。

兴许,谁能领先解决「操作手机」的 巩固性难题,谁就能定义 AI 时代的「iPhone 时刻」 。

做一个APP,在 AI 时代已经不够了

豆包手机帮手的浮现, 性质上兴许是一次对移动互联网交互逻辑的重构 。

大模型的 威力越来越强,单纯做一个 APP,在 AI 时代已经不够了 。

AI Agent 需求接管更复杂的 使命、感知更 丰盛的上下文, 施展一些 实在的 性能,才有更落地的价格,这 象征着它必须走出软件的围墙,向下 积淀,与操作系统的底层权限和硬件 威力进行深度整合 。

过往,字节跳动向来是一支 壮大的“空军”—— 占有极致的算法和 宏大的 利用生态,但在操作系统和终端硬件上,相比 占有 Android 的谷歌或 占有全场景终端的华为,字节始终 缺乏一块落地的“阵地” 。

在移动互联网时代,这兴许不是问题,但在 AI 需求深度介入消费者场景的当下,不足硬件载体可能 象征着 损失对场景的感知力 。

豆包手机帮手的推出,像是字节在当下阶段抛出的一次探究 。

从 Pico 到 Ola Friend,再到如今 深刻手机 OS 层的帮手,字节正在小心补齐“硬件触点”这块短板 。

这兴许并不是 将来两三年行业的最后 状态,但至少 能够确认的是:字节已经意识到,想要让 AI 真正跑通,必须迈出“软硬 联合”的这 要害一步 。

免责声明:凡标注转载/编译字样内容并非本站原创,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。