今年初,微软创始人比尔·盖茨在接受德国商报采访时感概:「ChatGPT 像互联网发明一样重要,将会改变世界。」
过去将近一年的时间里,大模型几乎可以说是最炙手可热的一种技术、趋势和概念,一方面从大众到全球各国政府的关注,另一方面是所有科技互联网公司都在加速布局大模型,就算没有构建大模型(在开源大模型的基础上)的技术实力,也在紧迫地寻找业务与大模型的结合点。
同样地,没有一家手机厂商打算错过大模型。
不过严格来说,目前手机行业还处于 AI 大模型的混战前夜。尽管所有人的共识都是把大模型带到手机上,但在实现路径上还是各有想法,同时一些厂商已经只差临门一脚,就能将大模型正式带到手机上,另一些厂商还差一些准备,还有一些处于更早的准备阶段。
大乱斗倒计时
图/ OPPO
就在这几天,OPPO 宣布将在 11 月 16 日举行 ColorOS 14 发布会,同时还宣布基于 AndesGPT 大模型打造的新版 AI 助手——新小布 1.0 开启了第一轮公测。
同一天,OPPO 宣布将与联发科合作,共建轻量化大模型终端部署方案。
按照 OPPO 的说法,AndesGPT 大模型作为 OPPO 自主训练的生成式用户专属大模型,以「端云协同」为基础架构设计思路,推出从 10 亿至千亿多种不同参数规模的模型规格,实现本地与云端协同运作的效果。不过更具体的,还要等到发布会上或者之后揭晓了。
但其实更早之前,华为已经在国内率先掀起了手机大模型的战争「号角」。
图/雷科技
8 月初,我参加了华为举办的开发者大会,华为在会上就宣布 HarmonyOS 4 的全新小艺 AI 助手将率先接入大模型。不过还要到 8 月下旬,华为才是真正开启全新小艺的邀请测试。
全新小艺是在华为云自研盘古大模型的基础上,融入了大量的场景数据,并对模型进行精调,核心是一个对话模型,这方面从将小艺作为大模型的接入点也可以看到。
另一方面,由于主要依赖云端算力,理论上所有支持升级到 HarmonyOS 4 的机型后续体验到全新小艺。
小米的小爱大模型其实也是一样。
雷军年度演讲,图/小米
8 月 14 日,小米比华为还早就开启了小爱大模型的邀请测试活动,覆盖从 Redmi Note9 系列到小米 MIX Fold 3 等大量机型,还包括部分智能音箱,比如小米 Sound。
虽然在 8 月的那场年度演讲上,雷总提到小米自研端侧大模型 MiLM,走了轻量化的路线,宣称将 13 亿参数版本塞进手机,可以实现部分场景媲美云端大模型的效果,做到百亿内参数大模型的第一。
但考虑到从高端机到低端机的覆盖,显然不可能主要依赖本地计算。
按照小米 AI 实验室大模型团队负责人栾剑的说法,小米会先选择在内存最大、算力最强的手机上做实验(大模型 MiLM)。
最大的可能是小米做了两手准备,也许是受限于性能和功耗,目前开启邀测的小爱大模型走了云端路线,端侧路线的 MiLM 只能在高端型号乃至未来机型上搭载运行。
云端大模型和终端大模型都想要,谷歌大概会是小米的目标。
PaLM 2 壁虎,图/谷歌
今年 5 月的谷歌 I/O 开发者大会上,谷歌就宣布了新一代大模型 PaLM 2 将具备四个参数规格的版本,最大的「独角兽」拥有 5400 亿参数,最小的「壁虎」则专为智能手机而适配,在离线状态下也能实现每秒 20 个 token 的处理。
就在本月初,谷歌正式发布 Pixel 8 系列手机,其中明确 Pixel 8 Pro 在自研芯片 Tensor G3 的加持下,真正实现了在手机上本地运行大模型。
基于本地运行的大模型,谷歌还设法改进了用于照片后期处理的魔术橡皮擦功能,以及更智能的锐化和细节增强,其他还包括录音、谷歌键盘等。
不过与华为、小米类似,即将推出的 Google Assistant with Bard(Bard 是类 ChatGPT 的生成式对话 AI)也是依赖于谷歌云上的计算。事实上,在主流手机厂商中也只有谷歌和华为拥有自研的通用大模型,还有足够规模的自有云计算业务提供海量算力的支撑。
相比之下,vivo 的进展其实也不慢。
vivo 胡柏山,图/ vivo
9 月举办的博鳌亚洲论坛上,vivo 执行副总裁、首席运营官胡柏山宣布了即将发布自研大模型,并且「带有大模型的手机很快就会伴随 vivo 新机来到大家面前」。
按照目前流出的信息,vivo 计划在很快就要发布的 OriginOS 4 发布会上一齐发布自研大模型,更具体的还等待届时揭晓。
不过根据英伟达透露,至少在 6 月初 vivo 面向自然语言理解任务的文本预训练模型 3MP-Text,在中文语言理解测评基准 CLUE 上,1 亿参数模型效果排名同规模第一,7 亿参数模型排名总榜第十(不包括人类)。
荣耀确实慢了一拍。
荣耀赵明,图/荣耀
事实上,荣耀 CEO 赵明在很早就强调了大模型端侧部署的趋势和重要性,6 月底的上海 MWC 上还指出,手机端侧的个人大模型是未来探索方向,这也是荣耀的计划。
但计划是一方面,实际进展又是一方面,截止目前,荣耀仍未透露接入大模型的时间节点,没有看到构建大模型相关的明确信息。不过我相信,等到下一代 MagicOS 发布的时候,荣耀至少也会公布接入大模型的时间节点。
三星和苹果,好像没有那么急。
iOS 17 键盘输入引入 Transformer 模型,图/苹果
三星其实在较早就宣布自研通用大模型,由三星研究院主导,并且根据媒体报道,三星一度将公司所有 GPU 算力资源都投入到大模型训练之中,计划在 8 月完成第一版大模型的开发。不过考虑到是研究院主导,距离在三星手机上实际应用,可能还有一段时间要走。
苹果也显得非常慎重,或者说保守。苹果内部已经建立自研的大模型框架「Ajax」,也创建了类 ChatGPT 的生成式对话 AI。按照彭博社报道,大模型一度几乎成为了苹果公司每次开会都要提及的话题,几个技术团队甚至因为大模型项目合并在一起。
但在 iOS 17 上,苹果只是在键盘输入上引入 Transformer 模型运行,技术团队想要先解决与大模型技术有关的潜在隐私问题。
潮水变了,但离上岸还有一段距离
今年 2 月,高通在一部没有联网的 Android 手机上使用了 Stable Diffusion 来生成 AI 图像,整个生成时间不超过 15 秒,过程全部在手机上进行。高通、联发科等移动芯片厂商很早就开始探索在手机本地运行大模型的未来。
到今天,手机大模型已经是一个无可争议的趋势。
但事实上手机大模型还面临很多的疑问和挑战,除了谷歌,所有已经或者即将落地大模型的手机厂商,几乎都是在手机助手的基础上进行接入,不仅实际应用场景有待验证,目前的实现效果也存疑。
一个 OPPO 新小布的例子,图/微博@如何释好
另一方面,虽然在具体架构和实现路径上存在不同看法,但业界的普遍共识是手机大模型将走向云端+终端的混合架构,在终端本地运行势在必行,手机厂商也都在放弃「通用」,缩减「大」模型的参数规模,压到百亿级、十亿级和亿级(大模型能力也会不同程度的影响)。
这不仅是因为深入手机使用场景后的隐私问题,算力的稀缺性和高成本也决定了,大模型必须利用起终端本身的算力,覆盖大模型的一定算力成本,而不是由应用和平台背后的公司一力承担。
坦率地说,手机大模型在目前这个阶段,距离真正被大众用户应用可能还有很远,最直接的问题就是,在保持大模型关键的「智能涌现」能力的同时,手机还需要面对处理器算力、功耗和面积的改进。