什么才是布局大模型的正确姿势?

2023年初,随着ChatGPT走红,全球科技产业快速就大模型技术的潜力达成共识,我国科技企业快速跟进,“百模大战”如火如荼。


9月《时代周刊》发布首份“全球百大AI人物”榜单,上榜的有许多AI大佬:比如openAI的两位联合创始人、英伟达CEO黄仁勋以及马斯克。剔除公开资料中未提及国籍信息的入选人,入围榜单的华人一共有13人,其中中国籍只有4人,其余则是华裔代表,这一结果也不让人意外:虽然AI大模型玩家数量众多,但其中大多数都是凑热闹的“投机分子”滥竽充数,干实事且具备世界级大模型技术成果的,凤毛麟角。在狂热的大模型浪潮中,怎样的AI技术观才是市场更需要的?“百模大战”如何避免跟前些年的“千团大战”、网约车大战、共享单车大战一样留下“一地鸡毛”?



大模型不是新概念,只是AI浪潮中的一朵新浪花


基于大模型技术的消费级ChatGPT在年初走红,大模型一下成为广受关注的热点新概念,AIGC、生成式人工智能、MaaS(模型即服务)、LLM(大语言模型)、Transformer等热词走红。高度复杂的技术概念被许多企业用来炒作,他们对外述说的故事往往会采用大量专用名词,似乎越玄乎就越有前景。


著有《浪潮之巅》等科技史畅销书的吴军老师说“ChatGPT不算新技术革命,带不来什么新机会”,给狂热的大模型产业泼了冷水,我对他的观点很认可:大模型只是AI技术的一个实践,其本质是深度学习的“加强版”,通过给模型“填喂”大数据提高其自学习能力,进而具有更强的智能程度,可实现内容生成AIGC等新应用。大模型让AI的应用空间一下变得大了不少是不争事实,但确实算不上是平地惊雷。


AI技术革命早已开启。深度学习已有10年发展历程,在2016年便已伴随着AlphaGo战胜李世石迎来大规模爆发,智能助理、NLP(自然语言处理)、知识图谱、机器视觉和智能语音等AI应用高速普及,有的以消费级应用出现在用户面前,有的在云服务商推动下进入到产业之中。



大模型技术也已发展多年,2018年google发布拥有3亿参数的BERT预训练模型,接下来几年,OpenAI、英伟达、谷歌、微软以及我国的百度、阿里、讯飞等科技巨头均推出了大模型,巨头们早已将参数规模“狂卷”到“千亿”级。



既然人们已对AI技术“司空见惯”,既然前些年大模型技术就已在爆发,为何今年大模型会在“一夜之间”成了香饽饽?因为“百模大战”有着强烈的“炒作”意味。


包括自然语言处理技术、深度学习技术、知识图谱技术以及今年兴起的大模型技术,本质都是AI技术大浪潮中的一朵朵浪花,有的大一些,有的小一些。不过,每一项可落地应用的AI技术一经出现,都会让人类欣喜若狂。毫不夸张地说,AI的出现有着跟火、电一样的划时代意义。


AI在每一个产业的每一个场景都有巨大应用价值,它可以减少或者替代人工实现生产的“降本增效”;可以给人类提供前所未有的生活体验,比如智能助理、自动驾驶;可以在许多维度拥有超出人类的表现,比如大数据洞察、智能质检等等。因此说AI掀起继蒸汽革命、电力革命、信息革命后的第四次工业革命(智能革命)并不夸张。


20世纪原创媒介理论家马歇尔·麦克卢汉在《理解媒介》一书中指出:一切的技术都是人的延伸。从猿人会制作并使用石器起,人类就一直在想方设法延伸自己。电话延伸了耳朵,电灯延伸了眼睛,交通工具延伸了腿脚,刀斧锄耙延伸了双手,武器延伸了牙齿,互联网延伸了耳朵、眼睛甚至腿脚,AI则延伸了大脑,因为它让机器具备人一样的“学习与思考”能力。正因为此,AI技术的应用潜力,可能远超人类想象空间。


然而,人们对新技术总是在短时间期待甚高,以为在短时间内有利可图便快速涌入,当回报不及时又快速撤退,留下一地鸡毛,只有少数玩家坚持探寻技术的长期价值。前些年的智能硬件、深度学习、区块链等等技术都曾面临这样的局面,今天的“大模型狂热爱好者”们的面孔似曾相识。


大模型技术以及AI技术潜力巨大,其落地才刚开始,要实现电力、互联网一样广而深的应用还需要很长的时间。正因为此,面临大模型炒作风我们更要冷静以待。


AI工业化大生产,场景落地比技术重要得多


AI发展可以分为不同阶段:先是实验室阶段,深度学习在“下棋”等研究类场景应用;AI产业化阶段,AI技术在互联网等信息产业广泛应用后,开始在不同产业场景“试探性”应用落地并逐步形成一些标杆应用;如今,随着AI进入到更多场景实现更大规模应用,AI工业化阶段来临。


AI工业化阶段的AI应用有两大特征:一方面是更多行业更多场景可以应用AI技术,包括农业、工业等传统产业,另一方面,任何场景利用AI技术都变得更容易,技术门槛更低、算力成本更低、部署要求更低,AI真正变得跟水、电、气一样“所见即所得”,成为普惠型技术。


大模型技术可以加速AI工业化进程,但不论是深度学习还是大模型技术,AI工业化大生产的前提都是让技术实实在在落地到场景,为千行百业所用。让AI技术产品化、标准化以及普惠化,成为AI技术发展的新重点。


然而现在大大小小的科技企业一股脑梭哈AIGC大模型却大都没有考虑“落地”的问题。“一窝蜂”扎堆入场的玩家,有的在做基础通用大模型“重复发明轮子”;有的“浑水摸鱼”甚至有算法与算力都依赖第三方的“皮包型大模型公司”;还有的“拿着锤子找钉子”,技术不错却没有落地能力。就连年初名噪一时的ChatGPT也面临着巨大的商用困难,收入远远无法覆盖巨大的训练成本,因为AIGC内容准确度的不确定性,取代谷歌成了难圆的梦想。


“百模大战”这一波大模型技术的坑,在深度学习浪潮中科技企业们已经踩过了。毫无疑问,场景落地才是AI技术发展的重中之重,不论多么强大的技术都要走出实验室才能发挥真正的价值。


其实不只是AI,历史上每一项革命性的技术落地都会经历相似路径:先是少数人在实验室专研探索——当“技术奇点”来临逐利者们蜂拥而上形成泡沫——商业化不顺利泡沫破灭“凑热闹”玩家被淘汰——实力派玩家浮出水面继续努力落地——少数玩家靠拳头产品脱颖而出,彻底改变世界。


(咨询公司高德纳Gartner发布的技术周期曲线)


比如在第二次工业革命(电力革命)中,富兰克林“风筝实验”论证电的存在后,关于电的理论逐步被完善,围绕电的生成、转换、输送与利用,先驱们进行持续探索。1887年特斯拉发明交流电发电机解决了电的输送问题进而彻底打开了电的应用空间。但有了交流电发电机还不够,电力要普及还要能用电的“电器”,爱迪生的电灯、塞缪尔·莫尔斯的电报、贝尔的电话等等电器的发明让电走向普及,到了150年后的今天,电已经跟空气和水一样让人类离不开。



如果说AI是电力,那么大模型、深度学习就对应到“交流电”“直流电”这样的技术,它们给AI工业化创造了技术条件。现在AI工业化万事俱备,缺的是“电灯”这样的杀手级AI应用,这也是踏实做AI的玩家们在重点攻克的方向。在国内科技行业,除了百度、阿里、讯飞等出镜率高的AI玩家外,还有一个被忽视的实力派玩家:网易。网易在AI落地上走了一条不同的路,除了自身业务早已全面应用AI技术外,也在通过网易智企推动AI to B,通过AI产品化来助力产业AI工业化大生产。


场景落地成关键,行业需要怎样的技术观?


在互联网行业,网易是另类的存在。作为比BAT更早成立的初代互联网巨头,网易20多年来一直位居舞台中央,是仅次于腾讯、阿里、拼多多和美团的第五大厂。相较于同体量大厂而言,网易“出镜率”并不高,面对AI、区块链、VR/AR、元宇宙、大模型等新技术一直都是冷静观察、低调发力、闷声落地。


低调的玩家更可能是扫地僧。在深度学习阶段,网易就已在全方位布局AI,涵盖前沿底层技术储备、AI技术与业务的结合以及AI技术to B输出。面对大模型这一波AI技术浪潮,网易也做好了准备,丁磊在网易发布Q2财报时已明确表示,AI的发展可以用百花齐放、百家争鸣来形容,但其中落地场景最关键。“在AI大模型竞赛中,真正的胜者是能选择好应用场景的企业。所以,目前网易的首要任务是探索AI大模型在不同产品场景下的应用,并研发出更符合用户体验的优质产品。”


面对深度学习、大模型等AI新技术,网易的技术观都不曾改变:沉下心来,做好AI的场景落地。除了用户可感知的AI+游戏、AI+音乐、AI+传媒等消费级业务的AI应用外,网易一直在深耕的to B业务也已形成对应的AI to B业务矩阵,将AI技术输出到各行各业。前段时间,网易聚焦于toB的事业部网易智企召开了“智启AI AIGC产业赋能大会”,在大会上我看到其已将AI技术服务产品化这件事做得很深,对外形成了一套工业级的AI解决方案。


举例来说,网易智企将 AI 技术融合于网易易盾、网易云信、网易云商和游戏行业部的实际业务中。例如:


  • 基于AI技术,网易易盾的机器审核精确度平均提高了20%,机器检测性能优化平均时延减少30%,智能审核管理提效最高达10倍。不夸张的说,得益于 AI 的力量,才支撑了易盾2022全年 4000亿+级别的海量检测数据;

  • 网易云信则以 AI 应用于音频与视频领域,其 AI 音频降噪能够智能分析环境音成分,甄别并过滤环境噪声,将音频通话的体验感拉满。再如云信 AI 视频超分技术,通过对低画质视频和直播的优化,将用户视频观感抬上一个新的台阶;

  • 而网易云商旗下七鱼智能客服更是典型的 AI 驱动型业务,将 NLP 技术大量应用在了在线机器人中,发力智能客服场景,一改传统“客服”成本部门的刻板印象,使其也能反哺于业务增长。网易云商还将长期积累的海量客服领域语料库沉淀,锻造出了“商河”大模型这一 AI 利器;

  • 在游戏场景中,面对玩家苦“人机”久矣的老大难困境,网易智企创新性地为游戏内置了高度拟人逼真的“AlphaGo”,这些游戏中的 AI 智能体基于丰富的游戏训练数据和实践经验而成。通俗来说,它们能懂玩家意图、跟玩家互动、与玩家合作,甚至直接对战玩家而不落下风。正是因为网易智企为游戏内 NPC 装上的 AI 大脑,我们才能与呆板、糟糕的游戏体验彻底挥手告别……


这些看似不起眼、不入大厂法眼的碎片化场景,仅仅只是网易智企 AI 落地的小小缩影,但却真真实实地将内容安全、通信体验、客户服务、游戏竞技等方面的智能化水平革新换面。从这些 AI 服务中,我们得以窥见网易智企的AI价值观:


1、落地既有广度也有深度。


网易智企的AI服务涉及到内容安全、音视频、客服和游戏等场景,看似有些零散,但其实都跟网易核心业务有着紧密联系,这恰好反映出网易一直将AI充分应用到公司业务的“边边角角”的事实。网易智企也重视场景落地,基于深度学习、NLP、知识图谱、大模型、AI音频降噪的技术积累,形成了一个个“细而专”的AI解决方案。网易习惯于聚焦并吃透少数细分市场,在做AI to B时,网易智企也没有面面俱到要“ X 千行百业”,而是专注于特定产业垂直场景,一步步将AI大网编织得越来越细密。因为专注,网易智企AI to B做得更深更透,更有竞争力。


2、“自下而上”而不是“自上而下”。


有的大厂做AI做大模型是先斥巨资“造航母”,有了核心技术再“拿着锤子找钉子”,这种“自上而下”的挑战在于:在AI工业化前,技术富余苦于没有用武之地;在AI工业化时,实力派玩家云集,可用场景变得稀缺


网易智企的AI落地走了一条“自下而上”的路,它以客户真实场景为中心,以解决实际问题为出发点,通过合适的技术产品组合方案来满足客户需求。在服务业务场景中,网易智企的AI技术被倒逼着进化,需要深度学习就布局深度学习,需要大模型就布局大模型,“有了钉子再寻求合适的锤子”,开辟了一条“从业务中来 到业务中去”的AI技术落地之路。


当城外“百模大战”如火如荼、战火纷飞时,它也并未脱离业务去参与大模型军备竞赛,而是在服务客户的AI化实践中继续耕耘。即便是“商河”大模型的推出,也是服务经验水到渠成的结果。


网易智企“自下而上”地推动AI落地,始终保持着自己稳扎稳打的节奏,给人的感觉有些低调和迟缓,毕竟不高举高打就很难有很大的声量。不过,方向正确了,“慢就是快、少即是多”,当AI能力积蓄到一定阶段再破土而出时一样可惊艳众人,就像网易在20多年的发展历史里不断证明自己一样。


3、不“梭哈”大模型,但一直都重视AI,只因不干“大炮打蚊子”的事儿。


大模型只是AI技术浪潮最受关注的一朵新浪花,它本质上是AI众多技术栈里面的一种机器学习方式。2023年科技企业“梭哈大模型”,甚至“唯大模型至上”将大模型与AI划等号,这是大错特错的。大模型很强大,但其训练成本高,技术门槛高,部署难度大,并不适合所有智能化场景,有的AI应用场景用深度学习算法足够了,比如智能手机终端侧的AI音频降噪用大模型就是“大炮打蚊子”,网易云信自研轻量级深度神经网络用深度学习的方式反而开销更小,更适合在千元机等移动终端应用,这也是一种“润物细无声”式的AI应用。


大模型加速AI工业化时代来临,网易智企也意识到了这个趋势,但与其他厂商不同的是,它的工具箱里并不只有AI“大炮”,还有着机关枪、手枪、匕首等等轻小但锋利的“技术武器”,能根据产业客户的场景特性去尽情展示其最为合适的锋芒,一击致命。就AI to B来说,合适的技术才是最好的技术,这也是一种对客户负责的技术观。



写在最后:


AI浪潮已澎湃了10来年了,每隔一段时间都会掀起新热潮,但用第一性原则来思考AI本质未曾改变,从深度学习到大模型,行业在做的事情都是让机器具备更强的学习能力,更好地服务于人类的生活与工作。虽然每隔一段时间都会出现一波新的技术概念炒作,但AI的发展一定是一个长周期的事情,通过AI to B推动AI工业化的过程,需要大量的慢活、重活、细活甚至可能是苦活、累活,正因为此,大厂布局AI、做AI  to B,要沉得住气,慢慢来不着急。


纵然会有一些热衷炒作的公司可在短时间内获得股价上涨这样的既得利益,但不能踏实地研发底层技术和落地业务场景的他们,将很快在泡沫破灭时被淘汰出局。能在更长周期基于AI技术获取长期增长的,一定是低调踏实,认真做技术,认真做场景落地的玩家,因为只有定得住,才能行稳致远。