从PC到移动互联网,人机交互每一次变革,都会诞生一个万亿美元规模产业的新机会。当下,AI大模型正重塑智能手机,这一次引领产业的机会,轮到了vivo这样的中国科技企业。
作者|杨 铭
编辑|刘珊珊
1972年,出身英国学术世家,25岁的杰弗里·辛顿决定研究神经网络——此前,因为找不到人生方向,他跑到英国伦敦打零工,毕业后做了一年多木匠。
教会机器学习,在当时是痴人说梦。没人想到辛顿最后会成为席卷全球的人工智能革命的核心人物,甚至被誉为“AI教父”。
10月8日,2024年诺贝尔物理学奖公布。杰弗里·辛顿和约翰·霍普菲尔德被授予奖项。AI的重要性,获得了全球最高学术认可。
这也预示着,AI距巴菲特、黄仁勋、马斯克、扎克伯格等全球商界最聪明头脑们积极“布道”的第四次工业革命,越来越近。
AI对千行百业的渗透速度,不胜枚举。比如,如今美团、腾讯、西门子等大厂,乃至央国企和国有银行招聘面试,都让AI充当起“面试官”的角色。
但是从另一个角度来看,当下大多数人都觉得,真正的AI变革尚未到来:应用层面的 “iPhone 时刻”, 只出现在各类演讲或PPT里,日常生活几乎没有因为AI发生明显变化。AI对我们的真正意义到底在哪里?
如何让AI技术走进普罗大众,成为各大科技企业当下重要考量。其中,就包括连续三年稳居国内国产手机份额第一的vivo。
“AI与用户数据、用户行为偏好相结合后,提供更懂你、更智能、更安全的个人化AI体验。”10月10日,在深圳召开的2024年 VDC大会上,vivo正式发布全新AI战略——蓝心智能。
从蓝厂AI战略来看,没有太多宏大叙事,而是通过AI+OS深入底层系统,给出“AI重构人与设备的交互体验、重构人与数字世界的服务体验、重构人与物理世界的沟通体验”的实践答案。
01
蓝厂的AI战略:人人可用、好用
从PC到智能手机,从互联网到APP,其产业逻辑都表明,任何技术趋势,只有普通人成为故事主角,才能跑通技术到商业的正向循环,成为澎湃汹涌的浪潮。
AI手机显然也是如此。
作为普及率最高、最便携的智能终端,智能手机是人人可用的最佳载体、万物互联的核心入口已是共识。从产业角度,AI是一个确定性极高的增长点,可以带动产业持续升级,拉动市场换机需求,打开高端市场新空间。
最近两年,关于AI生态竞争的竞赛,已在所有手机厂商间打响——不仅比拼大模型装入手机,还包括自研OS、操作系统和AI的结合等等。
但缺陷也很明显:大部分手机AI功能,仍处于“我们告诉手机要怎么做”的阶段,“AI对话、文生图、AI实时通话翻译,这些AIGC功能,对用户吸引力没有那么大。”多位用户就表示,一是同质化明显,二是没有发挥出用户对于“真·智能”的期待。
大模型加速驱动下,一些问题需要厘清,到底什么是真·AI手机?区别于智能手机更高阶、更智能的能力到底是什么?如何给用户带来怎样的普惠智能体验?
针对上述几个问题,vivo副总裁、OS产品副总裁周围表示,vivo主要从三个方向进行了思考和定义:
其一要完整地重构交互。其二,完整地重构整个数字世界,包括自有的能力、三方的能力、拥抱智能体,以及要有记忆,要有数据,要有隐私保护,成为个人助理。其三,真的能帮助人们在生活工作中提高效率,解决一些痛点问题,去连接社会,管理自我。
这可以简单总结为,AI手机区别于智能机更高阶、更本质的能力,是“意图识别”和主动行为,不仅是我能用手机做什么,还要包括手机能帮我们做什么。
可以看出,上升至vivo未来AI战略层面的“蓝心智能”思路,是打造差异化、个人化AI,以用户导向为驱动,深入探索AI在手机、Pad等终端设备上的用户使用场景。
这样的手机,应具备自我发展进化的能力,实现“千人千面”的不同体验,“要越用越懂你、越智能、越安全”。
其中最关键的是,如何构筑智能化、个性化的操作系统,这是行业们的共同问题——就像只有电网,人们才能使用上电。在AI时代,操作系统就是电网,是必不可少的基础设施。
“需要构筑足以承接起AI的OS系统。”多家研报分析认为,人机交互方式正向更自然、高效和智能的方向进化,智能手机AI能力也一定会向个人智能助理升级,操作系统一定会产生质的变化,尤其是2C操作系统。
过去几年,vivo推出的OriginOS系统,像iOS一样,证明了自己的强大生态位,现在它需要通过AI大模型,去重构和进化,人人可用、人人好用。
“‘蓝心智能’就是将大模型技术与手机操作系统深度融合后的个人智能。”周围说。其可以总结为,AI是无处不在的根基,蓝厂以此来重构智能手机操作系统,以及包括用户体验、业务逻辑方方面面的具体应用。
基于上述AI战略思路,vivo在今年开发者大会上,发布了全新蓝心大模型矩阵,全面升级语言大模型和端侧大模型能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型,并正式推出以AI为新内核的OriginOS 5操作系统。
例如自研语音大模型,就是基于vivo蓝心文本大模型为基座进行开发,围绕超拟人音色、声音复刻、语音翻译、方言自由说的算法能力打造,前两者主要为手机提供“说”的能力,后两者主要为手机提供“听”的能力。
显然,vivo相信,这会带来“意图识别”交互上的进化,不仅能够听懂用户千奇百怪的口音,还能说出“真人气息”的声音。
蓝心图像大模型和蓝心多模态大模型也是同样的逻辑——前者强化中国特色与东方美学的融合生成能力,后者升级上下文理解和记忆能力,对手机屏幕有更深度理解,在视频流实时对话上也更加流畅自然。
这样一来,手机操作系统就能承接更复杂任务,交互体验也会获得升级。
02
三大维度,重构操作系统体验
事实上,通过AI+OS重构操作系统体验的不止vivo。在苹果开发者大会,苹果推出Apple Intelligence,宣布将AI与iOS系统进行深度融合。
从技术实现、思维方式上看,vivo“蓝心智能”AI战略和苹果有“英雄所见略同”之处,比如都不是停留在单一应用和服务表层,而是深入系统底层架构,打造平台级AI,提供真正理解用户需求的终端。
但相比行业,vivo的重构更为彻底和深入——重构人与设备的交互体验、人与数字世界的服务体验、人与物理世界的沟通体验。
万物互联价值如何更好彰显?并非只是物与物之间的交互,人与设备的交互模式也亟须升级和改变。
“从触屏发展到用指尖去操作手机,本质变化是让整个操作和交互更符合人的自然习惯和的直觉。”周围就举了一个例子,一旦有更自然和更符合直觉的交互产生,在产品体验上,就会带来巨大突破和变革。
实际操作中,目前人类大多数时候是采用原有手机操作方式——点击具体功能选项使用,但AI的终端目的,显然是消除其工具化特征,成为人类大脑,解放双手。
因此,vivo首先将AI能力与 OS 交互深入融合,去重构人与设备的交互体验,带来人机交互范式革新。
OriginOS 5中,“Jovi语音”与“蓝心小V”深度融合,以此探索更符合直觉的人机沟通方式——以圈选、拖放为代表的自然手势,和支持多种语言互译、更情感化的人机自然对话。
从体验看,在自研语音大模型加持下,“蓝心小V”拥有超拟人的音色,像真人一样与用户对话,在“跨国”会议里做同声传译,解决了手机对语言互动的“听不清、听不懂、听不进”的问题。
不止如此,“小V圈搜”支持通过长按导航条形式将它呼出,还可以直接将图片、文件、文字直接向下拖拽方式交给它处理。通过语音、文字或指尖轻轻一碰,就能识别人机交互意图——把想要的内容发送给小V,或者查找服务。当设备主动理解用户并推荐相应的服务,人与设备的关系开始改变,新交互模式由此开始成型。
此外,重构人与数字世界的服务体验,让智能更加个人化。
这是vivo重构的核心,需要通过三点去实现。第一,依托 AI 技术对手机基础功能全面升级,构建平台化AI公共能力;第二,搭建连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求;第三,构建个人智能系统框架,让手机成为专属个人助理。
通过这三点,vivo去洞察用户真正需求,让终端成为自我学习的“贾维斯”,就像优秀的人类助理一样,主动适应和匹配人的个性化需求。
这是非常有意思的突破,因为当前不少用户对AI大模型手机的诟病就在于——体验割裂,单调不够智能。但数字世界的个人化,不是“胡子眉毛一把抓”,而是充分感知场景和情境,对用户潜在意图进行正确分析、判断。
从“原子岛、小V建议、小V记忆”等功能上,能够直观看到vivo解决上述痛点的差异化体验。比如“原子岛”功能,是将过去的“原子通知”和意图识别能力巧妙结合,让信息流转与服务推荐“合二为一”。
这是想象空间非常大的一个功能。比如,工作中收到会议邀请,拉入岛内,即可自动生成日程;收到淘宝/京东/拼多多的特价通知,可快速进入页面购买,还可以帮我们对比、判断是否值得购买;如果收到地址信息,拖拽上岛直接跳转打车或者导航页面……
这些差异化体验,是比用户多想一步,并将服务化被动为主动,更快更恰当地送到用户的眼前指尖。
最后,重构人与物理世界的沟通体验,让沟通更顺畅和温暖。
中国有大约1730万名视障人士,如何让“障碍人群”平等享受科技文明,成为当下推动社会文明进步的关键命题。vivo利用多模态大模型,让手机成为视障人士的眼睛,帮助他们可以独自安全的走到更远的陌生的地方。
在一段视频中,生活博主“宝哥和他的导盲犬”就记录了他使用“vivo看见”乘高铁出行的全过程。他“看见”了高铁窗外的风景、桌上的水杯,“分清”了酒店里的洗漱用品。用AI技术跨越沟通鸿沟,这就是“AI向善”的现实意义。
总体来说,在用户意图上,通过和AI算法的深度融合,vivo正持续进行更自然、更符合自觉的交互落地实践。不仅是简单的功能增强,而是深入到系统层面,让每个用户都能清晰感知AI技术带来的改变,整体提升用户对设备的归属感与操作流畅感。
这也意味着,vivo的AI能力,已从感知智能向认知智能大步迈进,为更多用户带来个性化、人性化、智能化的智慧体验。对vivo来说,这也是其他企业难以轻易逾越的壁垒。
03
范式革新,正在诞生新万亿美元产业机会?
值得一提的是,vivo的三大维度重构,离不开首创的“Ledger内存账本机制”。这一机制的设计,通过系统级调度策略,实现了对应用内存使用情况的精确追踪与智能分配,让用户手机没有负担。
不过,任何操作系统级别、跨终端的意图感知、交互,都必须先打牢AI根基——从意图到服务间,还要经过感知、分析、执行的漫长链路,只有具备完整AI技术体系的厂商,才能顺利跑通。
2017年,vivo就在内部组建了一个AI研究团队,定位是没有上限的投入,这是vivo深耕人工智能技术浪潮的起点。随后,便有了Jovi智能语音助手在vivo手机上的落地。
2023年vivo开发者大会,vivo AI成果迎来一次集中的爆发展示:首家推出手机大模型(蓝心大模型),OriginOS 4也率先AI大模型结合——很多人正是从这里看到手机厂商体系构建AI的能力,比集中在问答聊天、信息摘要的GPT们更具实用性,应用更广泛。
彼时周围透露,vivo每年投入20亿-30亿用于大模型,其中一半用于人才招聘和培养,另一半用于设备购置和维护。人才成本平均每年达到100万元,这还是税后的数额。
此后11个月以来,vivo探索、思考已更为深入。根据周围的说法,在AI核心领域做了三件事,一是用AI赋能传统的产品功能,使其变得更强大;二是构建一系列系统的公共能力,不仅是自用,还要开放给行业第三方;三是打造一些小的具有样板性的智能体(Agent),让行业都来用。
“不积跬步,无以至千里;不积小流,无以成江海。”这和vivo信奉“埋头种因”一样——所以,才有了现在的AI战略布局,AI+OS的深度融合,才有了三大维度重构带来的用户体验革命性创新。
同时,做好操作系统,不仅是种一棵参天大树,更是要创造一片繁茂的森林。只有千万开发者积极参与,才能建立起稳固、良好的庞大生态。vivo很早就深刻认识到这一点,并和上下游产业链、合作伙伴、开发者一起,构建着新的行业生态。
在最新AI战略上,vivo也将始终保持开放的心态,包括为开发者搭建的集合开发和分发于一体的智能体平台,以及针对轻量化和原子化的服务构建的完整的意图框架体系。
这意味着,vivo为开发者们提供了足够便捷的全链路开发通道——通过开发和分发于一体的智能体平台,开发者有了更为明确、直接的用户链接路径,对优质应用拓展、产业生态、产业价值都大有裨益。
不可否认的是,所有手机厂商都在加码布局AI战略、重构操作系统背后,是巨大的产业价值。
根据IDC预计,2024年全球新一代AI手机出货量将超过1.7亿部,约占智能手机整体出货量的15%,Counterpoint预计2027年出货量达到5.22亿部,渗透率达到40%。
而随着未来个人助手在AI手机上成为标配,还有望“撬动”万物互联生态,带来跨界融合、价值链升级的底层逻辑。IDC预测称,到2030年,AI将为全球经济贡献19.9万亿美元,推动全球GDP增长3.5%。掌握着数据、模型、软件的OS+硬件,将更有机会演进到AI Agent的最终形态。
vivo已开始这方面的探索。比如智能体演进方面,调动“蓝心小V”搜索餐厅,小V不仅为用户提供最佳餐厅建议,还能直接完成订座等后续操作,让用户无需再手动切换应用或进行复杂的操作流程。
更进一步,若搜索引擎、智能体成为用户获取信息、进行交互的重要入口,App以及应用商店入口功能可能会被削弱,当前手机厂商软件生态,更多传统行业商业模式,也会随之改变。
比如通过手机智能体PhoneGPT这一全新的技术探索,实现自动打电话订餐等功能,改变餐厅等传统行业生态;通过蓝心小V智能体广场,在出行、健康、生活等方面为用户带来更多智慧服务,通过智能体找到AI产业发展新动力等。
值得注意的是,平常心文化下的vivo,只是做好手机的基建,不碰行业第三方的业务——比如与QQ音乐的战略合作,共同做大行业生态。就像vivo 20年来只坚持做手机一件事。
对一家引领行业的科技企业来说,价值不止在商业。面向未来,vivo在AI助盲领域的“最美科技”多模态算法,有望实现应用场景的更多落地,比如在AI医疗诊断、AI反诈、AI灾情预警、AI智能政务等方面,为社会创造更多价值。
回顾历史,从PC到移动互联网,人机交互每一次变革,都会诞生一个万亿美元规模产业的新机会。苹果、微软、亚马逊的脱颖而出,都和他们抓住人机交互变革机会有关。
AI带来的第四次互联网工业革命汹涌澎湃,AI Agent也正加快手机端落地,差异化AI+OS系统体验注定成为竞争焦点。国泰君安计算机团队在研报中指出,历史经验表明,操作系统的竞争格局一旦形成,后来者几乎没有翻盘的可能性。
因此,如果有新的操作系统能够把握住时代机遇,降低软硬件结合的门槛,那么就有可能培育出一系列基于边缘硬件的爆款创新应用,从而把握住未来十年、二十年的行业生态话语权。
这一次的机会,很大可能属于中国科技企业。
一个例子是,对中国用户而言,iPhone 16还只是“伪AI手机”——其AI功能今年完全没希望,明年也是未知数。而连续3年稳居国内国产第一的vivo,其AI能力,以及重构的新服务体验、新商业模式,已经同步跨终端设备,实现无缝连接,做到人人可用。