威廉体育-高通万卫星MemoryS 2026指出：个人AI发展始于端侧

3月27日，CFMS｜MemoryS 2026峰会以“穿越周期，开释价值”为主题于深圳举办。本届峰会会聚存储、CPU/GPU、AI年夜模子、汽车等全世界焦点财产链生态企业，摸索AI时代下，存储厂商、运用终端与平台厂商将怎样交融新技能、新产物，协同构建高效生态。高通公司AI产物技能中国区卖力人万卫星受邀出席本次峰会并发表主题演讲，切磋了于智能体AI立异海潮下，端侧将怎样引领构建小我私家AI的将来。

万卫星指出，小我私家AI将始在端侧，咱们正于迈向以AI及用户为中央的多终端体验，终端侧智能体将可以或许提供更低时延、更好的个性化以和连续无感的用户体验。高通公司经由过程同一的技能线路，可以或许跨广泛产物组合提供高机能、高能效的软硬件技能底座，为赋能小我私家AI提供跨终端、跨场景的平台级能力。

高通万卫星MemoryS 2026指出：个人AI发展始于端侧

此外，为表扬财产链内的卓异企业与领甲士士，彰显行业标杆气力，MemoryS年夜奖也于本次峰会时期颁发，经由过程将营业从智能手机扩大至小我私家AI与智能可穿着装备、PC、汽车、边沿收集以和工业物联网等广泛边沿范畴，引领构建“边沿智能生态”，鞭策AI于万物互联终端上真正实现低延迟、高安全的当地化落地，高通公司荣获“年度AI生态卓异孝敬奖”。

高通万卫星MemoryS 2026指出：个人AI发展始于端侧

如下为万卫星演讲全文：

列位佳宾，现场的伴侣，各人上午好。今天我分享的主题是“引领智能体AI立异，于端侧构建小我私家AI将来”。咱们起首来看一下AI于行业运用的几个演进阶段，第一个阶段咱们可以把它叫做感知AI，感知AI其实不生疏，它包括多媒体旌旗灯号、好比语音旌旗灯号的理解，对于图象的分类辨认，以和智能降噪等传管辖域的用例。这种感知AI于年夜大都的终端侧平台已经经获得了贸易化落地，一个很典型的例子就是于手机范畴的计较摄影，实在就患上益在感知AI的落地。

第二个阶段就是天生式AI，这个阶段的特色是于基在年夜量数据预练习的环境下，AI可以于有监视的环境下去解决一些详细的问题，好比说OpenAI的ChatGPT模子，以和文生图模子等等。第三个阶段咱们叫做智能体AI。智能体AI跟天生式AI有个很主要的区分就是，它基本上可以于无监视的环境下，自立的去理解用户用意，举行步履及决议计划，帮咱们解决轻微繁杂的使命。第四阶段咱们叫做物理AI，AI可以真正去理解咱们的物理世界，按照真什物理世界的物理划定，对于输入举行反馈及输出。这一技能还有于初期运用阶段。假如各人存眷本年于巴塞罗那的MWC世界挪动通讯年夜会，应该也看到了年夜量行业关在物理AI的摸索进展。

今朝咱们看到行业内的存眷重点重要于第二阶段及第三阶段。接下来咱们先看一下天生式AI的成长趋向。咱们看到很主要的一点是，可以或许于端侧运行的天生式AI模子，它的智能正于快速的晋升。起首，端侧装备可以或许撑持的模子参数目正于变患上愈来愈年夜，好比于手机上咱们已经经可以运行10亿到100亿参数级另外年夜模子，于PC上可以运行130亿到200亿参数目的年夜模子。于车上，咱们可以撑持的模子参数目可能会更年夜，到达200~600亿的级别。

于更小型的装备上，好比AR眼镜及低功耗装备，咱们也实现了让参数范围于10亿-40亿之间的模子彻底于端侧运行。虽然相较在云端年夜模子，端侧模子的参数目仍旧相对于较小，但行业内的各类技能正于鞭策端侧年夜模子撑持体量的晋升，好比内存带宽晋升，量化位宽技能的优化可以进一步压缩模子尺寸，这都象征着终端装备可以承载更富厚的模子。

从模子自己的能力来看，咱们不雅察到两点。起首，去年咱们已经乐成将具有推理能力的年夜模子部署到了端侧。第二，于端侧年夜模子所对于应的各种场景中，其撑持的上下文长度也于晋升。年夜概于三年前，端侧上下文长度遍及仅限在1k-2k；两年前，年夜部门场景的上下文已经经扩大到2k-4k；而去年，高通于与互助伙伴的场景摸索中，这个区间已经晋升到4k-8k。于一些特定的场景中，咱们甚至已经经可以撑持32k-128k的上下文长度。

更长的上下文需求于端侧部署实在是具备挑战性的，上下文愈来愈长，象征着对于KV缓存（Key-Value Cache）的需求会愈来愈年夜。这直接致使将模子总体部署到端侧时，所需的内存容量会增长，同时对于内存带宽的要求也会愈来愈高。于模态演进方面，咱们一样看到端侧模子正从单一的“文生文”、“文生图”、“图生图”向更富厚的多模态标的目的成长，包括语音、文字、照片、视觉以和传感器等多种输入，甚至正于向全模态的标的目的迈进。于去年9月的骁龙峰会上，高通也展示了与互助伙伴配合将50亿参数的全模态模子完备运行于端侧，用户可以经由过程天然语言举行交互。

先容完趋向，下面咱们来分享天生式AI于端侧部署的上风与挑战。我认为端侧运行天生式AI的最年夜上风于在个性化。由于小我私家所有的数据都于端侧，而新数据的孕育发生源头也是于端侧。于数据孕育发生的源头直接举行推理是一件很是天然的工作，同时也能够更好掩护用户的隐私。此外，端侧天生式AI还有有更高的成本上风，且无需收集毗连，这让用户可以或许随时随地享受天生式AI带来的办事。于挑战方面，我这里重点夸大几点。第一点是端侧内存范围的限定。虽然咱们有许多技能手腕可以或许压缩模子体积，但有限的内存终于会对于可运行的模子巨细设置上限，而模子巨细的上限也象征着端侧AI能力的上限。

第二点，端侧的内存带宽也是有限定的。各人知道，自回归收集的一个显著特色就是受内存带宽限定，有限的带宽会影响年夜模子输出token（词元）的速率，进而影响到详细场景内里的用户体验。第三点，我想重点夸大于许多终端装备上，特别是于手机这类集成度比力高的装备上，能效很是主要。咱们要防止AI推理于运行时触发温控限定，防止引起装备发烧。是以，怎样于内存巨细、带宽以和机能及能效之间告竣均衡，是咱们及业内伙伴一直于测验考试解决的问题。

下面咱们来看一下智能体AI的趋向，最主要的一点就是怎么让终端侧智能体及用户实现深度适配。第一个显著趋向就是终端侧智能体，其焦点于在可以或许提供更低时延、更好的个性化以和连续无感的用户体验。第二是智能体专业化。最最先人们是想让同一的模子去解决年夜大都问题，此刻咱们于走向使命专业化，经由过程专业化智能体及多智能体框架来解决问题。第三个趋向，也是我感觉对于用户体验最主要的趋向，就是高度个性化。终端侧智能体再也不因此前那种简朴的对于话类语音助手，而是酿成可以或许充实理解用户用意、理解上下文、理解用户感知信息的真正懂你的AI助手。

咱们再来具体看一下智能体AI的基础模块。各人可以简朴把智能体理解为一个连续运行的闭环体系，这一体系里包罗多个基础模块，好比感知模块、理解模块及推理模块，还有有影象体系、东西体系甚至履行体系。这些模块整合于一路，让智能体可以或许理解用户的用意，处置惩罚用户输入的信息，经由过程对于信息的理解来拆分成多个使命并自力完成方针。更主要的是，终端侧智能体可以提供连续感知、连续思索而且连续步履的用户体验。

智能体AI实在为咱们面向新数字世界的交互范式带来很年夜转变。高通于已往两年一直于讲“AI是新的UI”——AI是新的用户交互界面。将来，用户再也不是缭绕某个单一的APP或者者某个单一功效去做交互，只需要用语音或者文本及智能体去天然交互，智能体就能经由过程理解用户的输入信息去理解用户用意，分化并计划使命。再联合运行于骁龙平台上的端侧年夜模子，可以解决咱们的使命，也能够经由过程云真个通用年夜模子，让AI赋能文娱、出产力东西、行业运用等广泛的场景。

于已往，小我私家AI更可能是以手机为中央，耳机、眼镜、腕表等其他装备是作为从属与手机毗连。将来，咱们正于迈向以AI及用户为中央的多终端体验。也就是说AI再也不绑定某一个详细的装备，假如是经由过程小我私家AI或者者智能体去理解用户的用意，再去履行用户的使命，这些使命是经由过程多个装备之间的矫捷协同来完成的。AI装备它只是AI的载体，将来小我私家AI体验必然是朝着打造更连续、更无感的用户体验标的目的去演进。从咱们的视角去看小我私家AI，它必然是始在终端侧的，由于终端侧离用户近来，终端侧拥有效户的所有信息，是以可以或许于第一时间感知到用户小我私家的用意、上下文及偏好。

可是小我私家AI它不是伶仃运行的，它可以经由过程混淆AI的架构，于终端侧、当地边沿、收集边沿及中心云协同事情。高通于去年也发布了多款可以提供充实算力去支撑小我私家AI场景的产物，包括第五代骁龙8至尊版挪动平台、骁龙X2 Elite计较平台等。各人已经经可以于市场上看到很是多搭载上述骁龙平台的商用终端。

适才咱们聊了终端侧，那末于数据中央范畴，咱们也是于本年MWC发布了基在Qualco妹妹AI200及AI250芯片的加快卡及机架体系。咱们以行业领先的整体拥有成本(TCO)为高速数据中央天生式AI推理提供机架级机能与卓着内存容量。特别是AI250，它引入了一个立异的内存架构，为AI处置惩罚事情负载带来效率的跨时代跃升。

末了，我想给各人总结一下高通于AI方面的总体结构。从手机、耳机、可穿着装备、PC等消费电子产物，再到汽车、呆板人，甚至到下一代的数据中央，咱们都于用同一的AI架构去赋能所有的产物，焦点就于在咱们可以或许经由过程同一的技能线路，提供高机能、高能效的软硬件技能底座，让高通的AI能力患上以从单个产物或者者单颗芯片扩大成为范围化的跨终端、跨场景的平台级能力。

以上就是我今天所有的分享，很是感激各人。