回望2023年:“群模时代”来临,端侧大模型催生想象空间

【环球网科技报道 记者 郑湘琪】如果说2022年的大模型行业在某种意义上还是“一枝独秀”,2023年的大模型行业则是“百花齐放”。如同一列高速疾驰的火车,今年以来,大模型行业迅速驶入全新阶段。一系列大模型密集“上新”,从实验室走向商业化,在千行百业释放出强劲的发展势能。

大模型密集“上新”,落地进程提速

为消费者提供个性化推荐,帮助科学家“搞科研”,提升职场人士的协同办公效率……大模型在千行百业的真实场景中加速落地,也源源不断转化为推动发展的生产力。据专家预测,2035年生成式人工智能有望为全球贡献近90万亿元的经济价值,其中我国将突破30万亿元。

在上海财经大学校长刘元春看来,对于通用人工智能,大模型的长期价值将通过行业应用实现,而应用场景是关键。我国拥有超大规模市场和数字资源优势,并且已经在数字技术和应用上取得了巨大成就,为大模型提供了更深入、更丰富的落地场景以及能够持续训练,终身学习的环境。同时,这也要求大模型要更加实用,助力实体经济发展。

回望2023年,各家厂商的大模型悉数登场,呈现出千帆竞逐的勃勃生机,赋能更多产业提质升级。百度文心一言、阿里云通义千问、腾讯混元、360智脑、华为盘古、科大讯飞星火、商汤日日新等大模型跑步入场,通过一系列差异化自研技术释放出全新价值。

随着各行各业开源、闭源大模型竞相发布,“群模时代”已然来临。《北京市人工智能行业大模型创新应用白皮书(2023年)》显示,截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区。

层出不穷的大模型也面向不同垂直领域实现落地应用,催生全新的想象空间。根据工业和信息化部赛迪研究院公布的数据,2023年我国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。在制造业、零售业、电信行业和医疗健康等四大行业的生成式人工智能技术的采用率均实现较快增长。

就在12月22日,我国首个官方“大模型标准符合性测试”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试,符合《人工智能大规模预训练模型 第2部分:评测指标与方法》语言大模型的相关技术要求。这也意味着这些厂商在通用性、智能性等维度达到国家相关标准,未来可以在更广泛的场景中应用,满足不同行业和用户的需求。

IDC中国区副总裁兼首席分析师武连峰告诉记者,未来5至10年是AI大模型加速重构企业数字化的关键时期。从节约经济成本和效益最大化的角度来看,未来大模型市场参与者的分工会更加明确。更多企业将在云厂商的算力、模型和数据资源基础上开发AI原生应用,推动AI原生应用市场走向繁荣。

端侧大模型方兴未艾,挖掘终端消费新潜能

值得关注的是,大模型的热潮同样涌向手机产业,越来越多的端侧大模型有望成为用户生活、工作中的助手,满足用户在多场景下的使用需求。据中国工程院院士邬贺铨介绍,厂商通过模型压缩和定制AI芯片提升算力,将具有百亿参数大模型的推理能力嵌入手机,将提供低成本、低时延、高安全的智能助手服务。

2023年国内头部手机厂商也正加速布局卡位。在10月举行的2023高通骁龙峰会期间,荣耀CEO赵明宣布,荣耀Magic6系列将搭载第三代骁龙8移动平台,支持70亿参数的端侧AI大模型。

赵明在采访中表示,AI在端侧的发展具有无穷的想象力,目前荣耀端侧AI大模型可基于对用户偏好的理解和感知,为用户提供个性化服务,结合多模态自然交互,荣耀Magic6对用户意图理解更精准更立体,能够认知学习图像、文本和复杂语义,带来千人千面的用户专属智慧服务。而荣耀Magic6内置的端侧AI大模型也将全面融入到AI使能的个人化全场景操作系统中。

11月,vivo在开发者大会上发布自研通用大模型矩阵——蓝心大模型,其中包含十亿、百亿、千亿三个参数量级的5款自研大模型,覆盖多个核心场景,并推出基于其打造的首款系统级人工智能应用蓝心小V、蓝心千询等功能应用。

近日OPPO也宣布将在Find X7系列上实现端侧应用的70亿参数的模型,通过高精度4bit量化等模型压缩,推理引擎的加速,以及与芯片平台深度合作的硬件加速方式,第一次为手机端侧带来完全体的70亿参数大模型,彻底变革手机端侧AI的使用方式。

事实上,与云端大模型相比,端侧大模型具有明显优势,包括用户的隐私安全可以得到更好保障,以及个性化用户体验得到大幅提升。不过,端侧大模型的布局同样需要克服计算、存储、续航能力等一系列技术瓶颈。但就像绝大多数前沿技术的落地过程一样,端侧大模型也将在不断探索中释放出无限潜能。

而在这一过程中,扮演着重要角色的芯片厂商,也正蓄势赋能端侧大模型走入“寻常百姓家”。比如高通在10月发布了第三代骁龙8,作为其首个专为生成式AI打造的移动平台,其能够运行高达100亿参数的生成式AI模型,并可以每秒20个tokens的速度运行大语言模型。

高通技术公司高级副总裁兼手机、计算和XR业务总经理阿力克斯·卡图赞称,通过在终端侧运行这些大型模型,用户将无需再完全依赖云端。在第三代骁龙8上,AI辅助特性将响应更快、更高效,并且因为在终端侧运行,所以隐私性与安全性也会提升。

据IDC预测,到2026年,中国市场中近50%的终端设备的处理器将带有AI引擎技术。IDC中国研究副总裁王吉平认为,未来AI终端将在创作与创意、游戏和虚拟世界、语音合成与转换、视觉和图像处理、聊天机器人、个性化推荐、医疗辅助等领域广泛落地发展。

基于端侧大模型带来的升维体验,智能终端消费也有望获得新的拉动力。华福证券研报称,端侧大模型将成为消费电子品牌厂商提升个性化用户体验,打造产品差异化竞争力的重要方向,具备更强AI能力的终端新品推出或将带动消费电子见底复苏。

热门相关:仙王   一念路向北(刘恺威主演电视剧原著)   别有用心的善良女秘书   贴身侍卫   圣人门徒