RockAI发布Yan1.3大模型 可高效处理多模态信息

【环球网科技综合报道】9月26日,RockAI正式推出了全新升级的Yan1.3大模型,并展示了其在无人机、机器人、PC、手机等各类终端设备上的超强模力。

相较于1月份首发的Yan1.0,Yan1.3具备了强大的多模态能力,可高效处理图文及语音等多模态信息,并实现了模型在更广泛设备端上的离线无损部署,普通电脑CPU上也能够流畅运行。

同时,RockAI团队对外展示了一款部署了Yan1.3大模型的“飞龙”无人机。区别于大多数云、边、端协同控制的无人机,飞龙的智能大脑Yan1.3直接部署于设备端,对突发状况能做出即时判断和处理,无需先传回云端判定再回到设备端执行,大大提升无人机在复杂环境中的适应性和自主性,实现高度的自动化水平和快速反应能力。如与某厂商合作的无人机项目,便能解决设备将高清画面传回云端,所产生的5G-A流量成本高的痛点。

在实际应用方面,部署了Yan1.3的飞龙无人机,可全面感知复杂环境并在设备端实时处理,支持各类环境下的智能巡检,不仅高效适配电力巡检、安全监控、环境监测等城市治理及工业场景;更可面向个人用户,广泛运用于AI拍摄、外出旅游、山地越野等日常生活情景,贴心勘探环境、规划行程的同时,还能够解放双手,自动捕捉最佳角度并挑选出最佳照片。

此外,研发团队还演示了Yan1.3在更多端侧设备的广泛应用,比如此前惊艳亮相世界人工智能大会的 “胖虎”智能机器人,能够基于Yan1.3的多模态处理能力,在离线状态下识别复杂环境、准确理解用户意图,并据此控制其机械躯体高效完成各类复杂任务,如展现“七步成诗”“咏春拳法”等。

RockAI认为,真正的智能是不应受限的,因此,他们始终坚定地走在非Transformer架构、无损部署这条少有人走的路上。如今,未经压缩、裁剪的Yan1.3大模型在越来越多设备端展现出的丝滑适配和超强模力,正向行业证实RockAI技术路线的合理性,及其最终激发群体智能的充分可能。

在RockAI的规划中,群体智能的实现包括四个阶段:创新型基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。如果说自主架构的Yan模型是走向群体智能的开端,那么此次发布的Yan1.3群体智能单元大模型,显然已经快速实现了在多元化硬件设备上的适配。其在端侧的无损推理基于两大核心技术创新,一是以底层神经网络架构MCSD替代Transformer的Attention机制,二是基于仿生神经元驱动的选择算法实现类脑分区激活,大大减少计算复杂度及算力消耗。

RockAI借鉴了大脑分区激活的原理,由选择神经网络自己决定处理某个任务时参与运算的神经元,初始具有随机性,但通过大量数据学习、训练后会变得有迹可循。就像人类一样,随着一件事情做的越多,被激活的那部分神经元就会越确定,反应也就越快。基于该算法实现的模型分区激活,不仅节省了算力成本,还可以通过共享神经元实现多模态的对齐。

经过对不同硬件的研究和大量调试,目前RockAI已经适配了英伟达、高通、联发科、英特尔、瑞芯微等平台,商业化进程也在不断加速。随着自主学习机制进入实验室测试阶段,RockAI也与芯片厂商及终端厂商达成初步合作意向,突破硬件限制,打造越来越多基于Yan架构的智能单元。

其CEO刘凡平表示:“在AGI这个终极命题下,无论是云端还是端侧,都只是实现智能普惠及跃迁的一个载体。RockAI始终坚信,只有真正提升每一台设备的自我学习能力,才能激发更高级别智能形态即群体智能的涌现。”