让AI有感知能力，天图万境联合华为云发布“视频声效大模型”解决方案

2024-06-25 09:55 由咸宁日报发表于 #商业

人工智能已经成为当下最火热的赛道,众多企业和资本纷纷入局。尽管如此,AI技术始终难以出现新突破,普遍聚焦于“AI内容生成”这一领域。

6月22日,天图万境在华为开发者大会2024(HDC 2024)上正式发布了AI“视频声效大模型解决方案”,该模型依托天图万境自主研发的AI感知视听技术,为人工智能领域带来了颠覆性革命。这一里程碑式的发布不仅标志着AI技术在“空间智能”领域取得了重大突破,更预示着众多行业将因此迎来新一轮生产力革新的浪潮。

视频声效大模型解决方案发布,让AI具备感知力

“视频声效大模型解决方案”底层基于天图万境自主研发的AI感知视听技术,通过深度学习和大数据分析,让AI具备了前所未有的视觉和听觉能力,为应用场景做出精准的机器决策和行动。

大会上,天图万境创始人图拉古发表《视频声效大模型解决方案催生空间智能》的主题演讲,他表示,“我和我的团队一直致力于创造更加理想的空间智能。我们要让 AI拥有类人的记忆推理能力,让它理解行为意图、物质属性、运动规律、和空间关系。我们希望机器能够为人做事,或者帮人做事,知道哪些是人类需要的,并理解不同场景下人类的差异化需求,通过“联级神经元”和多样数据的训练,让机器学会自我认知和决策,可以在数字世界中,像人类一样识别多样的世界环境,理解场景的复杂性。”

与传统的AI文生图、文生视频路线不同, 天图万境的AI感知视听技术希望AI 能够像人类一样,先通过听觉和视觉来认识世界,再通过大脑积累的经验记忆来进行预测和自我修正。该技术将每个专用AI模型视作人类的神经元,通过多个AI“神经元”的相互配合和大规模数据训练,使计算机能够深度理解人类生活的三维世界和数字世界中的物理规律。这种设计不仅提高了AI的感知和理解能力,还降低了对硬件算力的依赖,使得计算机能够以更低的功耗处理复杂任务。

“视频声效大模型解决方案”通过模拟人脑的机制行为,使AI能够像人类一样通过视觉和听觉来感知和理解世界。例如,在识别火车由远及近的场景时,模型能够根据画面的空间变化生成从小到大的音量;在识别海鸥群集的场景时,模型能够匹配出真实的等量动态声音。这种智慧生成声音的能力,使得AI在数字世界中具有了更为丰富的感知和理解能力。

天图万境凭借AI感知视听技术的前沿创新和行业影响力,在HDC 2024大会上与华为云正式签署战略合作协议,携手促进“视频声效大模型”解决方案的研发和推广。这一合作不仅将促进双方在人工智能与云计算领域的深度融合,也在全球范围内树立了新一代视听技术的标杆。

赋能千行百业,迈向“空间智能”时代

此次天图万境的与华为云携手推出的“视频声效解决方案”引起在场观众的热烈讨论。这一技术突破不仅为AI领域带来了新的发展机遇,更是赋能需要机器决策和行动的千行百业,迈向新的“空间智能”时代。

当AI具备类人的感知世界能力后,它将拥有更强的认知能力、识别能力和记忆能力:在矿山探测领域,无人探测车可以借助AI的感知能力分辨岩石和实时监测矿井环境,提高安全性和工作效率;在消防检测领域,AI可以快速识别火源位置并预测火势蔓延路径,为应急响应提供有力支持;在普通摄像头领域,AI可以使摄像头不借助任何深度传感器就能拍摄三维立体画面,获得稳定清晰的深空间深度并输出立体的空间视频。

以上正是人类感知、理解世界的方式……这种智慧使AI能够更好地理解人类的需求和意图,为人类创造更加美好的生活。未来,天图万境将持续在AI感知视听技术方面发力,不断追求新的突破,为全球AI的智能化发展开辟一条独特的创新之路。