通义万相发布视频生成模型可一键创作影视级高清视频

2024-09-20 11:38 由环球网发表于 #科技

【环球网科技综合报道】9月 19 日，在杭州云栖大会上，阿里云CTO周靖人宣布通义万相全面升级，并发布全新视频生成模型，可生成影视级高清视频，可应用于影视创作、动画设计、广告设计等领域。即日起，所有用户可通过通义APP及通义万相官网免费体验。

据介绍，通义万相首批上线文生视频、图生视频功能，在文生视频功能中，用户输入任意文字提示词，即可生成一段高清视频，支持中英文多语言输入，并可以通过灵感扩写功能智能丰富视频内容表现力，支持16:9、9:16等多种比例生成；在图生视频功能中，支持用户将任意图片转化为动态视频，按照上传的图像比例或预设比例进行生成，同时可以通过提示词来控制视频运动。

现场，阿里云演示了该模型强大的运动生成和概念组合能力，输入“穿着滑冰鞋的小兔子在冰面上灵活移动的可爱场景”，通义万相仅用数分钟就能生成一段高清、逼真的视频。

通义万相视频生成大模型集成了多项创新技术，有效解决画面表现力和大幅度运动等视频生成技术难题。针对运动生成和物理模拟等难点优化算法，实现了大幅度主体运动和运镜控制，并有效模拟真实世界物理特性；设计了高压缩比、高质量视频VAE框架，有效降低视频信息冗余，并保持高质量视频重构能力；同时，基于轻量微调框架和精选数据集优化训练，在中式传统元素、风格化视频生成上表现更好。

去年7月，通义万相图像生成大模型首次亮相，目前已累计生成7500万张图片。云栖大会现场，通义万相宣布视觉生成大模型全面升级为Diffusion Transformer框架，同时结合通义千问复杂提示词解释能力，有效提升画面表现力、语义理解能力、可控生成能力。随着通义万相视频生成模型的发布，通义大模型已覆盖文本生成、图像理解、视频理解、音频理解、图像生成、视频生成等全模态场景。

相关文章

释放科技信息数据要素价值！八月瓜科技李磊揭秘背后的运营逻辑

而提到八月瓜科技，公司以全球科技信息数据要素资源为基础，为企业、高校、科研院所、政府提供科技信息检索分析、科技咨询、知识产权情报、科技成果转化查询等信息服务，围阅读全文

任天堂Switch 2外观曝光：8英寸屏幕，拥有12GB内存

如今游戏机市场是越来越热闹，前几天索尼发布了PS5 Pro，由于太过于昂贵的售价而争议不断，目前任天堂Switch 2又得到了大量的曝光，据悉网上出现了疑似任天堂Switch 2的实物图以及建模图，有阅读全文

大疆发布全新超旗舰画质运动相机 Osmo Action 5 Pro

Osmo Action 5 Pro的诞生，是我们向用户提供的又一款集旗舰级画质、硬核性能及多场景适配功能于一体的运动相机阅读全文

博雅发布BOYALINK升级版无线麦克风，引领音频创作新风尚

【环球网科技报道】近日，全球知名声学设备品牌BOYA博雅再次发力，正式推出了全新升级版的BOYALINK无线麦克风阅读全文

埃安新款轿车9月26日开启预售

在车型配置方面，该车车身长4865mm、宽1875mm、高1520mm，轴距2775mm，且前挡风玻璃上方配备有激光雷达，同时搭载英伟达Orin-X高算力平台，阅读全文

高德开放时空智能应用发布交通、商业领域两大类智能体应用

全域商业智能体基于人地时空数据、行业知识融合形成商业时空洞察能力，为用户提供基于时空知识的商业洞察问询及指标解读，并针对咖啡茶饮、商超便利、餐饮、文旅、交通等行阅读全文

激光显示“向新”突破，未来激光电视主机或迎革命性变化

与此同时，智能投影领域同样受益于激光显示技术的引入，加速了产业升级并引领了消费高端化趋势阅读全文

近30亿人次出行，全国铁路客运量创新高

通过动态优化列车开行方案、丰富客运产品供给、提升站车服务品质等措施，精心组织中秋、十一假日运输工作，努力为广大旅客提供更加美好的出行体验阅读全文

2024年Q2儿童智能手表出货量同比增4%

中国作为全球儿童智能手表市场的领头羊，2024年第二季度占据了64%的市场份额，得益于强大的分销渠道和本土品牌的蓬勃发展阅读全文

中国科学院发布地理科学大模型“坤元”

在“知人心”方面，该团队创新性地提出了基于“认知启航-应用智导-前沿研析”框架的用户画像精准判别与响应技术，保证“坤元”能够充分考虑地理知识爱好者、地理学专业学阅读全文