谷歌新技术可用AI模型为无声视频配音可自动生成背景音效

2024-06-18 23:55 由新浪科技发表于 #资讯

据新浪科技报道，谷歌DeepMind新闻稿，DeepMind近日公布了一项利用AI为无声视频生成背景音乐的“video-to-audio”技术。

当前DeepMind这款AI模型依然存在局限性，需要开发者使用提示词为模型预先“介绍”视频可能的声音，暂时不能直接根据视频画面添加具体音效。

据悉，该模型首先会将用户输入的视频进行拆解，此后结合用户的用户文字提示，利用扩散模型反复运算，最终以生成与视频画面协调的背景声音，例如输入一条“在黑暗中行走”的无声视频，再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示，相关模型就能生成恐怖风格的背景音效。

DeepMind同时表示，该“video-to-audio”模型可以为任何视频生成无限数量的音轨，还能够通过提示词内容判断生成的音频“正向性”或“反向性”，从而令生成的声音更贴近某些特定场景。

展望未来，DeepMind表示研究人员正进一步优化这款“video-to-audio”模型，计划未来能够让模型直接根据视频内容，无须通过提示词即可生成视频背景音，同时还将改善视频中人物对白的口型同步能力。

热门相关：宠宠欲恋大周仙吏我能看到隐藏机缘我朋友的老婆学霸，你女朋友掉了

相关文章

万代官宣7月5日举行活动带来龙珠、高达游戏新情报

万代南梦宫宣布，将于7月5日在Anime Expo 2024上举办游戏夏季展示会。阅读全文

游民晨播报：《超越善恶20周年纪念版》本周公布新消息《COD》×《辐射》联动预告

1、韩国MMO《王权与自由》9月17日推出 2、《超越善恶：20周年纪念版》本周公布新消息 3、《使命召唤》×《辐射》联动预告 4、万…阅读全文

《马力欧&路易吉RPG》完全新作公布！11月7日发售

在最新的直面会上，任天堂公布了《马力欧&路易吉RPG》完全新作《马力欧&路易吉RPG：兄弟齐航》，预计于11月7日发售。一起来看看。阅读全文

美国歌手“贾老板”贾斯汀汀布莱克酒驾被捕原定于本周末举行演出

美国歌手贾斯汀·汀布莱克在纽约长岛因酒驾被捕。阅读全文

港任确认支持中文的第三方游戏：《逆转检察官》等

任天堂香港发文确认，以下第三方游戏将全部支持中文。阅读全文

任天堂直面会：《逆转检察官1+2》公布 9月6日发售

在今天的直面会上，任天堂公布了《逆转检察官1+2》，预计于9月6日发售。阅读全文

任天堂直面会：《弹丸论破》团队新作公布 25年推出

在今天的直面会上，任天堂公布了《弹丸论破》开发团队新作《HUNDRED LINE最终防卫学园》，预计于2025年初发售。阅读全文

COSPLAY图赏：俄妹COS《鬼灭之刃》祢豆子成年版还原傲人身材

最近，来自俄罗斯的小姐姐AGflower也带来了成年版祢豆子COS阅读全文

任天堂直面会：《银河战士Prime4》公布 2025年推出

在今天的直面会上，任天堂公布了《银河战士Prime4》，预计于2025年推出。阅读全文

《塞尔达》2D新作公布！限定版NS9月26日同步发售

在今日的直面会上，任天堂正式公布了以塞尔达为操作角色的《塞尔达传说》2D新作，同时宣布《塞尔达传说》主题限定Switch Lite将于9…阅读全文