Meta宣布推出新的AI模型,可生成带声音的视频

Meta,Facebook和Instagram的所有者,宣布周五推出了一款名为“电影生成器(Movie Gen)”的新人工智能模型,该模型可以根据用户提示创建逼真的视频和音频剪辑,并声称可以与领先的媒体生成初创公司(如OpenAI和ElevenLabs)的工具相媲美。


Meta提供的Movie Gen的创作样本显示,视频中有动物在游泳和冲浪,还有使用人们真实照片来展示他们进行绘画等动作。Meta在一篇博文中表示,Movie Gen还可以生成与视频内容同步的背景音乐和音效。用户还可以使用该模型编辑现有视频。在其中一个视频中,Meta让工具在一个人独自在沙漠中奔跑时插入了啪啪声,而在另一个视频中,它将一个男人正在滑板的停车场从干燥的地面变成了溅水的水洼覆盖的场景。Meta表示,由Movie Gen创建的视频最长可达16秒,音频则可以长达45秒。Meta分享的数据显示,在盲测中,该模型的表现比从未来、OpenAI、ElevenLabs和Kling等初创公司的产品表现更为良好。

这一宣布出现在好莱坞今年一直在较劲如何利用生成式人工智能视频技术之际,此前微软支持的OpenAI于二月份首次展示了其产品Sora如何可以根据文本提示创建类似电影特效的视频。娱乐行业的技术人员渴望使用这类工具来增强和加快电影制作进程,而其他人担心采用那些似乎已经未经授权地训练过版权作品的系统。立法者也在强调对于人工智能生成的伪造视频,或称深度伪造,如何被用于世界各地的选举中,包括美国、巴基斯坦、印度和印度尼西亚等国的担忧。Meta的发言人表示,公司不太可能像释放其Llama系列的大型语言模型一样向开发者开放Movie Gen,称公司会为每一个模型单独评估风险。他们拒绝就Movie Gen的具体评估发表评论,而是表示Meta正在直接与娱乐界和其他内容创作者合作,讨论如何使用Movie Gen,并计划在明年将其整合到Meta的产品中。

根据Meta发布的博文和有关工具的研究论文,公司使用了一组许可和公开可获得的数据集来构建Movie Gen。

OpenAI今年已经与好莱坞高管和经纪人开会,讨论可能涉及Sora的合作伙伴关系,尽管尚未报告有任何交易是由那些会谈产生的。今年五月,当演员斯嘉丽·约翰逊指控ChatGPT制造商未经许可模仿她的声音用于其聊天机器人时,对该公司的担忧加剧。《饥饿游戏》和《暮光之城》幕后公司狮门娱乐(Lionsgate)于九月宣布,正在训练一项生成模型,使用其电影和电视库进行学习。回报是,公司表示,该工作室和其制片人们可以使用该模型来增强他们的工作。

探索更多关于这些主题的内容。

Meta人工智能(AI)新闻分享。

此内容可转载。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Meta宣布推出新的AI模型,可生成带声音的视频

https://www.gptnb.com/2024/10/05/2024-10-04-auto1-2um9mp/

作者

ByteAILab

发布于

2024-10-05

更新于

2025-03-21

许可协议