Make-A-Video 文本转视频工具

该工具从文本描述中生成静止图像。虽然有许多类似的工具,如DALL-E和Midjourney已经占领了互联网….

周四,Facebook 的母公司 Meta 宣布了Make-A-Video,这是一种从文本描述中生成短视频剪辑的工具——这是人工智能图像生成世界令人不安但不可避免的。

该工具沿用了该公司于 7 月推出的Make-A-Scene工具,该工具从文本描述中生成静止图像。虽然有许多类似的工具,如DALL-E和Midjourney已经占领了互联网,但 Make-A-Video 是我们第一次看到即将向公众提供的文本到视频工具。

“生成式人工智能研究通过为人们提供快速轻松地创建新内容的工具来推动创造性表达,” Meta 的新闻稿说。“只需几句话或几行文字,Make-A-Video 就可以将想象力带入生活,并创造出充满生动色彩、人物和风景的独一无二的视频。该系统还可以从图像中创建视频或拍摄现有视频并创建类似的新视频。”

Meta 的新闻稿说

“生成视频比生成照片要困难得多,因为除了正确生成每个像素之外,系统还必须预测它们将如何随时间变化,”Meta 首席执行官马克扎克伯格在Facebook 帖子中写道。“Make-A-Video 通过添加一层无监督学习来解决这个问题,使系统能够理解物理世界中的运动并将其应用于传统的文本到图像生成。”

马克扎克伯格在Facebook 帖子中写道

Make-A-Video 网站上的示例视频展示了“一只穿着红色斗篷的超级英雄服装的狗在天空中飞翔”和“一只泰迪熊在画肖像”的视频。这些视频显然是由 AI 生成的,具有 AI 生成的图像所固有的模糊、绘画般的品质。然而,它们仍然展示了人工智能艺术系统的快速发展,仅在几年前,人工智能艺术系统还是模因和科幻小说的内容。

Make-A-Video 文本转视频工具
由 META 的 MAKE-A-VIDEO 创建的超级英雄狗视频的屏幕截图

根据 Make-A-Video 研究论文,图像模型是使用 LAION 数据集的一个子集进行训练的,该数据集以抓取会产生有偏差结果的未过滤网络数据而闻名。Motherboard 最近报道说,在这个数据集中有 ISIS 处决的图像、非自愿的裸体和名人的照片。Meta 似乎通过将超过 58 亿张图像的原始数据集解析为 23 亿张来解决这个问题,该论文的作者声称,“我们过滤掉带有 NSFW 图像的样本对、文本中的有毒词、带有水印概率的图像大于 0.5。”

与此同时,人工智能伦理研究人员反对使用这些大型语言模型,警告说它们的庞大规模会产生无法轻易解决的有害偏见的根本问题。甚至Facebook自己的研究人员也承认,他们的语言模型“很容易”产生种族主义和有害结果。

发布者:飞鱼出海,转载请注明出处:https://www.toptiao.com/10445.html

转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。

(0)
打赏 微信 微信
上一篇 2022年10月5日 09:26
下一篇 2022年10月7日 08:09

相关推荐

发表回复

登录后才能评论
error: Content is protected !!