Google VideoPoet
Google VideoPoet是谷歌推出的一项革命性AI技术,它可以将文本提示转换成视频。简单来说,如果你想象了一个场景,比如“一只机器猫在吃意大利面”,只需输入这个描述,VideoPoet就能在几秒钟内生成一个对应的视频给你看。这听起来像是科幻小说里的技术,但它确实存在,而且是基于谷歌强大的AI研究背景。
主要包括:
- 文字转视频
- 图像到视频
- 视频编辑
- 造型
使用场景:
-
艺术创作: 如果你是一名艺术家或创意工作者,想要快速将你的创意想法转化为视频形式,VideoPoet可以帮助你实现这一点。
-
教育和培训: 教师和培训师可以使用VideoPoet根据特定的教学内容快速制作出具有教育意义的视频,提高教学的互动性和趣味性。
-
营销: 营销人员可以利用它创建动态吸引人的营销视频, 特别是当需要快速展示一个新概念或产品时。
-
个人娱乐: 想要为社交媒体制作有趣的个性化视频,或者仅仅是为了娱乐和自我表达,VideoPoet都能为你提供无限的创意可能性。
VideoPoet的工作机制:
VideoPoet并不是使用传统的扩散模型来生成视频,而是基于大型语言模型(LLM)。这意味着,与ChatGPT和Google Bard等能够预测文本中单词如何组合成句子的技术相同,VideoPoet能够进一步预测视频和音频片段。谷歌通过将大量的图像-文本对以及公共视频样本转换成通用的“令牌”(tokens),使得VideoPoet能够以此学习和预测视频内容。
与竞争者的不同:
谷歌声称,相比于其他依赖扩散模型将文本转换成视频的AI,VideoPoet能够更加优雅地处理运动,并且能生成更长的视频。当前市面上的大多数视频生成模型要么只能生成运动较小的视频,要么在生成大幅运动时会出现明显的画面问题。VideoPoet在这方面做得较好,能够保持视频内容连贯,即便是在展示八到十秒的视频片段时。
目前,谷歌还未公布VideoPoet的发布计划或是否免费。考虑到AI生成的图像和视频需要巨大的计算资源,未来可能需要通过订阅的方式来获取服务。因此,我们可能还需要等待一段时间,以见证谷歌是否会像OpenAI的ChatGPT那样,推出令市场颠覆的产品。
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621