VideoPoet是由 Google Research 于 2023 年开发的一款大型语言模型,主要用于影片制作。[1][2][3][4] 该模型能将静态影像转换为动画。[5] VideoPoet 支持文本、影像和影片作为输入,并能将这些输入转换成多种格式。[4] 该模型于 2023 年 12 月 19 日正式公开。[1]VideoPoet 使用自我回归模型

Quick Facts 开发者, 首次发布 ...
VideoPoet
"一只狗在电影院里吃爆米花"
"一只戴着帽子、太阳眼镜和皮夹克的泰迪熊正在打鼓"
由该模型生成的示例影片来自于文本
开发者Google
首次发布2024年2月8日,​9个月前​(2024-02-08
类型大型语言模型
Close

参考资料

外部链接

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.