Loading AI tools
深度學習模型,用於微調現有的文生圖模型 来自维基百科,自由的百科全书
DreamBooth是一个深度学习模型,用于微调现有的文生图模型,由Google Research和波士顿大学的研究人员于2022年开发。最初利用谷歌开发的的Imagen文生图模型开发,DreamBooth可以应用到其他文生图模型,在使用指定主题的三到五张图像进行演算、训练后,可以让模型产生更精细和个性化的输出图像。[1][2][3]
预先训练的文生图扩散模型,虽然通常能够提供多种不同的图像输出,但缺乏生成不太知名的主题图像所需的特异性,并且在不同情况和背景下呈现已知主题的能力有限。[1] 运行DreamBooth来微调模型的过程首先需要输入一小套描绘某一种特定主题的图像,一般三到五张图像就足够了,这些图像与包含主题所属类别名称的提示词 配对,加上一个独特的标识符(例如:a photograph of a [Nissan R34 GTR] car
,用car
作为类别);同时,一个“特定类别的先验保存损失”(class-specific prior preservation loss)来让模型在已经训练好的类别上产生不同的主题实例。[1] 从一组输入图像中提取的一对低分辨率和高分辨率的图像被用来微调超分辨率组件,从而保留主题的微小细节。[1]
DreamBooth可以用来对Stable Diffusion等模型进行微调,通过这种用例它能够缓解Stable Diffusion无法生成特定个人图像的常见缺陷。[4] 然而,这样的用例是相当耗费VRAM的,因此对业余用户来说是成本高昂的。[4] 有人对使用DreamBooth来训练模仿与人类艺术家的特定艺术风格的道德问题表示关切。[5]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.