【发现者网】6月25日消息,Stability AI近日正式推出旗下文字生成图片模型SDXL 0.9。据悉,该版本在图像内容和构图细节方面经过大幅改进,并且可以在消费级GPU上运行。
SDXL 0.9是Stability AI中参数数量排名前列的开源图像模型之一,它包含一个基础模型和一个附加模型,分别拥有35亿和66亿个参数。SDXL的工作原理是利用基础模型生成粗略的图像细节,再通过附加模型对生成的图片进行精细化处理。如果读者之前使用过Stable Diffusion,他们可能会注意到这种逐步改进的工作过程。
据发现者网了解,SDXL 0.9采用了两个CLIP模型,其中包括目前体积最大的OpenCLIP模型vitg/14。借助该模型,Stable Diffusion能够创建出更深度、分辨率更高的逼真图像。
Stability AI还表示,SDXL团队将发布一篇研究博客,详细介绍SDXL 0.9的模型规范和更多参数细节。预计该模型将于7月发布1.0正式版本,并在GitHub上进行开源。
新版本在图像内容和构图细节方面经过改进,并能在消费级GPU上运行。该模型具有较大的参数数量,分为基础模型和附加模型。SDXL的工作原理是逐步改进生成过程。SDXL 0.9采用了两个CLIP模型,其中包括体积最大的OpenCLIP模型vitg/14。Stability AI计划在7月发布1.0正式版本并进行开源。