Stability AI 近日宣布,旗下文字生成圖片模型 SDXL 0.9 已經正式推出。該版本在圖像內容與構圖細節方面做了大幅改進,并可以在消費級 GPU 上運行。
據悉,SDXL 0.9 在所有開源圖像模型中參數數量位居前茅,其具備一個 35 億參數的基礎模型和一個 66 億參數的附加模型。圍繞這兩個模(mo)(mo)型(xing),SDXL 的(de)工作原(yuan)理即(ji),使用(yong)(yong)基(ji)礎(chu)模(mo)(mo)型(xing)創(chuang)建粗略(lve)的(de)細節(jie),再使用(yong)(yong)附(fu)加模(mo)(mo)型(xing)精細化生(sheng)成的(de)圖片(pian),如果IT之家的(de)小伙伴(ban)們有使用(yong)(yong)過 Stable Diffusion 的(de)話,應該可(ke)以注意到這一漸(jian)進(jin)式的(de)工作過程。
▲ 圖(tu)源 SDXL 團(tuan)隊
Stability AI 表示,SDXL0.9 中(zhong)使用(yong)了(le)兩個(ge) CLIP 模型,其中(zhong)包括 OpenCLIP vitg /14,這是迄今(jin)為止(zhi)體積最(zui)大的(de) OpenCLIP 模型。憑借該模型,Stable Diffusion 可以創建深(shen)度更(geng)廣(guang)、分辨(bian)率更(geng)高的(de)逼真圖像。
Stability AI 同時表示,SDXL 團隊將發布一篇研究博客,詳細介紹 SDXL 0.9 的模規范和更多參數細節,預計該模型將在 7 月迎來 1.0 正式版本,并將在 GitHub 開源。