Stability AI 近日宣布,旗下文字生成圖片模型 SDXL 0.9 已經正式推出。該版本在圖像內容與構圖細節方面做了大幅改進,并可以在消費級 GPU 上運行。
據悉,SDXL 0.9 在所有開源圖像模型中參數數量位居前茅,其具備一個 35 億參數的基礎模型和一個 66 億參數的附加模型。圍繞這(zhe)(zhe)兩(liang)個模(mo)型,SDXL 的工作原理即,使(shi)(shi)用(yong)基(ji)礎(chu)模(mo)型創建粗(cu)略的細節,再(zai)使(shi)(shi)用(yong)附加模(mo)型精(jing)細化(hua)生(sheng)成的圖片(pian),如果IT之家的小伙伴們有使(shi)(shi)用(yong)過 Stable Diffusion 的話,應該(gai)可以注意到這(zhe)(zhe)一漸進式(shi)的工作過程。

▲ 圖(tu)源(yuan) SDXL 團隊
Stability AI 表示,SDXL0.9 中(zhong)使(shi)用(yong)了兩(liang)個 CLIP 模(mo)型,其中(zhong)包括 OpenCLIP vitg /14,這是迄今為止體積最大(da)的 OpenCLIP 模(mo)型。憑借該模(mo)型,Stable Diffusion 可以創建深(shen)度更廣、分(fen)辨率更高的逼真圖像。
Stability AI 同時表示,SDXL 團隊將發布一篇研究博客,詳細介紹 SDXL 0.9 的模規范和更多參數細節,預計該模型將在 7 月迎來 1.0 正式版本,并將在 GitHub 開源。