與Midjourney開戰(zhàn)!Stable Diffusion XL 0.9重磅發(fā)布,35億+66億雙模型,AI圖像生成飛躍式進(jìn)步 全球播報(bào)
新智元報(bào)道??
編輯:編輯部
【新智元導(dǎo)讀】雖然此前CEO曾陷入種種爭(zhēng)議,但依然不影響Stability AI登上時(shí)代雜志。近日,該公司又發(fā)布了Stable Diffusion 的XL 0.9版本,35億+66億雙模型,搭載最大OpenCLIP,讓AI生圖質(zhì)量又有了新的飛躍。
(資料圖)
Stable Diffusion又雙叒升級(jí)了!
最近,Stability AI發(fā)布了最新版的Stable Diffusion XL 0.9(SDXL 0.9)。
比起之前的模型,這波更新在圖像和構(gòu)圖細(xì)節(jié)上,都有了質(zhì)的飛躍。
尤其是在參數(shù)上,這次的SDXL0.9具有35億參數(shù)基礎(chǔ)模型和66億參數(shù)模型的集成管線。相比之下,Beta測(cè)試版僅用了單個(gè)31億參數(shù)的模型。
為了生成更逼真的圖像,以及更大的深度和更高的分辨率(1024x1024),SDXL 0.9使用了兩個(gè)CLIP模型,包括迄今為止最大的OpenCLIP模型(OpenCLIP ViT-G/14)。
不僅如此,SDXL 0.9在消費(fèi)級(jí)顯卡上就能運(yùn)行。只需要Win10/11或Linux操作系統(tǒng)、16GB內(nèi)存,以及具有8GB以上顯存的英偉達(dá)RTX 20系顯卡即可。
SDXL 0.9和SDXL Beta的差異究竟有多大?
咱們看圖說(shuō)話。
實(shí)測(cè)效果
下面就來(lái)看看新版的SDXL 0.9,在圖片細(xì)節(jié)上有什么不一樣吧~
Prompt:外星人在拉斯維加斯漫步
SDXL Beta版
SDXL 0.9
Prompt:優(yōu)勝美地國(guó)家公園的一只狼
Negative prompt:3d渲染,光滑,塑料,模糊,顆粒感,低分辨率,動(dòng)漫,過度飽和
SDXL Beta版
SDXL 0.9
Prompt:手舉咖啡
Negative prompt:3d渲染,光滑,塑料,模糊,顆粒狀,低分辨率,動(dòng)漫
SDXL Beta版
SDXL 0.9
官方表示,SDXL系列還會(huì)提供一系列超越基本文本prompt的功能。
包括圖像對(duì)圖像的prompt(輸入一個(gè)圖像以獲得該圖像的變化)、內(nèi)畫(重建圖像的缺失部分)和外畫(構(gòu)建一個(gè)現(xiàn)有圖像的無(wú)縫擴(kuò)展)。
SDXL 0.9在兩個(gè)CLIP模型上運(yùn)行,包括迄今為止訓(xùn)練的最大的OpenCLIP模型之一(OpenCLIP ViT-G/14),這增強(qiáng)了0.9的處理能力和創(chuàng)造具有更大深度和1024x1024更高分辨率的逼真圖像的能力。
SDXL團(tuán)隊(duì)不久將發(fā)布一個(gè)研究博客,更詳細(xì)地介紹這個(gè)模型的規(guī)格和測(cè)試。
榮登Time最具影響力公司
就在最近,Stability AI被時(shí)代雜志選為100家最有影響力的公司之一。
對(duì)于Stability AI,時(shí)代雜志是這樣介紹的——
如果你能用文字描述,Stability AI可以將其轉(zhuǎn)化為圖片。
Stable Diffusion是該公司幫助訓(xùn)練的免費(fèi)開源文本到圖像生成器,在8月份推出后,它改變了世界對(duì)于AI潛力的理解。
然而,Stability AI很快陷入了種種爭(zhēng)議,包括如何訓(xùn)練這些工具,以及從互聯(lián)網(wǎng)上獲取數(shù)據(jù)的版權(quán)訴訟之中。
盡管如此,該公司表示,在推出Stable Diffusion 2.0的一個(gè)月內(nèi),App Store TOP 10應(yīng)用中的4個(gè),背后都是這個(gè)模型。
而公司CEO Emad Mostaque也被報(bào)道經(jīng)??浯蠊镜谋憩F(xiàn),此前他曾聲稱:Stability AI「真正的開源」為「突破」鋪平了道路。
SDXL Beta
實(shí)際上,SDXL的Beta版本也沒發(fā)布多久,可見作圖這一塊的版本迭代真的是日新月異。
當(dāng)時(shí),StabilityAI就表示,Stable Diffusion XL并不是最終發(fā)布版的名字,并且也并非是v3,因?yàn)镾D-XL的架構(gòu)和SD-v2系列的模型架構(gòu)非常相似。
下面幾張SD-XL官方發(fā)布的例圖,可以看出圖像的質(zhì)量已經(jīng)非常能打了。
SD-XL相比之前版本的改進(jìn)如下:
使用較短的描述性prompt即可生成高質(zhì)量圖像
可以生成更貼合prompt的圖像
圖像中的人體結(jié)構(gòu)更合理
與 v2.1和 v1.5版本(程度較輕)相比,SD-XL生成的圖片更符合大眾審美
負(fù)面提示詞(negative prompt)是可選項(xiàng)
生成的肖像圖更逼真
圖像中的文本更清晰
清晰可讀的文字
在v1系列和v2.1版本的Stable Diffusion模型中,并不具備在圖片中生成可讀文本的能力。
雖然SD-XL生成的文本信息并不總是準(zhǔn)確,但確實(shí)得到了巨大的提升。
一個(gè)年輕的女性舉著一個(gè)牌子,上面寫著「Stable Diffusion」,頭發(fā)高亮,坐在餐廳外面,棕色的眼睛,穿著裙子,側(cè)燈
更好的人體結(jié)構(gòu)
Stable Diffusion在生成人體解剖結(jié)構(gòu)方面一直存在諸多問題,多幾條腿、少個(gè)胳膊實(shí)在是太常見不過的問題。
比如說(shuō)SD-v1.5生成瑜伽的圖像,經(jīng)常會(huì)出現(xiàn)扭曲的人體。
而SD-XL雖然生成的圖像并不完美,不過在人體姿態(tài)方面已經(jīng)有了顯著的進(jìn)步。
更有美感(more aesthetic)
比如同樣以屋子為主題,SD-XL可以生成更對(duì)稱、視覺效果更好的照片。
SD-XL在肖像照片上也有顯著改進(jìn)。
一個(gè)女人的照片
參考資料:
https://stability.ai/blog/sdxl-09-stable-diffusion
關(guān)鍵詞:
您可能也感興趣:
今日熱點(diǎn)
為您推薦
注意避雨!深圳24-25日有雷陣雨,局地暴雨風(fēng)險(xiǎn)較高
烏情報(bào)局長(zhǎng)稱俄方在扎波羅熱核電站埋地雷,俄烏曾屢次互指“反人類”
全球今亮點(diǎn)!榆林首次試驗(yàn)在沙區(qū)飛播喬木樹種
更多
- 西藏養(yǎng)老金調(diào)整最新消息公布了嗎(2022~2023年西藏養(yǎng)老金調(diào)整...
- 2023秋冬飲品流行什么?資深研發(fā)都在關(guān)注這6個(gè)方面
- 創(chuàng)業(yè)板工程機(jī)械概念上市公司股票一覽,代碼查詢 天天最新
- 全球要聞:醫(yī)藥行業(yè):中國(guó)醫(yī)藥產(chǎn)業(yè)發(fā)展報(bào)告
- 港股異動(dòng) | 小鵬汽車-W(09868)跌超7%領(lǐng)跌汽車股 本月首18...
- 走!到日喀則觀風(fēng)光品文化讀歷史
- 睚眥讀什么音(睚毗)
- 時(shí)髦精致的夏季穿搭示范,真正愛美懂美的人,從不敷衍自己的...
更多
- 全球最資訊丨三句半服裝造型_三句半服裝及全套道具
- 今日熱搜:好聚好散,分手后千萬(wàn)不要糾纏的星座
- 焦點(diǎn)播報(bào):切實(shí)做到還綠于民 河南許昌市中央公園開放4處共享綠地
- 世界熱門:福建省永安市發(fā)布雷雨大風(fēng)橙色預(yù)警
- 256GB+1TB擴(kuò)展+5000mAh+一億像素,現(xiàn)已跌至1098元,售價(jià)更親民了
- 假日市場(chǎng)活力足_今日關(guān)注
- 西安市碑林區(qū)舉辦“工程科技企事業(yè)單位走進(jìn)西工大活動(dòng)”
- 詹姆斯·卡梅隆談泰坦號(hào)觀光艇內(nèi)爆導(dǎo)致5名乘員死亡:和泰坦尼...
排行
- 熱點(diǎn)!工信部:強(qiáng)化平臺(tái)設(shè)施建設(shè),遴選跨行業(yè)跨領(lǐng)域綜合型等...
- 兩部門印發(fā)辦法明確 消防員面向社會(huì)公開招錄
- 低價(jià)出售410萬(wàn)旅客信息?12306回應(yīng):為第三方泄漏
- 2019年這些新規(guī)將落地 又一次普惠“加薪”
- 北京8家醫(yī)院試點(diǎn)將推錯(cuò)峰就診 率先開展“治堵”
- 數(shù)字化的城商行們?cè)趺礃恿???shù)字化轉(zhuǎn)型背后的故事
- 四川省稅務(wù)系統(tǒng)將推出10大類舉措服務(wù)納稅人、繳費(fèi)人
- 長(zhǎng)三角禁限塑新規(guī)實(shí)施尚存3個(gè)堵點(diǎn) 仍需多方合力推進(jìn)
- 中國(guó)鐵建高溢價(jià)溫州奪地 去年毛利率低于行業(yè)約10個(gè)百分點(diǎn)
- 推行郵件快件包裝“綠色革命” 從根源上解決問題
最近更新
- 與Midjourney開戰(zhàn)!Stable Diffusion XL 0.9重磅發(fā)布,35...
- 【一級(jí)建造師】海南省2023年度一級(jí)建造師資格考試報(bào)名資格核...
- 【一級(jí)建造師】安徽考區(qū)2023年度一級(jí)建造師資格考試答題方式_...
- 國(guó)際移民組織官員:意大利海域發(fā)生移民船沉沒事故 或有40人...
- 美國(guó)將要求大貨車大客車配備自動(dòng)剎車系統(tǒng)
- 這份心理調(diào)適指南,送給高考后的你們
- 杜康:黃金1917空單進(jìn)場(chǎng),歐盤繼續(xù)看跌!
- 【天天新視野】BNANA幣全面介紹
- 磁粉商品報(bào)價(jià)動(dòng)態(tài)(2023-06-23)
- 【鄉(xiāng)村振興新農(nóng)人】尤兵:優(yōu)化種養(yǎng)殖結(jié)構(gòu) 念活“生態(tài)循環(huán)經(jīng)...
- 西餐主食一般有哪幾種
- 陰離子交換樹脂商品報(bào)價(jià)動(dòng)態(tài)(2023-06-23)_全球快訊
- 法拉第未來(lái)賈躍亭發(fā)文承諾全力解決融資瓶頸問題,F(xiàn)F 91 2.0...
- 粒堿商品報(bào)價(jià)動(dòng)態(tài)(2023-06-23)
- 【全球獨(dú)家】3999元辦公本市場(chǎng)戰(zhàn)況膠灼:惠普星14 Pro跟進(jìn),...
- 北京觀象臺(tái)連續(xù)兩天氣溫超40℃,專家解析為何北京這么熱?
- 全球通訊!殊觀(關(guān)于殊觀介紹)
- 狂虎帝技能(狂虎帝覺醒)
- 周鴻祎談高考志愿:優(yōu)先看專業(yè) 比好大學(xué)更重要 今日最新
- 世界今熱點(diǎn):加拿大出臺(tái)《在線新聞法》 強(qiáng)制數(shù)字平臺(tái)付費(fèi)使...
- 暴雨藍(lán)色預(yù)警!湘南地區(qū)注意防范
- 奔馳發(fā)布了一臺(tái)諾基亞
- 高考和中考結(jié)束了,孩子抑郁癥也好了?是不是可以停藥了?家...
- 天天信息:79個(gè)觀眾,首日票房?jī)H3982元,端午檔最慘新片誕生了
- 西藏養(yǎng)老金調(diào)整最新消息公布了嗎(2022~2023年西藏養(yǎng)老金調(diào)整...
- 速讀:齊魯山水文脈深 花式露營(yíng)玩法新
- 浙江湖州:粽葉飄香迎端午 環(huán)球觀速訊
- 巨蟹勿拐彎抹角 射手要注意小人 環(huán)球快資訊
- 環(huán)球熱頭條丨遼寧營(yíng)口一鋼鐵廠發(fā)生燙傷事故,造成4人死亡5人受傷
- 2023年端午檔票房突破5億
今日要聞
- 天天信息:79個(gè)觀眾,首日票房?jī)H3982元,端午檔最慘新片誕生了
- 與Midjourney開戰(zhàn)!Stable Diffusion XL 0.9重磅發(fā)布,35億+66億雙模型,AI圖像生成飛躍式進(jìn)步 全球播報(bào)
- 狂虎帝技能(狂虎帝覺醒)
- 西藏養(yǎng)老金調(diào)整最新消息公布了嗎(2022~2023年西藏養(yǎng)老金調(diào)整方案細(xì)則全文)
- U17亞洲杯小組賽今晚收官 中國(guó)隊(duì)背水一戰(zhàn) 全球微頭條
- 618結(jié)束后下一個(gè)活動(dòng)是什么_世界消息
- 焦點(diǎn)快報(bào)!介紹幾本好看的都市言情小說(shuō)吧_推薦3部都市言情
- 存款異地騰挪賺息差 當(dāng)前速讀
- 環(huán)球快訊:畢業(yè)典禮上火出圈的他,還有一個(gè)身份
- 全球最資訊丨三句半服裝造型_三句半服裝及全套道具