受控擴(kuò)散模型可以改變圖像中物體的材質(zhì)屬性 研究人員開發(fā)出可持續(xù)策略來操縱界面?zhèn)鳠?實(shí)現(xiàn)環(huán)保冷卻應(yīng)用 新型碳納米管紗線可利用廢熱發(fā)電 小鯽魚刺卡在喉嚨怎么辦(魚刺卡在喉嚨怎么辦) 心率快吃什么藥緩解比索洛爾片(心率快吃什么藥緩解) 臉上脫干皮是怎么回事(臉上脫皮干燥怎么回事) 結(jié)石疼有什么辦法(結(jié)石疼痛怎么止痛最快) 大便出血是怎么了女生(大便出血是怎么了) 人流后多久會來月經(jīng)?(人流后多久會來月經(jīng)) 幽門螺桿菌感染的癥狀和表現(xiàn)有哪些?(幽門螺桿菌感染的癥狀) 過敏性鼻炎會自愈嗎 好大夫(過敏性鼻炎會自愈嗎) 四個月寶寶可以吃什么輔食一天喂幾次(四個月寶寶可以吃什么輔食) 伲福達(dá)硝苯地平緩釋片2說明書(伲福達(dá)硝苯地平緩釋片說明書) 精子要多久才能游到卵子身邊(精子要多久才能和卵子結(jié)合) 克林霉素對尿道感染有效果嗎(注射用克林霉素磷酸酯的作用及功效) 月經(jīng)第5天同房有什么影響(月經(jīng)第5天同房有影響嗎) 痔瘡到什么程度需要動手術(shù)(痔瘡到什么程度要手術(shù)) 胃息肉半夜胃痛怎么辦(半夜胃痛怎么辦) 研究人員開發(fā)出可重復(fù)使用的海綿 用于吸收海洋漏油 研究表明細(xì)胞因子如何在接種疫苗后產(chǎn)生持久的體液免疫 工程化的 CAR-T 細(xì)胞可抑制小鼠一年內(nèi)的過敏性哮喘癥狀和體征 新型汗液監(jiān)測裝置無需體力活動 數(shù)學(xué)模型利用癌細(xì)胞可塑性來指導(dǎo)適應(yīng)性治療 沈陽市全區(qū)域解除限購限售 官方回應(yīng):未發(fā)現(xiàn)異常! 手掌上長透明小疙瘩怎么回事兒(手掌上長透明小疙瘩怎么回事) 血肌酐偏高是什么原因造成的女性(血肌酐偏高是什么原因造成的) 女人來月經(jīng)能不能泡腳(月經(jīng)能不能泡腳) 宮頸癌篩查多久出結(jié)果會打電話通知嗎(宮頸癌篩查多久出結(jié)果) 咽喉好像有東西堵住是什么情況(咽喉感覺有東西堵著怎么回事) 月經(jīng)來了半個月都不干凈是什么原因(月經(jīng)來了半個月還不干凈怎么回事) 早期乳腺癌術(shù)后能活幾年?。ㄔ缙谌橄侔┬g(shù)后能活幾年) 高血壓的藥什么時間吃最佳(高血壓藥什么時間吃最佳) 阿奇霉素腸溶片吃幾天(阿奇霉素腸溶片怎么吃) 皮膚曬紅了怎么辦?(皮膚曬紅了怎么辦) 骨刺是缺鈣還是鈣多了(膝蓋骨刺的最佳治療方法) 兒童止咳化痰的藥都有哪些(兒童止咳化痰的藥有哪些) 每天用鹽水泡腳有什么好處(鹽水泡腳有什么好處) 撲熱息痛片的作用和功效(撲熱息痛是什么藥) 生姜擦頭皮能生發(fā)嗎看完就明白了(生姜擦頭皮能生發(fā)嗎) 天津:首套住房商貸最低首付款比例調(diào)整為不低于15% 國際貨幣基金組織上調(diào)今年中國經(jīng)濟(jì)增長預(yù)期至5% 特朗普“封口費(fèi)”案進(jìn)行結(jié)案陳詞 陪審團(tuán)將開始審議 中糧集團(tuán)有限公司原黨組成員、副總經(jīng)理周政被決定逮捕 太突然!傳奇巨星離世,姚明發(fā)文悼念 增豆,避開這幾個誤區(qū)|吃出健康來 時速600公里的高速磁浮,有新進(jìn)展! 突然不會寫字?原因竟是......醫(yī)生提醒 5月29日央行開展2500億元7天期逆回購操作 罌粟的作用是什么意思(罌粟的作用是什么)
您的位置:首頁 >要聞 >

受控擴(kuò)散模型可以改變圖像中物體的材質(zhì)屬性

導(dǎo)讀 麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室 (CSAIL) 和谷歌研究中心的研究人員可能剛剛進(jìn)行了數(shù)字魔法——以擴(kuò)散模型的形式,可以改變圖像...

麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室 (CSAIL) 和谷歌研究中心的研究人員可能剛剛進(jìn)行了數(shù)字魔法——以擴(kuò)散模型的形式,可以改變圖像中物體的材質(zhì)屬性。

該系統(tǒng)名為 Alchemist,允許用戶改變真實(shí)圖片和 AI 生成圖片的四個屬性:粗糙度、金屬度、反照率(物體的初始基色)和透明度。作為圖像到圖像的擴(kuò)散模型,可以輸入任何照片,然后在 -1 到 1 的連續(xù)范圍內(nèi)調(diào)整每個屬性以創(chuàng)建新的視覺效果。這些照片編輯功能可能會擴(kuò)展到改進(jìn)視頻游戲中的模型、擴(kuò)展 AI 在視覺效果方面的能力以及豐富機(jī)器人訓(xùn)練數(shù)據(jù)。

Alchemist 背后的魔力始于一個去噪擴(kuò)散模型:在實(shí)踐中,研究人員使用了 Stable Diffusion 1.5,這是一個文本到圖像的模型,因其逼真的效果和編輯功能而備受贊譽(yù)。之前的研究基于這個流行的模型,使用戶能夠進(jìn)行更高級別的更改,例如交換對象或改變圖像的深度。相比之下,CSAIL 和 Google Research 的方法應(yīng)用此模型來關(guān)注低級屬性,通過獨(dú)特的基于滑塊的界面修改物體材料屬性的更精細(xì)的細(xì)節(jié),其性能優(yōu)于其他同類產(chǎn)品。

雖然之前的擴(kuò)散系統(tǒng)可以為圖像變出一只兔子,但 Alchemist 可以將同一只動物變成半透明的。該系統(tǒng)還可以使小黃鴨呈現(xiàn)出金屬質(zhì)感,去除金魚的金色,并使舊鞋發(fā)亮。Photoshop 等程序具有類似的功能,但此模型可以更直接地更改材料屬性。例如,在廣泛使用的應(yīng)用程序中,修改照片的金屬外觀需要幾個步驟。

“當(dāng)你看到自己制作的圖像時,結(jié)果往往與你想象的并不完全一致,”麻省理工學(xué)院電氣工程和計算機(jī)科學(xué)博士生、CSAIL 附屬機(jī)構(gòu)、一篇描述這項(xiàng)工作的新論文的主要作者 Prafull Sharma說道。“你想在編輯圖片時控制它,但圖像編輯器中現(xiàn)有的控件無法更改材質(zhì)。借助 Alchemist,我們利用文本到圖像模型輸出的照片級真實(shí)感,并梳理出一個滑塊控件,讓我們可以在提供初始圖片后修改特定屬性。”

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章