123,123,123

在我們當(dāng)前的人工智能時(shí)代，計(jì)算機(jī)可以通過擴(kuò)散模型生成自己的“藝術(shù)”，迭代地向嘈雜的初始狀態(tài)添加結(jié)構(gòu)，直到出現(xiàn)清晰的圖像或視頻。

擴(kuò)散模型突然在每個(gè)人的餐桌上占據(jù)了一席之地：輸入幾個(gè)詞，在現(xiàn)實(shí)與幻想的交匯處體驗(yàn)瞬間的、令人多巴胺飆升的夢境。在幕后，它涉及一個(gè)復(fù)雜、耗時(shí)的過程，需要算法進(jìn)行多次迭代才能完善圖像。

麻省理工學(xué)院計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的研究人員推出了一種新框架，將傳統(tǒng)擴(kuò)散模型的多步驟過程簡化為單個(gè)步驟，解決了以前的局限性。這是通過一種師生模型來完成的：教授一個(gè)新的計(jì)算機(jī)模型來模仿生成圖像的更復(fù)雜的原始模型的行為。

該方法稱為分布匹配蒸餾 (DMD)，可以保留生成圖像的質(zhì)量并允許更快的生成速度。

麻省理工學(xué)院博士 Tianwei Yin 表示：“我們的工作是一種新穎的方法，可以將穩(wěn)定擴(kuò)散和 DALLE-3 等現(xiàn)有擴(kuò)散模型加速 30 倍。”電氣工程和計(jì)算機(jī)科學(xué)專業(yè)的學(xué)生、CSAIL 附屬機(jī)構(gòu)和 DMD 框架的首席研究員。

“這一進(jìn)步不僅顯著減少了計(jì)算時(shí)間，而且保留了(如果不是超越的話)生成的視覺內(nèi)容的質(zhì)量。理論上，該方法將生成對抗網(wǎng)絡(luò)(GAN)的原理與擴(kuò)散模型的原理結(jié)合起來，實(shí)現(xiàn)了視覺內(nèi)容的生成“一步——與當(dāng)前擴(kuò)散模型所需的數(shù)百步迭代細(xì)化形成鮮明對比。它可能是一種在速度和質(zhì)量方面都表現(xiàn)出色的新生成建模方法。”

這種單步擴(kuò)散模型可以增強(qiáng)設(shè)計(jì)工具，實(shí)現(xiàn)更快的內(nèi)容創(chuàng)建，并有可能支持藥物發(fā)現(xiàn)和 3D 建模的進(jìn)步，其中及時(shí)性和有效性是關(guān)鍵。

分銷夢想

DMD 巧妙地具有兩個(gè)組件。首先，它使用回歸損失，錨定映射以確保圖像空間的粗略組織，從而使訓(xùn)練更加穩(wěn)定。

接下來，它使用分布匹配損失，確保使用學(xué)生模型生成給定圖像的概率與其真實(shí)世界的出現(xiàn)頻率相對應(yīng)。為此，它利用兩個(gè)擴(kuò)散模型作為指導(dǎo)，幫助系統(tǒng)了解真實(shí)圖像和生成圖像之間的差異，并使訓(xùn)練快速的一步生成器成為可能。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場無關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請聯(lián)系刪除！

AI 一步生成高質(zhì)量圖像的速度提高了 30 倍

猜你喜歡

最新文章