在我們當前的人工智能時代,計算機可以通過擴散模型生成自己的“藝術”,迭代地向嘈雜的初始狀態(tài)添加結構,直到出現(xiàn)清晰的圖像或視頻。
擴散模型突然在每個人的餐桌上占據(jù)了一席之地:輸入幾個詞,在現(xiàn)實與幻想的交匯處體驗瞬間的、令人多巴胺飆升的夢境。在幕后,它涉及一個復雜、耗時的過程,需要算法進行多次迭代才能完善圖像。
麻省理工學院計算機科學和人工智能實驗室(CSAIL)的研究人員推出了一種新框架,將傳統(tǒng)擴散模型的多步驟過程簡化為單個步驟,解決了以前的局限性。這是通過一種師生模型來完成的:教授一個新的計算機模型來模仿生成圖像的更復雜的原始模型的行為。
該方法稱為分布匹配蒸餾 (DMD),可以保留生成圖像的質量并允許更快的生成速度。
麻省理工學院博士 Tianwei Yin 表示:“我們的工作是一種新穎的方法,可以將穩(wěn)定擴散和 DALLE-3 等現(xiàn)有擴散模型加速 30 倍。”電氣工程和計算機科學專業(yè)的學生、CSAIL 附屬機構和 DMD 框架的首席研究員。
“這一進步不僅顯著減少了計算時間,而且保留了(如果不是超越的話)生成的視覺內容的質量。理論上,該方法將生成對抗網(wǎng)絡(GAN)的原理與擴散模型的原理結合起來,實現(xiàn)了視覺內容的生成“一步——與當前擴散模型所需的數(shù)百步迭代細化形成鮮明對比。它可能是一種在速度和質量方面都表現(xiàn)出色的新生成建模方法。”
這種單步擴散模型可以增強設計工具,實現(xiàn)更快的內容創(chuàng)建,并有可能支持藥物發(fā)現(xiàn)和 3D 建模的進步,其中及時性和有效性是關鍵。
分銷夢想
DMD 巧妙地具有兩個組件。首先,它使用回歸損失,錨定映射以確保圖像空間的粗略組織,從而使訓練更加穩(wěn)定。
接下來,它使用分布匹配損失,確保使用學生模型生成給定圖像的概率與其真實世界的出現(xiàn)頻率相對應。為此,它利用兩個擴散模型作為指導,幫助系統(tǒng)了解真實圖像和生成圖像之間的差異,并使訓練快速的一步生成器成為可能。
標簽:
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!