📢 Gate廣場 #MBG任务挑战# 發帖贏大獎活動火熱開啓!
想要瓜分1,000枚MBG?現在就來參與,展示你的洞察與實操,成爲MBG推廣達人!
💰️ 本期將評選出20位優質發帖用戶,每人可輕鬆獲得50枚MBG!
如何參與:
1️⃣ 調研MBG項目
對MBG的基本面、社區治理、發展目標、代幣經濟模型等方面進行研究,分享你對項目的深度研究。
2️⃣ 參與並分享真實體驗
參與MBG相關活動(包括CandyDrop、Launchpool或現貨交易),並曬出你的參與截圖、收益圖或實用教程。可以是收益展示、簡明易懂的新手攻略、小竅門,也可以是現貨行情點位分析,內容詳實優先。
3️⃣ 鼓勵帶新互動
如果你的帖子吸引到他人參與活動,或者有好友評論“已參與/已交易”,將大幅提升你的獲獎概率!
MBG熱門活動(帖文需附下列活動連結):
Gate第287期Launchpool:MBG — 質押ETH、MBG即可免費瓜分112,500 MBG,每小時領取獎勵!參與攻略見公告:https://www.gate.com/announcements/article/46230
Gate CandyDrop第55期:CandyDrop x MBG — 通過首次交易、交易MBG、邀請好友註冊交易即可分187,500 MBG!參與攻略見公告:https://www.gate.com/announcements
真實性驚人,Google、康乃爾提出真實的影像補全技術RealFill
假期出遊,肯定少不了拍照留念。不過,大部分在景觀拍攝的照片或多或少都有些遺憾,背景裡不是多了些什麼,就是少了些什麼。
獲得一張「完美」的圖像,是CV 研究人員長期以來努力的目標之一。日前,Google Research 和康乃爾大學的研究人員合作,提出了一種「真實的影像補全」(Authentic Image Completion)技術-用於影像補全的生成模型RealFill。
RealFill 模型的優點是可以使用少量的場景參考影像進行個人化設置,而這些參考影像無須與目標影像對齊,甚至可以在視角、光線條件、相機光圈或影像風格等方面有極大的差異。一旦完成個人化設置,RealFill 就能夠以忠實於原始場景的方式,用視覺上引人入勝的內容來補全目標影像。
補畫(inpainting)和擴畫(outpainting)模型是能夠在圖像的未知區域生成高品質、合理的圖像內容的技術,但這些模型生成的內容必然是不真實的,因為這些模型在真實場景的上下文資訊方面有不足。相較之下,RealFill 能夠產生「應該」出現在那裡的內容,從而使影像補全的結果更為真實。
作者在論文中指出,他們定義了一個新的影像補全問題-「真實影像補全」(Authentic Image Completion)。不同於傳統的生成型影像修復(替代缺失區域的內容可能與原始場景不一致),真實影像補全的目標是使補全的內容盡可能忠實於原始場景,用「應該出現在那裡」的內容來補全目標影像,而不是用「可能在那裡」的內容。
作者表示,RealFill 是第一個透過在過程中添加更多的條件(即添加參考圖像)來擴展生成型圖像修復模型表達力的方法。
在一個涵蓋了一系列多樣化且具有挑戰性的場景的新的影像補全基準測試中,RealFill 的表現大大超過了現有的方法。
方法
RealFill 的目標是在盡可能保持真實性的前提下,使用少量的參考影像來補全給定目標影像的缺失部分。具體來說,給定最多5 張參考影像,和一張大致捕捉到相同場景(但佈局或外觀可能不同)的目標影像。
對於給定的場景,研究人員首先透過在參考影像和目標影像上微調一個預先訓練的inpainting 擴散模型,創建一個個人化的生成模型。這個微調過程被設計成讓微調後的模型不僅保持良好的影像先驗,還能學習輸入影像中的場景內容、光線和風格。然後,使用這個微調過的模型,透過標準的擴散採樣過程來填充目標影像中的缺失區域。
值得注意的是,為了實際的應用價值,模型特別關注更具挑戰性、無約束的情況,即目標影像和參考影像可能有非常不同的視點、環境條件、相機光圈、影像風格,甚至包括移動的對象。
實驗結果
根據左側的參考影像,RealFill 能夠對右側的目標影像進行擴展(uncrop)或修復(inpaint),產生的結果不僅視覺上吸引人,而且與參考影像保持一致,即使參考影像和目標影像在視點、光圈、光線、影像風格和物體運動等方面有較大差異。
對照實驗
研究人員比較了RealFill 模型和其他的基準方法。相較之下,RealFill 產生的結果品質高,在場景保真度和與參考影像的一致性方面,RealFill的表現較好。
Paint-by-Example 無法實現高度的場景保真,因為它依賴CLIP 嵌入,而CLIP 嵌入只能捕獲高級語義資訊。
Stable Diffusion Inpainting 雖然可以產生看似合理的結果,但由於的表達能力有限,所以最終生成結果與參考圖像並不一致。
限制
研究人員也討論了RealFill 模型的一些潛在的問題和限制,包括處理速度、對視點變化的處理能力,以及對基礎模型具有挑戰性的情況的處理能力。具體來說:
RealFill 需要對輸入影像進行基於梯度的微調過程,這使得它的運行速度相對較慢。
當參考影像和目標影像之間的視點變化非常大時,RealFill 往往無法恢復3D 場景,特別是當只有一張參考影像的時候。
由於RealFill 主要依賴從基礎的預訓練模型繼承的圖像先驗,因此它無法處理那些對基礎模型來說具有挑戰性的情況,例如stable diffusion 模型無法處理好文字。
我們要感謝Rundi Wu、Qianqian Wang、Viraj Shah、Ethan Weber、Zhengqi Li、Kyle Genova、Boyang Deng、Maya Goldenberg、Noah Snavely、Ben Poole、Ben Mildenhall、Alex Rav-Acha、Pratul Srinivasan、Dor Verbin 和Jon Barron 的寶貴討論與回饋,同時也感謝Zeya Peng、Rundi Wu、Shan Nan 對評估資料集的貢獻。我們特別感謝Jason Baldridge、Kihyuk Sohn、Kathy Meier-Hellstern 和Nicole Brichtova 對專案的回饋和支持。