重磅更新丨Midjourney 推出「風格調整器」,一致畫風不再是難事

撰文:Carl Franzen

來源:VentureBeat

圖片來源:由無界 AI生成

作為最火的 AI 藝術和文本到圖像生成器之一,Midjourney 可以根據使用者用純正英語輸入的提示生成高品質的作品,這些作品已經出現在了電視和影院中。

Midjourney 由前 Magic Leap 程式師大衛 - 霍爾茨(David Holz)構思,於 2022 年夏天推出,在獨立消息應用 Discord 的伺服器上吸引了超過 1600 萬使用者,並由一個小規模的程式師團隊不斷更新,推出了包括平移、擴展和以動漫為重點的移動應用在內的新功能。

不過,對於希望用同一風格講述具有凝聚力的故事的企業、品牌和創作者來說,2023 年 11 月 1 日晚推出的最新更新(名為 style tuner“風格調整器”)可以說是迄今為止最重要的更新。 這是因為,該功能允許使用者生成自己獨特的視覺風格,並將其應用於應用程式中生成的任何圖像,甚至可能是所有圖像。

在該功能之前,用戶必須重複文本描述,才能在多張圖片上生成一致的風格,而且即使這樣也無法保證結果,因為 Midjourney 和大多數人工智慧藝術生成器一樣,可以提供功能無限的各種圖片風格和類型。

現在,使用者不再依賴於自己的語言,而是可以在各種風格中進行選擇,並獲得一個代碼,將其應用到今後的所有作品中,使它們保持在同一美學風格中。 Midjourney 使用者還可以選擇將代碼複製並粘貼到其他地方,以便保存並在今後使用時參考,此外,使用者甚至可以與組織中的其他 Midjourney 使用者共用代碼,讓他們以相同的風格生成圖片。 這對於企業、品牌和任何尋求以統一風格開展集體創作專案的人來說都是巨大的挑戰。

如何使用 Midjourney 風格調整器

進入 Midjourney Discord 伺服器,使用者只需輸入“/tune”,然後按提示操作即可調試風格。

例如,我想在冬季更新我的產品或服務網站的背景圖像,加入更多雪景和舒適的空間。 那麼,我可以在“/tune”后輸入一個提示想法 --“一個機器人穿著舒適的毛衣,坐在壁爐前用杯子喝著熱巧克力”。

隨後,Midjourney 的 Discord 機器人會自動回復一大段資訊,詳細解釋風格調整過程,並詢問使用者是否要繼續。 注意,這個過程是需要付費的(Midjourney 訂閱計劃起價為每月 10 美元,按月支付,或預付每年 96 美元),並使用每個計劃附帶的一些快速 GPU 點數(根據計劃層級的不同而不同,越貴的計劃授予的快速 GPU 點數越多)。 與“relaxed”(休閒)模式相比,這些點數用於更快速地圖像生成。

選擇風格方向和模式及其含義

該資訊包括兩個下拉功能表,允許使用者選擇不同的選項:「風格方向」的數量(16、32、64 或 128)和「模式」(預設或raw)。

其中,「風格方向」設置表示 Midjourney 將根據使用者的提示生成多少張不同的圖片,每張圖片都顯示出截然不同的風格。 然後,使用者就有機會從這些圖片中選擇自己的風格,或將生成的圖片組合起來,在其中幾張圖片的基礎上創建新的元風格。

重要的是,不同風格方向選項生成的圖片數量不同,各自耗費的 GPU 點數也不同。 例如,16 種風格方向會耗費 0.15 個 GPU 點數,而 128 種風格方向則會耗費 1.2 個 GPU 點數。 因此,用戶應該仔細斟酌自己想要生成多少種不同的風格,以及是否要花費所有這些點數。

同時,「模式」設置是二進位的,用戶可以選擇預設模式或raw模式,這關係到照片的真實度和顆粒感。 Raw 圖像看起來更像膠片或數碼單反相機,因此可能更逼真,但也會包含一些人工痕跡,而預設模式和經過調整的平滑模式則不會。

在本文的演示中,我們選擇了 16 種風格方向和預設模式。 需要說明單是,在我們的測試中,以及一些使用者在網上報告的測試中,Midjourney 錯誤地給使用者提供了比他們所要求的多一級的風格方向,因此在我們的案例中,雖然我們要求的是 16 種,卻得到了 32 種風格。

選擇模式和風格方向后,Midjourney 機器人會詢問你是否確定要繼續,並再次顯示你正在使用的點數,如果你按下綠色按鈕,就可以繼續。 整個過程可能需要 2 分鐘。

如何找到可供選擇的不同風格

在 Midjourney 完成對風格調整器選項的處理後,機器人會回復如下圖所示的一條資訊「風格調整器已準備就緒! 您的自訂風格調整器已完成生成。 您現在可以在這裡查看、共用和生成風格:「然後是指向 Midjourney 調整器的網站(域名為 tuner.midjourney.com)的 URL。

生成的 URL 結尾應包含一串隨機的字母和數位。 為了安全起見,我們在下面的截圖中刪除了我們的網址。

點擊 URL 即可在瀏覽器中進入 Midjourney 網站。

隨後,使用者將看到來自 Midjourney 的定製但預設的資訊,顯示使用者的提示語言,並解釋如何完成調整過程。 也就是說,Midjourney 要求使用者在兩個帶標籤按鈕的不同選項中進行選擇:“一次比較兩種風格”或“從一個大網格中挑選你的最愛”。

在第一種情況下,“一次比較兩種風格”時,Midjourney 會顯示您之前在 Discord 的風格方向選項中選擇的任何數量圖像的網格,每行 2 種,每種風格 4 張圖片。

然後,使用者可以從每一行中選擇一個 4×4 網格,行數不限,Midjourney 將根據這些網格的組合來製作風格。 你可以通過網格周圍出現的白色輪廓來判斷網格是否被選中。

如果我從第一行中選擇了右邊的圖片,又從最下面一行中選擇了左邊的圖片,那麼 Midjourney 就會把這兩種圖片風格應用到一個組合中,使用者就可以把這個組合風格應用到今後的所有圖片上。 正如 Midjourney 在選擇頁面底部所指出的,從每一行中選擇更多的選項會產生一種更“細緻入微、排列整齊”的風格,而只選擇幾個選項則會產生一種“大膽的風格”。

第二個選項是“從一個大網格中挑選你的最愛”,使用者可以從根據之前設置的風格方向數量生成的所有圖片的整個網格中只選擇一張圖片。 在我們這篇文章中,總共有 32 張圖片排列在一個 8×4 的網格中。 與「比較兩種風格」選項相比,該選項更精確,但也因此造成了更多限制。

在本文中,我們將選擇“一次比較兩種風格”,總共選擇 5 個網格,然後讓演算法來決定合併後的風格。

將新調整的風格應用到新圖片和提示中

無論使用者選擇了多少行圖片作為風格的基礎,Midjourney 都會自動應用該風格,並將其轉化為數位和字母的簡碼,使用者可以手動複製並粘貼到今後的所有提示中。 該代碼會出現在使用者唯一的風格調整器頁面底部的多個地方,既包括標有“您的代碼是:”的部分,也包括代碼後面的部分,還包括根據使用者提供的原始代碼製作的提示示例,該示例位於最底部的一個持久疊加 chyron 元素中。

然後,使用者可以複製這些代碼並將其保存在某個地方,也可以複製整個原始提示,並在底部 chyron 中添加代碼。 使用者也可以按底部的「刷新」小圖示(圓形箭頭)重做整個風格。

然後,使用者需要返回 Midjourney Discord 伺服器,並在提示後粘貼代碼,如下所示:“想像/一個機器人穿著舒適的毛衣,坐在壁爐前用杯子喝著熱巧克力 -- 風格 [此處插入風格代碼]”。

下面是我們使用原始提示和新生成的風格生成的 4×4 圖像網格:

我們最喜歡第四個機器人,因此我們將選擇它,點擊「U4」即可!

現在,我們可以通過複製粘貼/手動添加“-style”語言到新提示符的末尾,將相同的風格應用到新的提示中就像這樣:“機器人家族打開禮物 - 風格 [此處插入風格代碼]”。 以下是一些結果:

還不錯吧! 請注意,這是在來回生成幾次之後的結果。 此外,風格代碼還可以與提示中的其他參數一起使用,包括寬高比/尺寸。 下面是一個 16:9 版本,使用的是相同的提示語,但寫法如下:“一個機器人家庭打開禮物 -ar 16:9 -style [此處插入風格代碼]”。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)