回應OpenAI 的挑戰,Midjourney 將在今年發表V6 版本升級

圖片來源:由無界AI 生成

距離Midjourney v5 發布已經過了半年時間,下一個重大版本v6 什麼時候發布?答案是:今年晚些時候。

Midjourney 執行長David Holz 在昨日的活動中表示,Midjourney v5 到v6 的飛躍將大於v4 到v5 的飛躍。不過,Holz 沒有給出確切的發布日期,但表示很快就會發布,總之肯定是今年。

對於Midjourney v6 會帶來哪些新的東西,Holz 承諾會帶來更好的文字理解,即圖像生成將更接近提示的描述,並更好地記錄提示措辭中的細節,也可能會帶來文字渲染功能。

Holz說這些「並不難」。但他也表示,他還沒有看到很好的文本渲染,並且對於該功能是否會有以及達到何種效果程度仍持開放態度。

OpenAI 向Midjourney 發起挑戰,Midjourney 要用V6 迎戰

OpenAI 上週發布了新版本的圖像生成大模型DALL-E 3。 DALL-E 是最早的一批生成式AI 大模型,比Midjourney 更早。 DALL-E 3 版本在各方面都進行了大幅提升。許多人甚至認為DALL-E 3 將對Midjourney 構成直接威脅,在某些方面甚至已經超越了Midjourney,尤其是DALL-E 3 與ChatGPT 結合之後對提示詞的理解,對細節的理解,正在超越Midjourney。

當被問及OpenAI 的DALL-E 3 的發佈時,Holz 「非常樂觀」地認為Midjourney 將繼續提供最高的影像品質。 DALL-E 3 和Midjourney v5 的第一次比較表明,DALL-E 3 在圖像品質方面並沒有那麼領先,但它確實更好地遵循提示並可以渲染文字。

Midjourney v6 會帶來哪些新東西?

3D 和視頻

Midjourney 的路線圖上還包括創建3D 影像和影片的功能。尤其是對於3D 圖像,Holz “非常樂觀”,認為事情很快就會出現轉折點。

當他審視當前的視頻遊戲時,他說他對圖像質量的糟糕程度以及生成式AI 對質量的貢獻之大感到驚訝。 Holz 過去曾表示,他預計未來電玩遊戲將是生成的,而不是渲染的。 3D 影像功能對於VR、AR 遊戲創作者將會是一大福音。

Midjourney 今年不打算發布任何有關3D 生成的具體資訊或演示。 Midjourney 團隊正在開發的影片產生也是如此,但Holz 表示,影片產生可能比3D 晚,還沒有做好準備。

更高的分辨率

Midjourney 目前最大的缺點之一是產生的影像解析度相當低。目前預設影像尺寸為1,024 x 1,024 像素。其他寬高比也可用,但它們不會提高72ppi 的解析度。例如,16:9 影像的解析度只能達到1,456 x 816 像素。

這種解析度通常適合網路發布,但不足以進行任何大尺寸的列印。因此,更高解析度支援是一個急需解決的用戶需求。

其他方面的更新

新的Niji 風格

Midjourney 團隊同時也正在開發新的Niji 風格。這款二次元模型在上線之後受到了二次元愛好者的一致好評,新的Niji 模型預計也將帶來大量升級改進。

新的網站

Midjourney 的web 版本仍在開發中。新web 版本將分兩階段推出:

第一階段:能夠查看、搜尋自己的影像等

第二階段:將具有圖像創建和社交功能

但對於上線時間,Holz 並沒有提供具體的時間表。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)