そして、Stability AI 機械学習の担当者は、SDXL 0.9 と比較して、バージョン 1.0 では計算能力の需要が軽減されていると述べました。
子供靴に興味がある方はぜひ試してみてくださいね〜
トライアルエントリー:
GitHub:
参考リンク:
[1]
[2]
[3]
原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
超大型カップ安定拡散が無料で登場! 「最強のヴィンセントグラフオープンモデル」、プロンプトの文言もシンプルに
出典: 量子ビット
Stable Diffusionの最強バージョンが登場!
効果という観点から見ると、それが現実の大ヒット作であるかどうかは次のとおりです。
また、生成された画像を Web ページ上で直接後編集することもできます。
(ミッドジャーニーとファイアフライの喧嘩の匂いがする)
基本的な安定拡散と比較して、SDXL 1.0 はより正確で現実的な結果を生成します。
これは、SDXL 1.0 の基本モデル パラメータが **35 億 ** に達し、理解力が強化されたためです。
Stable Diffusion の基本バージョンと比較すると、パラメータの数はわずか約 10 億個です。
その結果、SDXL 1.0 は、現在最大のオープン イメージ モデルの 1 つになりました。関係者はこれが世界最高のオープンイメージモデルであると直接述べました。
青と白の磁器にムスクをプリント
SDXL 1.0は操作が非常に便利で、直接入力でき、下からスタイルやサイズのパラメータを確認することもできます。
和風のイメージを生成し、画風が非常に適しており、光と影の処理がより自然です。
「WWDC」では記者やファン(ドージェ)に囲まれながら、新型iPhoneを掲げて人々に見せた。
左は斉白石の水墨画、右は風刺画です。
しかし、その効果から、単純なプロンプトの言葉のために股間が伸びることはなく、それは公式声明によっても確認されています。
ミッドジャーニーが作成した、ソ連で自動車修理作業員として働く老馬の貴重な写真を見つけ、それをMJに再供給して新しい写真に仕上げた。
エンディングには別の複雑な映像があり、これも過去の作品に基づいて MJ によって生成され、SDXL に供給されます。
左がSDXLの作品、右がMJのオリジナル版で、見比べていただけます。
たとえば、「虎が海辺にいる」と入力すると、偶然国民風の女の子が表示されます。
無料ユーザーの場合、時間は主に行列に費やされますが、それほど長く待つことはありません。
5.5 秒で、キューは 160 から 99 に減りました。
具体的には、背景除去、ディテール処理、フレーム拡大などです。
ここでは背景除去機能を選択して表示していますが、エッジの細部にほとんど欠陥がないことがわかります。
月額支払いは月額 9 ドル、年間支払いは 1 日あたり 1,500 個の SDXL 割り当てを含む月額 7 ドル (約 50 RMB) に相当し、並ぶ必要はありません。
Pro アカウントに加えて、開発者が利用できる API バージョンもあります (Stability AI、Amazon などにアクセスできる)。
オープンイメージモデルの「最大カップ」
最新のブログでは、Stability AI が SDXL 1.0 の技術的な詳細を紹介しています。
まず、このモデルは規模とアーキテクチャの両方で新境地を開拓します。
ベースモデル + リファイナーモデルを革新的に使用します。
2 つのパラメータのサイズは、それぞれ 35 億 と 66 億 です。
Stability AI の創設者である Emad Mostaque 氏は、パラメーターの数が増えると、モデルがより多くの概念を理解し、より深いことを教えることができるようになると述べました。
同時に、SDXL 0.9 バージョンでは RLHF の強化も行われました。
SDXL 1.0 が短いプロンプト ワードをサポートし、赤の広場と赤の広場を区別できるようになったのはこのためです。
基本モデルは独立したモジュールとしても使用できます。
これら 2 つのモデルを組み合わせることで、より多くのコンピューティング リソースを消費することなく、より高品質の画像を生成できます。
公式の紹介によると、SDXL 1.0 は 8GB VRAM を備えたコンシューマーグレードの GPU またはクラウド上で実行できます。
さらに、SDXL 1.0 では微調整も改善されており、カスタム LoRA やチェックポイントを生成できるようになりました。
また、Stability AI チームは現在、SDXL 専用の T2I/ControlNet を使用して、タスク固有の構造化、スタイル設定、および組み合わせた新世代のコントロールを構築しています。
ただし、これらの機能はまだベータテストの段階であり、今後の正式アップデートに注目してほしい。
モスタク氏は、モデルを迅速に微調整するために必要な写真は 5 ~ 10 枚だけであると述べました。
ユーザーのフィードバックからも、SDXL 1.0 の方が Stable Diffusion よりも満足度が高いことがわかります。
6月に社内テストが始まり、少し前にバージョン0.9がリリースされましたが、その際、オープン版の最新バージョン1.0が7月にリリースされることが発表されました。現在、関連するコードウェイトは GitHub で公開されています。
そして、Stability AI 機械学習の担当者は、SDXL 0.9 と比較して、バージョン 1.0 では計算能力の需要が軽減されていると述べました。
子供靴に興味がある方はぜひ試してみてくださいね〜
トライアルエントリー:
GitHub:
参考リンク: [1] [2] [3]