Khuếch tán ổn định cốc siêu lớn ở đây miễn phí! "Mô hình mở đồ thị Vincent mạnh nhất", các từ nhắc cũng đơn giản hơn

Nguồn: Qubit

Phiên bản mạnh nhất của Khuếch tán Ổn định đã có tại đây!

Hiện tại, SDXL 1.0 đã chính thức được phát hành và bạn có thể dùng thử trực tuyến miễn phí.

Xét về hiệu ứng, dù là bom tấn đời thực:

Gấu trúc siêu thực uống bia:

Hay truyện tranh cyberpunk, cả hai đều rất hay~

Theo Ổn định AI, SDXL 1.0 tạo ra màu sắc sống động và chính xác hơn, với các cải tiến về độ tương phản, ánh sáng và bóng tối, đồng thời có thể tạo ra hình ảnh 1 megapixel (1024×1024).

Nó cũng hỗ trợ chỉnh sửa hậu kỳ các hình ảnh được tạo trực tiếp trên trang web.

(Có mùi giống như cuộc chiến giữa Midjourney và Firefly)

Cư dân mạng không thể không dùng thử ~

So với khuếch tán ổn định cơ bản, SDXL 1.0 tạo ra kết quả chính xác và thực tế hơn.

Và quan chức này nói rằng các từ nhắc có thể đơn giản hơn trước.

Điều này là do các tham số mô hình cơ bản của SDXL 1.0 đã đạt tới 3,5 tỷ và khả năng hiểu rõ hơn.

So với phiên bản cơ bản của Khuếch tán ổn định, số lượng tham số chỉ khoảng 1 tỷ.

Do đó, SDXL 1.0 cũng đã trở thành một trong những mô hình hình ảnh mở lớn nhất hiện tại. Quan chức này thậm chí còn trực tiếp nói rằng đây là mô hình hình ảnh mở tốt nhất trên thế giới.

Không có nhiều điều để nói, chúng ta hãy bắt đầu ~

In xạ hương trên sứ xanh và trắng

SDXL 1.0 hoạt động rất thuận tiện, bạn có thể nhập trực tiếp và bạn cũng có thể kiểm tra các thông số kiểu dáng và kích thước từ phía dưới.

Mặc định là tạo 4 hình 1 lúc, nếu chưa ưng ý có thể bấm vào "dấu cộng" bên dưới để nó vẽ tiếp.

Theo lời giới thiệu chính thức, giờ đây SDXL 1.0 có thể tạo ra những kiệt tác, không cần phải thêm từ "kiệt tác" nữa.

Hãy để nó tạo ra một hình ảnh theo phong cách Nhật Bản, phong cách vẽ rất phù hợp và việc xử lý ánh sáng và bóng tối tự nhiên hơn.

Cặp đôi chụp màn hình anime độ phân giải thấp những năm 1990 đi dạo trên phố vào ban đêm

Hay một bức ảnh phong cảnh? Nó cũng có thể sai.

Thậm chí, hãy để Musk đứng trong một khoảng sân ở Trung Quốc, nhìn lên bầu trời...

Elon Musk trong cung điện cổ Trung Hoa

Hay bạn đã mua Apple?

Tại "WWDC", anh ấy đã giơ chiếc iPhone mới lên cho mọi người xem, xung quanh là các phóng viên và người hâm mộ (doge).

Elon Musk ra mắt iPhone mới tại WWDC

Thêm vào đó là tin hành mộc của những tuổi ngựa này, tác dụng của các tác phẩm phong sơn cũng rất tốt.

Cái bên trái là phong cách mực của Qi Baishi, trong khi cái bên phải là một bức tranh biếm họa.

左:Elon Musk phát biểu, vẽ mực, phong cách Qi Baishi Phải: Truyện tranh Elon Musk

Ngoài bức tranh, bạn cũng có thể đưa những con ngựa cũ vào Yuan Qinghua của chúng tôi.

Xạ hương Elon trong hình Sứ xanh trắng thời nhà Nguyên

"Những câu chuyện về con ngựa già" được hiển thị ở trên tương đối đơn giản để sử dụng.

Nhưng về hiệu quả, đũng quần không bị kéo căng vì những lời nhắc đơn giản, điều này cũng được xác nhận bởi tuyên bố chính thức.

Nhưng chúng tôi vẫn muốn xem, nó sẽ như thế nào nếu chúng tôi sử dụng một cái phức tạp và tinh tế hơn?

Chúng tôi đã tìm thấy một bức ảnh hiếm hoi về một con ngựa già đang làm công nhân sửa chữa ô tô ở Liên Xô do Midjourney tạo ra và gửi lại cho MJ để biến nó thành một con mới.

MJ đã tạo thông tin sau, mà chúng tôi đã sử dụng để kiểm tra SDXL:

Elon Musk(这里MJ生成的是a man) đứng trong phòng làm việc, theo phong cách thẩm mỹ máy móc công nghiệp, deutscher werkbund, hình ảnh được dàn dựng đồng nhất, màu chàm nhạt và đồng đậm của Liên Xô, chụp ảnh màu kiểu Mỹ mới, các đặc điểm khuôn mặt chi tiết

Phong cách đúng như chúng tôi mong đợi và các chi tiết không tệ.

Có một bức tranh phức tạp khác là phần kết, cũng do MJ tạo ra dựa trên các tác phẩm trước đó và sau đó được đưa vào SDXL.

elon xạ hương ăn thức ăn bằng đũa, theo phong cách của peter coulson, xử lý chéo/xử lý, chụp ảnh lỗ kim, cỏ ba lá, james tissot, transavanguardia, đo sáng điểm

Bên trái là tác phẩm của SDXL, còn bên phải là bản gốc của MJ, các bạn so sánh nhé.

Các từ gợi ý cũng hỗ trợ tiếng Trung Quốc, nhưng có vẻ như kết quả sẽ nghiêng về phong cách dân tộc và độ chính xác cũng có thể bị ảnh hưởng.

Ví dụ, sau khi nhập "một con hổ đang ở bên bờ biển", một cô gái phong cách dân tộc vô tình được đưa ra.

Mọi người đã thấy hiệu quả, vậy SDXL tạo ảnh nhanh như thế nào?

Đối với người dùng miễn phí, thời gian chủ yếu dành cho việc xếp hàng, nhưng sẽ không phải chờ quá lâu.

Trong 5,5 giây, hàng đợi đã giảm từ 160 xuống 99.

Ngoài việc tạo hình ảnh, SDXL còn cung cấp nhiều chức năng chỉnh sửa hậu kỳ.

Cụ thể, nó bao gồm xóa nền, xử lý chi tiết, phóng to khung hình, v.v.

Các chức năng này đã có sẵn trên nền tảng Clipdrop nơi đặt SDXL và SDXL có thể chuyển ảnh đã tạo sang mô-đun tương ứng chỉ bằng một cú nhấp chuột.

Ở đây chúng tôi chọn chức năng xóa nền để thể hiện, có thể thấy các chi tiết viền hầu như không có khuyết điểm.

Hiện tại hạn mức sử dụng miễn phí của SDXL vẫn còn tương đối cao, sau khi đăng nhập mỗi tài khoản có thể tạo 400 thẻ mỗi ngày (cần phải xếp hàng).

Khoản thanh toán hàng tháng là 9 đô la mỗi tháng và khoản thanh toán hàng năm tương đương với 7 đô la (khoảng 50 RMB) mỗi tháng, bao gồm 1.500 hạn ngạch SDXL mỗi ngày và không cần phải xếp hàng.

Tuy nhiên, giá ở các khu vực khác nhau dường như khác nhau, chẳng hạn như khoản thanh toán hàng năm ở Argentina là 742 peso (khoảng 19,4 nhân dân tệ hoặc 2,7 đô la Mỹ) mỗi tháng.

Ngoài ra, vì phiên bản trả phí thực sự là đăng ký Pro cho nền tảng Clipdrop nên các tính năng khác của nền tảng cũng được bao gồm.

Ngoài tài khoản Pro, còn có các phiên bản API dành cho nhà phát triển (có quyền truy cập vào Ổn định AI, Amazon, v.v.).

** "Cúp tối đa" trong Mô hình hình ảnh mở**

Trong blog mới nhất, Stability AI giới thiệu thêm chi tiết kỹ thuật của SDXL 1.0.

Đầu tiên, mô hình tạo ra bước đột phá mới về cả quy mô và kiến trúc.

Nó sử dụng một cách sáng tạo mô hình cơ sở + mô hình tinh chỉnh.

Kích thước tham số của cả hai lần lượt là 3,5 tỷ6,6 tỷ.

Điều này cũng làm cho SDXL 1.0 trở thành một trong những mô hình đồ họa mở lớn nhất hiện nay.

Emad Mostaque, người sáng lập Stability AI, nói rằng số lượng tham số lớn hơn có thể cho phép mô hình hiểu nhiều khái niệm hơn và dạy nó những điều sâu sắc hơn.

Đồng thời, việc cải tiến RLHF cũng được thực hiện trong phiên bản SDXL 0.9.

Đây là lý do tại sao SDXL 1.0 hiện hỗ trợ các từ gợi ý ngắn và có thể phân biệt giữa Quảng trường Đỏ và Quảng trường Đỏ.

Trong quy trình tổng hợp cụ thể, ở bước đầu tiên, mô hình cơ sở tạo ra độ tiềm ẩn nhiễu, sau đó mô hình tinh chỉnh thực hiện khử nhiễu.

Mô hình cơ bản cũng có thể được sử dụng như một mô-đun độc lập.

Sự kết hợp của hai mô hình này có thể tạo ra hình ảnh chất lượng tốt hơn mà không tiêu tốn nhiều tài nguyên máy tính.

Theo lời giới thiệu chính thức, SDXL 1.0 có thể chạy trên GPU cấp độ người tiêu dùng với 8GB VRAM hoặc trên đám mây.

Ngoài ra, SDXL 1.0 cũng đã được cải tiến trong việc tinh chỉnh và có thể tạo LoRA hoặc điểm kiểm tra tùy chỉnh.

Nhóm Stability AI hiện cũng đang xây dựng một thế hệ điều khiển kết hợp, có cấu trúc và kiểu dành riêng cho nhiệm vụ mới, với T2I/ControlNet dành riêng cho SDXL.

Tuy nhiên, các chức năng này vẫn đang trong giai đoạn thử nghiệm beta và bạn có thể chú ý đến các bản cập nhật chính thức trong tương lai.

Tóm lại, sơ đồ Vincent là một quá trình lặp đi lặp lại dần dần và mục tiêu của SDXL 1.0 là làm cho quá trình này dễ dàng hơn.

Mostak cho biết bây giờ chỉ cần 5-10 bức ảnh là có thể nhanh chóng tinh chỉnh mô hình.

Cũng có thể thấy từ phản hồi của người dùng rằng SDXL 1.0 hài lòng hơn so với Khuếch tán ổn định.

Trên thực tế, từ tháng 4 năm nay, Stability AI đã phát hành phiên bản beta sớm nhất của SDXL.

Thử nghiệm nội bộ bắt đầu vào tháng 6 và phiên bản 0.9 đã được phát hành cách đây một thời gian.Vào thời điểm đó, có thông báo rằng phiên bản mở, phiên bản mới nhất 1.0, sẽ được phát hành vào tháng 7. Hiện tại, các trọng số mã có liên quan đã được phát hành trên GitHub.

Còn người phụ trách Ổn định máy học AI cho biết so với SDXL 0.9, phiên bản 1.0 giảm yêu cầu về sức mạnh tính toán.

Nếu bạn quan tâm đến giày trẻ em, hãy đi thử chúng ~

Mục nhập thử nghiệm:

GitHub:

Liên kết tham khảo: [1] [2] [3]

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)