Công cụ hình ảnh tổng quát chưa được phát hành không né tránh ảnh khoả thân và máu me, và nó đã thu hút sự chú ý của MidJourney.
Hình ảnh được tạo bằng AI
OpenAI đã thử nghiệm riêng phiên bản mới của mô hình hình ảnh trí tuệ nhân tạo (AI) tổng quát của mình trong vài tháng qua và các mẫu ban đầu do người dùng YouTube MattVidPro rò rỉ cho thấy mô hình này vượt trội so với các trình tạo hình ảnh trước đó.
Matt cho biết trong một bản xem trước được đăng trên YouTube: "Rất thú vị, nó thổi bay tâm trí của bất cứ thứ gì chúng tôi đã xem trước đây, thật điên rồ. Midjourney không thể cạnh tranh ở cấp độ này, tôi thậm chí không nghĩ rằng phiên bản thứ 6 của Midjourney có thể cạnh tranh ở cấp độ này mức độ."
Đừng mong đợi để thử nó bất cứ lúc nào sớm, mặc dù. Truy cập là vô cùng hạn chế.
Mẫu chưa phát hành có thể là phiên bản nâng cấp của DALL-E 2 và đang được thử nghiệm thông qua bản xem trước được mời trong ChatGPT-4. Matt cho biết chỉ có khoảng 400 người trên thế giới có quyền truy cập vào trình tạo hình ảnh OpenAI mới này.
Mặc dù các mẫu hình ảnh còn hạn chế, nhưng các kỹ năng tiên tiến của trí tuệ nhân tạo đã được thể hiện. Nó tạo ra những hình ảnh sắc nét bằng cách bắt chước ánh sáng và sự phản chiếu của những bức ảnh thực, và mô hình tái tạo các chi tiết như họa sĩ cho đến những nét vẽ có thể nhìn thấy được. Nó cũng tái tạo hoàn hảo các tên thương hiệu như "Snickers" và biểu trưng của các thương hiệu nổi tiếng như Subway trên các sản phẩm được tạo và đạt được chính tả khá tốt trong văn bản được hiển thị.
Một ví dụ về hình ảnh được tạo bởi tính năng chuyển văn bản thành hình ảnh của OpenAI. Nguồn: Matt VidPro
Mặc dù các trình tạo hình ảnh hiện tại đang gặp khó khăn trong việc tạo ra các bàn tay mạch lạc, nhưng những ví dụ này cho thấy các bàn tay có tỷ lệ thực tế và phù hợp với nền tảng thuyết phục hơn so với các hệ thống AI cạnh tranh.
OpenAI rõ ràng đã loại bỏ các bộ lọc an toàn của nó để kiểm tra toàn bộ tiềm năng của mô hình. Người dùng nói rằng nó không ngần ngại tạo ra bạo lực và ảnh khoả thân. Tuy nhiên, với lập trường của OpenAI về nội dung NSFW, rất khó có khả năng một phiên bản công khai chính thức sẽ được phát hành theo các tiêu chuẩn như vậy.
Matt nhận xét, “Đó là OpenAI, vì vậy bạn có thể cá là họ sẽ đóng cửa nó giống như họ đã làm với mọi thứ trước khi phát hành.”
Một số chuyên gia đã chỉ trích OpenAI vì đã "đơn giản hóa" các mô hình của nó để tránh gây tranh cãi. Một số nghiên cứu thậm chí còn chỉ ra rằng ChatGPT do OpenAI đào tạo có khuynh hướng chính trị mạnh mẽ trong đầu ra của nó.
Tuy nhiên, chất lượng nhất quán được hiển thị trong các mẫu là một bước tiến vượt bậc và nó nhấn mạnh những nỗ lực không ngừng của OpenAI nhằm cải thiện khả năng của AI tổng quát. Công ty có thể tiết lộ thêm về tiến độ của mình vào cuối năm nay, đặc biệt nếu lĩnh vực tạo và nhận dạng hình ảnh góp phần tạo nên sự mạnh mẽ cho sản phẩm nổi bật của họ: một GPT đa phương thức có thể hiểu văn bản, hình ảnh và bản nháp trong một dấu nhắc duy nhất— 4.
Hiện tại, công nghệ này vẫn chỉ giới hạn ở phiên bản beta kín với số lượng người dùng rất nhỏ.
Khi các mô hình tiếp tục được cải thiện, ranh giới giữa nhân tạo và thực tế trở nên mờ nhạt hơn. Mặc dù điều này khiến nhiều người phấn khích, nhưng những lo ngại về việc lạm dụng sẽ vẫn tồn tại và việc xây dựng công nghệ này một cách có trách nhiệm vẫn là một thách thức cấp bách.
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Không bị kiểm duyệt và 'Crazy': Nhìn vào bên trong Trình tạo hình ảnh bí mật của OpenAI
Công cụ hình ảnh tổng quát chưa được phát hành không né tránh ảnh khoả thân và máu me, và nó đã thu hút sự chú ý của MidJourney.
Hình ảnh được tạo bằng AI
OpenAI đã thử nghiệm riêng phiên bản mới của mô hình hình ảnh trí tuệ nhân tạo (AI) tổng quát của mình trong vài tháng qua và các mẫu ban đầu do người dùng YouTube MattVidPro rò rỉ cho thấy mô hình này vượt trội so với các trình tạo hình ảnh trước đó.
Matt cho biết trong một bản xem trước được đăng trên YouTube: "Rất thú vị, nó thổi bay tâm trí của bất cứ thứ gì chúng tôi đã xem trước đây, thật điên rồ. Midjourney không thể cạnh tranh ở cấp độ này, tôi thậm chí không nghĩ rằng phiên bản thứ 6 của Midjourney có thể cạnh tranh ở cấp độ này mức độ."
Đừng mong đợi để thử nó bất cứ lúc nào sớm, mặc dù. Truy cập là vô cùng hạn chế.
Mẫu chưa phát hành có thể là phiên bản nâng cấp của DALL-E 2 và đang được thử nghiệm thông qua bản xem trước được mời trong ChatGPT-4. Matt cho biết chỉ có khoảng 400 người trên thế giới có quyền truy cập vào trình tạo hình ảnh OpenAI mới này.
Mặc dù các mẫu hình ảnh còn hạn chế, nhưng các kỹ năng tiên tiến của trí tuệ nhân tạo đã được thể hiện. Nó tạo ra những hình ảnh sắc nét bằng cách bắt chước ánh sáng và sự phản chiếu của những bức ảnh thực, và mô hình tái tạo các chi tiết như họa sĩ cho đến những nét vẽ có thể nhìn thấy được. Nó cũng tái tạo hoàn hảo các tên thương hiệu như "Snickers" và biểu trưng của các thương hiệu nổi tiếng như Subway trên các sản phẩm được tạo và đạt được chính tả khá tốt trong văn bản được hiển thị.
Một ví dụ về hình ảnh được tạo bởi tính năng chuyển văn bản thành hình ảnh của OpenAI. Nguồn: Matt VidPro
Mặc dù các trình tạo hình ảnh hiện tại đang gặp khó khăn trong việc tạo ra các bàn tay mạch lạc, nhưng những ví dụ này cho thấy các bàn tay có tỷ lệ thực tế và phù hợp với nền tảng thuyết phục hơn so với các hệ thống AI cạnh tranh.
OpenAI rõ ràng đã loại bỏ các bộ lọc an toàn của nó để kiểm tra toàn bộ tiềm năng của mô hình. Người dùng nói rằng nó không ngần ngại tạo ra bạo lực và ảnh khoả thân. Tuy nhiên, với lập trường của OpenAI về nội dung NSFW, rất khó có khả năng một phiên bản công khai chính thức sẽ được phát hành theo các tiêu chuẩn như vậy.
Matt nhận xét, “Đó là OpenAI, vì vậy bạn có thể cá là họ sẽ đóng cửa nó giống như họ đã làm với mọi thứ trước khi phát hành.”
Một số chuyên gia đã chỉ trích OpenAI vì đã "đơn giản hóa" các mô hình của nó để tránh gây tranh cãi. Một số nghiên cứu thậm chí còn chỉ ra rằng ChatGPT do OpenAI đào tạo có khuynh hướng chính trị mạnh mẽ trong đầu ra của nó.
Tuy nhiên, chất lượng nhất quán được hiển thị trong các mẫu là một bước tiến vượt bậc và nó nhấn mạnh những nỗ lực không ngừng của OpenAI nhằm cải thiện khả năng của AI tổng quát. Công ty có thể tiết lộ thêm về tiến độ của mình vào cuối năm nay, đặc biệt nếu lĩnh vực tạo và nhận dạng hình ảnh góp phần tạo nên sự mạnh mẽ cho sản phẩm nổi bật của họ: một GPT đa phương thức có thể hiểu văn bản, hình ảnh và bản nháp trong một dấu nhắc duy nhất— 4.
Hiện tại, công nghệ này vẫn chỉ giới hạn ở phiên bản beta kín với số lượng người dùng rất nhỏ.
Khi các mô hình tiếp tục được cải thiện, ranh giới giữa nhân tạo và thực tế trở nên mờ nhạt hơn. Mặc dù điều này khiến nhiều người phấn khích, nhưng những lo ngại về việc lạm dụng sẽ vẫn tồn tại và việc xây dựng công nghệ này một cách có trách nhiệm vẫn là một thách thức cấp bách.