Tìm hiểu về mô hình AI DreamEditor có thể chỉnh sửa cảnh 3D thông qua lời nhắc bằng văn bản

Lời bài hát có nghĩa là: Ekrem Chetinkaya

Nguồn: MarkTechpost

Nguồn hình ảnh: Được tạo bởi công cụ Unbounded AI

Trong những năm gần đây, lĩnh vực thị giác máy tính 3D tràn ngập công nghệ NeRF. Một bước đột phá trong lĩnh vực này, NeRF có thể tái tạo và tổng hợp các góc nhìn mới lạ của một cảnh. Nó có thể nắm bắt và lập mô hình thông tin hình học và diện mạo cơ bản từ các bộ sưu tập hình ảnh nhiều chế độ xem.

Thông qua các mạng thần kinh, NeRF cung cấp một cách vượt ra ngoài các phương pháp tiếp cận dựa trên dữ liệu truyền thống. Mạng thần kinh trong NeRF học cách thể hiện các mối quan hệ phức tạp giữa hình dạng cảnh, ánh sáng và hình thức phụ thuộc vào ánh mắt, cho phép tái tạo cảnh có độ chi tiết cao và chân thực. Điểm mạnh chính của NeRF là khả năng tạo hình ảnh chân thực từ bất kỳ góc nhìn mong muốn nào trong một cảnh, ngay cả những vùng không được chụp bởi bộ ảnh gốc.

Thành công của NeRF đã mở ra những khả năng mới trong đồ họa máy tính, thực tế ảo và thực tế tăng cường, cho phép mọi người tạo ra các môi trường ảo nhập vai và tương tác gần giống với các tình huống trong thế giới thực. Do đó, có rất nhiều mối quan tâm trong việc thúc đẩy hơn nữa lĩnh vực NeRF.

Nhưng một số nhược điểm của NeRF cũng hạn chế ứng dụng của chúng trong các tình huống thực tế. Ví dụ: chỉnh sửa các trường thần kinh là một thách thức đáng kể do mã hóa ngầm thông tin về hình dạng và kết cấu trong các tính năng mạng thần kinh chiều cao. Mặc dù một số phương pháp cố gắng giải quyết vấn đề này bằng các kỹ thuật chỉnh sửa khám phá, nhưng chúng thường yêu cầu nhiều thông tin đầu vào của người dùng và khó đạt được kết quả chính xác và chất lượng cao.

Khả năng chỉnh sửa NeRF có thể mở ra khả năng cho các ứng dụng trong thế giới thực. Tuy nhiên, tất cả những nỗ lực cho đến nay vẫn chưa đủ để giải quyết những vấn đề này. Nhưng bây giờ, có một người chơi mới trong trò chơi -- DreamEditor.

DreamEditor cho phép chỉnh sửa 3D NeRF. nguồn:

DreamEditor là một khung thân thiện với người dùng, cho phép sửa đổi các trường thần kinh một cách trực quan và dễ dàng bằng cách sử dụng các tín hiệu văn bản. Bằng cách sử dụng trường thần kinh dựa trên lưới để thể hiện cảnh và áp dụng khung chỉnh sửa từng bước, DreamEditor có thể đạt được nhiều hiệu ứng chỉnh sửa khác nhau, bao gồm ánh xạ lại, thay thế đối tượng và chèn đối tượng.

Biểu diễn lưới tạo điều kiện chỉnh sửa cục bộ chính xác bằng cách chuyển đổi mặt nạ chỉnh sửa 2D thành các vùng chỉnh sửa 3D, đồng thời phân tách hình học và kết cấu để tránh biến dạng quá mức. Khung từng bước kết hợp mô hình khuếch tán được đào tạo trước với SDS (lấy mẫu chưng cất điểm số), cho phép chỉnh sửa hiệu quả và chính xác dựa trên lời nhắc văn bản đơn giản.

DreamEditor tuân theo ba giai đoạn chính để hỗ trợ chỉnh sửa cảnh 3D có hướng dẫn bằng văn bản trực quan và chính xác. Trong giai đoạn ban đầu, trường bức xạ thần kinh ban đầu được chuyển đổi thành trường thần kinh dựa trên lưới. Biểu diễn lưới này cho phép chỉnh sửa có chọn lọc theo không gian. Sau khi chuyển đổi, nó sử dụng mô hình chuyển văn bản thành hình ảnh (T2I) tùy chỉnh được đào tạo trên một cảnh cụ thể để nắm bắt mối quan hệ ngữ nghĩa giữa các từ khóa trong tín hiệu văn bản và nội dung trực quan của cảnh. Cuối cùng, sửa đổi đã chỉnh sửa được áp dụng cho đối tượng đích trong trường thần kinh bằng chế độ khuếch tán T2I.

DreamEditor cho phép chỉnh sửa cảnh 3D chính xác, từng bước trong khi vẫn duy trì mức độ trung thực và chân thực cao. Cách tiếp cận từng bước này, từ biểu diễn dựa trên lưới đến định vị chính xác và chỉnh sửa có kiểm soát thông qua các mẫu khuếch tán, cho phép DreamEditor đạt được kết quả chỉnh sửa thực tế cao trong khi giảm thiểu các sửa đổi không cần thiết ở những khu vực không liên quan.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)