Kể từ nửa cuối năm nay, Kuaishou thường xuyên phát triển hoạt động kinh doanh mô hình lớn.
GenAI New World đã trực tiếp biết được rằng tiến bộ mới nhất của Kuaishou trong lĩnh vực AIGC - mô hình đồ thị Vincent tự phát triển "Kolors" đã được ra mắt đầy đủ trong công ty để thử nghiệm nội bộ.
Sau khi ra mắt mô hình ngôn ngữ lớn "KwaiYii" vào tháng trước, Kuaishou đã tung ra mô hình đồ thị Wensheng lớn "Kolors" trong vòng chưa đầy một tháng. "Sau đó, lãnh thổ của" Vincent Pictures "đã được thêm vào.
GenAI New World đã học được từ các thành viên nghiên cứu và phát triển của nhóm dự án Ketu rằng mô hình lớn Wenshengtu "Ketu" có ba tính năng nổi bật, đó là khả năng hiểu văn bản mạnh mẽ, mô tả chi tiết phong phú và chuyển đổi phong cách đa dạng.
Từ cách bố trí trang chủ của phiên bản thử nghiệm của nền tảng nội bộ mô hình lớn "Ketu", chúng ta có thể thấy rằng nó đã có nguyên mẫu sản phẩm trưởng thành.
Trang chủ beta nền tảng nội bộ mô hình lớn "Ketu"
Mặc dù mô hình lớn "Ketu" vẫn chưa bắt đầu thử nghiệm bên ngoài, nhưng chúng ta vẫn có thể biết sơ qua về hiệu suất cụ thể của nó từ chức năng "Đánh giá trò chơi AI" do Ứng dụng Kuaishou ra mắt hai ngày trước.
"Đánh giá trò chơi AI" đã được ra mắt để thử nghiệm nội bộ trên trang web chính của Kuaishou vào ngày 15 tháng 9, với sự hỗ trợ kỹ thuật được cung cấp bởi mô hình lớn "Ketu" Wenshengtu.
Ngay khi chúng tôi nghĩ rằng đây là một công cụ Wenshengtu khác hoàn toàn dành cho những người tạo video ngắn và sẽ xuất hiện trong phần phụ trợ chỉnh sửa video, Kuaishou đã bất ngờ đưa chức năng "AI Play Review" vào khu vực bình luận.
Nói cách khác, sau này khi bạn bình luận về một video ngắn nào đó, bạn có thể không cần phải vất vả tìm gói hình ảnh/biểu tượng cảm xúc phù hợp nữa mà Kuaishou có thể trực tiếp tạo ra một gói cho bạn.
Vào ngày "Đánh giá trò chơi AI" được ra mắt, những người dùng đủ điều kiện để thử nghiệm đã bắt đầu để lại những tin nhắn "như mong muốn" trong khu vực bình luận chính thức của Kuaishou.
GenAI New World cũng lần đầu tiên đạt được chứng chỉ thử nghiệm nội bộ, hãy cùng xem trải nghiệm thực tế của chúng tôi.
Đầu tiên, hãy mở khu vực bình luận của bất kỳ video nào trong Ứng dụng Kuaishou và tìm nút "AI" ở bên phải hộp nhập bình luận, bạn có thể dễ dàng vào giao diện chức năng "AI Play Review".
Điều kiện tiên quyết để tạo hình ảnh là bạn cần nhập một văn bản có ít nhất sáu từ, sau khi nhập xong, biểu tượng AI ở bên phải sẽ tự động sáng lên, báo cho bạn biết rằng bạn có thể bắt đầu tạo.
Trước tiên, hãy thử một số mô tả thông thường hơn để xem liệu nó có hiểu được không, chẳng hạn như “một đứa trẻ đang chơi trên bãi biển ngập nắng”.
Sau vài giây, một bộ hình ảnh do AI tạo ra sẽ xuất hiện bên dưới, mỗi hình ảnh được đánh dấu bằng một phong cách khác nhau, bao gồm Makoto Shinkai, pixel art, hoạt hình chân thực, phong cách Trung Quốc, cyberpunk, Pixar, v.v. Người ta nói rằng có hơn chục loại.. Nếu bạn không hài lòng với bộ ảnh đã tạo, bạn cũng có thể nhấp vào "Thay đổi" ở góc trên bên phải để tạo bộ ảnh mới.
Đánh giá từ những hình ảnh được tạo ra, độ hiểu là khá tốt.
Nhập thêm một số bài thơ cổ của Trung Quốc, nó thực sự hiểu được chúng:
Đánh giá từ chi tiết của bức ảnh, cho dù đó là kết cấu tinh tế của lá và cánh hoa, hay nhị hoa được xác định rõ ràng, hiếm khi chúng được xử lý tốt (các cạnh chết ở ngoại vi của lá cũng được phản ánh).
Được biết, nhóm nghiên cứu Kuaishou AI đã thay đổi công thức cơ bản và công thức cộng nhiễu của thuật toán khử nhiễu, đồng thời chọn lọc một loạt dữ liệu chất lượng cao, có độ chi tiết cao và tính thẩm mỹ cao để tiến hành học tập tập trung ở các giai đoạn sau của việc học theo mô hình. Nó có thể làm cho các chi tiết và kết cấu của hình ảnh được tạo ra trở nên phong phú hơn, điều này hẳn phải liên quan đến điều này.
Hãy nhập một số cụm từ có ý nghĩa cụ thể trong ngữ cảnh tiếng Trung:
Không tệ, ít nhất thịt lợn xé vị cá không được hình dung như một con cá và một miếng thịt, và bạn có thể ngửi thấy vị cay của đậu phụ mapo qua màn hình (thậm chí nó còn được trang trí bằng hành lá xắt nhỏ).
Nó thậm chí có thể hiểu được người Gan Fan là gì (“Gan Fan” ban đầu là một phương ngữ tiếng Quan Thoại ở Tây Nam):
Việc hiểu cách diễn đạt tiếng Trung trong mô hình lớn “Ketu” có thể nói đã được cân nhắc ngay từ đầu.
Theo nhân viên R&D của Kuaishou, Kuaishou AI có hàng tỷ dữ liệu đào tạo bằng hình ảnh và văn bản, được tổng hợp từ cộng đồng nguồn mở và công nghệ AI tự phát triển, bao gồm 30 triệu khái niệm thực thể phổ biến của Trung Quốc. Mô hình CLIP của Trung Quốc.
LLM tiếng Trung tự phát triển kết hợp với các tính năng đồ họa và văn bản của CLIP được sử dụng làm mô-đun hiểu văn bản của biểu đồ Vincentian, cho phép mô hình lớn "có thể lập biểu đồ" hiểu rõ hơn các khái niệm đặc trưng của Trung Quốc và giảm thiểu các vấn đề thường gặp trong lĩnh vực biểu đồ Vincentian chẳng hạn như các khái niệm phức tạp và nhầm lẫn thuộc tính. .
Tuy nhiên, vì chức năng "Đánh giá trò chơi AI" được đặt trong khu vực bình luận nên chúng ta cũng nên xem nó hoạt động như thế nào trong kịch bản bình luận.
Lợi dụng một chủ đề đang nóng, tôi vào mô tả tâm trạng của mình "Tôi rất bực mình vì không lấy được vé tàu", "AI Play Review" vẫn tạo ra một số hình ảnh thú vị có thể phản ánh cảm xúc này rõ hơn:
Và khi tôi gõ câu nói cổ điển "Tôi không hiểu, nhưng tôi đã bị sốc", tôi thấy rằng phong cách hình que được tạo ra và phong cách của Makoto Shinkai là phù hợp nhất (phong cách được tạo ra phổ biến nhất theo lịch trình?):
Sau trải nghiệm tổng thể, phần "Đánh giá trò chơi AI" vẫn rất đáng chú ý, tất nhiên tiền đề vẫn là AI có thể được nhắc nhở bằng những mô tả phù hợp và tương đối phổ biến. Và nếu tính đến đặc điểm chung của việc cư dân mạng thoải mái thể hiện tâm trạng, ngôn ngữ thông tục khi bình luận thì chức năng này vẫn có thể được khám phá rất nhiều.
Từ chức năng "AI Game Review", chúng ta thực sự có thể thấy một số suy nghĩ của Kuaishou về việc áp dụng các mô hình lớn, tức là nhấn mạnh vào việc "hạ cánh".
Không giống như nhiều công ty trước đây cam kết xây dựng các sản phẩm mô hình lớn có mục đích chung, các cộng đồng nội dung video ngắn như Kuaishou nên chú ý hơn đến việc tích hợp với cộng đồng trong việc phát triển các chức năng của sản phẩm mô hình lớn và quan tâm đến việc liệu người dùng có thực sự sử dụng được chúng hay không .
Giống như chức năng "AI đàm thoại" ra mắt vào tháng 8 dựa trên mô hình lớn "Ruyi", một phần dựa trên các kịch bản tìm kiếm, cho phép người dùng tìm kiếm nội dung trên nền tảng một cách thuận tiện và chính xác hơn (các câu trả lời cũng sẽ đi kèm các câu hỏi liên quan). video, liên kết Bách khoa toàn thư), ý tưởng phục vụ người dùng còn mở rộng sang "đánh giá trò chơi AI".
Về lý do tại sao mô hình lớn "Ketu" lần đầu tiên được đăng trong phần bình luận trên trang Kuaishou, câu trả lời chính thức của Kuaishou là,
"Số lượng tích lũy các cặp người dùng liên quan lẫn nhau của ứng dụng Kuaishou vượt quá 31,1 tỷ, tăng gần 50% so với cùng kỳ năm trước và số lượt tương tác trung bình hàng ngày (bao gồm lượt thích, bình luận và chuyển tiếp, v.v.) lên tới 8 tỷ lần . Các video ngắn có độ thu hút người dùng cao Khu vực bình luận đã trở thành một trong những kịch bản ứng dụng tốt nhất cho khả năng AIGC... (dành thời gian và sức lực để tìm những bức ảnh phù hợp) đã hạn chế rất nhiều sự sẵn lòng đăng bình luận của người dùng. Đánh giá AI có thể tăng số lượng người dùng lên rất nhiều ' nhiệt tình và nhiệt tình tham gia góp ý. Hài lòng.”
Tất nhiên, giờ đây mô hình cỡ lớn “như hình” đã được sản xuất thành sản phẩm, Kuaishou có thể còn có những tham vọng lớn hơn đằng sau nó.
Trong cuộc gọi hội nghị thu nhập quý đầu tiên vào tháng 5 năm nay, Giám đốc điều hành Kuaishou Cheng Yixiao lần đầu tiên tiết lộ với thế giới bên ngoài về tiến trình kinh doanh mô hình lớn của Kuaishou: một nhóm nghiên cứu và phát triển mô hình lớn đã được thành lập, dựa trên các công nghệ trước đây trong AIGC các thuật toán và mô hình ngôn ngữ quy mô lớn. Tích lũy và thúc đẩy phát triển và đào tạo mô hình lớn theo kế hoạch.
Hai tháng sau, Kuaishou thông báo vào ngày 8 tháng 7 rằng họ sẽ bắt đầu thử nghiệm nội bộ “sản phẩm hỏi đáp thông minh tìm kiếm”, khởi động việc ra mắt các ứng dụng mô hình quy mô lớn.
Tiếp theo là đợt phát hành sản phẩm và chức năng tương đối chuyên sâu: vào ngày 8 tháng 8, Kuaishou bắt đầu thử nghiệm nội bộ chức năng “Hội thoại AI”, vào ngày 21 tháng 8, mô hình ngôn ngữ lớn “Ruyi” bắt đầu thử nghiệm nội bộ và vào ngày 15 tháng 9, mô hình chính Trang web ra mắt thử nghiệm nội bộ chức năng “AI Game Review” “, cho đến ngày hôm nay, mô hình lớn” Ketu” Wenshengtu đã xuất hiện...
Điều đáng chú ý là Kuaishou đã lần đầu tiên giới thiệu chính thức và chi tiết về tiến trình kinh doanh mô hình lớn của mình tại Hội nghị người sáng tạo quang hợp được tổ chức dành cho những người sáng tạo nền tảng vào ngày 10 tháng 8 năm nay.
Kuaishou đã công bố một số phát triển tại hội nghị này đối với hoạt động kinh doanh mô hình lớn của mình, điều mà cho đến nay hiếm khi được tiết lộ với thế giới bên ngoài. Điều này bao gồm nhiều khả năng khác nhau để tạo văn bản, hình ảnh, video và thậm chí cả vật liệu 3D và âm thanh âm nhạc, bao gồm tất cả các khía cạnh kích thích sáng tạo, khai thác và chỉnh sửa vật liệu cũng như sản xuất video. Nó cũng tập trung vào cảnh phát sóng trực tiếp để nhanh chóng tạo ra cảnh của riêng người dùng. Giải pháp song sinh dành cho con người kỹ thuật số "Kuaishou Zhibo".
Ngay cả bản thân hội nghị thường niên, bao gồm cả áp phích và sự xuất hiện của khách mời, cũng hiếm khi có đầy đủ các yếu tố AIGC.
Kuaishou, công ty đã chọn phát triển mô hình lớn của riêng mình từ đầu, đã vô tình tích lũy được rất nhiều và từ từ xây dựng cái mà họ gọi là "giải pháp AIGC mô hình lớn ở chế độ đầy đủ".
Vì vậy, có thể nói Kuaishou đã có sự chuẩn bị tốt khi tung ra mẫu xe cỡ lớn “có thể thay đổi” lần này.
Dù các công ty lớn trong nước đã bắt đầu tung ra các sản phẩm mô hình lớn của riêng mình trong năm nay nhưng đối với các công ty nội dung, chúng ta vẫn chưa thấy một sản phẩm nào thực sự ấn tượng. các cách chơi của các công ty nội dung sẽ được khám phá, điều này khá thú vị khi nghĩ đến.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Trực tiếp | Mô hình lớn Wenshengtu “Ketu” do Kuaishou tự phát triển đã có mặt và đã bắt đầu thử nghiệm nội bộ trong thời gian tới
Nguồn gốc: GenAI New World
Tác giả|Lý Hà Tử
Kể từ nửa cuối năm nay, Kuaishou thường xuyên phát triển hoạt động kinh doanh mô hình lớn.
GenAI New World đã trực tiếp biết được rằng tiến bộ mới nhất của Kuaishou trong lĩnh vực AIGC - mô hình đồ thị Vincent tự phát triển "Kolors" đã được ra mắt đầy đủ trong công ty để thử nghiệm nội bộ.
Sau khi ra mắt mô hình ngôn ngữ lớn "KwaiYii" vào tháng trước, Kuaishou đã tung ra mô hình đồ thị Wensheng lớn "Kolors" trong vòng chưa đầy một tháng. "Sau đó, lãnh thổ của" Vincent Pictures "đã được thêm vào.
GenAI New World đã học được từ các thành viên nghiên cứu và phát triển của nhóm dự án Ketu rằng mô hình lớn Wenshengtu "Ketu" có ba tính năng nổi bật, đó là khả năng hiểu văn bản mạnh mẽ, mô tả chi tiết phong phú và chuyển đổi phong cách đa dạng.
Từ cách bố trí trang chủ của phiên bản thử nghiệm của nền tảng nội bộ mô hình lớn "Ketu", chúng ta có thể thấy rằng nó đã có nguyên mẫu sản phẩm trưởng thành.
Mặc dù mô hình lớn "Ketu" vẫn chưa bắt đầu thử nghiệm bên ngoài, nhưng chúng ta vẫn có thể biết sơ qua về hiệu suất cụ thể của nó từ chức năng "Đánh giá trò chơi AI" do Ứng dụng Kuaishou ra mắt hai ngày trước.
"Đánh giá trò chơi AI" đã được ra mắt để thử nghiệm nội bộ trên trang web chính của Kuaishou vào ngày 15 tháng 9, với sự hỗ trợ kỹ thuật được cung cấp bởi mô hình lớn "Ketu" Wenshengtu.
Ngay khi chúng tôi nghĩ rằng đây là một công cụ Wenshengtu khác hoàn toàn dành cho những người tạo video ngắn và sẽ xuất hiện trong phần phụ trợ chỉnh sửa video, Kuaishou đã bất ngờ đưa chức năng "AI Play Review" vào khu vực bình luận.
Nói cách khác, sau này khi bạn bình luận về một video ngắn nào đó, bạn có thể không cần phải vất vả tìm gói hình ảnh/biểu tượng cảm xúc phù hợp nữa mà Kuaishou có thể trực tiếp tạo ra một gói cho bạn.
Vào ngày "Đánh giá trò chơi AI" được ra mắt, những người dùng đủ điều kiện để thử nghiệm đã bắt đầu để lại những tin nhắn "như mong muốn" trong khu vực bình luận chính thức của Kuaishou.
Đầu tiên, hãy mở khu vực bình luận của bất kỳ video nào trong Ứng dụng Kuaishou và tìm nút "AI" ở bên phải hộp nhập bình luận, bạn có thể dễ dàng vào giao diện chức năng "AI Play Review".
Trước tiên, hãy thử một số mô tả thông thường hơn để xem liệu nó có hiểu được không, chẳng hạn như “một đứa trẻ đang chơi trên bãi biển ngập nắng”.
Sau vài giây, một bộ hình ảnh do AI tạo ra sẽ xuất hiện bên dưới, mỗi hình ảnh được đánh dấu bằng một phong cách khác nhau, bao gồm Makoto Shinkai, pixel art, hoạt hình chân thực, phong cách Trung Quốc, cyberpunk, Pixar, v.v. Người ta nói rằng có hơn chục loại.. Nếu bạn không hài lòng với bộ ảnh đã tạo, bạn cũng có thể nhấp vào "Thay đổi" ở góc trên bên phải để tạo bộ ảnh mới.
Đánh giá từ những hình ảnh được tạo ra, độ hiểu là khá tốt.
Hãy nhập một số cụm từ có ý nghĩa cụ thể trong ngữ cảnh tiếng Trung:
Nó thậm chí có thể hiểu được người Gan Fan là gì (“Gan Fan” ban đầu là một phương ngữ tiếng Quan Thoại ở Tây Nam):
Theo nhân viên R&D của Kuaishou, Kuaishou AI có hàng tỷ dữ liệu đào tạo bằng hình ảnh và văn bản, được tổng hợp từ cộng đồng nguồn mở và công nghệ AI tự phát triển, bao gồm 30 triệu khái niệm thực thể phổ biến của Trung Quốc. Mô hình CLIP của Trung Quốc.
LLM tiếng Trung tự phát triển kết hợp với các tính năng đồ họa và văn bản của CLIP được sử dụng làm mô-đun hiểu văn bản của biểu đồ Vincentian, cho phép mô hình lớn "có thể lập biểu đồ" hiểu rõ hơn các khái niệm đặc trưng của Trung Quốc và giảm thiểu các vấn đề thường gặp trong lĩnh vực biểu đồ Vincentian chẳng hạn như các khái niệm phức tạp và nhầm lẫn thuộc tính. .
Tuy nhiên, vì chức năng "Đánh giá trò chơi AI" được đặt trong khu vực bình luận nên chúng ta cũng nên xem nó hoạt động như thế nào trong kịch bản bình luận.
Lợi dụng một chủ đề đang nóng, tôi vào mô tả tâm trạng của mình "Tôi rất bực mình vì không lấy được vé tàu", "AI Play Review" vẫn tạo ra một số hình ảnh thú vị có thể phản ánh cảm xúc này rõ hơn:
Từ chức năng "AI Game Review", chúng ta thực sự có thể thấy một số suy nghĩ của Kuaishou về việc áp dụng các mô hình lớn, tức là nhấn mạnh vào việc "hạ cánh".
Không giống như nhiều công ty trước đây cam kết xây dựng các sản phẩm mô hình lớn có mục đích chung, các cộng đồng nội dung video ngắn như Kuaishou nên chú ý hơn đến việc tích hợp với cộng đồng trong việc phát triển các chức năng của sản phẩm mô hình lớn và quan tâm đến việc liệu người dùng có thực sự sử dụng được chúng hay không .
Giống như chức năng "AI đàm thoại" ra mắt vào tháng 8 dựa trên mô hình lớn "Ruyi", một phần dựa trên các kịch bản tìm kiếm, cho phép người dùng tìm kiếm nội dung trên nền tảng một cách thuận tiện và chính xác hơn (các câu trả lời cũng sẽ đi kèm các câu hỏi liên quan). video, liên kết Bách khoa toàn thư), ý tưởng phục vụ người dùng còn mở rộng sang "đánh giá trò chơi AI".
Về lý do tại sao mô hình lớn "Ketu" lần đầu tiên được đăng trong phần bình luận trên trang Kuaishou, câu trả lời chính thức của Kuaishou là,
Tất nhiên, giờ đây mô hình cỡ lớn “như hình” đã được sản xuất thành sản phẩm, Kuaishou có thể còn có những tham vọng lớn hơn đằng sau nó.
Trong cuộc gọi hội nghị thu nhập quý đầu tiên vào tháng 5 năm nay, Giám đốc điều hành Kuaishou Cheng Yixiao lần đầu tiên tiết lộ với thế giới bên ngoài về tiến trình kinh doanh mô hình lớn của Kuaishou: một nhóm nghiên cứu và phát triển mô hình lớn đã được thành lập, dựa trên các công nghệ trước đây trong AIGC các thuật toán và mô hình ngôn ngữ quy mô lớn. Tích lũy và thúc đẩy phát triển và đào tạo mô hình lớn theo kế hoạch.
Hai tháng sau, Kuaishou thông báo vào ngày 8 tháng 7 rằng họ sẽ bắt đầu thử nghiệm nội bộ “sản phẩm hỏi đáp thông minh tìm kiếm”, khởi động việc ra mắt các ứng dụng mô hình quy mô lớn.
Tiếp theo là đợt phát hành sản phẩm và chức năng tương đối chuyên sâu: vào ngày 8 tháng 8, Kuaishou bắt đầu thử nghiệm nội bộ chức năng “Hội thoại AI”, vào ngày 21 tháng 8, mô hình ngôn ngữ lớn “Ruyi” bắt đầu thử nghiệm nội bộ và vào ngày 15 tháng 9, mô hình chính Trang web ra mắt thử nghiệm nội bộ chức năng “AI Game Review” “, cho đến ngày hôm nay, mô hình lớn” Ketu” Wenshengtu đã xuất hiện...
Điều đáng chú ý là Kuaishou đã lần đầu tiên giới thiệu chính thức và chi tiết về tiến trình kinh doanh mô hình lớn của mình tại Hội nghị người sáng tạo quang hợp được tổ chức dành cho những người sáng tạo nền tảng vào ngày 10 tháng 8 năm nay.
Kuaishou đã công bố một số phát triển tại hội nghị này đối với hoạt động kinh doanh mô hình lớn của mình, điều mà cho đến nay hiếm khi được tiết lộ với thế giới bên ngoài. Điều này bao gồm nhiều khả năng khác nhau để tạo văn bản, hình ảnh, video và thậm chí cả vật liệu 3D và âm thanh âm nhạc, bao gồm tất cả các khía cạnh kích thích sáng tạo, khai thác và chỉnh sửa vật liệu cũng như sản xuất video. Nó cũng tập trung vào cảnh phát sóng trực tiếp để nhanh chóng tạo ra cảnh của riêng người dùng. Giải pháp song sinh dành cho con người kỹ thuật số "Kuaishou Zhibo".
Ngay cả bản thân hội nghị thường niên, bao gồm cả áp phích và sự xuất hiện của khách mời, cũng hiếm khi có đầy đủ các yếu tố AIGC.
Kuaishou, công ty đã chọn phát triển mô hình lớn của riêng mình từ đầu, đã vô tình tích lũy được rất nhiều và từ từ xây dựng cái mà họ gọi là "giải pháp AIGC mô hình lớn ở chế độ đầy đủ".
Vì vậy, có thể nói Kuaishou đã có sự chuẩn bị tốt khi tung ra mẫu xe cỡ lớn “có thể thay đổi” lần này.
Dù các công ty lớn trong nước đã bắt đầu tung ra các sản phẩm mô hình lớn của riêng mình trong năm nay nhưng đối với các công ty nội dung, chúng ta vẫn chưa thấy một sản phẩm nào thực sự ấn tượng. các cách chơi của các công ty nội dung sẽ được khám phá, điều này khá thú vị khi nghĩ đến.