З перших вуст | Велика модель Wenshengtu «Ketu» власної розробки Kuaishou тут, і найближчим часом розпочнеться внутрішнє тестування

2023-09-18 03:43:42

Перше джерело: GenAI New World

Автор｜Li Hezi

Джерело зображення: створено Unbounded AI‌

З другої половини цього року Куайшоу активно розвиває великий модельний бізнес.

GenAI New World дізнався з перших вуст, що останній прогрес Kuaishou у сфері AIGC — власно розроблена графова модель Вінсента «Kolors» була повністю запущена в компанії для внутрішнього тестування.

Після запуску великої мовної моделі «KwaiYii» минулого місяця, менш ніж за місяць Kuaishou запустив велику графову модель Wensheng «Kolors». «Після цього була додана територія «Vincent Pictures».

GenAI New World дізнався від дослідників і розробників команди проекту Ketu, що велика модель «Ketu» Wenshengtu має три видатні особливості, а саме потужне розуміння тексту, багату характеристику деталей і різноманітну трансформацію стилю.

З макета домашньої сторінки тестової версії внутрішньої платформи великої моделі «Ketu» ми бачимо, що вона вже має зрілий прототип продукту.

Внутрішня бета-версія платформи великої моделі "Ketu".

Хоча велика модель «Ketu» ще не почала зовнішнє тестування, ми все ще можемо отримати уявлення про її конкретну продуктивність за допомогою функції «AI Game Review», запущеної Kuaishou App два дні тому.

«AI Game Review» було запущено для внутрішнього тестування на головному сайті Kuaishou 15 вересня, технічну підтримку надає велика модель «Ketu» Wenshengtu.

Саме тоді, коли ми подумали, що це ще один інструмент Wenshengtu, призначений виключно для творців коротких відео, і він з’явиться у серверній частині редагування відео, Куайшоу несподівано розмістив функцію «AI Play Review» в області коментарів.

Іншими словами, коли ви в майбутньому коментуватимете певне коротке відео, можливо, вам більше не доведеться старанно шукати відповідний пакет зображень/емоцій. Kuaishou може безпосередньо створити їх для вас.

У день запуску «Огляду ігор штучного інтелекту» користувачі, які пройшли кваліфікацію для тестування, вже почали залишати повідомлення «схожі на бажання» в офіційній зоні коментарів Kuaishou.

GenAI New World також отримав кваліфікацію для внутрішнього тестування вперше.

Спочатку відкрийте область коментарів до будь-якого відео в додатку Kuaishou і знайдіть кнопку "AI" праворуч від поля введення коментарів. Ви можете легко увійти до функціонального інтерфейсу "AI Play Review".

Обов’язковою умовою для генерації зображень є те, що вам потрібно ввести текст щонайменше з шести слів.Після введення автоматично засвітиться значок штучного інтелекту праворуч, повідомляючи вам, що ви можете почати генерувати.

Спершу спробуйте кілька більш традиційних описів, щоб перевірити, чи він їх розуміє, наприклад «дитина, що грається на освітленому сонцем пляжі».

Через кілька секунд нижче з’явиться набір зображень, згенерованих штучним інтелектом. Кожне зображення позначено іншим стилем, зокрема Makoto Shinkai, піксельне мистецтво, реалістична анімація, китайський стиль, кіберпанк, Pixar тощо. більше десятка видів.. Якщо ви не задоволені створеними наборами зображень, ви також можете натиснути «Змінити» у верхньому правому куті, щоб створити новий набір.

Судячи зі згенерованих зображень, розуміння досить добре.

Введіть ще кілька давніх китайських віршів, і він дійсно їх зрозуміє:

Судячи з деталей малюнка, чи то тонка текстура листя і пелюсток, чи чітко окреслені тичинки, рідко коли вони добре оброблені (мертві краї на периферії листя також відбиваються).

Зазначається, що дослідницька група Kuaishou AI змінила базову формулу та формулу додавання шуму алгоритму усунення шумів і водночас відібрала пакет високоякісних даних із високою деталізацією та високою естетикою для проведення цілеспрямованого навчання на наступних етапах. модельного навчання. Він може зробити багатшими деталі та текстуру згенерованих картинок, що має бути пов’язане з цим.

Давайте введемо кілька фраз зі специфічним значенням у китайському контексті:

Непогано, принаймні подрібнена свинина зі смаком риби не зображена як риба та шматок м’яса, а через екран відчувається гострий запах мапо тофу (він навіть прикрашений подрібненою зеленою цибулею).

Він навіть може зрозуміти, що таке людина Ган Фан («Ган Фан» спочатку є південно-західним мандаринським діалектом):

Можна сказати, що розуміння китайських виразів у великій моделі "Ketu" було враховано з самого початку.

За словами дослідницько-розробного персоналу Kuaishou, штучний інтелект Kuaishou має мільярди навчальних даних зображень і тексту, синтезованих із спільноти з відкритим кодом і власно розробленої технології штучного інтелекту, і охоплює 30 мільйонів поширених китайських концепцій сутностей. На основі цього навчання та розробки потужний Китайська модель CLIP.

Власнорозроблений китайський LLM у поєднанні з графічними та текстовими функціями CLIP використовується як модуль розуміння тексту графа Вінсента, що дозволяє «графічній» великій моделі краще розуміти китайські характерні поняття та зменшувати загальні проблеми в області графів Вінсента. наприклад складні поняття та плутанина атрибутів.

Однак, оскільки функція «Огляд гри зі штучним інтелектом» розміщена в області коментарів, ми також повинні поглянути на те, як вона працює в сценарії коментарів.

Скориставшись гарячою темою, я ввів опис свого настрою "Я дуже розчарований, тому що не можу купити квиток на потяг". "Огляд гри AI" все ж згенерував кілька цікавих зображень, які краще відображають цю емоцію:

І коли я ввів класичний вислів «Я не розумію, але я був шокований», я виявив, що згенерований стиль фігурки та стиль Макото Шинкая були найбільш відповідними (найпопулярніший згенерований стиль заплановано?):

Після загального досвіду «Огляд гри зі штучним інтелектом» все ще чудовий. Звичайно, передумовою все ще є те, що ШІ можна підказувати відповідними та відносно поширеними описами. А якщо взяти до уваги загальні характеристики користувачів мережі, які вільно висловлюють свої настрої та просторіччя під час коментарів, цю функцію можна ще багато вивчати.

З функції «Огляд ігор штучного інтелекту» ми дійсно можемо побачити деякі думки Куайшоу щодо застосування великих моделей, тобто є сильний акцент на «приземленні».

На відміну від багатьох попередніх компаній, які були віддані створенню великих моделей продуктів загального призначення, спільноти короткого відеовмісту, такі як Kuaishou, повинні приділяти більше уваги інтеграції зі спільнотою в розробці функцій продукту великих моделей і піклуватися про те, чи можуть користувачі насправді ними користуватися. .

Подібно до функції «ШІ-діалог», запущеної в серпні на основі великої моделі «Ruyi», частина її заснована на сценаріях пошуку, що дозволяє користувачам зручніше і точніше знаходити вміст на платформі (відповіді також супроводжуватимуться відповідними відео, посилання на енциклопедію), ідея обслуговування користувачів також поширюється на «огляди ігор AI».

Щодо того, чому велика модель "Ketu" була вперше опублікована в області коментарів на сайті Kuaishou, офіційна відповідь Kuaishou така:

«Сукупна кількість взаємно пов’язаних пар користувачів додатків Kuaishou перевищує 31,1 мільярда, що становить майже 50% зростання порівняно з минулим роком, а середня щоденна взаємодія (включаючи лайки, коментарі та пересилання тощо) становить 8 мільярдів разів .Короткі відеоролики з сильною прихильністю користувачів Область для коментарів стала одним із найкращих сценаріїв застосування для можливостей AIGC... (витрати часу та енергії на пошук відповідних зображень) значно знизило бажання користувачів публікувати коментарі. Огляд AI може значно збільшити кількість користувачів "ентузіазм і ентузіазм для участі в коментарях. Задоволення".

Звичайно, тепер, коли «мальовничу» велику модель перетворили на продукт, у Куайшоу можуть стояти більші амбіції.

Під час телефонної конференції про доходи за перший квартал у травні цього року генеральний директор Kuaishou Чен Ісяо вперше розповів зовнішньому світу про прогрес великого модельного бізнесу Kuaishou: було створено велику команду досліджень і розробки моделей, яка спирається на минулі технології в AIGC. алгоритми та великомасштабні мовні моделі Накопичуйте та сприяйте розробці та навчанню великих моделей, як планувалося.

Через два місяці Kuaishou оголосила 8 липня, що розпочне внутрішнє тестування свого «інтелектуального пошукового продукту запитань і відповідей», поклавши початок запуску масштабних модельних додатків.

Далі йде відносно інтенсивний випуск продуктів і функцій: 8 серпня компанія Kuaishou почала внутрішнє тестування функції «AI Conversation», 21 серпня — велика мовна модель «Ruyi», а 15 вересня — основна веб-сайт запустив внутрішнє тестування функції «AI Game Review»», поки сьогодні не з’явилася велика модель «Ketu» Wenshengtu...

Варто відзначити, що компанія Kuaishou офіційно і детально вперше представила прогрес свого великого модельного бізнесу на конференції Photosynthetic Creator Conference, що відбулася для творців платформи 10 серпня цього року.

На цій конференції компанія Kuaishou оголосила про низку подій для свого великого модельного бізнесу, про який досі мало повідомлялося зовнішньому світу. Сюди входять різноманітні можливості для створення тексту, зображень, відео та навіть 3D-матеріалів і музичного аудіо, що охоплює всі аспекти творчої стимуляції, видобутку матеріалів, редагування та створення відео. Він також фокусується на сцені прямого мовлення для швидкого створення власного користувача. Подвійне цифрове людське рішення "Kuaishou Zhibo".

Навіть сама річна конференція, включаючи плакати та виступи гостей, рідко буває насичена елементами AIGC.

Компанія Kuaishou, яка вирішила розробити власну велику модель з нуля, накопичила багато несвідомо та повільно побудувала те, що вона називає «повнорежимним рішенням великої моделі AIGC».

Таким чином, можна сказати, що Kuaishou добре підготовлений, коли мова заходить про запуск великої моделі, яка «наставляється», цього разу.

Незважаючи на те, що цього року великі вітчизняні компанії почали випускати власні великі модельні продукти, що стосується контент-компаній, здається, що ми не бачили справді вражаючого продукту. Як ми можемо навчити надійну модель? На основі великих моделей , буде досліджено більше нових способів гри для контент-компаній, про що дуже цікаво думати.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
1/3
1Simple Earn Annual Rate 24.4%
13k Популярність
2Gate Launchpad List IKA
22k Популярність
3ETH Trading Volume Surges
17k Популярність
4Gate ETH 10th Anniversary Celebration
24k Популярність
5Trump’s AI Strategy
19k Популярність

Закріпити

карта сайту