Со второй половины этого года Куайшоу часто развивает крупный модельный бизнес.
GenAI New World узнала из первых рук, что последний прогресс Kuaishou в области AIGC — графовая модель Винсента собственной разработки «Kolors» была полностью запущена в компании для внутреннего тестирования.
После запуска большой языковой модели «KwaiYii» в прошлом месяце компания Kuaishou менее чем за месяц запустила большую графовую модель Wensheng «Kolors». После этого к ней была добавлена территория «Vincent Pictures».
GenAI New World узнала от участников исследований и разработок из команды проекта Ketu, что большая модель Wenshengtu «Ketu» обладает тремя выдающимися особенностями, а именно мощным пониманием текста, богатой детализацией характеристик и разнообразной трансформацией стиля.
Из макета домашней страницы тестовой версии внутренней платформы большой модели «Кету» мы видим, что у нее уже есть зрелый прототип продукта.
Домашняя страница бета-версии внутренней платформы большой модели «Кету»
Хотя большая модель «Кету» еще не приступила к внешнему тестированию, мы все еще можем получить представление о ее конкретных характеристиках с помощью функции «Обзор игры AI», запущенной приложением Kuaishou два дня назад.
«Обзор AI Game Review» был запущен для внутреннего тестирования на главном сайте Kuaishou 15 сентября при технической поддержке со стороны большой модели Wenshengtu «Ketu».
Когда мы подумали, что это еще один инструмент Wenshengtu, предназначенный исключительно для создателей коротких видеороликов и который появится в интерфейсе редактирования видео, Куайшоу неожиданно добавил функцию «Обзор AI Play» в область комментариев.
Другими словами, когда вы в будущем будете комментировать определенное короткое видео, вам больше не придется кропотливо искать подходящий пакет изображений/смайликов: Kuaishou может создать его напрямую для вас.
В день запуска «Обзора AI Game Review» пользователи, прошедшие тестирование, уже начали оставлять сообщения с пожеланиями в официальной зоне комментариев Kuaishou.
GenAI New World также впервые получила квалификацию для внутреннего тестирования.Давайте посмотрим на наш опыт из первых рук.
Сначала откройте область комментариев к любому видео в приложении Kuaishou и найдите кнопку «AI» в правой части поля ввода комментария. Вы можете легко войти в функциональный интерфейс «AI Play Review».
Обязательным условием для генерации изображений является то, что вам необходимо ввести текст длиной не менее шести слов.После ввода автоматически загорится значок AI справа, сообщая вам, что вы можете начать генерацию.
Сначала попробуйте несколько более традиционных описаний, чтобы увидеть, понимает ли он это, например, «ребенок, играющий на залитом солнцем пляже».
Через несколько секунд ниже появится набор изображений, сгенерированных искусственным интеллектом. Каждое изображение отмечено своим стилем, включая Макото Синкай, пиксельную графику, реалистичную анимацию, китайский стиль, киберпанк, Pixar и т. д. Говорят, что есть более десятка типов. . Если вас не устраивают сгенерированные наборы изображений, вы также можете нажать «Изменить» в правом верхнем углу, чтобы сгенерировать новый набор.
Судя по сгенерированным изображениям, понимание достаточно хорошее.
Введите еще несколько древних китайских стихотворений, и он действительно их поймет:
Судя по деталям рисунка, будь то тонкая фактура листьев и лепестков или четко очерченные тычинки, редко они хорошо обрабатываются (отражаются и отмершие края по периферии листьев).
Говорят, что исследовательская группа Kuaishou AI изменила базовую формулу и формулу добавления шума алгоритма шумоподавления и в то же время выбрала пакет высококачественных данных с высокой детализацией и высокой эстетикой для проведения целенаправленного обучения на более поздних этапах. модельного обучения. Он может сделать детализацию и текстуру создаваемых изображений богаче, что должно быть связано с этим.
Давайте введем несколько фраз, имеющих конкретное значение в китайском контексте:
Неплохо, по крайней мере, тертая свинина с рыбным вкусом изображена не как рыба, а как кусок мяса, и через экран чувствуется пряный запах тофу мапо (он даже украшен нарезанным зеленым луком).
Он даже может понять, что такое человек Ган Фан («Ган Фан» — изначально диалект юго-западного мандарина):
Можно сказать, что понимание китайских выражений в большой модели «Кету» было учтено с самого начала.
По словам сотрудников отдела исследований и разработок Kuaishou, Kuaishou AI располагает миллиардами обучающих данных изображений и текста, которые синтезированы из сообщества открытого исходного кода и самостоятельно разработанной технологии искусственного интеллекта и охватывают 30 миллионов распространенных концепций китайских сущностей. Китайская модель CLIP.
Саморазвитый китайский LLM в сочетании с графическими и текстовыми функциями CLIP используется в качестве модуля понимания текста винсентианского графа, позволяя «графической» большой модели лучше понимать китайские характерные концепции и уменьшать распространенные проблемы в области винсентианских графов. такие как сложные понятия и путаница атрибутов.
Однако, поскольку функция «Обзор игры с использованием ИИ» размещена в области комментариев, нам также следует взглянуть на то, как она работает в сценарии комментариев.
Воспользовавшись горячей темой, я ввел описание своего настроения: «Я очень расстроен, потому что не могу купить билет на поезд». «AI Game Review» все же сгенерировал несколько интересных изображений, которые могут лучше отразить эту эмоцию:
И когда я набрал классическое выражение «Я не понимаю, но я был в шоке», я обнаружил, что сгенерированный стиль фигурки и стиль Макото Синкая были наиболее подходящими (самый популярный сгенерированный стиль запланирован?):
После общего опыта «Обзор игры ИИ» по-прежнему примечателен. Конечно, предпосылка по-прежнему заключается в том, что ИИ можно подсказать соответствующими и относительно распространенными описаниями. А если принять во внимание общие характеристики пользователей сети, свободно выражающих свое настроение и разговорные выражения при комментировании, эту функцию еще можно многое изучить.
Из функции «Обзор игры AI» мы действительно можем увидеть некоторые мысли Куайшоу о применении больших моделей, то есть сильный упор делается на «посадку».
В отличие от многих более ранних компаний, которые стремились создавать продукты для больших моделей общего назначения, сообществам с коротким видеоконтентом, таким как Kuaishou, следует уделять больше внимания интеграции с сообществом при разработке функций продуктов для больших моделей и заботиться о том, смогут ли пользователи действительно их использовать. .
Так же, как и запущенная в августе функция «ИИ-диалог» на основе большой модели «Жуйи», часть ее основана на сценариях поиска, что позволяет пользователям более удобно и точно находить контент на платформе (ответы также будут сопровождаться соответствующими видео, ссылка на Энциклопедию), идея обслуживания пользователей распространяется и на «обзоры ИИ-игр».
Что касается того, почему большая модель «Кету» была впервые опубликована в комментариях на сайте Kuaishou, официальный ответ Kuaishou таков:
«Совокупное количество взаимно связанных пар пользователей приложений Kuaishou превышает 31,1 миллиарда, рост по сравнению с прошлым годом почти на 50%, а среднесуточное взаимодействие (включая лайки, комментарии, переадресацию и т. д.) составляет 8 миллиардов раз. Короткие видеоролики, вызывающие сильную привязанность пользователей. Область комментариев стала одним из лучших сценариев применения возможностей AIGC... (трата времени и энергии на поиск подходящих изображений) значительно снизила желание пользователей оставлять комментарии. Обзор с помощью ИИ может значительно повысить интерес пользователей энтузиазм и энтузиазм от участия в комментариях.Удовлетворение».
Конечно, теперь, когда «изображенная» большая модель стала продуктом, у Kuaishou могут быть большие амбиции.
Во время телеконференции по итогам первого квартала в мае этого года генеральный директор Kuaishou Чэн Исяо впервые рассказал внешнему миру о прогрессе крупного модельного бизнеса Kuaishou: была создана большая группа исследований и разработок моделей, опирающаяся на прошлые технологии AIGC. алгоритмы и крупномасштабные языковые модели. Накапливать и продвигать разработку и обучение крупных моделей в соответствии с планом.
Два месяца спустя, 8 июля, Kuaishou объявила, что начнет внутреннее тестирование своего «поискового интеллектуального продукта вопросов и ответов», положив начало запуску крупномасштабных модельных приложений.
Далее следует относительно интенсивный выпуск продуктов и функций: 8 августа Kuaishou приступила к внутреннему тестированию функции «Разговор с ИИ», 21 августа началось внутреннее тестирование большой языковой модели «Ruyi», а 15 сентября началось внутреннее тестирование основной веб-сайт запустил внутреннее тестирование функции «Обзор игры AI», и сегодня всплыла большая модель «Кету» Вэньшэнту...
Стоит отметить, что Kuaishou впервые официально и подробно представила ход своего крупного модельного бизнеса на конференции Photosynthetic Creator Conference, проводимой для создателей платформ 10 августа этого года.
На этой конференции компания Kuaishou объявила о ряде изменений в своем крупном модельном бизнесе, о которых до сих пор редко сообщалось внешнему миру. Сюда входят различные возможности для создания текста, изображений, видео и даже 3D-материалов и музыкального аудио, охватывающие все аспекты творческой стимуляции, добычи и редактирования материалов, а также создания видео. Он также фокусируется на сцене прямой трансляции, чтобы быстро создавать собственные Двойное цифровое человеческое решение «Куайшоу Жибо».
Даже сама ежегодная конференция, включая плакаты и выступления гостей, редко наполнена элементами AIGC.
Компания Kuaishou, которая решила разработать свою собственную большую модель с нуля, неосознанно накопила очень много и медленно создала то, что она называет «полнорежимным решением AIGC для большой модели».
Таким образом, можно сказать, что на этот раз Kuaishou хорошо подготовлена к запуску «настраиваемой» большой модели.
Хотя крупные отечественные компании в этом году начали выпускать собственные крупные модельные продукты, что касается контент-компаний, то, похоже, мы не увидели по-настоящему впечатляющего продукта. Как мы можем обучить надежную модель? На основе больших моделей , будут изучены новые способы игры для контент-компаний, и об этом очень интересно думать.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Из первых рук | Крупная модель Wenshengtu «Кету», разработанная Kuaishou, уже здесь и в ближайшем будущем начнет внутренние испытания.
Первоисточник: GenAI New World
Автор|Ли Хэцзы
Со второй половины этого года Куайшоу часто развивает крупный модельный бизнес.
GenAI New World узнала из первых рук, что последний прогресс Kuaishou в области AIGC — графовая модель Винсента собственной разработки «Kolors» была полностью запущена в компании для внутреннего тестирования.
После запуска большой языковой модели «KwaiYii» в прошлом месяце компания Kuaishou менее чем за месяц запустила большую графовую модель Wensheng «Kolors». После этого к ней была добавлена территория «Vincent Pictures».
GenAI New World узнала от участников исследований и разработок из команды проекта Ketu, что большая модель Wenshengtu «Ketu» обладает тремя выдающимися особенностями, а именно мощным пониманием текста, богатой детализацией характеристик и разнообразной трансформацией стиля.
Из макета домашней страницы тестовой версии внутренней платформы большой модели «Кету» мы видим, что у нее уже есть зрелый прототип продукта.
Хотя большая модель «Кету» еще не приступила к внешнему тестированию, мы все еще можем получить представление о ее конкретных характеристиках с помощью функции «Обзор игры AI», запущенной приложением Kuaishou два дня назад.
«Обзор AI Game Review» был запущен для внутреннего тестирования на главном сайте Kuaishou 15 сентября при технической поддержке со стороны большой модели Wenshengtu «Ketu».
Когда мы подумали, что это еще один инструмент Wenshengtu, предназначенный исключительно для создателей коротких видеороликов и который появится в интерфейсе редактирования видео, Куайшоу неожиданно добавил функцию «Обзор AI Play» в область комментариев.
Другими словами, когда вы в будущем будете комментировать определенное короткое видео, вам больше не придется кропотливо искать подходящий пакет изображений/смайликов: Kuaishou может создать его напрямую для вас.
В день запуска «Обзора AI Game Review» пользователи, прошедшие тестирование, уже начали оставлять сообщения с пожеланиями в официальной зоне комментариев Kuaishou.
Сначала откройте область комментариев к любому видео в приложении Kuaishou и найдите кнопку «AI» в правой части поля ввода комментария. Вы можете легко войти в функциональный интерфейс «AI Play Review».
Сначала попробуйте несколько более традиционных описаний, чтобы увидеть, понимает ли он это, например, «ребенок, играющий на залитом солнцем пляже».
Через несколько секунд ниже появится набор изображений, сгенерированных искусственным интеллектом. Каждое изображение отмечено своим стилем, включая Макото Синкай, пиксельную графику, реалистичную анимацию, китайский стиль, киберпанк, Pixar и т. д. Говорят, что есть более десятка типов. . Если вас не устраивают сгенерированные наборы изображений, вы также можете нажать «Изменить» в правом верхнем углу, чтобы сгенерировать новый набор.
Судя по сгенерированным изображениям, понимание достаточно хорошее.
Давайте введем несколько фраз, имеющих конкретное значение в китайском контексте:
Он даже может понять, что такое человек Ган Фан («Ган Фан» — изначально диалект юго-западного мандарина):
По словам сотрудников отдела исследований и разработок Kuaishou, Kuaishou AI располагает миллиардами обучающих данных изображений и текста, которые синтезированы из сообщества открытого исходного кода и самостоятельно разработанной технологии искусственного интеллекта и охватывают 30 миллионов распространенных концепций китайских сущностей. Китайская модель CLIP.
Саморазвитый китайский LLM в сочетании с графическими и текстовыми функциями CLIP используется в качестве модуля понимания текста винсентианского графа, позволяя «графической» большой модели лучше понимать китайские характерные концепции и уменьшать распространенные проблемы в области винсентианских графов. такие как сложные понятия и путаница атрибутов.
Однако, поскольку функция «Обзор игры с использованием ИИ» размещена в области комментариев, нам также следует взглянуть на то, как она работает в сценарии комментариев.
Воспользовавшись горячей темой, я ввел описание своего настроения: «Я очень расстроен, потому что не могу купить билет на поезд». «AI Game Review» все же сгенерировал несколько интересных изображений, которые могут лучше отразить эту эмоцию:
Из функции «Обзор игры AI» мы действительно можем увидеть некоторые мысли Куайшоу о применении больших моделей, то есть сильный упор делается на «посадку».
В отличие от многих более ранних компаний, которые стремились создавать продукты для больших моделей общего назначения, сообществам с коротким видеоконтентом, таким как Kuaishou, следует уделять больше внимания интеграции с сообществом при разработке функций продуктов для больших моделей и заботиться о том, смогут ли пользователи действительно их использовать. .
Так же, как и запущенная в августе функция «ИИ-диалог» на основе большой модели «Жуйи», часть ее основана на сценариях поиска, что позволяет пользователям более удобно и точно находить контент на платформе (ответы также будут сопровождаться соответствующими видео, ссылка на Энциклопедию), идея обслуживания пользователей распространяется и на «обзоры ИИ-игр».
Что касается того, почему большая модель «Кету» была впервые опубликована в комментариях на сайте Kuaishou, официальный ответ Kuaishou таков:
Конечно, теперь, когда «изображенная» большая модель стала продуктом, у Kuaishou могут быть большие амбиции.
Во время телеконференции по итогам первого квартала в мае этого года генеральный директор Kuaishou Чэн Исяо впервые рассказал внешнему миру о прогрессе крупного модельного бизнеса Kuaishou: была создана большая группа исследований и разработок моделей, опирающаяся на прошлые технологии AIGC. алгоритмы и крупномасштабные языковые модели. Накапливать и продвигать разработку и обучение крупных моделей в соответствии с планом.
Два месяца спустя, 8 июля, Kuaishou объявила, что начнет внутреннее тестирование своего «поискового интеллектуального продукта вопросов и ответов», положив начало запуску крупномасштабных модельных приложений.
Далее следует относительно интенсивный выпуск продуктов и функций: 8 августа Kuaishou приступила к внутреннему тестированию функции «Разговор с ИИ», 21 августа началось внутреннее тестирование большой языковой модели «Ruyi», а 15 сентября началось внутреннее тестирование основной веб-сайт запустил внутреннее тестирование функции «Обзор игры AI», и сегодня всплыла большая модель «Кету» Вэньшэнту...
Стоит отметить, что Kuaishou впервые официально и подробно представила ход своего крупного модельного бизнеса на конференции Photosynthetic Creator Conference, проводимой для создателей платформ 10 августа этого года.
На этой конференции компания Kuaishou объявила о ряде изменений в своем крупном модельном бизнесе, о которых до сих пор редко сообщалось внешнему миру. Сюда входят различные возможности для создания текста, изображений, видео и даже 3D-материалов и музыкального аудио, охватывающие все аспекты творческой стимуляции, добычи и редактирования материалов, а также создания видео. Он также фокусируется на сцене прямой трансляции, чтобы быстро создавать собственные Двойное цифровое человеческое решение «Куайшоу Жибо».
Даже сама ежегодная конференция, включая плакаты и выступления гостей, редко наполнена элементами AIGC.
Компания Kuaishou, которая решила разработать свою собственную большую модель с нуля, неосознанно накопила очень много и медленно создала то, что она называет «полнорежимным решением AIGC для большой модели».
Таким образом, можно сказать, что на этот раз Kuaishou хорошо подготовлена к запуску «настраиваемой» большой модели.
Хотя крупные отечественные компании в этом году начали выпускать собственные крупные модельные продукты, что касается контент-компаний, то, похоже, мы не увидели по-настоящему впечатляющего продукта. Как мы можем обучить надежную модель? На основе больших моделей , будут изучены новые способы игры для контент-компаний, и об этом очень интересно думать.