Выпущена новая модель Wenxin Big 4.0! Заявленные результаты тестирования GPT 4.0

Источник статьи: Geek Park

Автор | Ли Юань

Править | Цзин Юй

От поиска, библиотеки до бизнес-анализа — большие модели ИИ стали «вертикальной линией» Baidu.

«Добро пожаловать в эру генеративного ИИ! **」

17 октября 2023 года, одетый в белую рубашку и маленькие белые туфли, Робин Ли, основатель, председатель и генеральный директор Baidu, объявил о приходе на сцену новой эры.

На этой пресс-конференции под названием «Создавая будущее» Робин Ли официально представил последнюю версию 4.0 большой языковой модели компании, Wenxin Big Model, и научил людей, как использовать слова-подсказки, чтобы применить обновленную большую модель Wenxin, помогая людям использовать резервный фонд Пекина для покупки домов в провинции Хэбэй, создания рекламы и видео, а также создания онлайн-романов.

Робин Ли (Robin Li) напрямую сравнил Wenxin Model 4.0 с GPT-4 на встрече|Baidu

На встрече ** Робин Ли уверенно заявил, что возможности версии 4.0 модели Вэнь Синь «не меньше, чем у GPT-4».

При этом озвученное полгода назад заявление о том, что «все приложения стоит реконструировать большими моделями», также дало результаты на совещании в тот же день. От основного бизнес-поиска до библиотеки Baidu, сетевого диска, карты и других приложений семейства Baidu, они были подключены к большой модели Wenxin, демонстрируя лучшее взаимодействие и логические возможности.

На стороне «Б» Робин Ли также представил инструменты GBI (генеративный бизнес-анализ), а также офисных помощников с большими возможностями модели «Ruliu».

Если генеративный ИИ активирует весь технологический мир, то Baidu может стать гигантом, который получит наибольшую выгоду.

01 Вэнь Синь 4.0 Прямой бенчмарк GPT-4

Как только началась пресс-конференция, Робин Ли первым делом объявил о выпуске версии 4.0 модели Wenxin.

Baidu выделяет четыре определяющих критерия для возможностей больших моделей: понимание, генерация, логика и память. На этот раз Wen Xin Big Model 4.0 обновил инфраструктуру, инфраструктура осталась такой же, как и в версиях 3.0 и 3.5, но утверждает, что она значительно улучшена с точки зрения логики и памяти.

Робин Ли объявляет о выпуске Wenxin Grand Model 4.0|Baidu

По словам технического директора Baidu Ван Хайфэна, улучшение понимания и способности к генерации Wenxin Big Model 4.0 аналогично, в то время как улучшение логики в 3 раза больше, чем понимания, а улучшение памяти в 2 раза больше, чем понимания**.

Четыре различные возможности могут повысить эффективность различных сценариев приложений. Эти способности Ли Яньхун продемонстрировал на месте.

Понимание является основой для разговорного ИИ, чтобы помочь пользователям, и оно очень важно в государственных делах, маркетинге, обслуживании клиентов и других областях.

С точки зрения способности к пониманию, в сцене использовалась смена порядка слов и расплывчатое выражение (подсказка), чтобы проверить способность модели: «Я хочу вернуться в Чэндэ, чтобы купить дом, могу ли я использовать кредит резервного фонда?» А как насчет процедур? Я работаю в Пекине».

Чтобы понять это предложение, ИИ должен понять, что «работа в Пекине» и «возвращение в Чэндэ для покупки дома» на самом деле означают «выплату резервного фонда в Пекине, а хукоу находится в Чэндэ». Такого рода подтекст с китайской спецификой может дать точные ответы, которые нужны пользователям. И, конечно же, Вэнь Синь быстро понял ключ к вопросу и дал правильный ответ.

Робин Ли объясняет четыре основные возможности ИИ|Baidu

Способность к генерации может в основном повысить эффективность бренд-маркетинга, копирайтинга и творческой работы.

На месте происшествия Ли Яньхун показал, что по картинке с подсказками на естественном языке можно выполнять трансформацию фона, размытие предмета, а также создавать плакаты и копирайтинг в соответствии с информацией официального сайта.

В дополнение к этим традиционным методам обработки изображений, Baidu также продемонстрировала свою способность генерировать видео. Используя естественный язык, в ходе демонстрации в прямом эфире, Вэнь Синь сгенерировал цифровую устную видеорекламу человека почти без задержки. Видео включает в себя изображения продуктов, добавляет много переходного фона, и время от времени появляется цифровой человек в костюме, чтобы представить особенности продукта, собранные с официального сайта.

Демонстрация в реальном времени возможностей генерации рекламы Wenxin Model 4.0|Baidu

Эффект, который мог быть достигнут только за счет сотрудничества нескольких продуктов AIGC, был органично интегрирован в эту экспозицию. На создание одного рекламного ролика, 5 рекламных копий и плаката ушло менее 3 минут.

Логическое рассуждение, как правило, проявляется в виде проверки математической логики. На этой презентации Baidu подчеркнула свой потенциал в сфере образования.

Ли Яньхун дал прикладную задачу, связанную с преобразованием конического объема в объем куба, а Вэнь Синь не только дал решение, но и решил задачу шаг за шагом, а также проанализировал точки знаний, задействованные в каждом шаге.

Использовать генеративный искусственный интеллект для обучения детей домашним заданиям стало проще|Baidu

Для демонстрации способности к запоминанию выбор Baidu более особенный.

Baidu решила позволить Вэнь Синю написать сценарий романа о боевых искусствах. После того, как написание будет завершено, на первоначальном плане, позвольте большой модели усилить отношения между персонажами и увеличить драматический конфликт, чтобы показать, что большая модель может вспомнить первоначальный набросок и способности персонажа после добавления сложной информации, не используя бесцельное воображение.

Baidu также поделилась технической поддержкой для улучшения возможностей больших моделей Wenxin.

Ранее Baidu объявила, что модель Wenxin является первой крупной моделью, обученной с использованием кластера Wanka в Китае, и многие предполагают, что масштаб параметров модели Wenxin 4.0, как ожидается, превысит триллионный уровень. Однако на этой конференции Baidu не стала акцентировать внимание на уровне параметров большой модели.

В дополнение к обучению Wanka, технический директор Baidu также отметил, что средненедельный показатель стабильности обучения алгоритмов Baidu превысил 98%, а также была реализована технология повышения уровня знаний с точки зрения входных и выходных данных.

02 «Рефакторинг» Baidu Family Bucket

Несмотря на то, что они показаны по отдельности, на самом деле, чаще всего, четыре основные возможности больших моделей применяются в комплексе.

В мае Baidu объявила об использовании больших моделей для реконструкции приложений Baidu. На этой конференции компания Baidu также продемонстрировала последние достижения в области реконструкции больших моделей Wenxin.

Среди них самым удивительным является рефакторинг поиска.

В феврале Microsoft запустила новый Bing, основанный на технологии GPT, для рефакторинга поиска. В своем последнем выступлении Наделла из Microsoft сказал, что доля Microsoft на рынке поиска почти не изменилась с тех пор, как в Bing появились возможности искусственного интеллекта.

Компания Microsoft New Bing в основном запустила систему диалоговых ботов, которые могут общаться с New Bing, задавать вопросы, чтобы получить интегрированную информацию со ссылками. Бард от Google похож на него.

Baidu использует искусственный интеллект для реконструкции своего основного бизнес-поиска|Baidu

Однако поисковая реконструкция Baidu на этот раз углубляется во всю поисковую систему. Baidu описывает это как «максимальное удовлетворение, стимулирование рекомендаций и несколько раундов взаимодействия».

Конечное удовлетворение отражается в вводе вопроса в поисковую строку, Поиск больше не может дать ссылку, а напрямую сгенерировать лучший ответ.

В своем выступлении Робин Ли поднял вопрос о том, каков рейтинг промышленной добавленной стоимости различных стран за последние 20 лет.

В отличие от New Bing и Bard, которые могут дать ответ на связанные данные, новый Baidu может напрямую предоставить динамический табличный график в виде гистограммы, показывающий значения промышленного роста в разных странах. Этот график даже динамичен, растет и изменяется со временем.

Функция возбуждения рекомендаций в некоторой степени эквивалентна соответствующим вопросам текущей поисковой системы, которая может побудить пользователя продолжить понимать некоторые связанные вопросы в соответствии с подсказкой, например: «Какова взаимосвязь между промышленной добавленной стоимостью и ВВП?». «Каково влияние промышленности на развитие национальной экономики?».

Робин Ли (Robin Li) рассказывает о том, как искусственный интеллект реконструирует опыт применения корзин семейства Baidu|Baidu

И множественные раунды взаимодействия тоже очень интересны.

На нынешней волне предпринимательства с большими языковыми моделями один из многих предпринимателей усердно работает над использованием, то есть над использованием больших языковых моделей с рекомендательными движками для проведения нескольких раундов диалога, чтобы предоставить пользователям лучший выбор.

В сентябре Baidu провела проект конкурса предпринимательства Wenxin Cup, и обладатель первого приза Buysmart.AI стал лидером в этом направлении. Пользователи используют естественный язык и клики, чтобы постоянно уточнять свои потребности, а Buysmart.AI использует механизм рекомендаций, чтобы в конечном итоге рекомендовать продукты, в которых пользователи нуждаются больше всего.

Реконструированный поиск Baidu напрямую добавляет к поиску функцию аналогичного направления.

В демо-версии поисковая подсказка Baidu спрашивает: «Куда пойти в поход по Пекину?». После предоставления нескольких ответов, таких как Байхуашань, гора Хайтуо и т. д., поисковая система позволяет пользователям дополнительно нажимать, чтобы дополнить и выбрать свою собственную ситуацию. Например, если вы решите добавить новичков в походах для родителей и детей, поисковая система изменится и будет рекомендовать такие места, как Сишань и Байваншань, на которые относительно легко подняться и которые более дружелюбны к занятиям родителей и детей.

Помимо реконструкции поиска, Baidu также показала реконструкцию сетевого диска Baidu, карты Baidu, библиотеки Baidu и других приложений.

Облачный персональный облачный помощник Baidu Network Disk был запущен и раньше. Будучи первым в мире персональным облачным помощником, в настоящее время он насчитывает 20 миллионов пользователей. Вы можете использовать естественный язык для общения с ассистентом, найти видео в персональном облаке одним предложением, понять видеоконтент, найти определенный контент в видео, резюмировать золотое предложение видео и так далее.

Baidu Map, согласно рекламе Baidu, является первым в мире картографическим продуктом с искусственным интеллектом. Общение с помощником карты дает возможность получить доступ к тысячам сервисов в многоуровневом меню за один шаг. Вы также можете порекомендовать рестораны с подходящим расположением, выбрать из обстановки ресторана и, наконец, заказать такси напрямую.

Опираясь на миллиарды прошлых рукописных ресурсов, Baidu Wenku может напрямую выбирать тип необходимой статьи, серьезную научную литературу или общедоступные материалы после того, как пользователи ищут информацию по конкретным темам, и создавать статьи в один клик.

Реконструированная библиотека Baidu также добавляет функцию генерации PPT, которая может понять, являются ли представления сопоставленными или прогрессивными, и переключать стиль стиля PPT одним щелчком мыши, утверждает Baidu, что это «намного больше, чем другие инструменты генерации PPT на рынке».

03 Би-сайд Power

В этой демонстрации Baidu также продемонстрировала несколько новых приложений на стороне «Б».

Среди них Baidu сосредоточилась на запуске продукта бизнес-аналитики. Baidu GBI, Генеративная бизнес-аналитика.

Это новый продукт, запущенный компанией Baidu, который является первым продуктом генеративной бизнес-аналитики в Китае, способным поддерживать взаимодействие на естественном языке, анализ между базами данных и профессиональное обучение знаниям, сокращая работу по анализу данных, которую бизнес-аналитики могут выполнить за несколько дней до нескольких минут.

Продукты Baidu GBI, ориентированные на сторону «Б»|Baidu

В рекламном ролике вопрос «Какова ориентировочная стоимость?» Что такое нижний пол цены без потери денег? Заказчик попросил нас завершить доставку в течение 3 месяцев, можем ли мы это сделать? Какая длина самая быстрая? Если конкуренция правильная, например, наша низкая цена, что можно сделать?» На эту серию связанных вопросов по финансовому анализу, взаимодействию с проектами и анализу пользователей Baidu GBI может напрямую давать ответы через диалог на естественном языке и генерировать иллюстрированные ответы.

Эксперт не требуется, и для доступа к данным в базах данных и таблицах не требуются дополнительные операции. Кроме того, компании также могут обучать их, чтобы они получили профессиональные знания и стали отраслевыми экспертами.

Еще один продукт на стороне «Б» — Ruliu. После использования генеративного ИИ для рефакторинга, такого как Flow, можно одним щелчком мыши создавать протоколы совещаний, суммируя содержимое тысяч рабочих групп. В сочетании с CRM-системой компании предложите предысторию проекта и обсуждение проекта для менеджеров. В соответствии с личным маршрутом, планируйте рабочие планы, рассылайте приглашения на встречи и т.д.

В дополнение к созданию офиса, Baidu также продемонстрировала расширение возможностей больших моделей для автономного вождения, интеллектуальной кабины и правительственных проектов интеллектуального мониторинга.

С момента своего выпуска в течение более чем полугода Wenxin быстро реконструировал приложения Baidu и в то же время постепенно создает экосистему Wenxin.

На пресс-конференции Baidu также представила недавно запущенную платформу Lingjing. Будь то личные или корпоративные данные или приложения, их можно быстро превратить в плагин на платформе Lingjing, а API можно использовать для доступа к возможностям большой модели Wenxin.

Робин Ли предсказывает наступление экологической эры ИИ|Baidu

Baidu сообщила, что в текущем месяце с момента запуска платформы Lingjing 27 000 разработчиков подали заявки на обустройство, охватывая более 20 областей, включая юридические консультации, генерацию резюме, создание карт мозга, разговорную практику и другие нативные приложения в различных сценариях. Корпоративные конфиденциальные данные могут быть легко и быстро доступны с помощью возможностей этой современной большой модели без риска утечки.

«В Китае существует множество сценариев применения, и китайские пользователи, естественно, готовы принять новые технологии, а с помощью продвинутых базовых больших моделей мы можем построить процветающую экосистему искусственного интеллекта и совместно создать новый виток экономического роста». — сказал Ли Яньхун.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить