Полный текст выступления – 11500 слов | Baidu Робин Ли: Мы вступаем в эру искусственного интеллекта!

2023-10-17 06:44:46

Источник статьи: AI Dark Horse

Гость: Baidu Robin Li

Полевой рекорд: Темная лошадка предпринимательства

Мир вернулся к своему прежнему облику, и некоторые говорят, что у Робина есть серьезная реклама на сцене, раскрывающая футуристический смысл и любопытство технологических продуктов. Это надежда и резонанс будущего технологий на сцене и за ее пределами, компании и пользователей.

Всемирный конгресс Baidu 2023 — самая важная конференция Baidu по стратегии, технологиям и запуску продуктов, которая проводится уже 17 лет, начиная с 2006 года.

**17 октября темная лошадка предпринимательства была приглашена для участия во Всемирной конференции Baidu, на месте записала 10 важных материалов, а также разобралась с полным текстом выступления Робин Ли и поделилась им со всеми. **

Добро пожаловать в эру генеративного искусственного интеллекта! Самой большой инновацией в технологиях за последний год стало появление интеллекта из больших моделей, который является основой для разработки приложений, нативных на основе ИИ. Был официально выпущен Wenxin Model 4.0, реализующий комплексное обновление базовой модели, и значительно улучшивший ее понимание, генерацию, логику и возможности памяти, а всеобъемлющий уровень не меньше, чем у GPT-4.

2.AI. Нативные приложения ИИ — это приложения, разработанные на основе понимания, генерации, логики и возможностей памяти больших моделей. Эти возможности были недоступны в прошлые эпохи, что открывает неограниченное пространство для инноваций.

Генеративный ИИ и поиск — это пара, заключенная на небесах. Поиск Baidu был реконструирован на основе большой модели искусственного интеллекта, и новый поиск имеет три характеристики: чрезвычайная удовлетворенность, стимулирование рекомендаций и многоуровневое взаимодействие. Это не только повышает качество поиска, но и выходит за рамки применения поиска и расширяет границы продукта.
Baidu GBI - это первый генеративный продукт бизнес-аналитики в Китае, который может сократить работу по анализу данных и написанию отчетов, которую бизнес-аналитики могут выполнить более чем за десять дней, до минутного уровня, и является инструментом принятия решений, основанным на больших возможностях модели.
Библиотека Baidu — самый тщательный продукт реконструкции ИИ. Был представлен Baidu Wenku, основанный на реконструкции больших моделей, который превратился из «инструментов для контента» в «инструменты для повышения производительности». Он быстро развивается в таких функциях, как понимание материалов, написание статей, интеллектуальная генерация PPT и переключение стилей.
Сетевой диск Baidu завершил реконструкцию ИИ. Персональный облачный интеллектуальный помощник «Cloud One» осуществляет переход от взаимодействия с графическим интерфейсом к взаимодействию на естественном языке, улучшает понимание мультимодальной информации и может точно находить видео, резюмировать видеоконтент одним щелчком мыши и уточнять золотые предложения, лидируя в мире.
Плагин — это специальное нативное приложение на основе искусственного интеллекта, с самым низким пороговым значением и самое простое в использовании. Плагин расширяет возможности больших моделей, делая их более практичными и простыми в использовании, а также позволяет легко и быстро использовать многие корпоративные конфиденциальные данные без риска утечки.
Будущие нативные приложения ИИ должны быть мультимодальными, а автономное вождение является типичным применением визуальных больших моделей для реконструкции физического мира.
Baidu активно продвигает глубокую интеграцию цифровых технологий и реальной экономики, и технологии больших моделей применяются в производстве, энергетике, электроэнергетике, химической промышленности, транспорте и других реальных отраслях, используя интеллектуальную инспекцию для снижения потенциальных угроз безопасности, используя интеллектуальное планирование для сокращения цикла доставки, используя интеллектуальное принятие решений для повышения эффективности предприятия, интеллектуальное управление информацией для решения проблемы заторов на дорогах, а большая модель становится важной движущей силой для новой индустриализации.
Мы вступаем в эру искусственного интеллекта, эру взаимодействия человека и компьютера!

Ниже приводится полный текст выступления основателя и генерального директора Baidu Робина Ли под редакцией Dark Horse of Entrepreneurship:

Здравствуйте, гости! Добро пожаловать на Всемирный конгресс Baidu 2023!

Добро пожаловать в эру генеративного ИИ! **

**Тема конференции — нативные приложения на основе искусственного интеллекта. Я подробно поделюсь с вами опытом Baidu в процессе реконструкции нативных ИИ своих различных продуктовых линеек за последние несколько месяцев, и надеюсь, что он будет вам полезен. **

Как мы все знаем, нативные приложения ИИ разрабатываются на основе больших моделей. Самой большой инновацией в технологическом секторе за последний год, несомненно, стало появление интеллекта, вызванного большими моделями, который является основой для разработки приложений, нативных на основе ИИ.

Поэтому нативные приложения Baidu на основе искусственного интеллекта также разрабатываются на основе наших слов Вэнь Синя. Слова Вэнь Синя были впервые опубликованы 16 марта этого года, и с тех пор мы быстро прошли итерацию и получили одобрение на открытие миру 31 августа, получив много отзывов пользователей, и скорость инноваций ускоряется.

Сегодня я рад объявить об официальном выпуске Wenxin Grand Model 4.0.

В то же время мы начали приглашать на тесты. Друзья на месте происшествия, вам нужно только отсканировать QR-код на карте гостя, получить купон опыта, и вы можете войти на официальный сайт Wenxin Yiyan или в приложение Wenxin Yyyan, чтобы испытать Wenxin Model 4.0.

Это самая мощная большая модель Wenxin на данный момент, она достигла комплексного обновления базовой модели, понимания, генерации, логики и памяти четыре основные возможности, по сравнению с текущей версией Wenxin Yiyan были значительно улучшены, всеобъемлющий уровень не меньше, чем GPT4!

** Так называемое нативное приложение ИИ, как я понимаю, это приложение, разработанное на основе понимания, генерации, логики и возможностей памяти больших моделей. Эти возможности были недоступны в прошлые эпохи, поэтому они могут открыть неограниченное пространство для инноваций. **

Ниже я соберу сценарии применения, чтобы познакомить вас с четырьмя способностями слов Вэнь Синя. Приложение с этими четырьмя возможностями является нативным приложением эпохи ИИ.

** Во-первых, это способность понимать. Это самое удивительное, что я почувствовал после того, как соприкоснулся с большой моделью. **

В прошлом мы говорили, что ИИ — это «искусственная умственная отсталость», то есть ИИ часто не может понимать слова людей, и со временем с ним уже не хочется слишком много разговаривать.

Сегодня каждое слово, которое вы говорите, он, скорее всего, может понять, в разы лучше, чем ваши друзья и коллеги понимают то, что вы говорите.

Например, вы молодой человек, работающий в Пекине, который хочет купить дом в провинции Хэбэй и хочет узнать, можете ли вы подать заявку на получение кредита в резервном фонде в Пекине.

Давайте введем строку.

[Я хочу вернуться в Чэндэ, чтобы купить дом, могу ли я использовать кредит резервного фонда, что мне делать с процедурами?] Я работаю в Пекине. 】

Давайте посмотрим на результаты. Вэнь Синь ответил, что он может воспользоваться кредитом резервного фонда. Почему эти вопросы и ответы отражают способность понимать большую модель? На самом деле, то, что я только что привел, казалось бы, простое, имеет несколько небольших подводных камней, которые нужно понять:

Во-первых, это выражение «туда-сюда». Когда большинство людей звонят, чтобы задать вопросы, они думают о том, где сказать, не так строго, как этот, я сначала сказал о покупке дома и управлении резервным фондом, а в конце сказал «я работаю в Пекине», что выдвигает более высокие требования к пониманию.

Во-вторых, я намеренно использую здесь два расплывчатых выражения. Один из них — «работаю в Пекине», подтекст — «внести резервный фонд в Пекине», другой — «вернуться в Чэндэ, чтобы купить дом», просто слово «вернуться», на самом деле, подразумевая, что я, скорее всего, чэндэ хукоу.

В-третьих, Вэнь Синь объединил контекст и объединил все информационные точки вместе, чтобы точно понять реальный вопрос, а именно: «может ли пользователь, зарегистрированный по месту жительства в Чэндэ, провинция Хэбэй, использовать резервный фонд Пекина для покупки дома в Чэндэ с помощью кредита», а затем дал ответ и шаги по решению этого вопроса.

Видно, что в словах Вэнь Синя уже можно довольно точно понимать «неупорядоченные выражения, относительно расплывчатые намерения выражения и подтекст в словах». Эта способность имеет очень широкий спектр перспектив применения в государственных делах, маркетинге, обслуживании клиентов и других областях.

** Второй важной возможностью больших моделей является «генерация», которая может генерировать мультимодальный контент, такой как текст, изображения и видео. **

Так как же использовать генерирующую мощность? Я попросил Вэнь Синя сгенерировать набор креативов одним словом.

Сначала введите в него изображение, а затем абзац.

[Это новая энергетическая машина Чангана.] Пожалуйста, помогите мне сгенерировать два изображения с весной, яркими пейзажами на заднем плане и ощущением мчащейся машины. 】

Мы видим, что это поколение использует яркие весенние пейзажи на открытом воздухе, сопровождаемые размытием скорости.

Я попросил его сгенерировать вертикальный плакат непосредственно для меня.

[В сочетании с информацией Changan Qiyuan на официальном сайте Changan, сделайте вертикальный рекламный плакат и напишите простой и элегантный маркетинговый текст, перекликающийся со стилем кузова.] 】

Как видите, мы сгенерировали вертикальный рекламный постер как с изображениями, так и с текстом.

Теперь у нас есть рекламный плакат, и нам нужен более богатый рекламный текст, вы можете попросить Вэнь Синя написать еще несколько слов:

[В этом автомобиле особое внимание уделяется цифровому интеллекту, дизайну Fuguang и качественному вождению. Пожалуйста, напишите еще 5 рекламных материалов, каждый с коротким заголовком и описанием]

Копирайтинг, написанный искусственным интеллектом, который обладает красотой науки и техники, тенденцией времени, также подчеркивает взаимодействие человека и компьютера, копирайтинг более профессиональный и плавный, достиг стандарта бренд-маркетинга.

Так что же делать, если я все-таки хочу видео?

[Пожалуйста, объедините информацию об официальном веб-сайте и существующий видеоконтент, чтобы создать цифровое устное видео человека, я хочу запустить рекламу в ленте.] 】

Он был сгенерирован, затем мы открываем видео, чтобы увидеть эффект.

Это действительно более характерное цифровое видео, транслируемое населением, и оно также отражает характеристики этого автомобиля.

Теперь у нас есть 1 коммерческий фильм, 5 рекламных копий и 1 постер, и я дал Вэнь Синю только одно слово из фотоматериала и несколько слов, таких как «цифровой интеллектуальный автомобиль» и «качественное вождение», и весь процесс занял менее 3 минут.

Не так давно мы также использовали эту функцию для запуска маркетинговой креативной платформы AIGC Steering Engine, позволяющей одному человеку стать маркетинговой командой с искусственным интеллектом. Возможно, сегодня на сцене есть друзья-копирайтеры, которые, видя это, думаете ли вы, что большие модели могут принести больше творческого вдохновения и помочь вам повысить эффективность?

Теперь поговорим о третьей способности больших моделей — логике. **

Многим людям часто приходится помогать своим детям с домашними заданиями. Некоторые шутят, что «если ты не пишешь домашнее задание, мать — это сыновняя почтительность, а когда ты пишешь домашнее задание, курица мухнет, а собака прыгает». Итак, давайте разберемся, могут ли слова Вэнь Синя помочь родителям решить проблему репетиторства с домашними заданиями?

Давайте я сформулирую математическую задачу и посмотрю, как она работает:

[Конусообразная куча песка, площадь дна 8 квадратных метров, высота 12 дециметров, разложите эту кучу песка на дороге шириной 2 метра, толщиной 5 см, сколько метров можно проложить?] 】

Это своего рода математическая задача, которую мы, возможно, решали, когда были детьми, и, судя по ответу Вэнь Синя, логика ответа вполне ясна. Каждый шаг прописан. Родители могут увидеть, является ли он более подробным, чем то, что дается в некоторых учебных материалах.

Даже, ИИ может указать на точки знаний, используемые при решении задач, чтобы помочь детям закрепить знания, давайте спросим его еще раз:

[Какие очки знаний задействованы в описанном выше процессе решения проблем?] 】

Вэнь Синь ясно изложил знания, связанные с этим вопросом, такие как формула объема конуса, единая единица измерения, объем, остающийся неизменным, и решение уравнений. Это практично для учеников, учителей и родителей. После того, как эти знания будут четко усвоены, дети смогут делать выводы друг из друга.

Сверхлогическая способность большой модели, безусловно, может быть использована не только для решения задач. Планирование маршрутов для умных карт, умные помощники для сложных задач, управление светофорами в интеллектуальных транспортных системах и так далее — все это требует использования логических возможностей.

Теперь давайте посмотрим на четвертый момент, а именно на способность памяти большой модели. **

Память здесь в основном относится к тому, что вы сказали ранее, помнит ли ИИ это, контент, генерируемый ИИ, будет ли он противоречивым. Это важный показатель, позволяющий отличить интеллект крупных моделей, а многораундовый диалог является воплощением способности к запоминанию.

Я знаю, что многие творцы используют Вэнь Синь для написания романов. И если содержание романа противоречиво, то он не читабельен. Сегодня я попрошу его написать роман на месте, перемежать некоторые отвлекающие факторы вопросами и посмотреть, сможет ли он вспомнить, что он написал.

Сначала я введу один:

[Пожалуйста, помогите мне написать роман о боевых искусствах, главная героиня — женщина, и в сюжете есть взлеты и падения.] 】

Что ж, посмотрим, канва романа вышла:

Во-первых, это предыстория истории, в древнем мире боевых искусств поднимаются темные силы; Героиню зовут Лин'эр, и она обладает способностью манипулировать внутренними силами и бегством.

Сначала я введу один:

Что ж, посмотрим, канва романа вышла:

Далее, начало истории. Лин'эр хочет победить темные силы и спасти боевые искусства. В кульминационный момент романа она сражается не на жизнь, а на смерть со злодеем, побеждает злодея и спасает боевые искусства и все секты.

В конце концов, Лин'эр и её союзники вместе основали Институт Культивирования Внутренней Силы.

Теперь, когда история в основном сформирована, но она немного проста, я хочу добавить еще несколько требований к персонажам:

[Теперь отношения между персонажами слишком просты, есть только два персонажа, и добавлено еще 4 персонажа]

Вэнь Синь дал еще четыре роли одним словом, каждая с разной идентичностью и личностью, с разным характером, этот Муронг Гучэн - поколение гроссмейстеров, и есть пророк Сяо Ханьян, который может предсказывать будущее.

Но теперь в романе все еще есть необходимый элемент — драматический конфликт. История без конфликта — это не очень хорошая история, а процесс победы героини над темными силами сейчас слишком прост, давайте посмотрим, сможем ли мы сделать его более сложным.

Введите еще один

[Также необходимо добавить в историю драматический конфликт основной линии, чтобы сделать историю более смотрибельной]

Мы видим, что это уже написано для драматического конфликта. Здесь происходит разворот, за темными силами настоящим лидером является весьма уважаемая фигура уровня гроссмейстера, которая несколько раз подвергала героиню опасности. До решающей битвы у героини был шанс дать отпор.

Как видите, он помнит, что основной линией истории является противостояние Лин'эр с темными силами, и конфликт также вращается вокруг этой основной линии.

Итак, помнит ли Вэнь Синь историю, которую он только что написал, и соотносит этих персонажей с историей?

Сделаем еще одну просьбу:

[Внесите этих персонажей в набросок истории, которую вы придумали для меня, и придумайте название.] 】

Результаты были показаны на большом экране, а роман называется «Праведная битва рек и озер», что добавляет в сюжетную канву дополнительных персонажей и драматические конфликты. Четвертая и пятая главы также говорят нам о том, что великим мастером этого злодея является Муронг Гучэн, который только что был представлен.

На протяжении всего процесса я продолжал увеличивать сложность и выдвигать новые требования, чтобы вмешаться в его память, а Вэнь Синь все еще помнил все предыдущие потребности и ответы, и мог точно соответствовать сюжетной линии и персонажам, и его память была очень удивительной.

Тогда все на тестовой сцене сейчас, помните, в чем особая способность главного героя Лингера?

Может быть, большинство людей не помнят, так что давайте посмотрим, помнит ли Вэнь Синь?

[Какой способностью обладает героиня?] 】

Что ж, ответ очевиден, это способность манипулировать внутренними силами и полетом. Это пример текста, написанного Вэнь Синем в первом раунде диалога. Теперь, после пяти раундов диалога и нескольких тысяч слов вымысла, он все еще может вспомнить то, что писал раньше, а именно способность памяти большой модели.

Мы только что познакомились с четырьмя способностями большой модели, конечно, в большинстве случаев эти четыре способности появляются не сами по себе, они дополняют друг друга. **

Например, чтобы создать рекламный текст, ему нужно понять тему создания, прояснить логику создания и сохранить последовательность через память.

При решении задач также необходимо всесторонне применять умение понимать, генерировать, логика, запоминать.

Давайте рассмотрим исчерпывающий пример приложения:

Первым делом мы открываем реконструированное приложение Baidu, сканируем камерой вынутую пациентом коробку с лекарствами, и нет необходимости просматривать инструкцию мелким шрифтом, а цифровой врач-человек поможет объяснить.

Вопросы, появившиеся на экране только что, такие как «есть ли до или после еды», «можно ли пить алкоголь», «какие еще меры предосторожности», многие пациенты при ежедневном приеме лекарств столкнутся с проблемами.

Мы видим, что большая модель может не только помочь пациентам интерпретировать инструкции к препарату, но и объединить персонализированные потребности для повышения эффективности лечения и обеспечения точности и своевременности назначения лекарств пациентам.

Не так давно мы объединили модель Вэнь Синь с профессиональными медицинскими знаниями и выпустили Большую Модель Духовной Медицины, которая может помочь пациентам и врачам общаться и создавать медицинские записи, применяя Бота Духовной Медицины. В этом примере используется не только способность понимать и генерировать логическую память, но и способность к мультимодальной речи, зрению и так далее.

Предыдущая демонстрация в основном отражает прогресс модели Вэньсинь в четырех способностях: понимании, генерации, логике и памяти, которые являются основой для выживания всех нативных приложений ИИ. Точно так же без богатой экосистемы нативных приложений ИИ, построенной на основе базовой модели, большая модель бесполезна.

В мае я публично заявил, что Baidu станет первой компанией, которая реструктурирует все продукты, и мы будем использовать мышление ИИ для создания нативных приложений ИИ.

** За последние несколько месяцев наши поисковые запросы, такие как потоки, карты, онлайн-диски, библиотеки и т. д., встретят вас с новым видом. За этот период я наступил на множество ям, и я готов поделиться с вами, надеюсь, вы сможете пойти по менее кривым дорогам в процессе развития. **

Далее я покажу вам, как выглядят эти изделия, реконструированные с помощью больших моделей? Это также должно расширить воображение каждого и вдохновить всех на создание более удивительных нативных приложений на основе ИИ.

Первое, что я вам покажу, это поиск, с которого начался Baidu. У многих людей складывается впечатление, что вы вводите ключевое слово, а Baidu выдает вам веб-ссылку. Только не это!

Baidu новый поиск, при открытии интерфейса, помимо того, что вы увидите поисковую строку, результаты поиска будут полностью отличаться от прошлых.

** Реконструированный новый поиск имеет три характеристики: крайняя удовлетворенность, стимулирование рекомендаций и несколько раундов взаимодействия. **

Что такое окончательное удовлетворение? Когда вы вводите вопрос в поле поиска, например «Что такое MBTI?» «Как припарковаться на обочине», новый поиск больше не для того, чтобы выдать вам кучу ссылок, а для того, чтобы понять через большую модель и сгенерировать лучший ответ

Например, если вы спросите «рейтинг добавленной стоимости промышленности по странам за последние 20 лет», новый поиск не только подскажет вам ответ напрямую, но и покажет ответ с динамическими диаграммами.

С большого экрана позади меня я вижу, что за последние два десятилетия наша промышленная промышленность пережила бурное развитие и превращается из страны-производителя в производственную державу.

Это и есть высшее удовлетворение: один шаг, чтобы дать вам окончательный ответ.

Итак, второй шаг, после того, как вы увидели ответ, что еще вы хотите увидеть?

Здесь используется рекомендательная стимуляция. Например, после динамического графика функция возбуждения рекомендаций также выдает «какова взаимосвязь между промышленной добавленной стоимостью и ВВП» и «каково влияние промышленности на развитие национальной экономики», эти вопросы также могут вас волновать. Нажмите, чтобы получить ответ.

Конечно, не на все вопросы есть один правильный ответ. Потребности пользователей иногда могут быть сложными, и это не понятно в одном-двух предложениях. Кроме того, пользователям сложно за один раз полностью выразить очень сложное требование через большое описание.

В настоящее время нам необходимо использовать более новую и персонализированную модель поиска для обслуживания пользователей, а именно: многоуровневое взаимодействие.

Давайте посмотрим на этот пример:

Например, если вы спросите «где рекомендуется заняться альпинизмом в окрестностях Пекина», он даст несколько ответов, таких как гора Байхуа и гора Хайтуо, с уклоном в сторону пешеходных маршрутов;

Затем, он дает несколько подсказок, чтобы дополнить ваш выбор ситуации, вы можете выбрать между новичками, родителем-ребенком и просмотром опавших листьев. Теперь он изменился, чтобы рекомендовать Западную гору и гору Байванг, на которые относительно легко подняться и которые более дружелюбны к занятиям родителей и детей.

Тогда продолжайте спрашивать, какое снаряжение вам нужно для альпинизма и походов? Ответом были треккинговые палки, походная обувь и т.д., а также вспомнила, что ранее выбрала тур для родителей и детей, и особенно дала советы, как ухаживать за детьми.

Можно сказать, что генеративный ИИ и поиск — это пара, заключенная на небесах.

Поиск, хотя он по-прежнему начинается с этого простого окна, но следующий шаг за шагом, превзошел и реконструировал первоначальный режим поиска, не только улучшил качество поиска, но и пробил область применения поиска и расширил границы продукта. такой

Интерактивный поиск на основе искусственного интеллекта возглавит трансформацию поколений поисковой индустрии.

В ближайшем будущем поиск станет близким помощником, способным в любой момент вызывать, решать проблемы и даже ломать ограничения «конца», чтобы в любое время и в любом месте откликнуться, удовлетворить потребности и сопровождать весь процесс.

Далее давайте посмотрим на второй продукт нативного мышления ИИ, Baidu GBI, Generative Business Intelligence, то есть генеративную бизнес-аналитику. **

Это продукт с нуля, а не рефакторинг существующего продукта. **

В нашем деловом мире самым неотделимым является бизнес-анализ, то есть BI, как принимать самые быстрые бизнес-решения? Давайте сначала почувствуем через видео:

Как видим, на видео президент задал множество профессиональных вопросов. Есть и финансовый анализ, и реализация проектов, и анализ пользователей, а помощник президента GBI может быстро дать результаты и позволить президенту принимать решения на месте.

Это инструмент принятия решений, основанный на больших модельных возможностях, первый генеративный продукт бизнес-аналитики в Китае, Baidu GBI. С GBI делайте все быстро!

Мало того, что люди с продвинутыми инструментами не будут заменены искусственным интеллектом, так еще и «продвижение по службе и повышение — это не мечта». Люди, которые не используют продвинутые инструменты, рискуют потерять работу. **

Итак, как же Baidu GBI удалось сделать шаг вперед? Он подрывает традиционный анализ данных тремя способами:

Во-первых, традиционной BI могут управлять только профессионалы, в то время как GBI может напрямую понимать вопросы президента и выполнять их в режиме реального времени;

Во-вторых, GBI предоставляет удобный способ доступа, предприятия могут получать доступ к данным, задавать вопросы и анализировать любые данные на естественном языке, и больше не нужно вручную выполнять различные профессиональные операции над базами данных и таблицами;

В-третьих, GBI также обладает способностью к обучению, и компании могут привнести свой собственный отраслевой опыт, чтобы стать отраслевыми экспертами.

Это Baidu GBI, который может сократить работу по анализу данных и написанию отчетов, которую бизнес-аналитики могут выполнить за десяток дней, до уровня минуты. Так называемые боевые искусства мира могут быть сломаны только быстро;

** Корпоративная конкуренция, не большая рыба ест маленькую рыбу, а быстрая рыба ест медленную рыбу, быстрее принимает решения, чем конкуренты, вполне вероятно, что вы выиграете! **

Говоря о быстром принятии решений, в Baidu мы полагаемся на платформу умного офиса под названием Ruliu, а также переосмыслили это приложение с помощью искусственного интеллекта.

Сегодня он стал супер помощником, без которого не могут обойтись люди в Baidu.

Теперь все, пожалуйста, видите, это похоже на поток, делающий запись в реальном времени. Давайте посмотрим, сможет ли он запомнить все только что упомянутые пункты:

Это функция генерации протоколов заседаний одним щелчком мыши. Мы говорим, что эффективное проведение совещаний – это техническая работа. Эта функция значительно снижает нагрузку на совещание и сокращает время совещания на 40%.

Еще один распространенный сценарий — рабочие группы. Большинство людей на рабочем месте часто подвергаются бомбардировке различными сообщениями в групповом чате. Тогда быстрое подведение итогов группового чата становится крайне полезной функцией.

Давайте посмотрим, как его используют наши продакт-менеджеры.

У него 9 рабочих групп, задержка на определенный период времени, может быть более тысячи непрочитанной информации, и Ruliu может не только «1000 сообщений, получить фокус за одну секунду», но и грамотно разделить контент, который нужно прочитать, на несколько категорий: «жду моего подтверждения», «сосредоточьтесь на», «обсуждение темы», что значительно повышает эффективность работы.

Так будет ли он точным, будет ли он неправильно понят или в нем будет упущена ключевая информация? Это проверяет способность понимать и создавать большие модели. Чем глубже понимание, тем точнее резюме. Не говорите, что 1 000, 10 000 единиц информации, например, суперпомощник потока также может дать интеллектуальную классификацию и интеллектуальное резюме за несколько секунд.

Давайте посмотрим на другой сценарий на работе: путешествия.

Авиабилеты, гостиницы, переговоры и т.д., эти транзакционные задачи утомительны и отнимают много времени! Если бы у вас был помощник с искусственным интеллектом, который помогал бы вам решать тривиальные задачи, вы бы хотели работать больше?

Например, недавно менеджер по продукту Ruliu планировал поездку в Шанхай, чтобы встретиться с г-ном Ваном из PICC. Мы знаем, что PICC продвигает инновации в продуктах и услугах, бизнес-моделях, цифровых технологиях и других аспектах, и наша технология искусственного интеллекта в Baidu может сыграть свою роль.

Этот маршрут командировки можно передать супер помощнику Рулиу, и давайте посмотрим на его работу.

Супер помощник может организовать поездку на основе информации о своем расписании.

Например, последняя встреча заканчивается в 4 часа, поэтому бронируйте рейс после 7:30; И, в соответствии с его туристическими стандартами, помочь ему найти отели, где он может остановиться. Наконец, было выдано приглашение заказчику.

Ему может понадобиться некоторый бэкграунд перед встречей с клиентом, и суперассистент также может помочь ему в этом. Благодаря соединению с CRM и другими системными данными компании, такими как поток, предоставляются подробные данные, такие как совместные проекты и записи посещений.

Понимание ситуации делового сотрудничества и внешней информации, такой как поток, также может помочь ему сгенерировать ссылку на обсуждение, заранее задать вопросы, которые может задать клиент, и дать некоторые предложения по сотрудничеству. С этой точки зрения Рулиу больше похож на настоящего помощника?

Мы только что видели, что всего тремя словами Рулиу завершил бронирование путевых квитанций, машинного вина и расписаний, и даже подготовил справочные материалы для переговоров, что является «путешествием в один клик» Рулиу. Как он это делает?

Это комплексное применение способности к пониманию, генерации, логике и памяти большой модели, которая автоматически разбирает сложные задачи на несколько простых задач для выполнения по отдельности, а затем объединяет их для получения конечного результата. Мы говорим, что повышение эффективности означает повышение конкурентоспособности, например, использование «умной работы» вместо «тяжелой работы».

Теперь давайте взглянем на новую библиотеку Baidu. Это также продукт, который, как мне кажется, был полностью переработан. **

Библиотека Baidu полностью изменит наши привычки в работе, обучении и творчестве.

Как мы творили в прошлом? Например, вы выступаете с докладом о применении ИИ в психологии. На проверку информации, сортировку материалов, написание рукописей, написание PPT и оформление PPT уходит несколько дней.

Сегодня на Baidu Wenko можно начать работу с одного предложения, посмотреть на большой экран: сначала хочешь, чтобы он написал речь, а он находит десятки материалов на тему искусственного интеллекта и психологии.

Он также может определить, какие из них являются научными журналами, авторитетными отчетами, а какие просто массовыми материалами. Если вы хотите написать живую статью, выбирайте какие-то популярные материалы, например, эссе и научно-популярные материалы.

Затем, если вы хотите строгую академическую речь, вы можете проверить только авторитетный контент, чтобы убедиться в его точности. Затем, изучив эти рукописи, библиотека создает хорошо структурированную и четко определенную статью, одновременно шлифуя и форматируя содержание.

Это можно сделать, потому что у Baidu Wenku уже есть 1 миллиард качественных документов, основанных на понимании этого содержания, пишите действительно практичные и понятные документы, а не серьезную ерунду как многие большие модели, и это не будет общим пустым звуком.

Далее презентация также нуждается в PPT. Библиотека может объединить рукопись прямо сейчас с некоторыми из собранных вами материалов, чтобы автоматически сгенерировать структуру PPT, а затем украсить рисунок, чтобы сделать PPT из десятков страниц.

Есть также некоторые игровые процессы с возможностями мультимодальной генерации, такие как выбор стиля и переключение стилей одним щелчком мыши. Но есть некоторые места, которые больше проверяют возможности библиотеки и требуют от нее точного понимания содержания. Например, он должен знать взаимосвязь между идеями, независимо от того, сопоставлены они или подчинены, чтобы разработать правильную диаграмму.

Благодаря этой способности понимать, библиотека также может написать соответствующий речевой сценарий для этого PPT на основе генерации PPT. В придачу к этому, он также может использовать этот контент, чтобы вывести вопросы, которые аудитория может задать, и подготовить вас к ответам.

Мы оценили, что способность генерировать библиотеки, особенно PPT, намного превосходит любой другой инструмент на рынке, как зарубежный, так и отечественный. Раньше люди приходили в библиотеку, чтобы найти готовый контент. В будущем люди смогут создавать контент так, как они хотят, более эффективно, чем любой другой инструмент для повышения производительности.

Основываясь на четырех возможностях модели Wenxin, не будет преувеличением сказать, что Baidu Wenku коренным образом изменила свою жизнь и завершила эволюцию от «инструментов для работы с контентом» до «инструментов для повышения производительности»**.

Не так давно, в первый день работы новой версии Baidu Wenku, новая функция искусственного интеллекта принесла более 2 миллионов опытов. Теперь мы с большей уверенностью можем сказать, что в эпоху больших моделей Baidu Wenku является лучшей отправной точкой для производства контента.

Как и Wenku, сетевой диск Baidu также является знакомым старым другом. За последние 11 лет сетевой диск Baidu обслужил 800 миллионов пользователей, объем файлов достиг 4 триллионов, а пользователи ежедневно загружают более 1 миллиарда изображений.

В направлении реконструкции ИИ сетевой диск Baidu фокусируется на том, чтобы хорошо поработать в интеллектуальных сервисах для личных файлов.

То, что вы видите сейчас, - это новая домашняя страница сетевого диска Baidu.

**Реконструированный сетевой диск не только реализует переход от взаимодействия графического интерфейса к взаимодействию на естественном языке, но и улучшает понимание мультимодальной информации. **

Теперь, с помощью всего одного предложения, вы можете работать с файлами, изображениями, видео и т. д. на вашем онлайн-диске.

Это сетевой диск Baidu «Cloud One», который является первым в отрасли и даже первым в мире персональным облачным интеллектуальным помощником. Давайте почувствуем, какие болевые точки может решить «Cloud One» и принести новые впечатления?

Первым делом нужно найти картинки или видео. Иногда, мы думаем о какой-то картинке и хотим найти ее на сетевом диске, часто после многих шагов, ворочаясь полдня не удается найти. Теперь вы говорите слово «Cloud One», и оно может помочь вам точно определить его:

Что ж, это помогло мне быстро найти то, что главный научный сотрудник OpenAI LLYA опросил о трансформаторах.

За этим, казалось бы, простым поиском стоит роль нескольких возможностей искусственного интеллекта, которые должны быть в состоянии понимать видеоконтент, идентифицировать персонажей и формировать контекстные воспоминания для точного определения местоположения определенного кадра видео, что является очень ведущей технологией в области глобального персонального облака.

Вторая функция Yunyi — помочь пользователям быстро разобраться в содержании видео, давайте посмотрим:

Вы можете видеть, что демонстрируются две способности, одна из которых - это способность резюмировать и резюмировать содержание, и способность извлекать золотые предложения. Это 43-минутное интервью, в котором, благодаря пониманию и логическим способностям ИИ, Юнь Идуо подытожил и усовершенствовал видео, представив Лью и его основные идеи.

Но много раз мы будем чувствовать, что оригинальный текст очень интересен, после выделения основной идеи или резюме, он не так привлекателен, поэтому вторая функция как раз сейчас, я думаю, она на самом деле более полезна для меня, то есть мы должны найти самую захватывающую часть оригинального видео, которая - это те самые золотые предложения. Например, LLYA говорит, что «изучение статистических законов гораздо важнее, чем наблюдение за внешностью». Ключевым прорывом в извлечении этого золотого предложения является эффективное извлечение мультимодальной информации, которая является ведущей мировой технологией. Он может найти лучшие части из длинного содержания интервью, что значительно повышает эффективность нашего обучения и работы.

Это новый сетевой диск после реконструкции ИИ. По состоянию на вчерашний день количество пользователей Yunyi достигло 20 миллионов.

Это интеллектуальный помощник с искусственным интеллектом на базе персонального облака. В последнее десятилетие компания Baidu определила то, что называется сетевым диском; В следующем десятилетии Baidu будет использовать искусственный интеллект для переосмысления новых сетевых дисков.

Теперь давайте посмотрим на более исторический продукт — Baidu Map. **

Мы реконструировали этот продукт 18-летней давности с помощью нативного мышления ИИ, который также является первым в мире картографическим продуктом на основе искусственного интеллекта.

За последние 18 лет Baidu Maps накопил множество функций, он может ориентироваться, ловить такси, находить подменного водителя, бронировать отель, покупать билет и даже удовлетворять потребности поиска POI в более сложных условиях. В прошлом эти операции были сложными и часто требовали шести-семи или более шагов для выполнения;

Теперь, пока пользователь говорит о спросе, карта может мобилизовать тысячи интерфейсов API сервиса, а многоуровневое меню становится одношаговым прямым и быстрым ответом.

Давайте посмотрим далее, как реализована карта Baidu?

В видео пользователи тестируют понимание Baidu Map пан-спроса, выбор промежуточных мест встречи, сравнение информации из нескольких мест, а также рекомендации и бронирование будущих поездок, и это дает разумные решения.

Это связано с тем, что способность Вэнь Синя говорить была объединена с уникальными знаниями о точках интереса на миллиард уровней карты и триллионными данными о восприятии трафика, и к нему можно обратиться в любое время, чтобы дать рекомендации. Реконструированная карта Baidu — это не только навигация, но и наш путеводитель. Чем ты умнее, чем ты умнее, тем больше ты себя понимаешь.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

2 Лайков

Награда
2
комментарий
Поделиться

комментарий

0/400

Нет комментариев

Тема
1/3
1CandyDrop Airdrop Event 6.0
26k Популярность
2White House Crypto Report
35k Популярность
3Join Alpha RION Airdrop to Earn $40
17k Популярность
4Fed Holds Rates Decision
8k Популярность
5July Spark Program TOP 10 Creators Announced
2k Популярность

Закрепить

Карта сайта