Світ повернувся до колишнього вигляду, і деякі люди кажуть, що у Робіна на сцені серйозна реклама, що розкриває футуристичний сенс і цікавість технологічних продуктів. Це надія та резонанс майбутнього технологій на сцені та поза нею, компанії та користувачів.
Baidu World Congress 2023 – найважливіша конференція Baidu зі стратегії, технологій та запуску продуктів, яка проводиться вже 17 років, починаючи з 2006 року.
** 17 жовтня темна конячка підприємництва була запрошена до участі у Всесвітній конференції Baidu, на місці записала 10 важливих матеріалів, розібрала повний текст виступу Робіна Лі та поділилася ним з усіма. **
Ласкаво просимо в еру генеративного штучного інтелекту! Найбільшою інновацією в технологіях за останній рік стала поява інтелекту з великих моделей, що є основою для розробки додатків, нативних для штучного інтелекту. Wenxin Model 4.0 була офіційно випущена, реалізувавши комплексне оновлення базової моделі, і значно покращила її розуміння, генерацію, логіку та можливості пам'яті, а всебічний рівень не менший, ніж у GPT-4.
2.AI нативні додатки – це програми, розроблені на основі розуміння, генерації, логіки та можливостей пам'яті великих моделей. Ці можливості були недоступні в минулі епохи, що відкривало необмежений простір для інновацій.
Генеративний ШІ та пошук – це збіг, створений на небесах. Пошук Baidu був реконструйований на основі великої моделі штучного інтелекту, і новий пошук має три характеристики: надзвичайне задоволення, стимуляція рекомендацій і багатораундова взаємодія. Він не тільки підвищує якість пошуку, але і пробиває сферу застосування пошуку і розширює межі товару.
Baidu GBI є першим генеративним продуктом бізнес-аналітики в Китаї, який може скоротити роботу з аналізу даних і написання звітів, яку бізнес-аналітики можуть виконати більш ніж за десять днів, до хвилинного рівня, і є інструментом прийняття рішень, заснованим на великих можливостях моделі.
Бібліотека Baidu є найґрунтовнішим продуктом реконструкції штучного інтелекту. Було представлено Baidu Wenku, який базується на реконструкції великої моделі, перетворившись із «інструментів контенту» на «інструменти продуктивності». Він швидко розвивається в таких функціях, як розуміння матеріалів, написання статей, інтелектуальна генерація PPT і зміна стилю.
Мережевий диск Baidu завершив реконструкцію штучного інтелекту. Персональний хмарний інтелектуальний помічник «Cloud One» реалізує перехід від взаємодії з графічним інтерфейсом до взаємодії природною мовою, покращує розуміння мультимодальної інформації та може точно визначати місцезнаходження відео, узагальнювати відеоконтент одним клацанням миші та вдосконалювати золоті речення, лідируючи у світі.
Plug-in – це спеціальна нативна програма зі штучним інтелектом, з найнижчим порогом і найпростіша у використанні. Плагін розширює можливості великих моделей, роблячи їх більш практичними та простими у використанні, а також дозволяє легко та швидко використовувати багато корпоративних приватних даних без ризику витоку.
Майбутні нативні додатки штучного інтелекту повинні бути мультимодальними, а автономне водіння є типовим застосуванням візуальних великих моделей для реконструкції фізичного світу.
Baidu енергійно просуває глибоку інтеграцію цифрових технологій і реальної економіки, і технологія великих моделей застосовується у виробництві, енергетиці, електроенергетиці, хімічній промисловості, транспорті та інших реальних галузях, використовуючи інтелектуальну інспекцію для зменшення потенційних загроз безпеці, використовуючи інтелектуальне планування для скорочення циклу доставки, використовуючи інтелектуальне прийняття рішень для підвищення ефективності підприємства, інтелектуальний інформаційний контроль для вирішення заторів на дорогах, а велика модель стає важливою рушійною силою нової індустріалізації.
Ми ось-ось вступимо в еру рідного штучного інтелекту, еру взаємодії людини та комп'ютера!
Нижче наведено повний текст виступу засновника та генерального директора Baidu Робіна Лі під редакцією Dark Horse of Entrepreneurship:
Привіт гостям! Ласкаво просимо на Всесвітній конгрес Baidu 2023!
Ласкаво просимо в еру генеративного ШІ! **
**Тема цієї конференції – нативні додатки штучного інтелекту. Я детально поділюся з вами досвідом Baidu в процесі нативної реконструкції штучним інтелектом різних лінійок продуктів за останні кілька місяців, і сподіваюся, що він буде вам корисний. **
Як ми всі знаємо, нативні програми штучного інтелекту розробляються на основі великих моделей. Найбільшою інновацією в технологічному секторі за останній рік, безсумнівно, стала поява інтелекту, викликаного великими моделями, що є основою для розробки додатків, нативних для штучного інтелекту.
Тому нативні програми штучного інтелекту Baidu також розробляються на основі наших слів Вень Сінь. Слова Вень Сіня вперше були оприлюднені 16 березня цього року, і з тих пір ми швидко повторили і отримали дозвіл на відкриття для світу 31 серпня, отримавши багато відгуків користувачів, а швидкість інновацій прискорюється.
Сьогодні я радий оголосити про офіційний реліз Wenxin Grand Model 4.0.
Паралельно ми почали запрошувати на тести. Друзі на місці події, вам потрібно лише відсканувати QR-код на картці гостя, отримати купон на враження, і ви можете увійти на офіційний веб-сайт Wenxin Yiyan або додаток Wenxin Yiyan, щоб випробувати Wenxin Model 4.0.
Це найпотужніша велика модель Wenxin на сьогоднішній день, вона досягла комплексного оновлення базової моделі, розуміння, генерації, логіки та пам'яті чотири основні можливості, порівняно з поточною версією Wenxin Yiyan були значно покращені, всеосяжний рівень не менше GPT4!
**Так званий AI нативний додаток, як я розумію, це додаток, розроблений на основі розуміння, генерації, логіки та можливостей пам'яті великих моделей. Ці можливості були недоступні в минулі епохи, тому вони можуть відкрити необмежений простір для інновацій. **
Нижче я об'єднаю сценарії застосування, щоб познайомити вас з чотирма можливостями слів Вень Сіня. Додаток з цими чотирма можливостями є рідним додатком епохи штучного інтелекту.
** По-перше, це вміння розуміти. Це найдивовижніше, що я відчула після того, як познайомилася з великою моделлю. **
Раніше ми говорили, що ШІ – це «штучна інтелектуальна інвалідність», тобто ШІ часто не може розуміти слова людей, і з часом ви не наважуєтеся з ним занадто багато розмовляти.
Сьогодні кожне слово, яке ви говорите, він, швидше за все, може зрозуміти, у багато разів краще, ніж ваші друзі та колеги розуміють те, що ви говорите.
Наприклад, ви молодий чоловік, який працює в Пекіні, хоче купити будинок у Хебеї та хоче знати, чи можете ви подати заявку на позику в Пекіні.
Давайте введемо рядок.
[Я хочу повернутися в Ченде, щоб купити будинок, чи можу я скористатися позикою з резервного фонду, що мені робити з процедурами?] Я працюю в Пекіні. 】
Давайте подивимося на результати. Вень Сінь відповів, що може скористатися позикою з резервного фонду. Чому ці запитання та відповіді відображають здатність розуміти велику модель? Насправді, те, що я щойно навів, здавалося б, просте, має кілька невеликих підводних каменів, які потрібно зрозуміти:
Перш за все, це вираз туди-сюди. Коли більшість людей телефонують, щоб задати питання, вони думають, де сказати, не так суворо, як цей, я спочатку говорив про купівлю будинку і управління фондом забезпечення, а потім говорив «Я працюю в Пекіні», що висуває більш високі вимоги до розуміння.
По-друге, я навмисно використовую тут два розпливчастих вирази. Один з них – «працюю в Пекіні», підтекст – «покладіть резервний фонд у Пекіні», інший – «поверніться в Ченде, щоб купити будинок», просто слово «повернення», по суті, маючи на увазі, що я, швидше за все, ченде хукоу.
По-третє, Вень Сінь об'єднав контекст і об'єднав усі інформаційні моменти разом, щоб точно зрозуміти справжнє питання, а саме: «Чи може користувач, який зареєстрував домогосподарство в Ченде, провінція Хебей, використати резервний фонд Пекіна, щоб купити будинок у Ченде за допомогою кредиту», а потім дав відповідь і кроки щодо вирішення цього питання.
Видно, що в словах Вень Сіня вже можна досить точно розуміти «невпорядковані вирази, відносно розпливчасті наміри вираження і підтекст в словах». Ця здатність має дуже широкий спектр перспектив застосування в державних справах, маркетингу, обслуговуванні клієнтів та інших сферах.
**Другою важливою можливістю великих моделей є «генерація», яка може генерувати мультимодальний контент, такий як текст, зображення та відео. **
Отже, як використовувати потужність генерації? Я попросив Вень Сіня згенерувати набір креативів одним словом.
Спочатку введіть у нього зображення, а потім абзац.
[Це новий енергетичний автомобіль Чангана.] Будь ласка, допоможіть мені створити два зображення з пружиною, яскравими пейзажами на задньому плані та відчуттям перевищення швидкості автомобіля. 】
Ми бачимо, що це покоління дійсно використовує яскраві пейзажі весни, що супроводжуються розмиттям швидкості.
Я попросив його згенерувати вертикальний плакат безпосередньо для мене.
[У поєднанні з інформацією Чанган Цюань на офіційному сайті Changan, зробіть вертикальний рекламний плакат і напишіть простий і елегантний маркетинговий текст, що повторює стиль кузова.] 】
Як бачите, ми згенерували вертикальний рекламний плакат як із зображеннями, так і з текстом.
Тепер у нас є рекламний плакат, і нам потрібен багатший рекламний текст, ви можете попросити Вень Сіня написати ще кілька слів:
[Цей автомобіль робить акцент на кабіні з цифровим інтелектом, дизайні Fuguang і якісному водінні. Будь ласка, напишіть ще 5 одиниць рекламного тексту, кожен з коротким заголовком та описом]
Копірайтинг, написаний штучним інтелектом, який має красу науки та технологій, тренд часу, також наголошує на взаємодії людини та комп'ютера, копірайтинг більш професійний та плавний, досяг стандарту бренд-маркетингу.
Що робити, якщо я все одно хочу відео?
[Будь ласка, об'єднайте інформацію про офіційний веб-сайт та існуючий відеоконтент, щоб створити цифрове оральне відео людини, я хочу запустити рекламу в стрічці.] 】
Він згенерований, потім ми відкриваємо відео, щоб побачити ефект.
Це дійсно більш характерне цифрове відео, що транслюється населенням, і воно також відображає характеристики цього автомобіля.
Тепер у нас є 1 комерційний фільм, 5 рекламних текстів і 1 постер, і я дав Вень Сіню лише кілька слів на кшталт «цифровий інтелектуальний автомобіль» і «якісне водіння», і весь процес зайняв менше 3 хвилин.
Не так давно ми також використовували цю функцію, щоб запустити маркетингову креативну платформу AIGC Steering Engine, що дозволяє одній людині стати маркетинговою командою штучного інтелекту. Можливо, сьогодні на сцені знайдуться друзі-копірайтери, побачивши це, чи вважаєте ви, що великі моделі можуть принести більше творчого натхнення та допомогти вам підвищити ефективність?
Далі поговоримо про третю здатність великих моделей: логіку. **
Багатьом людям часто доводиться допомагати своїм дітям з домашніми завданнями. Деякі люди жартують, що «якщо ти не пишеш домашнє завдання, то мати синівська побожність, а коли пишеш домашнє завдання, курка літає, а собака стрибає». Тож давайте подивимося, чи можуть слова Вень Сінь допомогти батькам вирішити проблему репетиторства з домашніми завданнями?
Дозвольте мені скласти математичну задачу і подивитися, як вона виконується:
[Конусоподібна купа піску, площа дна 8 квадратних метрів, висота 12 дециметрів, розкидайте цю купу піску на дорозі шириною 2 метри, товщиною 5 см, скільки метрів можна заасфальтувати? ] 】
Це свого роду математична задача, яку ми, можливо, виконували в дитинстві, і, судячи з відповіді Вень Сіня, логіка її відповіді цілком зрозуміла. Кожен крок прописаний. Батьки можуть побачити, чи є вона більш детальною, ніж та, що дається в деяких навчальних матеріалах.
Навіть, штучний інтелект може вказати на точки знань, які використовуються при розв'язанні задач, щоб допомогти дітям закріпити навчання, давайте запитаємо ще раз:
[Які знання беруть участь у вищезгаданому процесі розв'язання проблем?] 】
Вень Сінь чітко дав точки знань, пов'язані з цим питанням, такі як формула об'єму конуса, єдина одиниця виміру, об'єм, що залишається незмінним, і розв'язування рівнянь. Це практично для учнів, вчителів та батьків. Після того, як ці знання будуть чітко засвоєні, діти матимуть можливість робити висновки один від одного.
Надлогічні здібності великої моделі, безумовно, можуть бути використані не тільки для вирішення проблем. Планування маршруту для смарт-карт, розумні помічники для складних завдань, управління світлофорами в інтелектуальних транспортних системах і так далі - все це вимагає використання логічних можливостей.
Далі розглянемо четвертий пункт, який полягає в здатності до запам'ятовування великої моделі. **
Пам'ять тут в основному відноситься до того, що ви сказали раніше, чи запам'ятає це ШІ, контент, згенерований ШІ, чи буде він суперечливим. Це важливий показник для того, щоб відрізнити інтелект великих моделей, а багатораундовий діалог є втіленням здатності до запам'ятовування.
Я знаю, що багато творців використовують Вень Сіня для написання романів. А якщо зміст роману суперечливий, то він не читається. Сьогодні я попрошу його написати роман на місці, перемежувати деякі відволікаючі фактори питаннями і подивитися, чи зможе він згадати, що написав.
Спочатку я введу один:
[Будь ласка, допоможіть мені написати роман про бойові мистецтва, головна героїня – жінка, а сюжет має злети та падіння.] 】
Ну що ж, подивимося, вийшла канва роману:
Перший – це передісторія історії, у стародавньому світі бойових мистецтв повстають темні сили; Героїню звуть Лін'ер, і вона має силу маніпулювати внутрішніми силами та втечею.
Спочатку я введу один:
[Будь ласка, допоможіть мені написати роман про бойові мистецтва, головна героїня – жінка, а сюжет має злети та падіння.] 】
Ну що ж, подивимося, вийшла канва роману:
Перший – це передісторія історії, у стародавньому світі бойових мистецтв повстають темні сили; Героїню звуть Лін'ер, і вона має силу маніпулювати внутрішніми силами та втечею.
Далі починається історія. Лінґер хоче перемогти темні сили та врятувати бойові мистецтва. У кульмінаційний момент роману вона веде битву на життя і смерть з лиходієм, перемагає лиходія і рятує бойові мистецтва і всі секти.
Врешті-решт, Лінґер та її союзники також разом заснували Інститут внутрішнього культивування влади.
Тепер, коли історія в основному сформована, але вона трохи проста, я хочу додати ще кілька вимог до персонажів:
[Тепер зв'язок між символами занадто простий, є лише два символи, і додано ще 4 символи]
Вень Сінь дав ще чотири ролі одним словом, кожна з різною ідентичністю та особистістю, з різною особистістю, цей Муронг Гучен є поколінням гросмейстерів, і є пророк Сяо Ханьян, який може передбачити майбутнє.
Але тепер у романі все ще є необхідний елемент – драматичний конфлікт. Історія без конфлікту – це не найкраща історія, а процес перемоги героїні над темними силами просто зараз занадто простий, подивимося, чи зможемо ми його ускладнити.
Введіть ще один
[Також необхідно додати до історії драматичний конфлікт основної лінії, щоб зробити історію більш доступною для перегляду]
Розуміємо, це вже написано для драматичного конфлікту. Ось розворот, за темними силами справжнім лідером є високоповажна фігура рівня гросмейстера, яка кілька разів наражала героїню на небезпеку. До вирішальної битви героїня мала шанс дати відсіч.
Як бачимо, він пам'ятає, що головною лінією історії є протистояння Лінг'ера та темних сил, і конфлікт також обертається навколо цієї основної лінії.
Отже, Вень Сінь все ще пам'ятає історію, яку він щойно написав, і співвідносить цих персонажів з історією?
Зробимо ще одне прохання:
[Внесіть цих персонажів в план історії, яку ви для мене придумали, і придумайте назву.] 】
Результати показали на великому екрані, а роман називається «Праведна битва річок і озер», що додає до сюжетної канві додаткових персонажів і драматичних конфліктів. Четвертий і п'ятий розділи тут також розповідають нам, що великим майстром цього лиходія є Муронг Гучен, якого щойно представили.
Протягом усього процесу я постійно збільшував складність і висував нові вимоги, щоб заважати його пам'яті, а Вень Сінь все одно пам'ятав всі попередні потреби та відповіді, міг точно відповідати сюжетній лінії та персонажам, а його пам'ять була дуже дивовижною.
Тоді всі зараз на випробувальній сцені, пам'ятаєте, в чому особливі здібності головного героя Лінгера?
Можливо, більшість людей не пам'ятають, тож давайте подивимося, чи пам'ятає Вень Сінь?
[Які здібності має героїня?] 】
Що ж, відповідь є, це сила маніпулювати внутрішніми силами та втечею. Це приклад тексту, написаного Вень Сінь у першому раунді діалогу. Тепер, після п'яти раундів діалогів і кількох тисяч слів художньої літератури, він все ще може пам'ятати те, що писав раніше, а це здатність до запам'ятовування великої моделі.
Ми тільки що випробували на собі чотири можливості великої моделі, звичайно, в більшості випадків ці чотири здібності не з'являються поодинці, вони доповнюють один одного. **
Наприклад, щоб створити рекламний текст, йому потрібно зрозуміти тему створення, уточнити логіку створення, зберегти послідовність за допомогою пам'яті.
У розв'язанні задач також необхідно комплексно застосовувати вміння розуміти, генерувати, логіку, запам'ятовувати.
Давайте розглянемо комплексний приклад застосування:
Перш за все, ми відкриваємо реконструйований додаток Baidu, скануємо камерою вийняту пацієнтом коробку з ліками, і немає необхідності переглядати інструкцію дрібним шрифтом, а цифровий лікар-людина допоможе вам пояснити.
Питання, які з'явилися на екрані тільки зараз, такі як «їсти до або після їжі», «чи можна вживати алкоголь», «які ще запобіжні заходи», багато пацієнтів при щоденному прийомі ліків зіткнуться з проблемами.
Ми бачимо, що велика модель може не тільки допомогти пацієнтам інтерпретувати інструкції до ліків, але й об'єднати персоналізовані потреби для підвищення ефективності ліків та забезпечення точності та своєчасності прийому ліків пацієнтами.
Не так давно ми об'єднали модель Вень Сінь з професійними медичними знаннями і випустили велику модель Spirit Medicine, яка може допомогти пацієнтам і лікарям спілкуватися і створювати медичні записи, застосовуючи Spirit Medicine Bot. У цьому прикладі використовується не тільки здатність до осмислення і генерації логічної пам'яті, але і здатність до мультимодальної мови, зору і так далі.
Попередня демонстрація в основному відображає прогрес моделі Wenxin у чотирьох можливостях розуміння, генерації, логіки та пам'яті, які є основою для виживання всіх нативних додатків ШІ. Аналогічно, без багатої нативної екології додатків штучного інтелекту, побудованої поверх базової моделі, велика модель нічого не варта.
У травні я публічно заявив, що Baidu стане першою компанією, яка реструктуризує всі продукти, і ми будемо використовувати мислення штучного інтелекту для створення нативних додатків для штучного інтелекту.
**За останні кілька місяців наші пошукові запити, такі як потоки, карти, онлайн-диски, бібліотеки тощо, зустрінуть вас по-новому. За цей період я наступив на багато ям, і готовий поділитися з вами, сподіваюся, ви зможете брати менш криві дороги в процесі розробки. **
Далі я покажу вам, як виглядають ці вироби, реконструйовані за допомогою великих моделей? Це також для того, щоб розширити уяву кожного та надихнути всіх на створення більш дивовижних нативних додатків зі штучним інтелектом.
Перше, що я вам покажу, це пошук, з якого і почався Baidu. У багатьох людей складається враження від пошуку, що ви вводите ключове слово, а Baidu видає вам веб-посилання. Вже ні!
Baidu новий пошук, при відкритті інтерфейсу, крім того, що ви бачите вікно пошуку, результати пошуку будуть зовсім іншими, ніж минулі.
** Реконструйований новий пошук має три характеристики: надзвичайне задоволення, стимуляція рекомендацій і кілька раундів взаємодії. **
Що таке кінцеве задоволення? Коли ви вводите запитання в поле пошуку, наприклад «Що таке MBTI?» «Як припаркуватися збоку», новий пошук більше не для того, щоб дати вам купу посилань, а для того, щоб зрозуміти через велику модель і згенерувати найкращу відповідь
Наприклад, якщо ви запитаєте «рейтинг доданої вартості промисловості за країнами за останні 20 років», новий пошук не тільки підкаже вам відповідь безпосередньо, але й покаже відповідь за допомогою динамічних графіків.
З великого екрану позаду мене я бачу, що за останні два десятиліття наша промислова промисловість пережила стрімкий розвиток і перетворюється з країни-виробника на виробничу державу.
Це і є остаточне задоволення: один крок, щоб дати вам остаточну відповідь.
Отже, другий крок, після того, як ви побачили відповідь, що ще ви хочете побачити?
Тут використовується рекомендаційна стимуляція. Наприклад, після динамічного графіка функція збудження рекомендацій також дає «який зв'язок між доданою вартістю промисловості та ВВП» та «який вплив промисловості на розвиток національної економіки» ці питання також можуть вас хвилювати. Натисніть, щоб отримати відповідь.
Звичайно, не на всі потреби є єдина правильна відповідь. Потреби користувачів іноді можуть бути складними, і вони не зрозумілі в одному-двох реченнях. Користувачам також складно за один раз повністю висловити дуже складну вимогу за допомогою великого опису.
У цей час нам потрібно використовувати більш нову та персоналізовану модель пошуку для обслуговування користувачів, тобто багатораундову взаємодію.
Давайте розглянемо цей приклад:
Наприклад, якщо ви запитаєте «де рекомендоване місце для альпінізму навколо Пекіна», він дасть кілька відповідей, таких як гора Байхуа та гора Хайтуо, зміщені до пішохідних маршрутів;
Потім, він дає кілька підказок, щоб доповнити ваш вибір ситуації, ви можете вибрати між новачками, батьками-дітьми та переглядом опалого листя. Тепер він змінився, щоб рекомендувати Західну гору та гору Байван, на які відносно легко піднятися та вони більш дружні до занять батьків і дітей.
Тоді продовжуйте питати, яке спорядження вам потрібне для альпінізму та походів? Відповіддю були трекінгові палиці, туристичне взуття тощо, а також згадали, що раніше обрали тур для батьків та дітей, і особливо давали поради, як доглядати за дітьми.
Можна сказати, що генеративний ШІ та пошук – це збіг, створений на небесах.
Пошук, хоч і все ще починається з того простого ящика, але наступний крок за кроком, перевершив і реконструював початковий режим пошуку, не тільки поліпшив якість пошуку, але і прорвав сферу застосування пошуку і розширив межі продукту. такий
Інтерактивний пошук зі штучним інтелектом очолить трансформацію поколінь пошукової індустрії.
У найближчому майбутньому пошук стане інтимним помічником, здатним викликати, вирішити проблеми і навіть в будь-який момент порушити обмеження «кінця», щоб реагувати в будь-який час і в будь-якому місці, задовольняти потреби і супроводжувати весь процес.
Далі розглянемо другий продукт нативного мислення штучного інтелекту, Baidu GBI, Generative Business Intelligence, тобто генеративну бізнес-аналітику. **
Це продукт з нуля, а не рефакторинг існуючого продукту. **
У нашому діловому світі самим невід'ємним є бізнес-аналіз, тобто BI, як приймати найшвидші бізнес-рішення? Давайте спочатку відчуємо на відео:
Як бачимо, на відео президент ставив різноманітні професійні запитання. Є фінансовий аналіз, реалізація проектів і аналіз користувачів, а помічник президента GBI може швидко дати результат і дозволити президенту приймати рішення на місці.
Це інструмент прийняття рішень, заснований на великих можливостях моделі, перший генеративний продукт бізнес-аналітики в Китаї Baidu GBI. З GBI робіть все швидко!
Мало того, що людей з передовими інструментами не замінить штучний інтелект, так ще й «підвищення по службі та підвищення – це не мрія». Люди, які не використовують передові інструменти, ризикують втратити роботу. **
Отже, як Baidu GBI став на крок попереду? Він підриває традиційний аналіз даних трьома способами:
По-перше, традиційним BI можуть керувати лише професіонали, тоді як GBI може безпосередньо розуміти запитання президента та виконувати їх у режимі реального часу;
По-друге, GBI забезпечує зручний спосіб доступу, підприємства можуть отримувати доступ до даних, ставити запитання та аналізувати будь-які дані природною мовою, і більше не потрібно вручну виконувати різні професійні операції з базами даних і таблицями;
По-третє, GBI також має здатність навчатися, і компанії можуть вносити свій власний галузевий досвід, щоб стати галузевими експертами.
Це Baidu GBI, який може скоротити роботу з аналізу даних і написання звітів, яку бізнес-аналітики можуть виконати за десяток днів, до хвилинного рівня. Так звані бойові мистецтва світу можна зламати лише швидко;
** Конкуренція на підприємстві, не велика риба їсть дрібну рибу, а швидка риба їсть повільну рибу, швидше прийняття рішень, ніж конкуренти, є ймовірність, що ви виграєте! **
Говорячи про швидке прийняття рішень, у Baidu ми покладаємося на платформу розумного офісу під назвою Ruliu, а також переосмислили цю програму за допомогою штучного інтелекту.
Сьогодні він став супер помічником, без якого не можуть обійтися жителі Baidu.
Тепер усі, будь ласка, подивіться, це як трансляція, яка записує в реальному часі. Давайте подивимося, чи зможе він запам'ятати всі щойно згадані моменти:
Це функція генерації протоколів засідань в один клік. Ми говоримо, що те, як ефективно проводити наради – це технічна робота. Ця функція значно зменшує робоче навантаження на нараду та скорочує час зустрічі на 40%.
Ще один поширений сценарій – робочі групи. Більшість людей на робочому місці часто засипають різними повідомленнями в груповому чаті. Тоді швидке узагальнення ключових моментів групового чату стає надзвичайно корисною функцією.
Давайте подивимося, як його використовують наші продакт-менеджери.
У нього 9 робочих груп, затримка на певний проміжок часу, непрочитаної інформації може бути більше тисячі, а Рулю може не тільки «1000 повідомлень, отримати фокус за одну секунду», але і грамотно розділити контент, який потрібно прочитати, на кілька категорій: «чекаю на підтвердження», «фокус на», «обговорення теми», що значно підвищує ефективність роботи.
Тож чи точно він доопрацьований, чи не буде його неправильно зрозумілий, чи він пропустить ключову інформацію? Це перевіряє здатність розуміти та генерувати великі моделі. Чим глибше розуміння, тим точніше резюме. Не кажіть, що 1 000, 10 000 одиниць інформації, наприклад, суперпомічник потоку також може дати інтелектуальну класифікацію та інтелектуальне резюме за кілька секунд.
Давайте розглянемо ще один сценарій на роботі: подорожі.
Авіаквитки, готелі, переговори і т.д., ці транзакційні завдання виснажливі і трудомісткі! Якби у вас був помічник зі штучним інтелектом, який допомагав би вам вирішувати тривіальні завдання, чи хотіли б ви працювати більше?
Наприклад, нещодавно продакт-менеджер Рулю планував поїхати до Шанхаю, щоб зустрітися з паном Ваном з PICC. Ми знаємо, що PICC просуває інновації в продуктах і послугах, бізнес-моделях, цифрових технологіях та інших аспектах, і наша технологія штучного інтелекту в Baidu може зіграти свою роль.
Цей маршрут відрядження можна передати суперпомічнику Руліу, і давайте подивимося на його виконання.
Суперасистент може організувати поїздку, виходячи з інформації про свій розклад.
Подібно до того, як остання зустріч закінчується о 4 годині, тому бронюйте рейс після 7:30; І, згідно з його стандартами подорожей, допоможіть йому знайти готелі, де він зможе зупинитися. Нарешті було оформлено запрошення замовнику.
Перед зустріччю з клієнтом йому може знадобитися деякий бекграунд, і в цьому йому також може допомогти суперасистент. Завдяки зв'язку з CRM та іншими системними даними компанії, такими як flow, ви отримуєте детальні дані, такі як проекти співпраці та записи відвідувань.
Розуміючи ситуацію ділового співробітництва та зовнішню інформацію, таку як потік, він також може допомогти йому створити посилання на обговорення, заздалегідь встановити запитання, які може поставити клієнт, і дати кілька пропозицій щодо співпраці. З цієї точки зору, Рулю більше схожий на справжнього помічника?
Ми щойно побачили, що лише трьома словами Рулю завершив бронювання туристичних квитанцій, машинного вина та розкладів, і навіть підготував довідкові матеріали для переговорів, які є «подорожжю в один клік» Рулю. Як він це робить?
Це комплексне застосування розуміння, генерації, логіки та здатності пам'яті великої моделі, яка автоматично розбирає складні завдання на кілька простих завдань для виконання окремо, а потім об'єднується для отримання кінцевого результату. Ми кажемо, що підвищення ефективності означає підвищення конкурентоспроможності, наприклад, дозволити «розумній роботі» замінити «важку роботу».
Тепер давайте подивимося на нову бібліотеку Baidu. Це також продукт, який, на мою думку, був повністю перероблений. **
Бібліотека Baidu повністю змінить наші звички працювати, вчитися та творити.
Як ми творили в минулому? Наприклад, скажімо, ви проводите презентацію про застосування штучного інтелекту в психології. На перевірку інформації, сортування матеріалів, написання рукописів, написання PPT та благоустрій PPT потрібно кілька днів.
Сьогодні на Baidu Wenko можна почати роботу з одного речення, поглянути на великий екран: По-перше, ви хочете, щоб він написав промову, а він знаходить десятки матеріалів на тему штучного інтелекту та психології.
Він також може визначити, які з них є академічними журналами, авторитетними звітами, а які просто масовими матеріалами. Якщо ви хочете написати живу статтю, вибирайте популярні матеріали, такі як есе та науково-популярні матеріали.
Тоді, якщо вам потрібна сувора академічна промова, ви можете перевіряти лише авторитетний контент, щоб переконатися в точності змісту. Потім, розуміючи ці рукописи, бібліотека створює добре структуровану та чітко визначену статтю, одночасно шліфуючи та форматуючи вміст.
Це можна зробити тому, що Baidu Wenku вже має 1 мільярд якісних документів, виходячи з розуміння цього змісту, писати по-справжньому практичні та зрозумілі документи, а не серйозну нісенітницю, як багато великих моделей, і це не буде загальною порожньою балачкою.
Далі презентація також потребує PPT. Бібліотека може об'єднати рукопис з деякими матеріалами, які ви зібрали, щоб автоматично згенерувати структуру PPT, а потім прикрасити малюнок, щоб зробити PPT з десятків сторінок.
Також є деякі ігрові процеси з можливостями мультимодальної генерації, такі як вибір стилю та перемикання стилів одним клацанням миші. Але є місця, які більше перевіряють здібності бібліотеки і вимагають від неї точного розуміння змісту. Наприклад, він повинен знати взаємозв'язок між ідеями, незалежно від того, чи є вони протиставленими або підпорядкованими, щоб розробити правильну діаграму.
Завдяки цій здатності розуміти, бібліотека також може написати відповідний мовний скрипт для цього PPT на основі генерації PPT. Мало того, він також може використовувати цей контент для визначення запитань, які може поставити аудиторія, і підготувати вас до відповідей.
Ми оцінили, що здатність генерувати бібліотеки, особливо PPT, набагато перевершує будь-який інший інструмент на ринку, як іноземний, так і вітчизняний. Раніше люди приходили до бібліотеки, щоб знайти готовий контент. У майбутньому люди зможуть створювати контент на свій розсуд ефективніше, ніж будь-який інший інструмент підвищення продуктивності.
Виходячи з чотирьох можливостей моделі Wenxin, не буде перебільшенням сказати, що Baidu Wenku докорінно здійснила революцію у власному житті та завершила еволюцію від «інструментів контенту» до «інструментів продуктивності»**.
Не так давно, в перший день виходу нової версії Baidu Wenku, нова функція штучного інтелекту подарувала понад 2 мільйони вражень. Тепер ми з більшою впевненістю можемо сказати, що в епоху великих моделей Baidu Wenku є найкращою відправною точкою для створення контенту.
Як і Wenku, мережевий диск Baidu також є знайомим старим другом. За останні 11 років мережевий диск Baidu обслужив 800 мільйонів користувачів, обсяг файлів досяг 4 трильйонів, а користувачі завантажують понад 1 мільярд зображень щодня.
У напрямку реконструкції штучного інтелекту мережевий диск Baidu фокусується на виконанні хорошої роботи в інтелектуальних сервісах для особистих файлів.
Те, що ви бачите зараз, - це нова домашня сторінка мережевого диска Baidu.
** Реконструйований мережевий диск не тільки реалізує трансформацію від взаємодії з графічним інтерфейсом до взаємодії природною мовою, але й покращує розуміння мультимодальної інформації. **
Тепер, лише одним реченням, ви можете оперувати файлами, зображеннями, відео тощо на своєму онлайн-диску.
Це мережевий диск Baidu «Cloud One», який є першим в галузі і навіть першим в світі персональним хмарним інтелектуальним помічником. Давайте відчуємо, які больові точки може вирішити «Cloud One» і принести нові враження?
Насамперед потрібно знайти картинки або відео. Іноді, ми замислюємося над картинкою і хочемо знайти її на мережевому диску, часто після багатьох кроків, підкидаючи протягом півдня не вдається знайти. Тепер ви промовляєте слово «Cloud One», і це може допомогти вам точно визначити його:
Що ж, це допомогло мені швидко знайти те, що головний науковий співробітник OpenAI LLYA опитав про трансформери.
За цим, здавалося б, простим пошуком стоїть роль кількох можливостей штучного інтелекту, який повинен вміти розуміти відеоконтент, ідентифікувати персонажів і формувати контекстну пам'ять, щоб точно визначити місцезнаходження певного кадру відео, що є дуже провідною технологією в глобальній сфері персональних хмар.
Друга фішка Yunyi полягає в тому, щоб допомогти користувачам швидко зрозуміти зміст відео, давайте подивимося:
Ви можете побачити, що демонструються дві здібності, одна - це здатність узагальнювати і узагальнювати зміст, і здатність витягувати золоті речення. Це 43-хвилинне інтерв'ю, завдяки розумінню та логічним здібностям ШІ, Юн Ідуо узагальнив та вдосконалив відео, представивши Лю та його основні ідеї.
Але багато разів ми будемо відчувати, що оригінальний текст дуже захоплюючий, після дистиляції основної ідеї або резюме він не такий привабливий, тому друга функція тільки зараз, я думаю, насправді корисніша для мене, тобто ми повинні знайти найцікавішу частину оригінального відео, а саме ці золоті речення. Наприклад, LLYA говорить, що «вивчення статистичних законів набагато важливіше, ніж споглядання зовнішності». Ключовим проривом у витягуванні цього золотого речення є ефективне вилучення мультимодальної інформації, яка є провідною світовою технологією. Він може знайти найкращі частини з контенту довгого інтерв'ю, що значно покращує наше навчання та ефективність роботи.
Це новий мережевий диск після реконструкції ШІ. Станом на вчора Yunyi досягла позначки у 20 мільйонів користувачів.
Це інтелектуальний помічник зі штучним інтелектом на базі персональної хмари. За останнє десятиліття Baidu визначив те, що називається мережевим диском; У наступному десятилітті Baidu буде використовувати штучний інтелект для перевизначення нових мережевих дисків.
Далі розглянемо більш історичний продукт – Baidu Map. **
Ми реконструювали цей продукт 18-річної давності з власним мисленням штучного інтелекту, який також є першим у світі продуктом для нативних карт зі штучним інтелектом.
За останні 18 років Baidu Maps накопичив безліч функцій, він може здійснювати навігацію, викликати таксі, знаходити водія на заміну, бронювати готель, купувати квиток і навіть задовольняти потреби пошуку POI в більш складних умовах. У минулому ці операції були складними і часто вимагали шести-семи кроків або більше для виконання;
Тепер, поки користувач говорить про попит, карта може мобілізувати тисячі інтерфейсів сервісних API, а багаторівневе меню стає одноетапним прямим і швидким реагуванням.
Давайте розглянемо далі, як реалізована карта Baidu?
У відео користувачі перевіряють розуміння Baidu Map попиту, вибору проміжних точок зустрічі, порівняння інформації з різних місць, а також рекомендації та бронювання майбутніх подорожей, і це дає розумні рішення.
Це пов'язано з тим, що здатність Вень Сіня говорити була об'єднана з унікальними знаннями POI на мільярдному рівні карти та даними про сприйняття трафіку на трильйоні, і його можна викликати в будь-який час для надання рекомендацій. Реконструйована карта Байду – це не тільки навігація, а й наш путівник. Чим ти розумніший, чим ти розумніший, тим більше ти тебе розумієш.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Повний текст виступу – 11500 слів | Байду Робін Лі: Ми ось-ось вступимо в еру штучного інтелекту!
Джерело статті: AI Dark Horse
Польовий рекорд: Темна конячка підприємництва
Світ повернувся до колишнього вигляду, і деякі люди кажуть, що у Робіна на сцені серйозна реклама, що розкриває футуристичний сенс і цікавість технологічних продуктів. Це надія та резонанс майбутнього технологій на сцені та поза нею, компанії та користувачів.
Baidu World Congress 2023 – найважливіша конференція Baidu зі стратегії, технологій та запуску продуктів, яка проводиться вже 17 років, починаючи з 2006 року.
** 17 жовтня темна конячка підприємництва була запрошена до участі у Всесвітній конференції Baidu, на місці записала 10 важливих матеріалів, розібрала повний текст виступу Робіна Лі та поділилася ним з усіма. **
2.AI нативні додатки – це програми, розроблені на основі розуміння, генерації, логіки та можливостей пам'яті великих моделей. Ці можливості були недоступні в минулі епохи, що відкривало необмежений простір для інновацій.
Генеративний ШІ та пошук – це збіг, створений на небесах. Пошук Baidu був реконструйований на основі великої моделі штучного інтелекту, і новий пошук має три характеристики: надзвичайне задоволення, стимуляція рекомендацій і багатораундова взаємодія. Він не тільки підвищує якість пошуку, але і пробиває сферу застосування пошуку і розширює межі товару.
Baidu GBI є першим генеративним продуктом бізнес-аналітики в Китаї, який може скоротити роботу з аналізу даних і написання звітів, яку бізнес-аналітики можуть виконати більш ніж за десять днів, до хвилинного рівня, і є інструментом прийняття рішень, заснованим на великих можливостях моделі.
Бібліотека Baidu є найґрунтовнішим продуктом реконструкції штучного інтелекту. Було представлено Baidu Wenku, який базується на реконструкції великої моделі, перетворившись із «інструментів контенту» на «інструменти продуктивності». Він швидко розвивається в таких функціях, як розуміння матеріалів, написання статей, інтелектуальна генерація PPT і зміна стилю.
Мережевий диск Baidu завершив реконструкцію штучного інтелекту. Персональний хмарний інтелектуальний помічник «Cloud One» реалізує перехід від взаємодії з графічним інтерфейсом до взаємодії природною мовою, покращує розуміння мультимодальної інформації та може точно визначати місцезнаходження відео, узагальнювати відеоконтент одним клацанням миші та вдосконалювати золоті речення, лідируючи у світі.
Plug-in – це спеціальна нативна програма зі штучним інтелектом, з найнижчим порогом і найпростіша у використанні. Плагін розширює можливості великих моделей, роблячи їх більш практичними та простими у використанні, а також дозволяє легко та швидко використовувати багато корпоративних приватних даних без ризику витоку.
Майбутні нативні додатки штучного інтелекту повинні бути мультимодальними, а автономне водіння є типовим застосуванням візуальних великих моделей для реконструкції фізичного світу.
Baidu енергійно просуває глибоку інтеграцію цифрових технологій і реальної економіки, і технологія великих моделей застосовується у виробництві, енергетиці, електроенергетиці, хімічній промисловості, транспорті та інших реальних галузях, використовуючи інтелектуальну інспекцію для зменшення потенційних загроз безпеці, використовуючи інтелектуальне планування для скорочення циклу доставки, використовуючи інтелектуальне прийняття рішень для підвищення ефективності підприємства, інтелектуальний інформаційний контроль для вирішення заторів на дорогах, а велика модель стає важливою рушійною силою нової індустріалізації.
Ми ось-ось вступимо в еру рідного штучного інтелекту, еру взаємодії людини та комп'ютера!
Привіт гостям! Ласкаво просимо на Всесвітній конгрес Baidu 2023!
Ласкаво просимо в еру генеративного ШІ! **
**Тема цієї конференції – нативні додатки штучного інтелекту. Я детально поділюся з вами досвідом Baidu в процесі нативної реконструкції штучним інтелектом різних лінійок продуктів за останні кілька місяців, і сподіваюся, що він буде вам корисний. **
Як ми всі знаємо, нативні програми штучного інтелекту розробляються на основі великих моделей. Найбільшою інновацією в технологічному секторі за останній рік, безсумнівно, стала поява інтелекту, викликаного великими моделями, що є основою для розробки додатків, нативних для штучного інтелекту.
Тому нативні програми штучного інтелекту Baidu також розробляються на основі наших слів Вень Сінь. Слова Вень Сіня вперше були оприлюднені 16 березня цього року, і з тих пір ми швидко повторили і отримали дозвіл на відкриття для світу 31 серпня, отримавши багато відгуків користувачів, а швидкість інновацій прискорюється.
Сьогодні я радий оголосити про офіційний реліз Wenxin Grand Model 4.0.
Паралельно ми почали запрошувати на тести. Друзі на місці події, вам потрібно лише відсканувати QR-код на картці гостя, отримати купон на враження, і ви можете увійти на офіційний веб-сайт Wenxin Yiyan або додаток Wenxin Yiyan, щоб випробувати Wenxin Model 4.0.
Це найпотужніша велика модель Wenxin на сьогоднішній день, вона досягла комплексного оновлення базової моделі, розуміння, генерації, логіки та пам'яті чотири основні можливості, порівняно з поточною версією Wenxin Yiyan були значно покращені, всеосяжний рівень не менше GPT4!
**Так званий AI нативний додаток, як я розумію, це додаток, розроблений на основі розуміння, генерації, логіки та можливостей пам'яті великих моделей. Ці можливості були недоступні в минулі епохи, тому вони можуть відкрити необмежений простір для інновацій. **
Нижче я об'єднаю сценарії застосування, щоб познайомити вас з чотирма можливостями слів Вень Сіня. Додаток з цими чотирма можливостями є рідним додатком епохи штучного інтелекту.
Раніше ми говорили, що ШІ – це «штучна інтелектуальна інвалідність», тобто ШІ часто не може розуміти слова людей, і з часом ви не наважуєтеся з ним занадто багато розмовляти.
Сьогодні кожне слово, яке ви говорите, він, швидше за все, може зрозуміти, у багато разів краще, ніж ваші друзі та колеги розуміють те, що ви говорите.
Наприклад, ви молодий чоловік, який працює в Пекіні, хоче купити будинок у Хебеї та хоче знати, чи можете ви подати заявку на позику в Пекіні.
Давайте введемо рядок.
[Я хочу повернутися в Ченде, щоб купити будинок, чи можу я скористатися позикою з резервного фонду, що мені робити з процедурами?] Я працюю в Пекіні. 】
Давайте подивимося на результати. Вень Сінь відповів, що може скористатися позикою з резервного фонду. Чому ці запитання та відповіді відображають здатність розуміти велику модель? Насправді, те, що я щойно навів, здавалося б, просте, має кілька невеликих підводних каменів, які потрібно зрозуміти:
Перш за все, це вираз туди-сюди. Коли більшість людей телефонують, щоб задати питання, вони думають, де сказати, не так суворо, як цей, я спочатку говорив про купівлю будинку і управління фондом забезпечення, а потім говорив «Я працюю в Пекіні», що висуває більш високі вимоги до розуміння.
По-друге, я навмисно використовую тут два розпливчастих вирази. Один з них – «працюю в Пекіні», підтекст – «покладіть резервний фонд у Пекіні», інший – «поверніться в Ченде, щоб купити будинок», просто слово «повернення», по суті, маючи на увазі, що я, швидше за все, ченде хукоу.
По-третє, Вень Сінь об'єднав контекст і об'єднав усі інформаційні моменти разом, щоб точно зрозуміти справжнє питання, а саме: «Чи може користувач, який зареєстрував домогосподарство в Ченде, провінція Хебей, використати резервний фонд Пекіна, щоб купити будинок у Ченде за допомогою кредиту», а потім дав відповідь і кроки щодо вирішення цього питання.
Видно, що в словах Вень Сіня вже можна досить точно розуміти «невпорядковані вирази, відносно розпливчасті наміри вираження і підтекст в словах». Ця здатність має дуже широкий спектр перспектив застосування в державних справах, маркетингу, обслуговуванні клієнтів та інших сферах.
Отже, як використовувати потужність генерації? Я попросив Вень Сіня згенерувати набір креативів одним словом.
Спочатку введіть у нього зображення, а потім абзац.
[Це новий енергетичний автомобіль Чангана.] Будь ласка, допоможіть мені створити два зображення з пружиною, яскравими пейзажами на задньому плані та відчуттям перевищення швидкості автомобіля. 】
Ми бачимо, що це покоління дійсно використовує яскраві пейзажі весни, що супроводжуються розмиттям швидкості.
Я попросив його згенерувати вертикальний плакат безпосередньо для мене.
[У поєднанні з інформацією Чанган Цюань на офіційному сайті Changan, зробіть вертикальний рекламний плакат і напишіть простий і елегантний маркетинговий текст, що повторює стиль кузова.] 】
Як бачите, ми згенерували вертикальний рекламний плакат як із зображеннями, так і з текстом.
Тепер у нас є рекламний плакат, і нам потрібен багатший рекламний текст, ви можете попросити Вень Сіня написати ще кілька слів:
[Цей автомобіль робить акцент на кабіні з цифровим інтелектом, дизайні Fuguang і якісному водінні. Будь ласка, напишіть ще 5 одиниць рекламного тексту, кожен з коротким заголовком та описом]
Копірайтинг, написаний штучним інтелектом, який має красу науки та технологій, тренд часу, також наголошує на взаємодії людини та комп'ютера, копірайтинг більш професійний та плавний, досяг стандарту бренд-маркетингу.
Що робити, якщо я все одно хочу відео?
[Будь ласка, об'єднайте інформацію про офіційний веб-сайт та існуючий відеоконтент, щоб створити цифрове оральне відео людини, я хочу запустити рекламу в стрічці.] 】
Він згенерований, потім ми відкриваємо відео, щоб побачити ефект.
Це дійсно більш характерне цифрове відео, що транслюється населенням, і воно також відображає характеристики цього автомобіля.
Тепер у нас є 1 комерційний фільм, 5 рекламних текстів і 1 постер, і я дав Вень Сіню лише кілька слів на кшталт «цифровий інтелектуальний автомобіль» і «якісне водіння», і весь процес зайняв менше 3 хвилин.
Не так давно ми також використовували цю функцію, щоб запустити маркетингову креативну платформу AIGC Steering Engine, що дозволяє одній людині стати маркетинговою командою штучного інтелекту. Можливо, сьогодні на сцені знайдуться друзі-копірайтери, побачивши це, чи вважаєте ви, що великі моделі можуть принести більше творчого натхнення та допомогти вам підвищити ефективність?
Багатьом людям часто доводиться допомагати своїм дітям з домашніми завданнями. Деякі люди жартують, що «якщо ти не пишеш домашнє завдання, то мати синівська побожність, а коли пишеш домашнє завдання, курка літає, а собака стрибає». Тож давайте подивимося, чи можуть слова Вень Сінь допомогти батькам вирішити проблему репетиторства з домашніми завданнями?
Дозвольте мені скласти математичну задачу і подивитися, як вона виконується:
[Конусоподібна купа піску, площа дна 8 квадратних метрів, висота 12 дециметрів, розкидайте цю купу піску на дорозі шириною 2 метри, товщиною 5 см, скільки метрів можна заасфальтувати? ] 】
Це свого роду математична задача, яку ми, можливо, виконували в дитинстві, і, судячи з відповіді Вень Сіня, логіка її відповіді цілком зрозуміла. Кожен крок прописаний. Батьки можуть побачити, чи є вона більш детальною, ніж та, що дається в деяких навчальних матеріалах.
Навіть, штучний інтелект може вказати на точки знань, які використовуються при розв'язанні задач, щоб допомогти дітям закріпити навчання, давайте запитаємо ще раз:
[Які знання беруть участь у вищезгаданому процесі розв'язання проблем?] 】
Вень Сінь чітко дав точки знань, пов'язані з цим питанням, такі як формула об'єму конуса, єдина одиниця виміру, об'єм, що залишається незмінним, і розв'язування рівнянь. Це практично для учнів, вчителів та батьків. Після того, як ці знання будуть чітко засвоєні, діти матимуть можливість робити висновки один від одного.
Надлогічні здібності великої моделі, безумовно, можуть бути використані не тільки для вирішення проблем. Планування маршруту для смарт-карт, розумні помічники для складних завдань, управління світлофорами в інтелектуальних транспортних системах і так далі - все це вимагає використання логічних можливостей.
Пам'ять тут в основному відноситься до того, що ви сказали раніше, чи запам'ятає це ШІ, контент, згенерований ШІ, чи буде він суперечливим. Це важливий показник для того, щоб відрізнити інтелект великих моделей, а багатораундовий діалог є втіленням здатності до запам'ятовування.
Я знаю, що багато творців використовують Вень Сіня для написання романів. А якщо зміст роману суперечливий, то він не читається. Сьогодні я попрошу його написати роман на місці, перемежувати деякі відволікаючі фактори питаннями і подивитися, чи зможе він згадати, що написав.
Спочатку я введу один:
[Будь ласка, допоможіть мені написати роман про бойові мистецтва, головна героїня – жінка, а сюжет має злети та падіння.] 】
Ну що ж, подивимося, вийшла канва роману:
Перший – це передісторія історії, у стародавньому світі бойових мистецтв повстають темні сили; Героїню звуть Лін'ер, і вона має силу маніпулювати внутрішніми силами та втечею.
Спочатку я введу один:
[Будь ласка, допоможіть мені написати роман про бойові мистецтва, головна героїня – жінка, а сюжет має злети та падіння.] 】
Ну що ж, подивимося, вийшла канва роману:
Перший – це передісторія історії, у стародавньому світі бойових мистецтв повстають темні сили; Героїню звуть Лін'ер, і вона має силу маніпулювати внутрішніми силами та втечею.
Далі починається історія. Лінґер хоче перемогти темні сили та врятувати бойові мистецтва. У кульмінаційний момент роману вона веде битву на життя і смерть з лиходієм, перемагає лиходія і рятує бойові мистецтва і всі секти.
Врешті-решт, Лінґер та її союзники також разом заснували Інститут внутрішнього культивування влади.
Тепер, коли історія в основному сформована, але вона трохи проста, я хочу додати ще кілька вимог до персонажів:
[Тепер зв'язок між символами занадто простий, є лише два символи, і додано ще 4 символи]
Вень Сінь дав ще чотири ролі одним словом, кожна з різною ідентичністю та особистістю, з різною особистістю, цей Муронг Гучен є поколінням гросмейстерів, і є пророк Сяо Ханьян, який може передбачити майбутнє.
Але тепер у романі все ще є необхідний елемент – драматичний конфлікт. Історія без конфлікту – це не найкраща історія, а процес перемоги героїні над темними силами просто зараз занадто простий, подивимося, чи зможемо ми його ускладнити.
Введіть ще один
[Також необхідно додати до історії драматичний конфлікт основної лінії, щоб зробити історію більш доступною для перегляду]
Розуміємо, це вже написано для драматичного конфлікту. Ось розворот, за темними силами справжнім лідером є високоповажна фігура рівня гросмейстера, яка кілька разів наражала героїню на небезпеку. До вирішальної битви героїня мала шанс дати відсіч.
Як бачимо, він пам'ятає, що головною лінією історії є протистояння Лінг'ера та темних сил, і конфлікт також обертається навколо цієї основної лінії.
Отже, Вень Сінь все ще пам'ятає історію, яку він щойно написав, і співвідносить цих персонажів з історією?
Зробимо ще одне прохання:
[Внесіть цих персонажів в план історії, яку ви для мене придумали, і придумайте назву.] 】
Результати показали на великому екрані, а роман називається «Праведна битва річок і озер», що додає до сюжетної канві додаткових персонажів і драматичних конфліктів. Четвертий і п'ятий розділи тут також розповідають нам, що великим майстром цього лиходія є Муронг Гучен, якого щойно представили.
Протягом усього процесу я постійно збільшував складність і висував нові вимоги, щоб заважати його пам'яті, а Вень Сінь все одно пам'ятав всі попередні потреби та відповіді, міг точно відповідати сюжетній лінії та персонажам, а його пам'ять була дуже дивовижною.
Тоді всі зараз на випробувальній сцені, пам'ятаєте, в чому особливі здібності головного героя Лінгера?
Можливо, більшість людей не пам'ятають, тож давайте подивимося, чи пам'ятає Вень Сінь?
[Які здібності має героїня?] 】
Що ж, відповідь є, це сила маніпулювати внутрішніми силами та втечею. Це приклад тексту, написаного Вень Сінь у першому раунді діалогу. Тепер, після п'яти раундів діалогів і кількох тисяч слів художньої літератури, він все ще може пам'ятати те, що писав раніше, а це здатність до запам'ятовування великої моделі.
Наприклад, щоб створити рекламний текст, йому потрібно зрозуміти тему створення, уточнити логіку створення, зберегти послідовність за допомогою пам'яті.
У розв'язанні задач також необхідно комплексно застосовувати вміння розуміти, генерувати, логіку, запам'ятовувати.
Давайте розглянемо комплексний приклад застосування:
Перш за все, ми відкриваємо реконструйований додаток Baidu, скануємо камерою вийняту пацієнтом коробку з ліками, і немає необхідності переглядати інструкцію дрібним шрифтом, а цифровий лікар-людина допоможе вам пояснити.
Питання, які з'явилися на екрані тільки зараз, такі як «їсти до або після їжі», «чи можна вживати алкоголь», «які ще запобіжні заходи», багато пацієнтів при щоденному прийомі ліків зіткнуться з проблемами.
Ми бачимо, що велика модель може не тільки допомогти пацієнтам інтерпретувати інструкції до ліків, але й об'єднати персоналізовані потреби для підвищення ефективності ліків та забезпечення точності та своєчасності прийому ліків пацієнтами.
Не так давно ми об'єднали модель Вень Сінь з професійними медичними знаннями і випустили велику модель Spirit Medicine, яка може допомогти пацієнтам і лікарям спілкуватися і створювати медичні записи, застосовуючи Spirit Medicine Bot. У цьому прикладі використовується не тільки здатність до осмислення і генерації логічної пам'яті, але і здатність до мультимодальної мови, зору і так далі.
Попередня демонстрація в основному відображає прогрес моделі Wenxin у чотирьох можливостях розуміння, генерації, логіки та пам'яті, які є основою для виживання всіх нативних додатків ШІ. Аналогічно, без багатої нативної екології додатків штучного інтелекту, побудованої поверх базової моделі, велика модель нічого не варта.
Далі я покажу вам, як виглядають ці вироби, реконструйовані за допомогою великих моделей? Це також для того, щоб розширити уяву кожного та надихнути всіх на створення більш дивовижних нативних додатків зі штучним інтелектом.
Baidu новий пошук, при відкритті інтерфейсу, крім того, що ви бачите вікно пошуку, результати пошуку будуть зовсім іншими, ніж минулі.
** Реконструйований новий пошук має три характеристики: надзвичайне задоволення, стимуляція рекомендацій і кілька раундів взаємодії. **
Що таке кінцеве задоволення? Коли ви вводите запитання в поле пошуку, наприклад «Що таке MBTI?» «Як припаркуватися збоку», новий пошук більше не для того, щоб дати вам купу посилань, а для того, щоб зрозуміти через велику модель і згенерувати найкращу відповідь
Наприклад, якщо ви запитаєте «рейтинг доданої вартості промисловості за країнами за останні 20 років», новий пошук не тільки підкаже вам відповідь безпосередньо, але й покаже відповідь за допомогою динамічних графіків.
З великого екрану позаду мене я бачу, що за останні два десятиліття наша промислова промисловість пережила стрімкий розвиток і перетворюється з країни-виробника на виробничу державу.
Це і є остаточне задоволення: один крок, щоб дати вам остаточну відповідь.
Отже, другий крок, після того, як ви побачили відповідь, що ще ви хочете побачити?
Тут використовується рекомендаційна стимуляція. Наприклад, після динамічного графіка функція збудження рекомендацій також дає «який зв'язок між доданою вартістю промисловості та ВВП» та «який вплив промисловості на розвиток національної економіки» ці питання також можуть вас хвилювати. Натисніть, щоб отримати відповідь.
Звичайно, не на всі потреби є єдина правильна відповідь. Потреби користувачів іноді можуть бути складними, і вони не зрозумілі в одному-двох реченнях. Користувачам також складно за один раз повністю висловити дуже складну вимогу за допомогою великого опису.
У цей час нам потрібно використовувати більш нову та персоналізовану модель пошуку для обслуговування користувачів, тобто багатораундову взаємодію.
Давайте розглянемо цей приклад:
Наприклад, якщо ви запитаєте «де рекомендоване місце для альпінізму навколо Пекіна», він дасть кілька відповідей, таких як гора Байхуа та гора Хайтуо, зміщені до пішохідних маршрутів;
Потім, він дає кілька підказок, щоб доповнити ваш вибір ситуації, ви можете вибрати між новачками, батьками-дітьми та переглядом опалого листя. Тепер він змінився, щоб рекомендувати Західну гору та гору Байван, на які відносно легко піднятися та вони більш дружні до занять батьків і дітей.
Тоді продовжуйте питати, яке спорядження вам потрібне для альпінізму та походів? Відповіддю були трекінгові палиці, туристичне взуття тощо, а також згадали, що раніше обрали тур для батьків та дітей, і особливо давали поради, як доглядати за дітьми.
Пошук, хоч і все ще починається з того простого ящика, але наступний крок за кроком, перевершив і реконструював початковий режим пошуку, не тільки поліпшив якість пошуку, але і прорвав сферу застосування пошуку і розширив межі продукту. такий
Інтерактивний пошук зі штучним інтелектом очолить трансформацію поколінь пошукової індустрії.
У найближчому майбутньому пошук стане інтимним помічником, здатним викликати, вирішити проблеми і навіть в будь-який момент порушити обмеження «кінця», щоб реагувати в будь-який час і в будь-якому місці, задовольняти потреби і супроводжувати весь процес.
Далі розглянемо другий продукт нативного мислення штучного інтелекту, Baidu GBI, Generative Business Intelligence, тобто генеративну бізнес-аналітику. **
Це продукт з нуля, а не рефакторинг існуючого продукту. **
У нашому діловому світі самим невід'ємним є бізнес-аналіз, тобто BI, як приймати найшвидші бізнес-рішення? Давайте спочатку відчуємо на відео:
Як бачимо, на відео президент ставив різноманітні професійні запитання. Є фінансовий аналіз, реалізація проектів і аналіз користувачів, а помічник президента GBI може швидко дати результат і дозволити президенту приймати рішення на місці.
Мало того, що людей з передовими інструментами не замінить штучний інтелект, так ще й «підвищення по службі та підвищення – це не мрія». Люди, які не використовують передові інструменти, ризикують втратити роботу. **
Отже, як Baidu GBI став на крок попереду? Він підриває традиційний аналіз даних трьома способами:
По-перше, традиційним BI можуть керувати лише професіонали, тоді як GBI може безпосередньо розуміти запитання президента та виконувати їх у режимі реального часу;
По-друге, GBI забезпечує зручний спосіб доступу, підприємства можуть отримувати доступ до даних, ставити запитання та аналізувати будь-які дані природною мовою, і більше не потрібно вручну виконувати різні професійні операції з базами даних і таблицями;
По-третє, GBI також має здатність навчатися, і компанії можуть вносити свій власний галузевий досвід, щоб стати галузевими експертами.
Це Baidu GBI, який може скоротити роботу з аналізу даних і написання звітів, яку бізнес-аналітики можуть виконати за десяток днів, до хвилинного рівня. Так звані бойові мистецтва світу можна зламати лише швидко;
** Конкуренція на підприємстві, не велика риба їсть дрібну рибу, а швидка риба їсть повільну рибу, швидше прийняття рішень, ніж конкуренти, є ймовірність, що ви виграєте! **
Сьогодні він став супер помічником, без якого не можуть обійтися жителі Baidu.
Тепер усі, будь ласка, подивіться, це як трансляція, яка записує в реальному часі. Давайте подивимося, чи зможе він запам'ятати всі щойно згадані моменти:
Це функція генерації протоколів засідань в один клік. Ми говоримо, що те, як ефективно проводити наради – це технічна робота. Ця функція значно зменшує робоче навантаження на нараду та скорочує час зустрічі на 40%.
Ще один поширений сценарій – робочі групи. Більшість людей на робочому місці часто засипають різними повідомленнями в груповому чаті. Тоді швидке узагальнення ключових моментів групового чату стає надзвичайно корисною функцією.
Давайте подивимося, як його використовують наші продакт-менеджери.
У нього 9 робочих груп, затримка на певний проміжок часу, непрочитаної інформації може бути більше тисячі, а Рулю може не тільки «1000 повідомлень, отримати фокус за одну секунду», але і грамотно розділити контент, який потрібно прочитати, на кілька категорій: «чекаю на підтвердження», «фокус на», «обговорення теми», що значно підвищує ефективність роботи.
Тож чи точно він доопрацьований, чи не буде його неправильно зрозумілий, чи він пропустить ключову інформацію? Це перевіряє здатність розуміти та генерувати великі моделі. Чим глибше розуміння, тим точніше резюме. Не кажіть, що 1 000, 10 000 одиниць інформації, наприклад, суперпомічник потоку також може дати інтелектуальну класифікацію та інтелектуальне резюме за кілька секунд.
Авіаквитки, готелі, переговори і т.д., ці транзакційні завдання виснажливі і трудомісткі! Якби у вас був помічник зі штучним інтелектом, який допомагав би вам вирішувати тривіальні завдання, чи хотіли б ви працювати більше?
Наприклад, нещодавно продакт-менеджер Рулю планував поїхати до Шанхаю, щоб зустрітися з паном Ваном з PICC. Ми знаємо, що PICC просуває інновації в продуктах і послугах, бізнес-моделях, цифрових технологіях та інших аспектах, і наша технологія штучного інтелекту в Baidu може зіграти свою роль.
Цей маршрут відрядження можна передати суперпомічнику Руліу, і давайте подивимося на його виконання.
Суперасистент може організувати поїздку, виходячи з інформації про свій розклад.
Подібно до того, як остання зустріч закінчується о 4 годині, тому бронюйте рейс після 7:30; І, згідно з його стандартами подорожей, допоможіть йому знайти готелі, де він зможе зупинитися. Нарешті було оформлено запрошення замовнику.
Перед зустріччю з клієнтом йому може знадобитися деякий бекграунд, і в цьому йому також може допомогти суперасистент. Завдяки зв'язку з CRM та іншими системними даними компанії, такими як flow, ви отримуєте детальні дані, такі як проекти співпраці та записи відвідувань.
Розуміючи ситуацію ділового співробітництва та зовнішню інформацію, таку як потік, він також може допомогти йому створити посилання на обговорення, заздалегідь встановити запитання, які може поставити клієнт, і дати кілька пропозицій щодо співпраці. З цієї точки зору, Рулю більше схожий на справжнього помічника?
Ми щойно побачили, що лише трьома словами Рулю завершив бронювання туристичних квитанцій, машинного вина та розкладів, і навіть підготував довідкові матеріали для переговорів, які є «подорожжю в один клік» Рулю. Як він це робить?
Це комплексне застосування розуміння, генерації, логіки та здатності пам'яті великої моделі, яка автоматично розбирає складні завдання на кілька простих завдань для виконання окремо, а потім об'єднується для отримання кінцевого результату. Ми кажемо, що підвищення ефективності означає підвищення конкурентоспроможності, наприклад, дозволити «розумній роботі» замінити «важку роботу».
Бібліотека Baidu повністю змінить наші звички працювати, вчитися та творити.
Як ми творили в минулому? Наприклад, скажімо, ви проводите презентацію про застосування штучного інтелекту в психології. На перевірку інформації, сортування матеріалів, написання рукописів, написання PPT та благоустрій PPT потрібно кілька днів.
Сьогодні на Baidu Wenko можна почати роботу з одного речення, поглянути на великий екран: По-перше, ви хочете, щоб він написав промову, а він знаходить десятки матеріалів на тему штучного інтелекту та психології.
Він також може визначити, які з них є академічними журналами, авторитетними звітами, а які просто масовими матеріалами. Якщо ви хочете написати живу статтю, вибирайте популярні матеріали, такі як есе та науково-популярні матеріали.
Тоді, якщо вам потрібна сувора академічна промова, ви можете перевіряти лише авторитетний контент, щоб переконатися в точності змісту. Потім, розуміючи ці рукописи, бібліотека створює добре структуровану та чітко визначену статтю, одночасно шліфуючи та форматуючи вміст.
Це можна зробити тому, що Baidu Wenku вже має 1 мільярд якісних документів, виходячи з розуміння цього змісту, писати по-справжньому практичні та зрозумілі документи, а не серйозну нісенітницю, як багато великих моделей, і це не буде загальною порожньою балачкою.
Далі презентація також потребує PPT. Бібліотека може об'єднати рукопис з деякими матеріалами, які ви зібрали, щоб автоматично згенерувати структуру PPT, а потім прикрасити малюнок, щоб зробити PPT з десятків сторінок.
Також є деякі ігрові процеси з можливостями мультимодальної генерації, такі як вибір стилю та перемикання стилів одним клацанням миші. Але є місця, які більше перевіряють здібності бібліотеки і вимагають від неї точного розуміння змісту. Наприклад, він повинен знати взаємозв'язок між ідеями, незалежно від того, чи є вони протиставленими або підпорядкованими, щоб розробити правильну діаграму.
Завдяки цій здатності розуміти, бібліотека також може написати відповідний мовний скрипт для цього PPT на основі генерації PPT. Мало того, він також може використовувати цей контент для визначення запитань, які може поставити аудиторія, і підготувати вас до відповідей.
Ми оцінили, що здатність генерувати бібліотеки, особливо PPT, набагато перевершує будь-який інший інструмент на ринку, як іноземний, так і вітчизняний. Раніше люди приходили до бібліотеки, щоб знайти готовий контент. У майбутньому люди зможуть створювати контент на свій розсуд ефективніше, ніж будь-який інший інструмент підвищення продуктивності.
Не так давно, в перший день виходу нової версії Baidu Wenku, нова функція штучного інтелекту подарувала понад 2 мільйони вражень. Тепер ми з більшою впевненістю можемо сказати, що в епоху великих моделей Baidu Wenku є найкращою відправною точкою для створення контенту.
У напрямку реконструкції штучного інтелекту мережевий диск Baidu фокусується на виконанні хорошої роботи в інтелектуальних сервісах для особистих файлів.
Те, що ви бачите зараз, - це нова домашня сторінка мережевого диска Baidu.
** Реконструйований мережевий диск не тільки реалізує трансформацію від взаємодії з графічним інтерфейсом до взаємодії природною мовою, але й покращує розуміння мультимодальної інформації. **
Тепер, лише одним реченням, ви можете оперувати файлами, зображеннями, відео тощо на своєму онлайн-диску.
Насамперед потрібно знайти картинки або відео. Іноді, ми замислюємося над картинкою і хочемо знайти її на мережевому диску, часто після багатьох кроків, підкидаючи протягом півдня не вдається знайти. Тепер ви промовляєте слово «Cloud One», і це може допомогти вам точно визначити його:
Що ж, це допомогло мені швидко знайти те, що головний науковий співробітник OpenAI LLYA опитав про трансформери.
За цим, здавалося б, простим пошуком стоїть роль кількох можливостей штучного інтелекту, який повинен вміти розуміти відеоконтент, ідентифікувати персонажів і формувати контекстну пам'ять, щоб точно визначити місцезнаходження певного кадру відео, що є дуже провідною технологією в глобальній сфері персональних хмар.
Друга фішка Yunyi полягає в тому, щоб допомогти користувачам швидко зрозуміти зміст відео, давайте подивимося:
Ви можете побачити, що демонструються дві здібності, одна - це здатність узагальнювати і узагальнювати зміст, і здатність витягувати золоті речення. Це 43-хвилинне інтерв'ю, завдяки розумінню та логічним здібностям ШІ, Юн Ідуо узагальнив та вдосконалив відео, представивши Лю та його основні ідеї.
Але багато разів ми будемо відчувати, що оригінальний текст дуже захоплюючий, після дистиляції основної ідеї або резюме він не такий привабливий, тому друга функція тільки зараз, я думаю, насправді корисніша для мене, тобто ми повинні знайти найцікавішу частину оригінального відео, а саме ці золоті речення. Наприклад, LLYA говорить, що «вивчення статистичних законів набагато важливіше, ніж споглядання зовнішності». Ключовим проривом у витягуванні цього золотого речення є ефективне вилучення мультимодальної інформації, яка є провідною світовою технологією. Він може знайти найкращі частини з контенту довгого інтерв'ю, що значно покращує наше навчання та ефективність роботи.
Це новий мережевий диск після реконструкції ШІ. Станом на вчора Yunyi досягла позначки у 20 мільйонів користувачів.
Це інтелектуальний помічник зі штучним інтелектом на базі персональної хмари. За останнє десятиліття Baidu визначив те, що називається мережевим диском; У наступному десятилітті Baidu буде використовувати штучний інтелект для перевизначення нових мережевих дисків.
Ми реконструювали цей продукт 18-річної давності з власним мисленням штучного інтелекту, який також є першим у світі продуктом для нативних карт зі штучним інтелектом.
За останні 18 років Baidu Maps накопичив безліч функцій, він може здійснювати навігацію, викликати таксі, знаходити водія на заміну, бронювати готель, купувати квиток і навіть задовольняти потреби пошуку POI в більш складних умовах. У минулому ці операції були складними і часто вимагали шести-семи кроків або більше для виконання;
Тепер, поки користувач говорить про попит, карта може мобілізувати тисячі інтерфейсів сервісних API, а багаторівневе меню стає одноетапним прямим і швидким реагуванням.
Давайте розглянемо далі, як реалізована карта Baidu?
У відео користувачі перевіряють розуміння Baidu Map попиту, вибору проміжних точок зустрічі, порівняння інформації з різних місць, а також рекомендації та бронювання майбутніх подорожей, і це дає розумні рішення.