Випущено велику модель Wenxin 4.0! Претензії до бенчмарку GPT 4.0

Джерело статті: Geek Park

Автор | Лі Юань

Редагувати | Цзін Юй

Від пошуку, бібліотеки до бізнес-аналізу, великі моделі штучного інтелекту стали «вертикальною лінією» Baidu.

«Ласкаво просимо в еру генеративного ШІ! **」

17 жовтня 2023 року в білій сорочці та маленьких білих туфлях Робін Лі, засновник, голова та генеральний директор Baidu, оголосив про настання нової ери на сцені.

На цій прес-конференції під назвою «Генеруючи майбутнє» Робін Лі офіційно випустив останню версію 4.0 великої мовної моделі компанії, Wenxin Big Model, і навчив людей, як використовувати слова-підказки, щоб оновлена модель Wenxin була застосована, допомагаючи людям використовувати фонд Пекіна для покупки будинків в Хебеї, створення реклами та відео, а також створення онлайн-романів.

Робін Лі безпосередньо порівняв Wenxin Model 4.0 з GPT-4 на зустрічі|Baidu

На зустрічі **Робін Лі впевнено заявив, що можливості версії 4.0 моделі Wen Xin «не менше, ніж GPT-4».

При цьому заява про те, що «всі заявки варті того, щоб їх реконструювати великими моделями», озвучена півроку тому, також мала результати на засіданні в той же день. Від основного бізнес-пошуку до бібліотеки Baidu, мережевих дисків, карт та інших програм сімейства Baidu — вони були підключені до великої моделі Wenxin, демонструючи кращі можливості взаємодії та логіки.

На стороні «Б» Робін Лі також викрив інструменти GBI (генеративний бізнес-аналіз), а також офісних помічників з великими модельними можливостями «Руліу».

Якщо генеративний ШІ активізує весь технологічний світ, то Baidu може стати гігантом, який отримає найбільшу вигоду.

01 Wen Xin 4.0 Прямий бенчмарк GPT-4

Як тільки почалася прес-конференція, Робін Лі вперше оголосив про вихід версії 4.0 моделі Wenxin.

Baidu виділяє чотири визначальні критерії можливостей великих моделей: розуміння, генерація, логіка і пам'ять. Цього разу оновлення великої моделі Wen Xin 4.0, інфраструктура все ще така ж, як у версій 3.0 і 3.5, але претендує на значне поліпшення з точки зору логіки та пам'яті.

Робін Лі анонсує Wenxin Grand Model 4.0|Baidu

За словами технічного директора Baidu Ван Хайфена, покращення розуміння та здатності генерації Wenxin Big Model 4.0 є аналогічним, тоді як покращення логіки в 3 рази більше, ніж розуміння, а покращення пам'яті — у 2 рази, ніж розуміння**.

Чотири різні можливості можуть підвищити ефективність різних сценаріїв застосування. За ці здібності Лі Яньхун показав це на місці.

Розуміння є основою для розмовного ШІ, щоб допомогти користувачам, і це дуже важливо в державних справах, маркетингу, обслуговуванні клієнтів та інших сферах.

З точки зору здатності до розуміння, сцена використовувала зміну порядку слів і розпливчастий вираз (підказку), щоб перевірити здатність моделі: «Я хочу повернутися в Ченде, щоб купити будинок, чи можу я скористатися позикою з резервного фонду?» А як щодо процедур? Я працюю в Пекіні».

Щоб зрозуміти це речення, ШІ повинен зрозуміти, що «робота в Пекіні» та «повернення в Ченде, щоб купити будинок» насправді мають «фонд виплати в Пекіні, а хукоу в Ченде». Такий підтекст з китайською специфікою може дати точні відповіді, які потрібні користувачам. І, звичайно ж, Вень Сінь швидко зрозумів ключ до питання і дав правильну відповідь.

Робін Лі пояснює чотири основні можливості AI|Baidu

Здатність генерації в основному може підвищити ефективність маркетингу бренду, копірайтингу та творчої роботи.

На сцені Лі Яньхун показав, що за картинкою, за допомогою підказок природною мовою можна виконувати трансформацію фону, розмиття об'єкта, а також генерувати плакати та копірайтинг відповідно до інформації офіційного веб-сайту.

На додаток до традиційної обробки зображень, Baidu також продемонстрував свою здатність генерувати відео. За допомогою природної мови під час демонстрації в прямому ефірі Вень Сінь майже без затримок згенерував цифрову людську усну відеорекламу. Відео включає фотографії продукту, додає багато перехідного фону, а цифрова людина в костюмі час від часу з'являється, щоб представити функції продукту, зібрані з офіційного веб-сайту.

Відображення в реальному часі можливостей генерації реклами Wenxin Model 4.0|Baidu

Ефект, якого можна було досягти лише завдяки співпраці кількох продуктів AIGC, був органічно інтегрований у цей дисплей. На створення одного рекламного фільму, 5 рекламних текстів і плаката пішло менше 3 хвилин.

Логічні міркування, як правило, проявляються як перевірка математичної логіки. У цій презентації Baidu підкреслила свій потенціал в освіті.

Лі Яньхун дав прикладну задачу, що передбачає перетворення конічного об'єму в об'єм куба, а Вень Сінь не тільки дав рішення, але й розв'язав задачу крок за кроком, а також проаналізував точки знань, пов'язані з кожним кроком.

Використовувати генеративний штучний інтелект для навчання дітей домашнім завданням простіше|Baidu

Для відображення здатності до запам'ятовування вибір Baidu більш особливий.

Байду вирішив дозволити Вень Сіню написати сценарій роману про бойові мистецтва. Після того, як сценарій буде завершено, на початковому контурі дозвольте великій моделі збільшити стосунки між персонажами та посилити драматичний конфлікт, щоб показати, що велика модель може запам'ятати початкову обстановку контуру та здібності персонажа після додавання складної інформації, не використовуючи безцільно уяву.

Baidu також поділилася технічною підтримкою для покращення можливостей великої моделі Wenxin.

Раніше Baidu оголосила, що модель Wenxin є першою великою моделлю, навченою за допомогою кластера Wanka в Китаї, і багато людей припускають, що очікується, що шкала параметрів моделі Wenxin 4.0 перевищить рівень трильйона. Однак на цій конференції Baidu не наголошувала на рівні параметрів великої моделі.

На додаток до навчання Wanka, технічний директор Baidu також зазначив, що середньотижневий показник стабільності навчання алгоритмів Baidu перевищив 98%, а технологія підвищення точок знань була проведена з точки зору введення та виведення.

02 "Рефакторинг" Baidu Family Bucket

Хоча вони показані окремо, насправді частіше за все чотири основні можливості великих моделей застосовуються в комплексі.

У травні Baidu оголосила про використання великих моделей для реконструкції додатків Baidu. На цій конференції Baidu також продемонструвала останні досягнення застосування Baidu реконструкції великих моделей Wenxin.

Серед них найдивовижнішим є рефакторинг пошуку.

У лютому Microsoft запустила новий Bing на основі технології GPT для рефакторингу пошуку. У своєму останньому свідченні Наделла з Microsoft сказав, що частка Microsoft на ринку пошуку майже не змінилася з моменту додавання можливостей штучного інтелекту в Bing.

Новий Bing від Microsoft в основному запустив систему розмовних ботів, які можуть спілкуватися з новим Bing, щоб задавати питання, щоб отримати інтегровану інформацію з посиланнями. Bard від Google схожий.

Baidu використовує штучний інтелект для реконструкції свого основного бізнес-пошуку|Baidu

Однак пошукова реконструкція Байду цього разу заглиблюється у всю пошукову систему. Байду описує це як «максимальне задоволення, стимуляція рекомендацій і кілька раундів взаємодії».

Максимальне задоволення відображається у введенні запитання в пошуковий рядок, Пошук більше не може дати посилання, а безпосередньо згенерувати найкращу відповідь.

У своїй презентації Робін Лі порушив питання про те, яким є рейтинг промислової доданої вартості різних країн за останні 20 років.

На відміну від нових Bing і Bard, які можуть дати пов'язану відповідь на дані, новий Baidu може безпосередньо давати динамічний табличний графік у вигляді гістограми, що показує значення промислового зростання різних країн. Цей графік навіть динамічний, зростає і змінюється з часом.

Функція збудження рекомендацій певною мірою еквівалентна відповідним питанням поточної пошукової системи, що може спонукати користувача продовжувати розуміти деякі пов'язані питання відповідно до підказки, наприклад, «Який зв'язок між промисловою доданою вартістю та ВВП?». «Який вплив промисловості на розвиток національної економіки?».

Робін Лі ділиться досвідом застосування відра сім'ї Baidu|Baidu

І багаторазові раунди взаємодії теж дуже цікаві.

У нинішній хвилі підприємництва з великими мовними моделями один із багатьох підприємців наполегливо працює над використанням, тобто використанням великих мовних моделей із механізмами рекомендацій для проведення кількох раундів діалогу, щоб надати користувачам найкращий вибір.

У вересні компанія Baidu провела проект конкурсу з підприємництва Wenxin Cup, і першим призером Buysmart.AI став лідером у цьому напрямку. Користувачі використовують природну мову та кліки, щоб постійно уточнювати свої потреби, а Buysmart.AI використовує механізм рекомендацій, щоб зрештою рекомендувати продукти, які найбільше потрібні користувачам.

Реконструйований пошук Baidu безпосередньо додає функцію подібного напрямку до пошуку.

У демонстрації пошукова підказка Baidu запитує: «Куди піти в похід по Пекіну?» Після надання кількох відповідей, таких як Байхуашань, гора Хайтуо тощо, пошукова система дозволяє користувачам далі натискати, щоб доповнити та вибрати власну ситуацію. Наприклад, якщо ви вирішите додати новачків у походах для батьків і дітей, пошукова система зміниться, щоб рекомендувати такі місця, як Сішань і Байваншань, на які відносно легко піднятися та які є більш дружніми для батьків і дітей.

Крім реконструкції пошуку, Baidu також показав реконструкцію мережевого диска Baidu, карти Baidu, бібліотеки Baidu та інших додатків.

Хмарний персональний хмарний помічник Baidu Network Disk вже був запущений раніше. Будучи першим у світі персональним хмарним помічником, він наразі налічує 20 мільйонів користувачів. Ви можете використовувати природну мову для спілкування з асистентом, знайти відео в персональній хмарі одним реченням, зрозуміти відеоконтент, знайти певний контент у відео, узагальнити золоте речення відео тощо.

Baidu Map, згідно з промоцією Baidu, є першим у світі картографічним продуктом зі штучним інтелектом. Спілкування з помічником карти дає можливість отримати доступ до тисяч сервісів у багаторівневому меню за один крок. Ви також можете порекомендувати ресторани з відповідним розташуванням, вибрати середовище ресторану і, нарешті, замовити таксі безпосередньо.

Спираючись на мільярди минулих рукописних ресурсів, Baidu Wenku може безпосередньо вибрати тип необхідної статті, серйозну академічну літературу або загальнодоступні матеріали після того, як користувачі шукатимуть інформацію на певні теми, і створювати статті в один клік.

Реконструйована бібліотека Baidu також додає функцію генерації PPT, яка може зрозуміти, чи є представлення зіставленими чи прогресивними, і перемикати стиль стилю PPT одним клацанням миші, стверджує Baidu, що «далеко за межами інших інструментів генерації PPT на ринку».

03 Сила Б

У цій демонстрації Baidu також показав кілька нових додатків на стороні Б.

Серед них Baidu зосередилася на запуску продукту бізнес-аналітики. Baidu GBI, генеративна бізнес-аналітика.

Це новий продукт, запущений Baidu, який є першим генеративним продуктом бізнес-аналітики в Китаї, з можливістю підтримувати взаємодію з природною мовою, аналіз між базами даних і навчання професійним знанням, скорочуючи роботу з аналізу даних, яку бізнес-аналітики можуть виконати за кілька днів, до хвилин.

Продукти Baidu GBI, орієнтовані на сторону Б|Baidu

У рекламному ролику питання «Яка кошторисна вартість?» Яка мінімальна ціна без втрати грошей? Клієнт попросив нас завершити доставку протягом 3 місяців, чи можемо ми це зробити? Скільки часу найшвидший? Якщо конкуренція правильна, наприклад, наша низька ціна, що можна зробити?» Для цієї серії пов'язаних запитань фінансового аналізу, взаємодії з проектами та аналізу користувачів Baidu GBI може безпосередньо давати відповіді за допомогою діалогу природною мовою та генерувати ілюстровані відповіді.

Експерт не потрібен, а для доступу до даних у базах даних і таблицях не потрібні додаткові операції. Крім того, компанії також можуть навчити їх отримувати професійні знання та ставати експертами галузі.

Ще одним продуктом на стороні Б є Ruliu. Після використання генеративного штучного інтелекту для рефакторингу, такий як Flow, може генерувати протоколи зустрічей одним клацанням миші, узагальнюючи вміст тисяч робочих груп. У поєднанні з CRM-системою компанії пропонуйте менеджерам передісторію проекту та його обговорення. Згідно з особистим маршрутом, плануйте робочі плани, розсилайте запрошення на зустрічі тощо.

На додаток до створення офісу, Baidu також продемонструвала розширення можливостей великих моделей для автономного водіння, інтелектуальної кабіни пілота та урядових проектів інтелектуального моніторингу.

З моменту свого випуску, що тривав понад півроку, Wenxin швидко реконструював додатки Baidu, і в той же час поступово створює екосистему Wenxin.

На прес-конференції Baidu також представила нещодавно запущену платформу Lingjing. Незалежно від того, чи це особисті чи корпоративні дані чи програми, їх можна швидко перетворити на плагін на платформі Lingjing, а API можна використовувати для доступу до можливостей великої моделі Wenxin.

Робін Лі прогнозує прийдешню екологічну еру штучного інтелекту|Baidu

Baidu повідомила, що в поточному місяці з моменту запуску платформи Lingjing 27 000 розробників подали заявки на облаштування, охоплюючи понад 20 сфер, включаючи юридичні консультації, створення резюме, створення мозкових карт, розмовну практику та інші нативні програми в різних сценаріях. Приватні дані підприємства можуть бути легко та швидко доступні до можливостей цієї сучасної великої моделі без ризику витоку.

«Китай має безліч сценаріїв застосування, і китайські користувачі, природно, готові використовувати нові технології, а за допомогою передових базових великих моделей ми можемо побудувати процвітаючу екосистему штучного інтелекту та спільно створити новий виток економічного зростання». – сказав Лі Яньхун.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити