Чи може генеративний штучний інтелект створити майбутнє Baidu?

Першоджерело: Light Conone Intelligence

Автор: Лю Юці

Джерело зображення: Створено Unbounded AI

Вітер починається в кінці Цінпіна, і випадковості і неминучість долі часто переплітаються.

2019 рік – найтемніший за всю історію штучного інтелекту. Після поразки AlphaGo від Лі Седоля у 2016 році, появи архітектури Tansformer у 2017 році, що призвело до масштабного вибуху технологій, та підприємницького буму у 2018 році. У 2019 році приплив капіталу, період технічних вузьких місць і складність сцен посадки відкрили «хаотичну еру» в історії штучного інтелекту.

Ніхто не знає, коли з'явиться загальний штучний інтелект, так само як трисолярець не знає, коли зійде сонце. **

Того року велика кількість компаній, що займаються штучним інтелектом, потрапила у звільнення, розірвала ланцюги капіталу та ускладнила виробництво продуктів, і мало що залишалося для того, щоб вистояти.

Але також у 2019 році почала зароджуватися нова надія на ШІ: у липні OpenAI прийняла інвестиції Microsoft та глибоку співпрацю з нею, і саме з цього року почали розробляти GPT-3, який зараз шокує світ; Компанія Baidu, яка першою запровадила стратегію ШІ в Китаї, з початку року провела піврічну кадрову перебудову, і тепер, схоже, перегрупування військ, схоже, відкрило чотирирічний період наполегливості.

У 2019 році Ван Хайфен був підвищений до технічного директора групи та продовжив виконувати обов'язки генерального керівника системи технологічних платформ штучного інтелекту (AIG) та базової технологічної системи (TG), які є найважливішими технічними основами Baidu; Шен був підвищений до старшого віце-президента, відповідального за бізнес-групу мобільної екосистеми, а потім перейшов до Baidu Intelligent Cloud у 2022 році, ставши піонером другої кривої зростання Baidu. Серед нових сил, представлених у 2019 році, Хе Цзюньцзе є єдиним віце-президентом Baidu після 80-х років, який спочатку відповідав за інвестиційні злиття та поглинання та стратегічні інвестиції, а потім повторно використовував, відповідаючи за вакантну мобільну екологічну бізнес-групу Shen Jing, яка має більш реальну владу.

Настав час 2023 року, і можливості Transformer нарешті зламали стелю OpenAI цього року, вийшовши на новий рівень, а прорив технологій зробив OpenAI найпопулярнішою компанією у світі. Microsoft затьмарила технологічний блиск Google.

** За останні чотири роки основний бізнес Baidu сформував трикутну структуру на чолі з інтелектуальною хмарою Shen Tian, Хе Цзюньцзе відповідає за мобільну екологію, Ван Хайфен — за технологію пресингових масивів, а Baidu нарешті закінчив період затишшя і почав перетворювати оборону в атаку, і дія безперервна. **

«Зроби кожну заявку заново» - це перший яскравий меч після півроку накопичення енергії, і тепер Байду схожий на планету, яка ось-ось зіткнеться з величезним «технологічним гравітаційним полем» і повністю змінить свою орбіту.

Напередодні появи великих моделей

У 2017 році Google запропонував архітектуру Transformer у статті під назвою «Attention Is All You Need» для заміни традиційних моделей циклів RNN і CNN, які показали, що точність навчання Transformer вища, ніж у всіх попередніх моделей, час навчання значно нижчий, ніж у попередньої моделі, а тренувальний ефект також хороший, коли вміст навчального набору невеликий.

З тих пір архітектура Transformer була швидко прийнята і застосована в області NLP і CV, особливо в області NLP, де механізм уваги дозволяє машинам більш точно розуміти семантику і генерувати її, а також зменшувати дублювання інформації.

Будучи однією з перших компаній, яка відкрила та простежила за технологічним маршрутом Transformer, Baidu проводить дослідження в галузі НЛП більше десяти років і сформувала команду ощадливого НЛП, сформовану провідними експертами, такими як Ван Хайфен, Ву Тянь, Ву Хуа тощо.

Ван Хайфен

На той момент першим важливим завданням команди НЛП була побудова перекладу Baidu. Ван Хайфен сміливо застосовує глибоке навчання та нейронні мережі до перекладу, щоб покращити розуміння контексту машиною та сформувати більш плавний переклад. Ця смілива спроба також зробила Baidu Translate першою системою перекладу, яка підтримувала понад 200 мов, навіть за рік і 3 місяці до Google.

** Це також прототип здатності до розуміння чотирьох основних можливостей великої моделі «розуміння, генерація, логіка та пам'ять». **

Але Ван Хайфен вважає, що НЛП недостатньо. Він спеціально вирушив до кабінету Лі Яньхуна, щоб доповісти, і запропонував наступну «висаджену Нормандію» - розпізнавання мови. Його міркування полягають у тому, що технологія розпізнавання мови ось-ось досягне критичної точки індустріалізації, і як тільки вона прорветься, вона незабаром буде комерціалізована у великих масштабах.

Маючи власні судження про технології, Лі Яньхун вирішив знову підтримати Ван Хайфена і послідовно заснував паралельно з відділом НЛП «відділ розпізнавання мови», «відділ розпізнавання зображень» і «відділ графа знань».

Операція Ван Хайфена змусила багатьох студентів Baidu спантеличитися: «Ці технології не мають нічого спільного з нинішніми продуктами Baidu, це для того, щоб накопичити на Новий рік, щоб створити стільки відділів в одному мозку?» "

У той час Ван Хайфен побачив, що пошукові дані мають дуже сильну підтримку логіки формування великої моделі. «Baidu має найбільшу в світі пошукову систему, яка не тільки має високу своєчасність інформації, але й має високий рівень точності, що дозволяє побудувати найповніший граф знань», — пояснив Ван у публічному інтерв'ю. **

Перед створенням Wenxin Байду створив мультигетерогенний надмасштабний граф знань з більш ніж 5 мільярдами сутностей і 55 мільярдами фактів, і зміг отримати єдине розуміння світу за допомогою мови, слуху, зору тощо. Його модель для підвищення знань, випущена в 2021 році, ERNIE (Wenxin) 3.0, є попередницею Wenxin Yiyan, і проєкт в основному відповідає за Wu Tian.

Ву Тянь

У 2019 році знову був випущений Baidu Wenxin 1.0, а за 4 роки було проведено 3 версії. У листопаді 2022 року Ву Тянь одночасно оголосив на публічному саміті про 11 галузевих моделей, які Wenxin накопичила, охоплюючи електроенергетику, газ, фінанси, аерокосмічну та інші галузі, і спочатку сформувалася промислова екологія.

** Все це провіщало і проклало шлях для Байду, щоб превентивно оприлюднити слова Вень Сіня. 16 березня, після оприлюднення слів Вень Сіня, Байду знову повернувся в центр уваги, але більш ніж підтвердив, що це було сумнівно. **

«У разі такого високого ринкового попиту все одно дуже важливо, хто зробить це першим», — сказав якось Лі Яньхун в інтерв'ю, навіть якщо продукт ще не повністю зрілий, але все одно має бути випущений: «Після оприлюднення слів Веньсіня незліченна кількість людей, людей, які не контактували зі мною в минулому або які знаходяться далеко від мене в галузі, запитують, як ми можемо співпрацювати з Baidu, як спробувати його якомога швидше».

**З технічної точки зору, великі моделі є високошвидкісними ітераціями «все більше і більше використовується». ** «Під час внутрішнього тестування співробітник запитав, як Вень Сінь може сховати голову і погано написати вірш? Я сказав, зачекайте, я думаю, що я зможу вивчити це післязавтра, і це можна буде використовувати наступного дня, і прогрес великої моделі також є безперервним процесом навчання», — сказав Ван Хайфен з посмішкою.

За півроку Wenxin Yiyan провів три ітерації від 3.0 до 3.5, а потім до версії 4.0, за словами Ван Хайфена на зустрічі, масштаб користувачів Wenxin Yiyan досяг 45 мільйонів, 54 000 розробників, 4 300 сценаріїв, 825 додатків і понад 500 плагінів.

Вода, полита в НЛП, внесені добрива, нарешті принесли високий урожай у 2023 році, і, як сказав Лі Яньхун, шлях технологічного розвитку – це процес «двох життів, двох життів, трьох, трьох життів і всього сущого».

Внутрішня сила великих моделей

Після спалаху загального штучного інтелекту увага хмарних обчислень і увага підприємств досягла піку, і справа дійшла і до «iPhone моменту».

Поява великих моделей, що призводить до величезного розриву в обчислювальній потужності, хмарні обчислення не тільки для великої моделі, щоб забезпечити підтримку потужності хмарних обчислень, але й найкраща точка посадки для великих моделей лендінгових підприємств, будь то Baidu чи будь-яке підприємство з великою моделлю, коли виходить велика модель, наступним фокусом є просування на ринок, нехай підприємства використовують.

** Для Байду такий тягар лягає на плечі Шень Шу. **

Шень здригнувся

Серед шести керівників бізнес-групи Baidu, за винятком технічного директора Ван Хайфена, Шень є єдиним старшим віце-президентом. Незважаючи на те, що вони обидва мають технічну освіту, на відміну від ролі «інженера» Ван Хайфена, Шень відповідав за зростання ключових бізнесів з того часу, як він приєднався до Baidu.

За 10 років, що минули з моменту приєднання до Baidu, Шен послідовно інтегрував рекламну систему та покращив можливості монетизації системи; Об'єднувати потоки пошуку та стрічки; Він об'єднує бізнес-групу мобільної екосистеми, оновлену пошуком, щоб заповнити територію мобільної екосистеми Baidu.

** Якщо Ван Хайфен створив гострий ніж, то Шень Шу є піонером, який може використовувати цей гострий ніж, щоб відкрити територію, за словами Лі Яньхуна, «наважитися вести важку битву і може виграти битву». **

У травні 2022 року Шень Цзісін був призначений президентом Baidu Intelligent Cloud (ACG) Business Group. Для Baidu вона спочатку не робила повної ставки на хмарні обчислення, але саме з постійним розвитком технології штучного інтелекту Baidu усвідомила недоліки хмарних обчислень і почала таємно культивувати другу криву зростання.

**У зв'язку з відсутністю переваги першопрохідця, мета Baidu Cloud за останні 10 років дуже зрозуміла, не конкурувати зі «старими гарматами» в масштабах шару IaaS, а за рахунок комбінації PaaS + SaaS та інтелектуальних можливостей, грати в диференціацію та врізатися в діджиталізацію підприємств у невеликих битвах. **

На Всесвітній конференції Baidu 2023 року Шен знову запропонував стратегію «інтеграції хмарного інтелекту»: «Глибоке поєднання штучного інтелекту та хмарних обчислень є ключем до швидкого впровадження підприємствами нативних додатків штучного інтелекту. В даний час всі додатки і сервіси Baidu Group працюють на Baidu Intelligent Cloud на основі технологічної архітектури «Cloud-Intelligence Integration».

**Згідно зі спостереженням оптичного конуса, суть стратегії інтеграції хмарного інтелекту полягає в тому, що, з одного боку, покладаючись на Baidu Intelligent Cloud, він може швидко надавати підприємствам повний набір послуг великого зразка; З іншого боку, великі моделі також підвищують поріг цифровізації підприємств. **

За п'ять місяців після поглинання ACG Shen швидко інтегрував «суперфабрику з обслуговування великих моделей» - Wen Xin Qianfan у відповідь на основні потреби підприємств в епоху великих моделей і розділив користувачів на п'ять категорій користувачів відповідно до їхніх потреб.

Перш за все, з огляду на розрив попиту, викликаний обчислювальними ресурсами потужності, платформа Qianfan надає різні види гетерогенної обчислювальної потужності. Наприклад, у найдорожчій навчальній ланці, завдяки розподіленому паралельному навчанню та можливостям взаємозв'язку мікросекундного рівня, платформа Qianfan може досягти коефіцієнта прискорення навчання 95% і ефективного коефіцієнта часу навчання 96%, значно зменшуючи обчислювальну потужність клієнта та витрати часу.

По-друге, на рівні моделі, для клієнтів, які хочуть безпосередньо називати існуючі великі моделі, підприємства можуть швидко викликати кілька великих моделей, включаючи Wen Xin Yiyan, тоді як платформа Qianfan надає такі інструменти, як китайське вдосконалення, підвищення продуктивності та покращення контексту. За словами Shen Ji, платформа Qianfan обслужила понад 17 000 клієнтів.

**Для клієнтів із вторинними потребами в розробці платформа Qianfan надає повний ланцюжок інструментів життєвого циклу, такий як перенавчання, точне налаштування, оцінка та розгортання для великих моделей, з найбільшою в галузі кількістю 41 високоякісних галузевих наборів даних і швидко оптимізує їх для власних бізнес-сценаріїв.

На конференції також була проведена практична демонстрація того, як швидко розробляти програми запитань і відповідей знань для Sany Heavy Industry на основі фреймворку retrieval enhancement generation (RAG, Retri Augmented Generation): просто виберіть попередньо встановлений фреймворк RAG у робочому столі нативного додатка Qianfan AI і налаштуйте відповідні параметри, щоб швидко реалізувати розробку та запуск програми інтелектуального обслуговування клієнтів на офіційному сайті Sany Heavy Industry.

** Шен сказав, що створення такого «маленького помічника», навіть якщо йому потрібно буде обробляти документи довжиною в тисячі тисяч слів, коштує всього кілька сотень юанів; Після цього кожна консультація користувача коштує всього кілька центів. **

Протягом тривалого часу великомасштабна промисловість, виробництво та сільське господарство були глибоководними сферами цифровізації, і основна причина полягає в тому, що складність галузі призвела до високого порогу цифровізації, і її важко приземлити.

Однак за рахунок великої моделі не тільки знижується поріг використання, але і знижується вартість використання. Немає необхідності будувати якусь нову систему, і вона не вимагає ручної участі, це більш досконалий метод застосування технічних компонентів, ** комбінація обох, але також обертається маховик хмарного інтелекту, поступово накопичуючись. **

Інноваційні виклики для великих моделей

Минуле – це вирішене наперед, але майбутнє може змінитися.

Усі вендори з великими моделями знайшли можливості на прикладному рівні. Microsoft почала працювати над повною лінійкою продуктів, включаючи системи Bing, Office і Windows, в березні, і Алі Даніель Чжан сказав: «Ми повинні використовувати велику модель, щоб переробити всі продукти», але це речення, простіше кажучи, є найбільшим інноваційним викликом в епоху великих моделей.

Як штучний інтелект рефакторизує програми? Для цього потрібні не тільки ділові здібності, а й уява, і перед обличчям нової ери штучного інтелекту Baidu також передала естафету в руки молоді. **

Після травня 2022 року Шень Цзе змінив на посаді керівника бізнес-групи MEG Хе Цзюньцзе, віце-президент покоління після 80-х, представленого в плані будівництва ешелону талантів Baidu. Якщо Шень Жань — це «фракція жорсткої війни», то Хе Цзюньцзе — справжня «молода сильна фракція». Як говорив Жень Чженфей, необхідно «дозволити тим, хто чує гармату, командувати боєм».

** Рефакторинг додатку не зламаний і не стоїть, на відміну від нього, Baidu дійсно «особливо безжальний» до себе. **

На Всесвітній конференції Baidu, присвяченій «екології», Хе Цзюньцзе передав відповіді «мобільна екологія», «екологія контенту» та «екологія бізнесу».

Серед них мобільна екосистема охоплює нативні програми штучного інтелекту, такі як «New Search», «New Wenku», Wenxin Yiyan APP та електронну комерцію Baidu «Huibexing»; На екологічному рівні контенту серія додатків, таких як Baidu APP «AI Editor», розширює можливості екосистеми творців; На рівні екології бізнесу запустили маркетингову платформу AI Native «Light». Крім того, Хе Цзюньцзе також анонсував плагін екології Wen Xin Yiyan - «Матриця духів», яка тепер повністю відкрита.

** Новий пошук, визначений Baidu, є саме логікою розрахунку коробки, запропонованою Робіном Лі у 2010 році. ** Він має три характеристики: кінцеве задоволення, стимуляція рекомендацій і багатораундова взаємодія. Тобто, коли користувачі шукають питання, «більше не дають вам купу посилань», а через розуміння контенту, генерують мультимодальні відповіді, такі як текст, картинки та динамічні діаграми; Рекомендаційна стимуляція може рекомендувати проблеми, які хвилюють користувачів, у режимі реального часу; У відповідь на складні потреби багатораундова взаємодія може задовольнити потреби користувачів у персоналізованому пошуку за допомогою підказок, коригувань тощо.

Процес узгодження попиту, також відомий як «наскрізний» пошук, але це зламає модель рейтингу ставок, на яку колись покладався Baidu, а дохід від реклами завжди був найбільшою дійною коровою Baidu.

Можливості AIGC надали нової життєздатності деяким старим програмам Baidu, таким як документи Baidu, оновлені з інструментів пошуку вмісту до інструментів виробництва контенту, а Baidu Editor став інструментом генерації контенту; Інша частина також досліджує нові сценарії, такі як універсальне створення маркетингового контенту Baidu Diager за допомогою AIGC та інтелектуальна доставка в поєднанні з платформою цифрової людської генерації «Huaicast Star», щоб допомогти продавцям розширити свої маркетингові рамки та сценарії.

** У той же час, з поступовим приземленням великих модельних додатків, Baidu також зрозуміла, що покладання на власні сили в кінцевому підсумку обмежене, а нескінченне є вертикальним і горизонтальним. **

У цьому цінність Spirit Matrix, платформи, яка значно знижує вартість розробки плагінів для великих моделей, дозволяючи звичайним людям з творчістю та ідеями ставати розробниками плагінів. Лі Яньхун сказав, що плагін є спеціальним нативним додатком штучного інтелекту, а також це нативний додаток зі штучним інтелектом з найнижчим порогом і найпростішим для початку.

Особливістю плагіна є «універсальний інтерфейс», який може підключати пошук, міні-програми, контент-платформи або будь-який вхід, завдяки чому використання «plug and play» дозволяє розробникам і творцям швидко влитися в екосистему.

Хе Цзюньцзе розповів, що через місяць після запуску Lingjing Matrix отримала 27 000 заявок на реєстрацію розробників, що охоплюють понад 20 вертикальних сфер, включаючи підприємства, установи та окремих розробників.

Інсайдер Baidu повідомив Light Cone Intelligence: «Плагін великої моделі прикладного рівня бере Lingjing як основну платформу і буде розміщений у Wenxin Yiyan і Baidu App. Qianfan знаходиться більше на нижньому рівні, а духовна сфера більш верхня, і в майбутньому навіть можна замінити Qianfan на рівні плагінів додатків».

Висновок

У 2016 році Лі сказав, що Baidu залишилося лише 30 днів до банкрутства. "Динозавр наступив на совок на ногу, і його мозок зреагував за кілька годин. Тож незалежно від того, наскільки великими виростуть динозаври, вони вимруть».

Байду не хоче бути динозавром, а на рівні свідомості завжди думає за десять кроків.

На щастя, Байду дочекався нової ери і пережив найважчі моменти; На жаль, на початку цієї нової ери будь-яке копітке викрадення здасться незначним в умовах тривалої конкуренції.

Але отримати новий квиток – це як мінімум новий початок.

Посилання:

Транскордонні експерти в різних галузях штучного інтелекту - Transformer"

Подорож далека: ліплять душі для штучного інтелекту

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити