Может ли генеративный ИИ создать будущее Baidu?

Первоисточник: Light Cone Intelligence

Автор: Лю Юйци

Источник изображения: Generated by Unbounded AI

Ветер начинается в конце Цинпина, и случайности и неизбежности судьбы часто переплетаются.

2019 год — самый мрачный год за всю историю искусственного интеллекта. После победы AlphaGo над Ли Седолем в 2016 году, появления архитектуры Tansformer в 2017 году, которая привела к масштабному взрыву технологий, и предпринимательского бума в 2018 году. В 2019 году спад капитала, период технических узких мест и сложность сцен приземления открыли «хаотичную эру» в истории искусственного интеллекта.

Никто не знает, когда появится общий ИИ, точно так же, как трисоляранец не знает, когда взойдет солнце. **

В том году большое количество компаний, занимающихся искусственным интеллектом, столкнулись с увольнениями, разрывом цепочек капитала и трудностями в производстве продуктов, и лишь немногие из них продолжали упорствовать.

Но именно в 2019 году начала зарождаться новая надежда на ИИ: OpenAI приняла инвестиции Microsoft и глубокое сотрудничество с ней в июле, и именно с этого года началась разработка GPT-3, которая сейчас шокирует мир; Компания Baidu, первой внедрившая стратегию ИИ в Китае, с начала года провела полугодовую кадровую корректировку, и теперь, похоже, перегруппировка войск, похоже, открыла четырехлетний период настойчивости.

В 2019 году Ван Хайфэн был назначен техническим директором группы и продолжил работу в качестве генерального руководителя системы технологической платформы искусственного интеллекта (AIG) и системы базовых технологий (TG), которые являются наиболее важными техническими основами Baidu; Шен был назначен старшим вице-президентом, ответственным за бизнес-группу мобильной экосистемы, а затем в 2022 году перешел в Baidu Intelligent Cloud, став пионером второй кривой роста Baidu. Среди новых сил, представленных в 2019 году, Хэ Цзюньцзе является единственным вице-президентом Baidu после 80-х годов, сначала отвечающим за инвестиционные слияния и поглощения и стратегические инвестиции, а затем повторно используемым, ответственным за пустующую мобильную экологическую бизнес-группу Shen Jing, обладающий большей реальной властью.

Пришло время 2023 года, и возможности Transformer окончательно пробили потолок OpenAI в этом году, выйдя на новый уровень, а прорыв технологий сделал OpenAI самой просматриваемой компанией в мире. Microsoft затмила технологический блеск Google.

** За последние четыре года основной бизнес Baidu сформировал треугольную структуру во главе с интеллектуальным облаком Shen Tian, Хэ Цзюньцзе отвечает за мобильную экологию, Ван Хайфэн - за технологию массива прессования, а Baidu наконец-то закончила период затишья и начала превращать защиту в атаку, и действие продолжается. **

«Делать каждое приложение заново» — это первый светлый меч после полугода накопления силы, и теперь Baidu похожа на планету, вот-вот столкнувшуюся с огромным «технологическим гравитационным полем» и полностью изменившую свою орбиту.

Канун появления больших моделей

В 2017 году Google предложила архитектуру Transformer в статье под названием «Attention Is All You Need» для замены традиционных моделей циклов RNN и CNN, которая показала, что точность обучения Transformer выше, чем у всех предыдущих моделей, время обучения значительно ниже, чем у предыдущей модели, а эффект обучения также хорош при небольшом содержимом обучающей выборки.

С тех пор архитектура Transformer была быстро принята и применена в области NLP и CV, особенно в области NLP, где механизм внимания позволяет машинам более точно понимать семантику и генерировать ее, а также уменьшать дублирование информации.

Будучи одной из первых компаний, открывших и проследовавших по пути технологии Transformer, Baidu уже более десяти лет занимается исследованиями в области НЛП и сформировала команду НЛП, сформированную ведущими экспертами, такими как Ван Хайфэн, Ву Тянь, Ву Хуа и так далее.

Ван Хайфэн

На тот момент первой важной задачей NLP-команды было создание перевода на Baidu. Ван Хайфэн смело применяет глубокое обучение и нейронные сети для перевода, чтобы улучшить понимание машиной контекста и сформировать более плавный перевод. Эта смелая попытка также сделала Baidu Translate первой системой перевода, поддерживающей более 200 языков, даже за год и 3 месяца до Google.

** Это также прототип способности к пониманию в четырех основных способностях большой модели «понимание, порождение, логика и память». **

Но Ван Хайфэн считает, что НЛП недостаточно. Он специально отправился в кабинет Ли Яньхуна, чтобы доложить и предложить следующую «высадку в Нормандии» - распознавание речи. Его аргументация заключается в том, что технология распознавания речи вот-вот достигнет критической точки индустриализации, и как только она прорвется, она скоро будет коммерциализирована в больших масштабах.

Со своим собственным суждением о технологиях Ли Яньхун решил снова поддержать Ван Хайфэна и последовательно создал «отдел распознавания речи», «отдел распознавания изображений» и «отдел графа знаний» параллельно с отделом НЛП.

Операция Ван Хайфэна озадачила многих студентов Baidu: «Эти технологии не имеют ничего общего с текущими продуктами Baidu, неужели для того, чтобы накопить на Новый год, чтобы создать столько отделов в одном мозгу?» "

В то время Ван Хайфэн увидел, что поисковые данные имеют очень сильную поддержку логики формирования больших моделей. «Baidu имеет крупнейшую в мире поисковую систему, которая не только обладает высокой своевременностью информации, но и имеет высокий уровень точности, что позволяет построить наиболее полный граф знаний», — пояснил Ван в публичном интервью. **

Перед созданием Wenxin компания Baidu создала мультигетерогенный сверхкрупномасштабный граф знаний с более чем 5 миллиардами сущностей и 55 миллиардами фактов и смогла получить единое понимание мира с помощью языка, слуха, зрения и т. д. Его модель расширения знаний, выпущенная в 2021 году, ERNIE (Wenxin) 3.0, является предшественницей Wenxin Yiyan, и проект в основном отвечает за Wu Tian.

У Тянь

В 2019 году снова был выпущен Baidu Wenxin 1.0, и за 4 года было переработано 3 версии. В ноябре 2022 года У Тянь одновременно объявил об 11 отраслевых моделях, которые Вэньсинь накопил на публичном саммите, охватывающих электроэнергетику, газ, финансы, аэрокосмическую и другие сферы, и изначально сформировалась промышленная экология.

** Все это предвещало и прокладывало путь для Baidu, чтобы превентивно обнародовать слова Вэнь Синя. 16 марта, после того, как слова Вэнь Синя были обнародованы, Baidu снова оказалась в центре внимания, но более чем подтвердила, что это было сомнительно. **

«В случае такого сильного рыночного спроса, по-прежнему очень важно, кто сделает его первым», — сказал однажды Ли Яньхун в интервью, даже если продукт еще не полностью созрел, но все еще должен быть выпущен: «После публикации слов Вэньсиня бесчисленное количество людей, людей, которые не контактировали со мной в прошлом или которые находятся далеко от меня в отрасли, спрашивают, как мы можем сотрудничать с Baidu, как попробовать его как можно скорее».

**С технической точки зрения большие модели являются скоростными итерациями «все больше и больше б/у». ** «Во время внутреннего теста сотрудник спросил, как Вэнь Синь может прятать голову и плохо писать стихотворение? Я сказал: «Подождите, я думаю, что я смогу выучить его послезавтра, и его можно будет использовать на следующий день, и прогресс большой модели также является непрерывным процессом обучения», — сказал Ван Хайфэн с улыбкой.

За полгода Wenxin Yiyan провела три итерации от 3.0 до версии 3.5, а затем до версии 4.0, по словам Ван Хайфэна на встрече, масштаб пользователей Wenxin Yiyan достиг 45 миллионов, 54 000 разработчиков, 4 300 сценариев, 825 приложений и более 500 плагинов.

Вода, поливаемая в НЛП, вносимые удобрения, наконец, возвестили о небывалом урожае в 2023 году, и, как сказал Ли Яньхун, путь технологического развития — это процесс «двух жизней, двух жизней, трех, трех жизней и всего».

Внутренняя сила, стоящая за большими моделями

После вспышки общего искусственного интеллекта внимание облачных вычислений и внимание предприятий достигло пика, а также наступил «момент iPhone».

Появление больших моделей, приводящее к огромному разрыву вычислительной мощности, облачные вычисления не только для большой модели, чтобы обеспечить поддержку мощности облачных вычислений, но и лучшая точка приземления для крупных предприятий по приземлению моделей, будь то Baidu или любое предприятие с большой моделью, когда выходит большая модель, следующим направлением является продвижение на рынок, позволяя предприятиям использовать.

** Для Baidu такое бремя ложится на плечи Shen Shu. **

Шен вздрогнул

Среди шести руководителей бизнес-групп Baidu, за исключением технического директора Ван Хайфэна, Шен является единственным старшим вице-президентом. Несмотря на то, что они оба имеют техническое образование, в отличие от роли «инженера» Ван Хайфэна, Шен отвечал за рост ключевых бизнесов с тех пор, как присоединился к Baidu.

За 10 лет, прошедших с момента прихода в Baidu, Шен последовательно интегрировал рекламную систему и улучшил возможности монетизации системы; Комбинировать поисковый и фидный потоки; Он объединяет бизнес-группу мобильной экосистемы, модернизированную поиском, чтобы завершить территорию мобильной экосистемы Baidu.

** Если Ван Хайфэн создал острый нож, то Шэнь Шу является первопроходцем, который может использовать этот острый нож, чтобы открыть территорию, по словам Ли Яньхуна, «осмелиться на жесткую битву и может выиграть битву». **

В мае 2022 года Шэнь Цзисин был назначен президентом бизнес-группы Baidu Intelligent Cloud (ACG). Что касается Baidu, то в начале она не делала полной ставки на облачные вычисления, но именно с непрерывным развитием технологии искусственного интеллекта Baidu осознала недостатки облачных вычислений и начала тайно культивировать вторую кривую роста.

** Из-за отсутствия преимущества первопроходца цель Baidu Cloud в последние 10 лет очень ясна: не конкурировать со «старыми пушками» в масштабе уровня IaaS, а за счет комбинации PaaS + SaaS и интеллектуальных возможностей, играть на дифференциации и врезаться в цифровизацию предприятий в небольших битвах. **

На Всемирной конференции Baidu 2023 года Шен в очередной раз предложил стратегию «интеграции облачного интеллекта»: «Глубокое сочетание искусственного интеллекта и облачных вычислений является ключом для предприятий к быстрому внедрению нативных приложений ИИ. В настоящее время все приложения и сервисы Baidu Group работают на базе Baidu Intelligent Cloud на основе технологической архитектуры «Cloud-Intelligence Integration».

**Согласно наблюдениям за оптическим конусом, суть стратегии интеграции облака и интеллекта заключается в том, что, с одной стороны, опираясь на Baidu Intelligent Cloud, он может быстро предоставлять предприятиям полный набор крупномасштабных сервисов; С другой стороны, большие модели также снижают порог цифровизации предприятия. **

В течение пяти месяцев после того, как он возглавил ACG, Шэнь быстро интегрировал «большую модельную суперфабрику» - Вэнь Синь Цяньфань в ответ на основные потребности предприятий в эпоху больших моделей, и разделил пользователей на пять категорий пользователей в соответствии с их потребностями.

Прежде всего, ввиду разрыва спроса, вызванного ресурсами вычислительных мощностей, платформа Qianfan предоставляет различные типы гетерогенных вычислительных мощностей. Например, в самом дорогом канале обучения, благодаря возможностям распределенного параллельного обучения и микросекундного взаимодействия, платформа Qianfan может достичь коэффициента ускорения обучения 95% и эффективного коэффициента времени обучения 96%, что значительно снижает вычислительную мощность и временные затраты клиентов.

Во-вторых, на уровне модели для клиентов, которые хотят напрямую вызывать существующие большие модели, предприятия могут быстро вызывать несколько больших моделей, включая Вэнь Синь Иянь, в то время как платформа Qianfan предоставляет такие инструменты, как улучшение китайского языка, повышение производительности и улучшение контекста. По словам Шэнь Цзи, платформа Qianfan обслужила более 17 000 клиентов.

** Для клиентов с вторичными потребностями в разработке платформа Qianfan предоставляет цепочку инструментов полного жизненного цикла, такую как переобучение, тонкая настройка, оценка и развертывание для больших моделей, с самым большим в отрасли количеством высококачественных отраслевых наборов данных (41), и быстро оптимизирует их для собственных бизнес-сценариев.

На конференции также была проведена практическая демонстрация того, как быстро разрабатывать приложения вопросов и ответов для Sany Heavy Industry на основе фреймворка для улучшения извлечения (RAG, Retri Augmented Generation): просто выберите предустановленный фреймворк RAG в рабочей среде нативного приложения Qianfan AI и настройте соответствующие параметры, чтобы быстро реализовать разработку и запуск интеллектуального приложения для обслуживания клиентов на официальном сайте Sany Heavy Industry.

** Шен сказал, что создание такого «маленького помощника», даже если ему нужно обрабатывать документы длиной в тысячи тысяч слов, стоит всего несколько сотен юаней; После этого каждая консультация пользователя стоит всего несколько центов. **

В течение долгого времени крупная промышленность, производство и сельское хозяйство были глубоководными областями цифровизации, и основная причина заключается в том, что сложность отрасли привела к высокому порогу цифровизации и ее трудно осуществить.

Однако благодаря большой модели снижается не только порог использования, но и стоимость использования. Нет необходимости строить какую-либо новую систему, и она не требует ручного участия, это более продвинутый метод применения технических компонентов, ** комбинация того и другого, но также вращает маховик облачного интеллекта, постепенно накапливаясь. **

Инновационные вызовы для больших моделей

Прошлое предрешено, но будущее может измениться.

Все поставщики с большими моделями нашли возможности на прикладном уровне. Microsoft начала работать над полной линейкой продуктов, включая системы Bing, Office и Windows, в марте, и Али Дэниел Чжан сказал: «Мы должны использовать большую модель, чтобы переделать все продукты», но это предложение, проще говоря, является самым большим инновационным вызовом в эпоху больших моделей.

Как ИИ выполняет рефакторинг приложений? Это требует не только деловых способностей, но и воображения, и перед лицом новой эры искусственного интеллекта Baidu также передала эстафету в руки молодых людей. **

После мая 2022 года Шэнь Цзе сменил на посту главы бизнес-группы MEG Хэ Цзюньцзе, вице-президент поколения после 80-х годов, представленного в плане строительства эшелона талантов Baidu. Если Шэнь Чжань – это «фракция жесткой войны», то Хэ Цзюньцзе – настоящая «молодая сильная фракция». Как говорил Жэнь Чжэнфэй, необходимо «пусть те, кто слышит пушку, командуют сражением».

** Рефакторинг приложения не ломается и не стоит, в отличие от него, Baidu действительно «особенно безжалостен» к себе. **

На Всемирной конференции Baidu, посвященной «экологии», Хэ Цзюньцзе передал ответы на вопросы «мобильной экологии», «контент-экологии» и «бизнес-экологии».

Среди них мобильная экосистема охватывает нативные приложения ИИ, такие как «Новый поиск», «Новый Wenku», приложение Wenxin Yiyan и электронная коммерция Baidu «Huibexing»; На экологическом уровне контента ряд приложений, таких как приложение Baidu «AI Editor», расширяют возможности экосистемы создателей; На уровне бизнес-экологии была запущена маркетинговая платформа AI Native «Лайт». Кроме того, Хэ Цзюньцзе также анонсировал плагин экологии Вэнь Синь Ияня - "Матрица Духа", который теперь полностью открыт.

** Новый поиск, определенный Baidu, в точности соответствует логике вычисления ящиков, предложенной Робином Ли в 2010 году. ** Он имеет три характеристики: максимальное удовлетворение, стимулирование рекомендаций и многоуровневое взаимодействие. То есть, когда пользователи ищут вопросы, «больше не дают вам кучу ссылок», а через понимание контента генерируют мультимодальные ответы, такие как текст, картинки и динамические диаграммы; Рекомендательная стимуляция может рекомендовать проблемы, которые волнуют пользователей, в режиме реального времени; В ответ на сложные потребности многоуровневое взаимодействие может удовлетворить потребности пользователей в персонализированном поиске с помощью подсказок, корректировок и т. д.

Процесс сопоставления спроса, также известный как «сквозной» поиск, но он сломает модель ранжирования ставок, на которую когда-то полагалась Baidu, а доходы от рекламы всегда были самой большой дойной коровой Baidu.

Возможности AIGC вдохнули новую жизнь в некоторые из старых приложений Baidu, такие как документы Baidu, обновленные с инструментов поиска контента до инструментов для создания контента, а Baidu Editor стал инструментом для создания контента; В другой части также рассматриваются новые сценарии, такие как универсальная генерация маркетингового контента Baidu Diager с помощью AIGC и интеллектуальная доставка в сочетании с цифровой платформой генерации людей «Huaicast Star», чтобы помочь продавцам расширить свои маркетинговые рамки и сценарии.

** В то же время, с постепенным внедрением приложений для больших моделей, Baidu также поняла, что полагаться на собственные силы в конечном итоге ограничено, а бесконечность может быть вертикальной и горизонтальной. **

В этом и заключается ценность Spirit Matrix, платформы, которая значительно снижает стоимость разработки плагинов для больших моделей, позволяя обычным людям с креативностью и идеями стать разработчиками плагинов. Ли Яньхун сказал, что плагин представляет собой специальное нативное приложение ИИ, а также нативное приложение ИИ с самым низким порогом и самым простым в запуске.

Особенностью плагина является «универсальный интерфейс», к которому можно подключать поисковые, мини-программы, контент-платформы или любой вход, так что использование «plug and play» позволяет разработчикам и создателям быстро влиться в экосистему.

Хэ Цзюньцзе сообщил, что через месяц после запуска Lingjing Matrix получила 27 000 заявок на регистрацию разработчиков, охватывающих более 20 вертикальных областей, включая предприятия, учреждения и индивидуальных разработчиков.

Инсайдер Baidu сообщил Light Cone Intelligence: «Большой модельный плагин прикладного уровня использует Lingjing в качестве основной платформы и будет размещен в Wenxin Yiyan и Baidu App. Цяньфань находится на более низком уровне, а духовная сфера — на более высоком, и в будущем даже возможно заменить Цяньфань на уровне плагинов приложений».

Заключение

В 2016 году Ли заявил, что Baidu находится всего в 30 днях от банкротства. «Динозавр наступил на совок на ноге, и его мозгу потребовалось несколько часов, чтобы среагировать. Поэтому, независимо от того, насколько большими вырастут динозавры, они вымрут».

Baidu не хочет быть динозавром, и на уровне сознания он всегда думает на расстоянии десяти шагов.

К счастью, Baidu дождалась новой эры и пережила самые трудные моменты; К сожалению, в начале этой новой эры любой кропотливый рывок будет казаться незначительным в условиях длительной конкуренции.

Но получение нового билета – это, по крайней мере, новое начало.

Ссылка:

Трансграничные эксперты в различных областях искусственного интеллекта - Transformer"

Поездка далеко: лепят души для искусственного интеллекта

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить