Большим моделям нужны исполнители

Оригинал: У Сяньчжи Вэнь Йехао

Редактор: Ван Пань

Источник: Фотонная планета

Источник изображения: сгенерировано Unbounded AI‌

Отечественная масштабная модельная война когда-то была окутана многими сомнениями. Когда JD.com и Tencent заняли свои места один за другим, эта сложная игра становится яснее.

Baidu и Ali, как первая партия крупномасштабных модельных игроков в Китае, выиграли ранний трафик, «получив преимущество». Напротив, хотя Tencent и JD.com начали работу немного позже, у них больше возможностей для более глубокого изучения крупномасштабной модели, чтобы углубить свое понимание отрасли.

Из-за этого некоторые крупные производители, относительно поздно выпустившие масштабные модели, не стали слепо следовать за публикой и вложили средства в волну универсальных крупногабаритных моделей. Например, в крупной модели Huawei ранее упоминалась практичность, а JD.com выбрала более дальновидный и целенаправленный путь в силу своего глубокого накопления в отрасли и цепочке поставок. была запущена отраслевая модель JD Yanxi.

В нынешнюю эпоху крупномасштабных моделей общего назначения крупномасштабная модель Yanxi и ее путь создания промышленной ценности, запущенный JD.com, являются не только отличной попыткой установить бизнес-порядок крупномасштабных моделей, но и принести новое мышление и направление для всей отрасли. В застойных водах коммерциализации больших моделей промышленные большие модели, которые ближе к посадке, вероятно, возглавят будущую конкуренцию за большие модели и станут новой силой, которую нельзя игнорировать.

Большая модель, не "рассказ" и не "игрушка"

Каждая волна технологического прогресса часто несет в себе много наносов.

От чипов, роботов до искусственного интеллекта в первые годы, в каждой волне всегда есть какие-то игроки со скрытыми мотивами, смешивающие технологии и маркетинг вместе, делая изначально ясный путь еще более мутным. То же самое верно и для отечественных масштабных моделей гусениц на данном этапе.

С одной стороны трассы игроки изо всех сил пытаются выяснить технический контекст большой модели и пытаются найти направление посадки; с другой стороны поле покидают даже компании, не имеющие никакого отношения к технологической сфере. один за другим, обучение. Так называемые продукты «большой модели» - я должен признать, что нынешняя ситуация «все может быть большой моделью» имеет значение «все может быть метавселенной» два года назад.

Очевидно, что когда так называемая «большая модель» становится синонимом, обслуживающим собственную «рассказывающую» привлекательность вместо того, чтобы создавать реальную ценность, тогда с большой вероятностью ее может устроить только судьба метавселенной. И это касается и тех игроков, которые честно изучают технологии. В конце концов, самой технологии сложно напрямую создавать ценность — цель большой модели не в том, чтобы обучить саму общую большую модель, а в том, чтобы позволить технологии создавать ценность, а затем осуществить зрелую коммерциализацию.

Таким образом, кажущиеся забавными действия фанатов-преследователей на самом деле прозвучали тревожным звонком для большой модельной трассы. В конце концов, ChatGPT, который зажег AIGC, тонко повлиял на представление игроков о большой модели, заставив многих игроков броситься к общей большой модели и запустить множество «вариантов» ChatGPT.

Объективно говоря, универсальная крупная модель имеет свою ценность, но в момент, когда конкуренция становится все более и более жесткой, универсальная крупномасштабная модель не гладкая:

С одной стороны, игроки стекаются на одно поле один за другим и с большой долей вероятности попадают в ситуацию «повторного изготовления колес». технологические гиганты.

С другой стороны, универсальная крупная модель — это типичный продукт разделения потребления и оплаты, и она станет «игрушкой», если вы не будете осторожны.

Простой пример: широкий круг C-конечных пользователей может задавать вопросы или даже обсуждать вселенную и небо, но у подавляющего большинства обычных пользователей фактически нет требований к производительности.После краткосрочного интенсивного опыта они будут быстро ощутить свежесть появляющихся технологий.Потерял, может не иметь силы пользоваться в течение долгого времени.

Исходя из этого, даже если текущая крупномасштабная модель общего назначения может в определенной степени повысить эффективность создания контента, за исключением снижения затрат и повышения эффективности в некоторых контентных отраслях и организациях, она еще не выработала зрелого и воспроизводимая бизнес-модель. Можно предвидеть, что по мере того, как общая трасса крупномасштабных моделей становится все более и более переполненной, игроки столкнутся со многими проблемами с точки зрения коммерческого расширения.

В конечном счете, теперь, когда наступила «сингулярность», большие модели являются не только вехой в преемственности технологий, но и ключевой движущей силой формирования будущего. Согласно этой логике, масштабная модельная война на данном этапе — это отнюдь не бег на короткие дистанции, а планомерный проект. Если игроки хотят пройти цикл и дойти до конца, они не могут просто полагаться на одну точку прорыва на техническом уровне, им нужно одновременно думать о многих измерениях, таких как техническое направление, применение сцены и бизнес-модель. .

Промышленные масштабные модели, новый фронт в «Войне сотен моделей»

Начиная с 1997 года, когда "Deep Blue" победил гроссмейстера Гарри Каспарова, до того, как "AlphaGo" вошла в круг го, а затем до визуальной системы искусственного интеллекта и автоматического вождения, искусственный интеллект пережил в прошлом множество раундов захватывающей эволюции. быть на грани взрыва приложений, но цветочные бутоны, полные ветвей, уже давно не могут распуститься.

Основная причина этого в том, что технология еще не нашла глубокого применения в промышленности, ведь конец технического прогресса – не ловушка в лаборатории, а погружение в «реальный мир».

Следуя этой логике и глядя на сегодняшние модели крупномасштабных моделей общего назначения, предстоит еще пройти долгий путь, прежде чем они укоренятся в реальных бизнес-сценариях и создадут реальную ценность.

Сюй Ран, генеральный директор Jingdong Group, заявил на конференции JDD, что большая модель сама по себе является инструментом для реализации промышленной ценности, а не целью.Настоящая ценность больших моделей должна быть реализована в промышленных приложениях.

Другими словами, цель — не большая модель, а цель — приложение.

Нынешние производители больших моделей часто рассматривают параметры модели как стандарт проверки качества больших моделей. Как всем известно, на уровне коммерческой реализации огромные параметры также соответствуют высоким затратам, а также есть такие проблемы, как долгое время соответствия и плохой параллелизм.

Простой пример, некоторые "параметрические монстры" стоят два-три цента, чтобы ответить на вопрос, и приходится ждать секунд 5-10. Каким бы точным ни был ответ, добиться масштабной коммерциализации сложно. Кроме того, текущая крупная модель общего назначения имеет уровень точности около 85%, что может быть достаточно для обычных пользователей, но в серьезных бизнес-сценариях эта ошибка, вероятно, окажет влияние, которое нельзя игнорировать для бизнеса.

Что касается проблемы с приложением, технические руководители нескольких бизнес-направлений JD.com отметили, что люди будут смеяться над сфабрикованным ответом от GPT, но как только он будет реализован в реальном процессе приложения, любое отклонение приведет к огромным потерям.

Доктор Хэ Сяодун, декан исследовательского института JD Exploration и президент отдела интеллектуальных услуг и продуктов JD Technology, однажды испытал на себе нечто весьма показательное. «Большая модель дает квадратный корень из 143, и дается ответ 11,5 (фактически примерно равный 11,96). Если ее использовать в реальном сценарии приложения, этот ответ принесет огромные потери».

В технической сфере важны параметры и точность модели, но в деловом мире ключом является то, что сама большая модель проста в использовании и стабильна. В этом отношении индустриальная модель, тесно связанная с отраслевыми подразделениями, несомненно, имеет естественные преимущества.

Однако разработать крупномасштабную промышленную модель непросто. Как мы все знаем, обучающие данные являются основой обучения больших моделей, а также определяют способность к обобщению и сценарии применения больших моделей. Поэтому, помимо прорывов на техническом уровне, для разработки крупных промышленных моделей не менее важны сценарии из первых рук и данные из отрасли.

Взяв в качестве примера JD.com, причина, по которой она запустила крупномасштабную модель для отрасли, во многом связана с ее сильными индустриальными генами. Ведь среди крупных отечественных производителей JD.com, связывающий потребительский рынок и два конца цепочки поставок, имеет сильную связь с одной и той же отраслью и обладает большим объемом качественных данных.

Сообщается, что при обучении большой модели Yanxi интегрируются 70% общих данных и 30% исходных данных цепочки поставок цифрового интеллекта. Видно, что JD.com не делает акцент исключительно на параметрах и не рассказывает преднамеренно «историю», а фокусируется на уровне «настройки», стремясь создать большую модель, тесно интегрированную с отраслью.

Масштабная промышленная модель может стать важным шагом на пути к масштабной коммерциализации трассы масштабной модели, и игроки, которые постепенно понимают логику, постепенно садятся на машину.

Недавно Tencent, которая долгое время сдерживалась, выпустила собственную крупномасштабную отраслевую модель; Baidu, которая высоко держит знамя крупномасштабных моделей общего назначения, также выпустила крупномасштабные отраслевые модели, охватывающие транспорт. , энергетика и другие области. Нетрудно заметить, что по мере того, как гиганты увеличивали свои размеры, приближенные к коммерциализации крупномасштабные промышленные модели стали новым фронтом «войны сотен моделей».

Встречаемся на узкой дороге, побеждает тот, кто попадет на «сцену»

Будь то модель общего назначения или промышленная модель, построение нового бизнес-порядка не может обойтись без «сцен».

Другими словами, для реализации непонятные технические термины и ослепительные коммерческие PPT — все это воздушные замки.Только путем реального применения возможностей больших моделей к сцене и создания реальной ценности можно открыть эффективный круг.

В момент, когда спрос на AIGC во всех сферах жизни резко падает, нетрудно найти так называемые сценарии применения для больших моделей. Но если вы хотите найти подходящую сцену для масштабного лендинга больших моделей и пробежать путь коммерциализации, вам, возможно, придется пройти множество окольных путей.

Следуя этой логике, игроки, уже представившие большую модель, постоянно пробуют себя в различных подразделениях, пытаясь найти свою точку опоры:

Baidu захватила горячие точки ежегодного вступительного экзамена в колледж и запустила помощников-добровольцев с искусственным интеллектом.В полной мере используя возможности больших моделей, она также пыталась использовать это для выхода на рынок C-end; Али использовал Tmall Genie в качестве якоря для изучить применение больших моделей в области бытовой электроники.Расширение возможностей.

JD.com, разрабатывающий большие промышленные модели, выдвигает формулу «стоимость больших моделей = алгоритм × вычислительная мощность × данные × квадрат промышленной толщины», а так называемая «промышленная толщина» просто нагромождается конкретными сценами. , стать.

Независимо от пути, игроки крупномасштабных моделей будут продолжать пытаться и совершать ошибки, прежде чем достигнуть «Земли обетованной» и даже пересечь «Красное море».

Столкнувшись с трудностями приземления больших моделей, некоторые игроки предпочитают играть роль «продавцов воды», помогая компаниям создавать свои собственные большие модели. Однако компания JD.com, которая всегда отличалась прагматичным стилем игры, предложила «трехэтапную» стратегию, то есть сначала построить универсальную большую модель, затем внутренне исследовать сценарии и приложения, а затем постепенно открывать использовать свои возможности во внешнем мире — используя себя в качестве испытательного поля, он также разрабатывается самостоятельно.Переварите стоимость проб и ошибок, чтобы убедиться, что крупномасштабные модельные продукты могут создавать реальную ценность.

Сообщается, что в рамках JD.com большая модель была не только встроена в общие сценарии приложений, такие как цифровой маркетинг, оптимизация рабочих процессов и обслуживание клиентов, но также была расширена на многие вертикальные сценарии, такие как розничная торговля, логистика, финансы. и здоровье.

Взяв в качестве примера область логистики, перед лицом этой сложной системной инженерии JD.com изучила несколько путей исследования: продукт цепочки поставок Jinghui, который создавался в течение 5 лет, в дополнение к богатым собственным алгоритмам, таким как прогнозирование ИИ. и оптимизация операций благодаря открытой экологической технологии может не только хорошо взаимодействовать с алгоритмами и данными гетерогенных систем, но и быть более выразительным с точки зрения прогноза продаж, запасов, планирования поставок и пополнения с поддержкой больших моделей. , благодаря широкому применению AIGC, его интерактивная башня управления цепочками поставок может помочь пользователям быстро находить и решать проблемы с цепочками поставок.

В сценарии управления фондами был запущен продукт JD Finance «умный выбор базы». Традиционный скрининг фондов дорог в понимании и сложен в эксплуатации, что напрямую влияет на вероятность успешных транзакций. С помощью больших моделей JD.com оптимизировала ссылки для сопоставления намерений, генерации алгоритмов, распознавания намерений и нескольких раундов диалога, в результате чего точность ответов на распространенные проверочные вопросы достигла 90%, что значительно улучшило качество обслуживания клиентов и эффективность транзакций. Этот продукт также будет полностью обслуживать финансовые учреждения в будущем.

Можно видеть, что «трехшаговая» стратегия JD.com достигла первоначальных результатов и постепенно проникла в текстуру вертикальных отраслей, таких как логистика и финансы. Можно предвидеть, что по мере постепенного развертывания стратегии JD.com также продолжит накапливать сценарии посадки и высококачественные данные, тем самым запуская маховик для коммерческой посадки крупномасштабных промышленных моделей.

В конечном счете, кажущаяся сложной крупномасштабная военная модель должна вернуться к основной проблеме, а именно к тому, как технология может принести реальную пользу реальной отрасли. На этом этапе игроки с разными путями могут только постепенно исследовать и практиковать ответы на вопросы в этом длинном марафоне.

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить