модель, круто

2023-07-25 06:01:02

Источник изображения: сгенерировано Unbounded AI

После более чем 200 дней крупномасштабного предпринимательства менталитет китайских исследователей превратился из идеального волнения в реальность.

До этого, помимо самой компании, предпринимательство модели ИИ наделялось большим количеством значений, таких как национальные чувства и тенденция времени.Столкнувшись с появлением модели общего назначения ChatGPT, китайские предприниматели быстро пришли к консенсусу о том, как построить китайскую версию OpenAI и ChatGPT.

Нет никаких сомнений в том, что ChatGPT является лучшим игроком в мире в этом году. Из-за этого трафик веб-сайта OpenAI в апреле превысил 1,8 миллиарда, и он входит в топ-20 в мировом рейтинге трафика. Однако, согласно данным, опубликованным компанией веб-анализа Similarweb, после шести месяцев быстрого роста посещения ChatGPT впервые испытали отрицательный рост, а в июне количество посещений упало на 9,7% по сравнению с предыдущим месяцем.

Внезапное падение трафика ChatGPT вызвало опасения и дискуссии в мировом технологическом сообществе о риске возникновения пузыря в индустрии ИИ, журнал Economist даже сделал вывод, что «путь к более крупному и лучшему ИИ больше не осуществим». Идея стать «китайской версией ChatGPT» также отходит от китайских предпринимателей.

Чжу Сяоху, партнер-основатель GSR, написал в «Моментах»: «Не будьте суеверны в отношении общей модели, потому что в следующем году GPT-3.5 станет товаром (общая инфраструктура), а через три года GPT-4 также будет. Для большинства предпринимателей сцена является приоритетом, а данные — королем!»

Одновременно с изменением менталитета практиков рынок крупных предпринимателей начал делиться.

Китайские крупные модельные компании больше не одержимы идеализированной целью «стать китайским OpenAI» и не одержимы погоней за параметрическими моделями и вычислительной мощностью.У них есть более прагматичные ответы и они уделяют больше внимания решению проблем в реальных промышленных сценариях.

Конкуренция больших моделей ИИ открыла новый узел трека.

Коллективный прагматизм

В начале этого года к ChatGPT начал обращаться Лян Цзяньчжан, основатель и председатель совета директоров Ctrip. В последние годы он активно работал в академических и деловых кругах в качестве демографа, но он также был самым ранним и самым молодым программистом в Китае и почти стал доктором философии в области искусственного интеллекта.

В 13 лет Лян Цзяньчжан разработал программу написания метрических стихов и получил национальную награду.В возрасте 15 лет он был принят в младшие классы Университета Фудань.После окончания учебы он уехал учиться в Соединенные Штаты и в возрасте 21 года получил степень магистра компьютерных наук в Технологическом институте Джорджии. В возрасте 22 лет Лян Цзяньчжан, который готовился к получению докторской степени, внезапно осознал ограниченность теоретических знаний и решил отказаться от своей докторской степени, чтобы присоединиться к Oracle в Соединенных Штатах.

Появление ChatGPT обрадовало Лян Цзяньчжана, что он не стал продолжать учиться на докторскую степень в области искусственного интеллекта, потому что "все эти алгоритмы обработки естественного языка были полностью побеждены им (ChatGPT)". Он вспоминал, что когда впервые столкнулся с ChatGPT, то был «очень-очень шокирован», а вторым чувством было смирение: «Самый интеллектуальный алгоритм, который мы наконец сделали, был так близок к биологической структуре человеческого мозга».

Лян Цзяньчжан начал думать о сочетании крупной модели ИИ и бизнеса Ctrip.

По мнению Лян Цзяньчжана, на фоне интеллектуального общества туризм как «индустрия духовного спроса, которую трудно автоматизировать», его спрос будет увеличиваться по мере улучшения общего социального благосостояния, и его доля в экономике также будет увеличиваться. Он обратил внимание на вертикальную модель индустрии туризма.

За последние шесть месяцев представители различных предприятий Ctrip сформировали техническую группу Ctrip по разработке крупномасштабных моделей. На начальном этапе разработки большой модели Ctrip скорректировала свою организационную структуру в соответствии со стратегическими требованиями большой модели и сформировала различные отделы, включая общую техническую группу, группу по стратегии контента, группу по составлению списков и т. д., а также адаптировала техническую группу в соответствии с постоянным обновлением и итерацией продуктов больших моделей.

Лян Цзяньчжан сказал, что Ctrip не пожалеет усилий, чтобы инвестировать в большую модель: «Мы должны очень твердо инвестировать в долгосрочной перспективе, если это ценно для наших клиентов или продавцов. Это (большая модель) очень новая, и техническая команда постоянно оптимизирует свои инвестиции, но у нас нет ограничений».

В середине июля Ctrip официально выпустила большую вертикальную модель индустрии туризма. Компания Asked проверила 20 миллиардов неструктурированных туристических данных в сочетании с существующими структурированными данными Ctrip в режиме реального времени, а также исторически обученными роботами и поисковыми алгоритмами Ctrip, а также провела самостоятельно разработанное обучение вертикальной модели. «В то же время мы вложили много сил в создание и проверку общего содержания ответов о путешествиях», — подчеркнул Лян Цзяньчжан.

Перед выпуском вопроса Ctrip провела внутреннее тестирование, и сотрудники службы поддержки клиентов Ван Юнь, очевидно, почувствовали, что ее работа претерпела большие изменения. В прошлом ей приходилось отвечать более чем на 150 звонков в день, чтобы ответить на вопросы клиентов об отмене послепродажных заказов и потерянном багаже; теперь Ван Юнь превратилась в рекомендателя обслуживания клиентов перед поездкой и входит в комнату прямой трансляции из-за кулис, чтобы предоставить пользователям сети услуги и предложения, которые необходимо подготовить перед поездкой.

По мнению Лян Цзяньчжана, на основе крупномасштабной модели общего назначения решение проблемы точности в индустрии туризма по-прежнему является ключевым: "Путешествия — это отрасль с большим потреблением. Даже если планирование сэкономит полчаса, может быть 5%-ная вероятность того, что рекомендуемый отель или результат маршрута будут неправильными". масштабная модель**.

Хотя она и не так хороша, как общая большая модель по параметрам, и не имеет жестких требований к вычислительной мощности и другим условиям общей большой модели, но вертикальная большая модель выдвигает более высокие требования к данным и сценариям.

Самая большая проблема в обучении крупномасштабной модели Ask заключается в том, что на реальной сцене, в процессе получения пользователями информации о путешествиях, нескольких раундах интерактивного сбора и очистки данных, объем данных и точность данных необходимо постоянно корректировать, особенно индустрия туризма претерпела огромные изменения, и информация о пунктах назначения трехлетней давности может быть полностью устаревшей к настоящему времени, особенно влияние эпидемии на глобальную индустрию туризма усугубило своевременность данных.

Подобно Ctrip, все больше и больше компаний помещают отслеживание больших моделей в вертикальное поле.

Лист ответов на крупномасштабную модель Yanxi, переданный JD.com, также рассматривает промышленную крупномасштабную модель как важную особенность. По словам Сюй Рана, нового генерального директора Jingdong Group, разработка технологии искусственного интеллекта в прошлом несколько раз была на грани взрыва приложений, но в конце концов она часто оказывалась недолгой, и одна из важных причин заключается в том, что технология не нашла прочного применения в отрасли**.

На пресс-конференции Huawei Pangu Large Model 3.0 7 июля Чжан Пинган, генеральный директор Huawei Cloud, даже прямо сказал: «У Pangu Large Model нет времени писать стихи и болтать. Независимо от того, сколько параметров и насколько хороша способность диалога, если она не может решить практические проблемы, от нее не будет большой пользы».

Tencent еще не объявила о прогрессе общей крупномасштабной модели Hunyuan, но она громко объявила о маршруте крупномасштабной модели в отрасли, выпустив более 50 решений для 10 основных отраслей за один раз. Ли Цян, вице-президент Tencent и президент Tencent по правительственному и корпоративному бизнесу, также сказал: «Обычные большие модели — не единственное направление применения моделей, и модели для вертикальных отраслей станут переломным моментом в ценности больших моделей».

Изменение мышления

Очевидный узел в изменении менталитета крупных предпринимателей начался, когда у Вана Хуэйвэня диагностировали депрессию, и он был приобретен Meituan за несколько световых лет до своего основания. Все вдруг поняли, что даже звездная компания, которую все ждали и возлагали большие надежды, может быть вынуждена прекратить работу из-за различных аварий.

Всего полгода назад другие розетки, казалось, рассеялись в одночасье, и только крупная модель была в позиции C. Предприниматели и инвесторы из технологических кругов Китая прилетели в Силиконовую долину, чтобы поучиться у OpenAI. Чжан Имин, Ма Хуатенг и Ван Син, главные фигуры этих гигантов, принимающие решения, за одну ночь вернулись в состояние возбуждения и любопытства, когда они впервые начали свой бизнес, читая документы и обмениваясь технологиями поздно ночью.

В то время казалось, что каждый исследователь китайских масштабных моделей думал о проблемах с чувствами семьи и страны. Столкнувшись с быстрой итерацией ChatGPT, цели, поставленные китайскими предпринимателями, заключаются в том, как добиться обгона за какое время.

Ли Яньхун сказал: "Baidu Wenxinyiyan находился на стадии исследований и разработок, и техническая команда Baidu провела сравнительный тест с ChatGPT. В то время разрыв составлял 40 баллов, и он мог наверстать упущенное за месяц".

Чжоу Хунъи, основатель 360, сказал в интервью "Китайскому предпринимателю", что большие модели больше не являются предметом коммерческой конкуренции. Если закрытость китайского Интернета и проблема острова данных между приложениями, вызванная мобильным Интернетом, не будут решены, это, вероятно, приведет к ограничениям обучения двигателей искусственного интеллекта, что может привести к новому витку революции ИИ между Китаем и Соединенными Штатами. Разрыв между поколениями.

Насчет того, почему в Китае не родилась такая компания, как OpenAI, китайские предприниматели в то время даже начали размышлять: в прошлом отечественные исследования искусственного интеллекта были слишком прагматичными, и все было ориентировано на KPI, так что у всех не хватило решимости и терпения вкладываться в него, поэтому они упустили такой важный узел.

С энтузиазмом, после того как Baidu Wenxin сделал первый выстрел, более 80 больших моделей ИИ появилось в течение полугода, и более 30 больших моделей появились только на Всемирной конференции по искусственному интеллекту 2023 г., проходившей в Шанхае.Не будет преувеличением назвать популярность больших моделей «войной ста моделей».

Но нужно ли нам так много больших моделей? Какая большая модель нам нужна?

Фактически, Робин Ли очень рано предложил: «Стартапам не имеет особого смысла воссоздавать ChatGPT. Я думаю, что есть прекрасная возможность разрабатывать приложения на основе этой большой языковой модели. Нет необходимости заново изобретать колесо.

Хэ Сяодун, вице-президент по технологиям в JD Group, также с самого начала понял: «Если большая модель должна быть ценной, она должна быть размещена в отрасли, и лучше всего находиться в области с высокой промышленной ценностью. Только таким образом она может стать действительно долгосрочной устойчивой вещью, иначе она может стать недолговечной».

НОВАЯ ПЕРЕМЕННАЯ

Как раз в то время, когда местные предприниматели изо всех сил пытались изучить модель ИИ, большой шаг Цукерберга привнес новые переменные в эту постоянно меняющуюся область.

Рано утром 19 июля по пекинскому времени Meta выпустила большую модель Llama 2 с открытым исходным кодом, которая в очередной раз взорвала круг ИИ: Llama 2 не только имеет ту же производительность, что и GPT-3, но также является бесплатной, с открытым исходным кодом и коммерчески доступной. Llama 2 является продолжением модели Llama, выпущенной Meta ранее в марте этого года.

На последующей партнерской конференции Microsoft Inspire генеральный директор Microsoft Сатья Наделла объявил о сотрудничестве между Meta и Microsoft, которое позволяет Llama 2 работать в облачной службе Microsoft Azure. В то же время к сотрудничеству с Meta присоединилось и облако Amazon AWS.

Значение Llama 2 для предпринимателей, занимающихся крупномасштабными моделями, заключается в том, что, как и система Android для разработки приложений, разработчикам не нужно изобретать велосипед и напрямую получать инфраструктуру крупномасштабных моделей по самой низкой цене, чтобы они могли больше сосредоточиться на своих собственных промышленных сценариях.

В некоторой степени это также означает, что для большинства предпринимателей решение сосредоточиться на отраслевых вертикальных приложениях оказалось более практичным путем.

Однако, в отличие от обычных крупных моделей, ** промышленные крупные модели также выдвигают другие пороговые значения и требования к участникам отрасли: ** с одной стороны, промышленные крупные модели требуют от разработчиков определенного технического опыта и силы; с другой стороны, промышленные крупные модели также требуют от операторов наличия богатых сценариев практического применения в промышленности.

Лян Цзяньчжан сказал «Китайскому предпринимателю»: «Наиболее важным показателем общей большой модели может быть количество параметров или количество используемых графических процессоров и т. д., но вертикальная большая модель и большая языковая модель — это только одна ее часть. Она также сочетается с другими данными, включая ручную проверку и т. д. Это более важно. В конечном счете, это указывает на то, можно ли проверить, насколько можно улучшить эффективность, точность и надежность этих вопросов и ответов от клиентов».

"Самая большая проблема в туризме - это надежность. Это действительно сложнее, чем ИИ, написавший стихи, статьи и романы. Это также долгосрочная работа. Все, что может улучшить этот показатель до 80%, 90%, 95% или даже 99%, того стоит", - наконец сказал Лян Цзяньчжан.

Посмотреть Оригинал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Награда
лайк
комментарий
Поделиться

комментарий

0/400

Нет комментариев

Тема
BTC Hits New High
49k Популярность
ETH Breaks $3,000
28k Популярность
VIP Exclusive Airdrop Carnival
8k Популярность
4Pump.Fun Debuts on Gate
4k Популярность
5Fed June Meeting Minutes
4k Популярность
6Join Gate VIP to Win MacBook
30k Популярность
7Trump Tariff Hikes
16k Популярность
8Gate xStocks Trading Share
23k Популярность
9HK Stablecoin Rules
12k Популярность
10Truth Social Crypto ETF
3k Популярность

Закрепить

Карта сайта