Диалог с Цзи Синьхуа, генеральным директором Youkede: Конкурентоспособные крупные модели не просто ложатся и выигрывают, если у них есть карта

Автор| Хе Сиси

Изменить | Чжан Цзинь

Источник изображения: сгенерировано Unbounded AI

«В определенной степени запрет на вычислительную мощность в США ограничит разработку отечественных крупномасштабных моделей, потому что нет возможности обучать модели без ядерной вычислительной мощности». Цзи Синьхуа, председатель и главный исполнительный директор UKED Так и скажи.

С тех пор, как большие модели стали популярными в Китае в феврале этого года, вычислительная мощность мгновенно стала самой важной темой в отрасли, а также стала препятствием, которое трудно преодолеть при обучении больших моделей в стране. На самом деле, с другой точки зрения, взрывной рост вычислительной мощности также предоставил беспрецедентные возможности для развития отечественным поставщикам облачных вычислений.

В этом отношении Цзи Синьхуа также согласился. Он сказал, что отключение вычислительных мощностей — это и плохо, и хорошо.С одной стороны, если вы хотите решить проблему узких мест в течение одного-двух лет, вам нужно ускорить исследования и разработку отечественных чипов, которые задача не из легких, с другой стороны, предприятия все больше внимания уделяют вычислительной мощности, что вместо этого будет способствовать развитию отечественных чипов.

Как нейтральный производитель облачных вычислений, Youkede давно считает, что за конкуренцией крупных моделей рынок вычислительной мощности приведет к огромным изменениям.

"Я впервые столкнулся со Stable Diffusion в ноябре прошлого года. В то время я думал, что его эффект был потрясающим, поэтому я начал обращать внимание на большую модель", - объяснил Цзи Синьхуа Leifeng.com, почему он обратил на это внимание. внимание на крупную модель. В то же время он также показал, что, поскольку в то время китайские компании не начали обращать внимание на крупномасштабные модели, и они не знали, какую ценность это может создать, поэтому они в то время не решались заниматься крупным модельным бизнесом.

Реальное применение крупномасштабных моделей и обслуживание крупных модельных предприятий в Великобритании начнется в феврале этого года, что также является моментом, когда крупномасштабные модели выходят из круга в Китае.

Leifeng.com узнал, что UKED сначала разработала четыре продукта ИИ для внутреннего использования на основе крупномасштабной модели, платформы вопросов и ответов знаний «Shiwen», платформы помощника кода UCoder, платформы помощника рисования ИИ и платформа управления безопасностью крупномасштабных моделей.Для недорогого центра обработки данных с высокой добавленной стоимостью, созданного самостоятельно, UKED создала базу вычислительной мощности AIGC, которая гибко предоставляет различные ресурсы вычислительной мощности графического процессора для обучения больших моделей, рассуждений и обработка данных.

Сразу после этого UKED запустила приватизированную крупномасштабную модель «все-в-одном», в которую встроена полнофункциональная частная облачная платформа UCloudStack, независимо разработанная UKED, предоставляющая решения для приватизации для моделей виртуализации, хранения, сети и MaaS в сочетании с отраслевые вертикальные крупномасштабные модели.Предприятия могут развертывать приложения для крупных моделей одним щелчком мыши.

Что касается позиционирования UKED в эпоху больших моделей, Цзи Синьхуа еще раз подчеркнул принцип «нейтралитета». Он пояснил, что нейтралитет означает, что Великобритания не только не имеет конкуренции с клиентами, но и помогает крупным модельным компаниям находить клиентов. В связи с этим Цзи Синьхуа также публично дразнил, что в эпоху больших моделей Юке приходится заниматься «сватом».

Из ответа Цзи Синьхуа мы также можем косвенно понять причины внутренних исследований и разработок UKED и применения крупномасштабных модельных продуктов.Одна из них заключается в том, чтобы сотрудники компании понимали крупномасштабные модели и учились использовать крупномасштабные модели.На этом основании, они могут глубоко понимать крупномасштабные модели, каковы болевые точки и в каких сценариях это можно реализовать, чтобы лучше обслуживать клиентов.

Что касается будущего больших моделей, Цзи Синьхуа сказал, что в будущем слишком много неопределенностей, но, несмотря ни на что, интернет-индустрия или индустрия искусственного интеллекта нуждаются в вычислительной мощности.Возможности межсоединения ограничены, поэтому будущая работа UKEDE сосредоточится на создании крупномасштабной вычислительной базы.

Ниже приводится разговор между Leifeng.com и Цзи Синьхуа:

Соревновательные большие модели не просто ложатся и побеждают, если у них есть карты Инженерные возможности имеют решающее значение для обучения моделей.

**Leifeng.com:**Многие говорят, что только несколько поставщиков облачных услуг наконец-то могут участвовать в конкурсе крупномасштабных моделей.Не у всех из них есть высокоскоростные сети.Как вы думаете, что мешает конкуренции?

Джи Синьхуа: Верно, такие технологии, как высокоскоростные сети, не являются основным порогом для конкурирующих крупных моделей. В том числе Youkede и большинство поставщиков облачных услуг способны на это. Сейчас сеть имеет две структуры: первая — это сеть RoCE, которая уже имеет эту возможность в UKED в 2019 году.

Второе — это сетевое решение IB, рекомендованное Nvidia.Это решение относительно простое, его нужно только развернуть и поддерживать. Поэтому для поставщиков облачных услуг или особо крупных компаний технология не является главным порогом.

**Leifeng.com:**На самом деле, говорят, что многие крупные предприятия начали запасаться картами?

Джи Синьхуа: Да, особенно некоторые крупные производители копят карты, включая A800, H800 и так далее. С одной стороны, собственный ИИ-бизнес должен использовать карты, и при больших капитальных вложениях он раньше закупит большое количество карт; с другой стороны, в феврале этого года началось широкомасштабное внимание внутри страны к крупным моделям, и различные производители Из-за важности это также ускорит скорость накопления карт.

Leifeng.com: Означает ли это, что чем больше у вас карт, тем больше вы выиграете? Как другие поставщики облачных услуг конкурируют с крупными игроками?

Джи Синьхуа: Я не сдался и не выиграл. Многие компании, занимающиеся крупномасштабным моделированием ИИ, сейчас используют наши карты. Это явление очень распространено.

Причин несколько: во-первых, одной карты недостаточно, а во-вторых, почему крупная модельная компания хочет сотрудничать с Youkede? Это потому, что они считают, что большие фабрики обладают вычислительной мощностью, алгоритмами, данными и сценариями, и в конце концов они беспокоятся о деловой конкуренции, когда сотрудничают с большими фабриками. Как нейтральный и безопасный поставщик облачных услуг Ukerd не имеет конкуренции с крупными предприятиями. В то же время UKDE может разрабатывать платформы вычислительной мощности, библиотеки моделей и т. д. из центра обработки данных и базовой архитектуры с глубоким техническим накоплением и возможностями комплексного системного проектирования.

Делайте хорошую работу в службе вычислительной мощности и хорошо работайте в роли крупного модельного «свата».

**Leifeng.com: **Когда Юкеде начал обращать внимание на крупных моделей?

**Джи Синьхуа: **Самый ранний контакт был во время Национального дня в прошлом году.Первое, что я увидел, была стабильная диффузия.В то время я думал, что ее эффект был потрясающим, поэтому я начал обращать внимание на большую модель, поэтому мы следили за ChatGPT ранее.

Leifeng.com: Итак, вы решили сделать это во время Национального дня в прошлом году?

Джи Синьхуа: После Национального дня в прошлом году UKED поставила AIGC в качестве цели на этот год и в ноябре прошлого года выпустила изображение платформы для рисования с помощью ИИ. В феврале этого года, пообщавшись с ведущими крупными модельными компаниями Китая, я понял, что отечественный рынок вычислительных мощностей будет иметь взрывное развитие, поэтому решился сделать это еще в конце марта.

Leifeng.com: Сколько потенциальных клиентов у этих крупных модельных предприятий?

Джи Синьхуа: Мы пришли к выводу, что в Китае существует 130 крупных модельных компаний, 78 компаний общего назначения и 52 вертикальные компании. И она продолжает расти, более 30 из них уже являются нашими клиентами.

Leifeng.com: В какой форме будет экспортироваться услуга?

Джи Синьхуа: Во-первых, это наши вычислительные мощности, а во-вторых, услуги компьютерного зала, потому что некоторые компании покупают собственное оборудование и размещают его в нашем компьютерном зале.

Leifeng.com: Как вы понимаете обслуживание компьютерного зала? Потому что у самого заказчика нет оперативных возможностей?

Джи Синьхуа: Самому предприятию нужен компьютерный зал, где бы он ни находился.Компьютерный зал, необходимый для большой модели, имеет две характеристики: во-первых, он потребляет много энергии, а во-вторых, потребление энергии машины H100 превышает 10 кВт.Компьютерный зал не может удовлетворить этот спрос, и центр обработки данных Уланкаб в Юкеде особенно подходит. Кроме того, у многих компаний сейчас есть проблема с серверами, но они не могут их использовать, и Укерде может помочь им построить платформу вычислительной мощности и выполнить последующее техническое обслуживание.

Leifeng.com: В дополнение к предоставлению вычислительной мощности, Youkede некоторое время назад также выпустила «Shiwen»?

Джи Синьхуа: UKED создала четыре внутренние платформы: платформу вопросов и ответов знаний «Shiwen», платформу помощника кода UCoder, платформу помощника по рисованию ИИ и платформу управления безопасностью больших моделей. На самом деле, до «знания» первое, что мы сделали, это система управления приложениями крупномасштабной модели.Это наш первый продукт, и мы надеемся, что в будущем все смогут использовать крупномасштабную модель;

Во-вторых, для решения вопросов коммерческой безопасности мы ввели некоторые ограничения, в том числе ваши вопросы и загружаемые файлы, мы будем их записывать и фильтровать, чтобы предотвратить утечку конфиденциальной информации компании в интернет;

В-третьих, для пользовательских проблем, включая внутренние проблемы сотрудников, а также внешнее общение и обратную связь, система будет автоматически записывать, чтобы компания могла продолжать проводить обучение по собственной модели на более позднем этапе.

Leifeng.com: Почему вы сделали эти четыре продукта? Может выйти наружу?

Джи Синьхуа: Во-первых, чтобы сотрудники компании могли понимать и использовать крупномасштабные модели.На этой основе они могли глубоко понять, в чем болевые точки крупных модельных компаний и в каких сценариях они будут реализованы, чтобы лучше обслуживать клиентов Предоставлять услуги.

Эти четыре продукта в настоящее время используются внутри компании, но если они нужны клиентам, мы также можем сообщить больше.

Leifeng.com: На какой модели основаны эти платформы?

**Джи Синьхуа: **Сначала потренируйтесь с GPT 4, проведите проверку модели, а затем постепенно используйте отечественные большие модели или большие модели с открытым исходным кодом для оптимизации. В связи с этим я еще упомянул концепцию под названием "затачивать пушки за границей и воевать дома".

Leifeng.com: Какие еще сценарии вы с оптимизмом смотрите в будущее?

Джи Синьхуа: Если различать в соответствии с допуском к неточному характеру выходного контента ChatGPT, мы разделили 10 сценариев.

Первое - это перевод и озвучивание, способности в этой области уже очень высокие и могут полностью заменить человека, второе - NPC игры, третье - социальное взаимодействие, четвертое - вывод контента электронной коммерции, пятое дизайн игры; шестой — обслуживание клиентов; седьмой — документация и помощь в программировании; восьмой — управление знаниями внутри предприятия; девятый — сценарии обучения и страхования; последний — помощь юристам и врачам.

Leifeng.com: Эти 10 сцен будут сниматься одновременно? Или шаг за шагом?

Джи Синьхуа: Ucar не делает больших моделей, мы просто соединяем клиентов и партнеров, что можно понимать как роль «свата». Например, подключите клиентов игр к MiniMax, а клиентов из сферы электронной коммерции и образования — к Zhipu Huazhang.

Отечественным масштабным моделям сложно догнать GPT4, а возможностей для стартапов больше

Leifeng.com: Как вы думаете, на сколько типов можно разделить отечественные крупные модельные компании? Кто является ключевыми клиентами Youkede?

Цзи Синьхуа: Мы разделены на пять категорий. Первая категория — это гиганты, в том числе Ali, Baidu, Toutiao, Huawei, JD.com и др. Вторая категория начинается учеными, такими как Zhipu Huazhang; третья категория — это оригинальная компания AI, AI Four Tigers, Daguan, Yunzhisheng, 4Paradigm и т. д.; четвертая категория — начинающие компании, такие как MiniMax; пятая категория — что первоначальные зарегистрированные компании перешли на крупномасштабные модели, такие как Kunlun, 360, а также включают таких лидеров-предпринимателей, как Ван Сяочуань и Ли Кайфу.

Крупные производители первого типа не являются целевыми клиентами Youkede, а вторые — нашими ключевыми клиентами.

Leifeng.com: То есть крупные заводы могут строить сами себя, а другие компании не могут строить сами себя?

Джи Синьхуа: Поскольку это связано с областью искусственного интеллекта, это не только сетевая проблема, но и ряд проблем, таких как хранение и компьютерные залы.Например, начинающие компании также могут создавать свои собственные вычислительные системы. мощность, но цикл будет очень долгим.Подождите, пока он сам ее построит После этого соревнование окончено. Соревнование больших моделей — это скорость, и тот, у кого самая высокая скорость, может занять командные высоты.

Leifeng.com: Сколько стадий и узлов в крупной фабрике для большой модели?

Джи Синьхуа: Первый — это запуск большой модели, а второй — проверка эффекта после запуска. В настоящее время известно, что запущены такие компании, как MiniMax, Zhipu, Baidu, Ali, HKUST Xunfei и т. д.

**Leifeng.com:**Какой из них лучше? В основном это зависит от того, сколько вычислительной мощности он использует?

Джи Синьхуа: Я так не думаю. Больше вычислительной мощности для обучения не обязательно дает хорошую модель, но если ссылка для логического вывода используется чаще, это означает, что существует большое количество пользователей и больше отзывов. будет получено Это способствует обучению хорошей модели.

**Leifeng.com:**Независимо от обучения или рассуждений, чтобы построить большую модель, вы должны сначала иметь вычислительную мощность?

Цзи Синьхуа: Да, в первую очередь нужно иметь карту. Если у вас ее нет, вы точно отстанете. Где-то 40-50%. Если две вышеупомянутые проблемы решены, это проблема безопасности, и проблема трафика также очень важна.

Leifeng.com: Каков уровень отечественных моделей? Многие говорят, что к концу этого года он догонит GPT4.

Джи Синьхуа: В настоящее время в Китае нет модели, которая превосходила бы GPT3.5.Конечно, на самом деле очень легко превзойти GPT3.5 в определенном аспекте. Превзойти GPT 4 сложно, ключ в том, что документы до GPT 3.5 общедоступны, а GPT 4 еще не обнародован, поэтому все не знают, что делать.

Leifeng.com: У этих крупных отечественных производителей нет шансов наверстать упущенное?

Джи Синьхуа: Я думаю, что эффект крупных компаний не так хорош, как у начинающих компаний. Потому что некоторые начинающие компании с убеждениями и идеалами уже начали это делать, и Дачанг фактически начал, увидев популярность ChatGPT.

Leifeng.com: Понятно, что крупные производители накопили технологии, значит, у них больше возможностей?

Цзи Синьхуа: Существует много направлений для ИИ. В прошлом большинство компаний думали, что вертикальные крупномасштабные модели имеют возможности, но не думали, что крупномасштабные модели общего назначения имеют возможности. Поэтому в прошлом Несколько лет это были некоторые предпринимательские команды с убеждениями и научно-исследовательские группы, такие как Zhipu Huazhang, MiniMax, Китайская академия наук и т. д.

Для крупных производителей важно, чтобы зарубежные страны последовали за этим, и это не соответствовало стратегии компании, поэтому у них нет большого накопления в крупных моделях общего назначения.

Leifeng.com: Проблема вычислительной мощности рано или поздно будет решена, так в чем преимущества UKEDe с точки зрения больших моделей?

Джи Синьхуа: Это можно свести к трем пунктам: во-первых, сохранять нейтралитет и не иметь конкурентных отношений с пользователями. Во-вторых, он может создавать полный набор решений AIGC для центров обработки данных, сетей и хранилищ данных, что может помочь малым и средним компаниям быстро создавать платформы и решать проблему эффективности использования больших моделей; в-третьих, он может лучше помочь крупным модельным компаниям расширить круг клиентов.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить