Разочарование AI: полугодовая модель, все еще летающая в небе

2023-08-04 06:52:59

Источник: «Фотонная планета» (ID: TMTweb), автор: Ву Куньян, редактор: Ву Сяньчжи.

Источник изображения: сгенерировано Unbounded AI

Огонь большой модели горит на этой земле уже полгода. По мере того, как пресс-конференции Huawei, JD.com и Ctrip догоняют вечерние эпизоды, в соответствии с последовательной парадигмой Интернета, «новинка» отечественных крупномасштабных моделей также открыла собственное полугодовое испытание.

Это просто отличается от полугодовых проверок других предприятий.Полугодовые проверки форм бизнеса, таких как автомобили на новых источниках энергии, мобильные телефоны и платформы электронной коммерции, поддерживаются достаточным количеством общедоступной информации для облегчения текстового анализа, а большие модели все еще в состоянии.В состоянии «черного ящика» нет четкой бизнес-модели, поэтому о так называемой информации о данных и других аргументах не может быть и речи.

Довольно иронично, что даже с точки зрения функции продукта большая модель еще не создала общего метода оценки. Перед конечной целью AGI, естественно, существуют различные методы оценки, такие как классический «метод беличьей рыбы-мандарина», на который полагаются домашние конечные пользователи C для «оценки» больших моделей.

Или из-за этого большинство отечественных производителей не открывают свои большие модели для использования наподобие OpenAI, а внедряют внутренние механизмы тестирования.

Исследование крупномасштабных моделей больше сосредоточено на стороне B и стороне G, таких как ведущие в отрасли крупномасштабные модели Tencent, Pangu 3.0 Huawei, Jingdong Lingxi и т. д. В качестве текущего направления, на котором сосредоточены ведущие игроки, его крупная модель фокусируется на максимально возможной демонстрации зрелых форм продукта с коммерциализацией в качестве основной цели. Например, для быстрой популяризации и продвижения коммерциализации этого типа крупной модели, в дополнение к ориентации на бизнес, важными контрольными показателями стали также возможности локализованного развертывания.

Тем не менее, в глазах отраслевых инсайдеров, крупномасштабной отраслевой модели, которая «доставляет чашу вперед», по-прежнему не хватает компаний, которые ее покупают.Ветер отраслевой модели дует уже месяц с июня, и пока не было масштабного коммерческого сотрудничества.

Поэтому нетрудно заметить, что на сегодняшнем инвестиционном рынке инвестиции, связанные с крупными моделями, сконцентрированы на вторичном рынке, а не на первичном. Даже если уровень крупной коровы Ван Хуэйвэня выйдет на рынок, публичные источники говорят, что его раунд финансирования намного превышает 230 миллионов долларов США, а его финансовые возможности не такие, как у OpenAI, который получает десятки миллиардов долларов. от Microsoft время от времени.

Инвестиционный рынок является квалифицированным барометром. Очевидно, что листы ответов, представленные отечественными крупномасштабными моделями на полугодовом экзаменационном узле, неудовлетворительны, и потребуется период покоя и полировки, чтобы «история» воплотилась в жизнь.

Большая модель без бизнес-модели?

Когда отечественным масштабным моделям необходимо отвечать на сомнения рынка, на первое место следует ставить бизнес-модели.

Популярность ChatGPT, которая уже занимала первое место в сознании пользователей, значительно упала, Baidu и Ali, первые отечественные универсальные большие модели, также «замолчали» после того, как за ними последовало большое количество игроков. вверх. Причина в том, что бизнес-модель общей большой модели не сработала. Несмотря на то, что он получил одобрение пользователей в области общественного мнения, коммерческий замкнутый цикл так и не появился.

Взяв в качестве примера крупномасштабную модель Baidu с широким спектром тестов, модель оплаты ее коммерческого приложения Wenxin Qianfan основана на количестве токенов, сгенерированных при вызове, стандарт составляет 0,012 юаня за тысячу токенов, а стоит 0,12 юаня. для вывода тысячезначной рукописи.

Независимо от скорости восстановления стоимости, плата в размере 0,012 юаня за тысячу токенов кажется дешевой, но генерация текста часто требует нескольких взаимодействий для получения желаемых результатов.Множественные взаимодействия бесконечно увеличивают скрытую стоимость.В конце концов, Wenxin Qianfan не вид персонала, который приходит и уходит.

Похожий сценарий — сообщество вопросов и ответов.Сун Цюань (псевдоним), академик, рассказал Photon Planet, что опыт использования модельных приложений аналогичен поиску качественных ответов в сообществе вопросов и ответов. мышление пользователя заключается в детализации вопроса, а готовность платить часто обнаруживается только в качественных ответах. КАЧЕСТВЕННЫЕ ОТВЕТЫ будут получены позже. Поэтому Baidu выбрала количество текстов логического вывода в качестве стандарта оплаты, но по-прежнему не может покрыть скрытые расходы коммерческого использования.

Если вы примете ежемесячный платеж, который любит видеть сторона B, это только перенесет расходы с пользователей на вас, что, очевидно, не является долгосрочным решением. Лучшим доказательством является то, что ChatGPT все еще подозревают в том, что он срезает углы по цене 20 долларов в месяц для конечных пользователей C.

В настоящее время при коммерциализации крупных моделей общего назначения трудно достичь безубыточного баланса, независимо от того, идет ли речь о стороне B или стороне C. В то же время она может столкнуться с рисками соответствия, такими как этика ИИ. и надзор. Поэтому индустриализация и вертикализация больших моделей стали сменой парадигмы в соответствии с требованием посадки.

В отличие от крупномасштабной отраслевой модели, хотя ее форма продукта начинается со спроса на посадку, проблемы, возникающие при фактической посадке, еще предстоит решить.

Один из типов кейсов, на который стоит обратить внимание, — это вертикальная модель C, построенная на основе собственной экологии продукта, например, Zhihaitu AI, о котором Zhihu объявил ранее для проведения внутреннего тестирования в продукте, и Ctrip.com, выпущенный не так давно. назад.

Преимущества двух вступающих в крупномасштабную модельную колею одинаковы, они заключаются в их собственной экологии сообщества и полученном из этого высококачественном контенте сообщества. Контент, как отраслевые данные, может стать учебным корпусом больших моделей после простой очистки. Тонкое различие между ними заключается в том, что Zhihu с самого начала был контент-сообществом, в то время как Ctrip начал сосредотачиваться на контенте только в последние годы.

Но с текущей точки зрения, будь то Zhihu или Ctrip, форма продукта его большой модели, похоже, не способна удовлетворить болевые точки пользователей и не может в достаточной степени улучшить существующие функции.

Анонсированный в настоящее время продукт Zhihaitu AI «Сводка по горячим спискам» использует ИИ для сбора высококачественных вопросов и ответов, а также полирует и переписывает сводку для представления пользователям, в то время как другое приложение «Агрегация поиска» объединяет мнения из самостоятельных ответов для улучшения информации о привлечении пользователей и оперативность в принятии решений.

Агрегирующие функции, такие как саморекомендация и горячий список, являются «традиционными художественными навыками» Чжиху, и производительность расширения возможностей большой модели не вызвала всплеск на уровне пользователя. Кроме того, процесс переписывания и полировки ИИ также охватывает персонализированные функции популярных ответов.Для пользователей функция этого приложения состоит только в том, чтобы быстро понять информацию, что противоречит дифференцированному и персонализированному общению, которое отстаивает контент-сообщество.

Основываясь на OTA, Ctrip спросил, по мнению Лян Цзяньчжана, председателя совета директоров Ctrip, что это «надежная библиотека ответов» для индустрии туризма. Потребуется время, чтобы проверить эффективность своих продуктов, но с точки зрения позиционирования его также подозревают в том, что он «жертвует основами и гонится за последним».

В глазах молодых пользователей стандартного ответа на туризм не существует, что доказывает появление разноплановых форм туризма, таких как «спецназ», «штамповка» и «погружение». Например, если предположить, что большое количество пользователей использует ИИ для планирования маршрута путешествия, такое же планирование маршрута фактически повлияет на общение и атмосферу в сообществе и даже приведет к сокращению времени пребывания пользователя.

Вообще говоря, попытка приземления вертикальной модели на конце C не является гладкой и может даже стать «невозвратной стоимостью». Возможно, из-за мифа о «повышении эффективности» самой большой модели позиционирование продукта в основном ограничивается словом «эффективность», но эффективность — это лишь второстепенный аспект взаимодействия с пользователем.

Та же самая парадигма была также продемонстрирована в области до В, а на стороне Б, которая преследует эффективность, бизнес-модель и вопросы реализации большой модели отрасли были более глубоко продемонстрированы.

Непонятный черный ящик

«ИИ — это не физика. В теории есть несколько крупных технологических прорывов, но больше тонкой настройки и небольшой оптимизации размеров структуры модели и качества данных. Во многих случаях выходные данные модели даже лучше, но команда не может найти причину».

По мнению инсайдера отрасли, в больших моделях за пределами отрасли существует огромное когнитивное искажение, и причина в том, что обучение больших моделей и индустрия ИИ являются «черным ящиком» для внешнего мира, и это трудно исследовать большие модели Процесс рассуждений, производящий вывод, невидим и неосязаем.

Это привело к тому, что внешний мир занял осторожное отношение к «черному ящику» большой модели после того, как они успокоились после периода безумия, вызванного ChatGPT. Это приведет к дилемме большой модели на земле, и это явление более очевидно в процессе перехода на маршрут B.

Возьмем в качестве примеров продукты, выпускаемые крупными производителями, которые теперь четко определили путь к B, включая технологическое решение MaaS, запущенное Tencent Cloud, и крупную модель Pangu, запущенную Huawei Cloud.Облачное развертывание, локализованное быстрое развертывание и т. д. Также есть достижения во взаимодействии, эксплуатации и последующем добавлении новых отраслевых данных итеративной оптимизации.Можно сказать, что ради посадки порог для больших моделей снижен до крайне низкого уровня.

Тем не менее, когнитивная стена, созданная «осторожностью», не была сломана, хотя ChatGPT дул в течение полугода, у многих компаний нет мотивации или интереса изучать, как импортировать большие модели.

Похожую логику можно было наблюдать в индустрии облачных вычислений несколько лет назад. Облачные вычисления - это услуга и производная, основанная на признании ценности данных.Что касается ценности больших моделей для предприятий, условно говоря, ценность данных подскочила. Это еще и технические возможности, которых не хватает корпоративным заказчикам.Даже популяризация облачных вычислений на отечественных предприятиях еще далека от завершения, не говоря уже о крупной модели.

Полезна отраслевая модель или нет, на самом деле уже не важно, в конце концов, потребительская ценность продукта должна быть обнаружена пользователем. Более того, внешний мир будет примерно измерять уровень модели с помощью определенных тестов и характеристик, таких как «метод беличьей рыбы-мандаринки» или Huawei Pangu, который недавно был подвергнут сомнению из-за ошибок в прогнозировании места приземления и интенсивности. супертайфун "Дусури" Погодная модель.

Возможно, из-за этого крупномасштабная модель Jingdong Lingxi, выпущенная недавно, предпочла отдать приоритет прогону собственных бизнес-сценариев, и ожидается, что она будет открыта для «внешних серьезных бизнес-сценариев» в начале следующего года.

Более того, стоит упомянуть, что в условиях «отраслевого тренда» так называемая отраслевая модель, ориентированная на коммерциализацию, заменила первоначальный «универсальный» нарратив большой модели и в то же время привела к тому, что многие люди «потеряли ".

Определение так называемой отраслевой модели расплывчато. Коннотация большой модели (Фундаментальная модель) заключается не в количестве параметров, а в общих возможностях, возникающих в результате обучения на общих данных. Если принять ту же архитектуру модели, но использовать данные одного домена для данных, не только будет потеряна общая способность, но даже проблемы домена не могут быть решены из-за возникающих скидок.

Если отраслевые данные используются для вторичного предварительного обучения на основе исходной большой модели, это эквивалентно тонкой настройке исходной модели, тогда сам продукт все еще находится в модельном слое, который можно назвать отраслевой большой моделью. , если знания предметной области добавляются через или из внешней базы данных, Это только для стимулирования возможностей исходной модели, и продукт также должен принадлежать прикладному уровню над моделью.Это преувеличение, чтобы назвать его отраслевой моделью.

В настоящее время большинство крупномасштабных отраслевых моделей на крупных фабриках являются первыми, такими как Tencent, Jingdong, Huawei и так далее. Последние будут чаще появляться в сообществе открытого исходного кода из-за более легких инвестиций и быстрого улучшения производительности модели, такой как ChatLaw, крупная юридическая модель, которая некоторое время назад вызвала бурные дискуссии.

«По сравнению с первым, последний является более зрелым с точки зрения формы продукта, что способствует быстрому построению возможностей модели, но последний часто имеет более высокий верхний предел после завершения процесса внедрения знаний в предметной области», — сказал инсайдер отрасли.

Угрозы с открытым исходным кодом

Недавно Meta предоставила свою последнюю большую модель Llama2 с открытым исходным кодом бесплатно по открытой коммерческой лицензии и представила ее на платформе Microsoft Azure.Этот шаг был воспринят как важная веха для LLM с открытым исходным кодом и даже начал угрожать статусу закрытого исходного кода. ведущий производитель OpenAI.

Через Microsoft, крупного спонсора модели, Meta бросает вызов OpenAI с более открытым отношением.

На самом деле, «фракция открытого исходного кода» незаметно возвысилась как третья сторона задолго до этого. «У нас нет рва, как и у OpenAI», — говорится во внутреннем документе Google, случайно просочившемся в мае. Общая идея заключается в том, что на первый взгляд OpenAI и Google догоняют друг друга в большой модели, но настоящий победитель может не прийти от этих двоих Причина такого суждения заключается во все более богатой экологии открытого исходного кода.

Экология открытого исходного кода становится все более и более активной, и даже появились Llama2, представляющая возможности модели, и LORA, репрезентативная технология парадигмы Finetune (тонкая настройка модели).Все это заставило производителей-гигантов, стремятся «стремиться к чудесам» ощущают явный холодок.

Такие факторы, как обмен технологиями с открытым исходным кодом и передача талантов, также делают черный ящик большой модели более «стеклянным».Неизбежным результатом отсутствия барьеров является то, что Konw How, в которую крупные компании инвестируют огромные время, легко опровергается сообществом открытого исходного кода.

Большинство ведущих отечественных производителей отвечают на это «хваткой обеими руками». Левая рука «закрывает дверь для сборки автомобиля», непрерывно отшлифовывает форму и возможности продукта в виде мелкомасштабного внутреннего тестирования, а правая рука «проводит мозговой штурм», строит сообщество с открытым исходным кодом в рамках экологии на основе облака. экология разработчика, но для этого просто требуется собственный уровень вычислительной мощности производителя и уровень модели От полного стека макета до прикладного уровня. Alibaba Cloud запустила крупномасштабное сообщество GPT с открытым исходным кодом, а Huawei Cloud, Baidu Cloud и Tencent Cloud также строили планы.

Вообще говоря, будь то промышленность или GM, на С или на В, полугодовая проверка большой модели дает прямое ощущение, что ее трудно реализовать, а ожидание прибыли постоянно движется назад, риск становится все больше. сильнее, и трудно сказать технический барьер. Так где же выход из сложившейся ситуации?

Пока есть два интересных направления. Одна — это векторная база данных, известная как «Память в эпоху ИИ», а другая — интеллектуальное оборудование, наделенное модельным интеллектом.

Так называемый вектор относится к многомерным данным, которые могут представлять что угодно, включая текст, изображения, видео и звуки, которые сегодня наиболее важны в обучении LLM. Эти формы контента четко представлены в базе данных и поддерживают семантический поиск, то есть поиск по сходству, например, мужчина или мальчик. Другими словами, для больших моделей векторный поиск — это поисковая оптимизация больших моделей.

Как упоминалось выше, знание предметной области может улучшить построение и использование отраслевых моделей с помощью возможностей векторной базы данных, точной настройки или подключаемых модулей.Для крупных производителей это, естественно, является фокусом следующего этапа. С мая капитал вливается в направления, связанные с векторными данными.Как продукт прикладного уровня с более определенной перспективой, векторные данные также привлекли пристальное внимание многих венчурных капиталистов.

Что касается встроенной модели смарт-железа, то это скачок в возможностях по сравнению с предыдущими смарт-помощниками, такими как «siri» и «Xiaoai», а также расширение реальных смарт-устройств (мобильных телефонов, компьютеров). В сообществе с открытым исходным кодом были попытки встроить модели с большими параметрами в MAC, в то время как крупные производители накопили определенный объем производственных мощностей в прошлую эпоху мобильного Интернета, и, условно говоря, их преимущество первопроходца более очевидно. .

Без пиар-стиля весенне-осеннего стиля написания масштабные модели, ставшие основными требованиями, уже не загадочны, а историй становится все меньше и меньше. усердно работать. Отрасли нужен следующий момент «ChatGPT», прежде чем мы увидим, как дайверы всплывают на поверхность и сталкиваются с ними лицом к лицу.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

1 Лайков