Коммерциализация больших моделей общего назначения еще рано, а генеративный ИИ только начался.

2023-07-31 07:06:57

Источник: Титаниум Медиа

Автор: Цинь Цунхуэй.

Источник изображения: сгенерировано Unbounded AI

От фанатичной погони до возвращения к спокойствию незаметно меняются взгляды людей на большие модели. С одной стороны, из-за соответствия, нормативных и других причин потребуется время для коммерциализации крупномасштабных моделей общего назначения; с другой стороны, отраслевая сторона только начала инвестировать в пилотные области, такие как финансы и медицинской помощи, и эффект не может быть виден сразу.

Таким образом, когда сумасшедшая спираль постепенно замедлялась, разные голоса постепенно рисовали настоящую "большую модельную" картину.

Среди них, использовать ли «общую крупномасштабную модель» или «отраслевую крупномасштабную модель», каждая компания сделала выбор после некоторого рассмотрения; и с конкуренцией крупномасштабных моделей «генеративный ИИ» вышел на первое место. прожектор. Надо сказать, что ChatGPT — это не что иное, как укол в руку для развития индустрии искусственного интеллекта, чтобы выйти на новый этап, и это вернет ИИ в центр событий.

Борьба между общей моделью и отраслевой моделью

ChatGPT заставил индустрию осознать огромную мощь больших моделей общего назначения, что привело к бизнес-спектаклю «Войны сотен моделей» в будущем.Бесчисленные инвесторы и предприниматели не могли спать из-за этого, а ресурсы GPU стали "Лоянская бумага дорогая" какое-то время.

Среди них есть много ведущих технологических компаний, которые вынуждены перейти в «Ляншань». Инсайдер индустрии крупномасштабных моделей однажды рассказал Titanium Media App о текущей ситуации в своей компании: «Если нет масштабной модели, слишком неловко выходить и говорить об этом. Давайте сделаем это сейчас, и это трудно объяснить, если нет крупномасштабной модели». Таким образом, только они могут сообщить внешнему миру о том, что он работает над крупномасштабной моделью общего назначения, и в то же время ускорить исследования и разработки. прогресс внутри.

Тем не менее, общая большая модель — это трудоемкая и трудоемкая работа, в конце концов OpenAI потратил 6 лет на итерацию GPT1, начал обучение несколько лет назад. Поэтому, если нет базового накопления технологий и данных ИИ, очень сложно реализовать коммерциализацию общих крупных моделей в краткосрочной перспективе.

Кроме того, крупная модель общего назначения, естественно, нуждается в общедоступных данных для обучения, а помещение собственных данных в крупную модель общего назначения также означает, что данные будут совместно использоваться по умолчанию. Поэтому некоторые отрасли с высокими требованиями к конфиденциальности данных вряд ли получат доступ к крупным моделям общего назначения без подготовки.

В таких обстоятельствах крупная модель в отрасли стала «вторым лучшим решением» в отрасли после общей крупной модели и может быстрее получить дивиденды от крупной модели. Чжоу Хунъи, основатель 360 Group, также прямо сказал: «Будущие возможности для крупномасштабных моделей искусственного интеллекта лежат в добавочном рынке на уровне предприятия, а «вертикализация» крупномасштабных моделей — это направление развития». технический руководитель крупного завода также сообщил Titanium Media App. «С точки зрения планирования нашей крупномасштабной модели мы продолжим итерацию крупномасштабной модели общего назначения и продолжим использовать ее для обучения отраслевым вертикальным крупномасштабным моделям».

Не так давно на Всемирной конференции по искусственному интеллекту 2023 года Тан Даошэн, старший исполнительный вице-президент Tencent Group и генеральный директор бизнес-группы Cloud and Smart Industry, также заявил, что крупномасштабное модельное приложение предприятий должно всесторонне учитывать отраслевой профессионализм. , безопасность данных, непрерывная итерация и комплексная стоимость, а также другие факторы. На основе крупной отраслевой модели создание собственной эксклюзивной модели может быть лучшим вариантом для предприятий. Причина в том, что отраслевые большие модели требуют меньше параметров, чем большие модели общего назначения, затраты на обучение и рассуждения ниже, а оптимизация модели проще.

Тем не менее, Titanium Media App также узнал от людей в отрасли, что в некоторых случаях крупная модель общего назначения не является необходимым условием для вертикальной крупномасштабной модели, а это означает, что платформа для обучения отраслевых моделей не имеет использовать в качестве основы крупномасштабную модель общего назначения. «Если определена общая крупномасштабная модель с сотнями миллиардов параметров, то общая крупномасштабная модель не является необходимым условием для крупномасштабной отраслевой модели». Масштабная отраслевая модель сообщила Titanium Media App. Однако он также сказал, что, хотя большие модели общего назначения не являются необходимым условием для крупномасштабных отраслевых моделей, различные базовые технологии для обучения больших моделей общего назначения, такие как Transformer, также являются важными элементами для обучения крупномасштабных отраслевых моделей. .

Постоянно «100 миллиардов» параметров, «без учета» взаимосвязи с общей большой моделью порог вертикальной большой модели дополнительно снижен, что дает больше возможностей для дальнейшего развития генеративного ИИ.

Помимо больших моделей, генеративный ИИ также заслуживает внимания

Когда дело доходит до больших моделей, генеративный ИИ (Generative Al) будет идти рука об руку. Просто поймите взаимосвязь между ними — большую модель можно понимать как механизм, реализующий генеративный ИИ, то есть способность генеративного ИИ обеспечивается моделью машинного обучения или большой моделью, а генеративный ИИ выше чем большая модель, и генеративный ИИ может В зависимости от требуемого сценария вы можете решить, какую большую модель вызывать ChatGPT — одно из типичных приложений генеративного ИИ.

Еще в 2020 году генеративный ИИ был включен в цикл ажиотажа Gartner Emerging Technology Hype Cycle, а в 2022 году генеративный ИИ был включен в список основных стратегических технологических тенденций, и эта технология вошла в пик завышенных ожиданий с момента запуска инноваций. Gartner считает, что генеративный ИИ станет технологией общего назначения с влиянием, подобным паровому двигателю, электричеству и Интернету. По мере постепенного внедрения генеративного ИИ ажиотаж вокруг концепции будет постепенно угасать, а влияние на людей и предприятия в их повседневной работе и жизни будет возрастать.

Изображение предоставлено @Gartner

Глобальный гигант облачных вычислений Amazon Cloud Technology также вкладывает больше пера и чернил в генеративный ИИ.Адам Селипски, генеральный директор Amazon Cloud Technology, сказал в эксклюзивном интервью Bloomberg, CNBC и другим СМИ: «Генеративный ИИ очень важен в чат-ботах и поиске. . Преимущества применения генеративного ИИ очевидны для всех, но это лишь верхушка айсберга многих возможностей. В будущем генеративный ИИ внесет изменения во все сферы жизни». Он считает генеративный ИИ «прорывом». " измениться, и это может быть его собственное Самое большое изменение с момента рождения Интернета.

«Представьте, что в эпоху, когда компьютеры используют перфокарты в качестве интерфейса, лишь немногие ученые имеют возможность использовать компьютеры; когда графические интерфейсы и мыши становятся интерфейсами взаимодействия человека с компьютером, каждый может использовать компьютеры», — сказал Адам Селипски.

Итак, как отразятся изменения, вызванные генеративным ИИ?

Видно, что в автомобильной сфере некоторые компании использовали генеративный ИИ для синтеза данных для автономного обучения вождению, чтобы ускорить процесс обучения; в сфере производства генеративный ИИ может помочь анализировать большое количество данных телеметрии IoT, выполнять прогнозирование. техническое обслуживание и сокращение времени простоя производственных линий. Опираясь на генеративный ИИ, Autodesk работала с производителями самолетов, чтобы успешно завершить часть конструкции переборки и представила новую конструкцию, которая на 45% легче. Если эту летную стенку применить к глобальному автопарку, то будет сэкономлено топливо, эквивалентное расходу топлива 93 000 автомобилей.

Однако необходимо подчеркнуть, что генеративный ИИ, на который опирается Autodesk, — это не какая-то большая модель, а управляемый ИИ инструмент проектирования, построенный с использованием модели машинного обучения.

Следовательно, для реализации генеративного ИИ большая модель — это только вариант, и в будущем большая модель не будет доминировать. Приложение Titanium Media обеспокоено тем, что когда большинство предприятий рассматривают возможность доступа к крупномасштабным моделям, они не просто вводят одну крупномасштабную модель напрямую, а выбирают доступ к нескольким. Таким образом, среди этих крупных моделей в будущем не исключено сотрудничество между вертикальными крупными моделями и общими крупными моделями.

Возьмем в качестве примера UFIDA и WPS, два отечественных программного обеспечения. UFIDA недавно выпустила YonGPT, модель обслуживания для крупных предприятий. Согласно приложению Titanium Media, общая база крупных моделей, к которой YonGPT планирует получить доступ, включает Zhipu ChatGLM, Wenxinyiyan и Zhiyuan Wudao Tianying и т. д. ; WPS ранее запустила WPS AI.Согласно последним новостям, основной крупномасштабной моделью WPS AI в материковом Китае является MiniMax, а его только что запущенная зарубежная версия поддерживается OpenAI и PaLM2.

В мире генеративного ИИ нельзя полагаться на большую модель, и не только большая модель определяет успех генеративного ИИ.

Нельзя отрицать, что внедрение генеративного ИИ также является результатом многих аспектов, и выявляются «вторичные» проблемы, связанные с внедрением генеративного ИИ.

«Вторичная» задача в рамках генеративного ИИ

«Скажите на мобильный телефон: «Если кошка побежит по дивану, напомни мне», тогда, когда кошка побежит по дивану, мобильный телефон получит тревожное сообщение», — старший поставщик видеорешений Shandong Zhongwei Century Technology Co., Ltd. В своем выступлении вице-президент Ван Чжэнбинь упомянул сценарий применения интеллектуального обнаружения видео в умном доме.

Но это такая, казалось бы, простая сцена.В дополнение к мультимодальной большой модели, стоящей за ней, очень важны также сеть и вычисления на периферии. «В генеративном приложении ИИ, таком как ChatGPT, если скорость потери сетевых пакетов достигает 1%, производительность платформы для обучения большой модели упадет до 5% от ее пиковой производительности, что означает потерю 95%. Сетевые возможности Производительность вся полномасштабная платформа модели является очень важным фактором», — сказал Чжан Ю, главный технический директор подразделения Intel Network and Edge Division в Китае и старший главный инженер Intel по искусственному интеллекту.

Прогнозируется, что с ростом спроса на ИИ развертывание искусственного интеллекта на периферии будет в три раза выше, чем в базе данных.Это также означает, что внедрение периферийного ИИ является серьезной проблемой для следующего шага в развитии. искусственного интеллекта.

«Временные затраты и трудозатраты на развертывание искусственного интеллекта на периферии, например, на заводской производственной линии, по-прежнему высоки, и более половины развертывания периферийного искусственного интеллекта терпит неудачу», — Сачин Катти, старший вице-президент Intel и генеральный менеджер по Сеть и периферийное подразделение, недавно Говоря о граничных вычислениях в эпоху больших моделей, сказал он. С одной стороны, причина в том, что оборудование устарело, а ресурсов периферийных вычислений недостаточно, с другой стороны, очень важно, как использовать собственные уникальные данные для развертывания ИИ. Эти проблемы будут сдерживать многие развертывания периферийного ИИ.

В то же время лучшая производительность генеративного ИИ в конечном итоге должна поддерживаться данными.В настоящее время отрасль надеется обеспечить безопасность данных в генеративном ИИ, с одной стороны, а с другой стороны, она также надеется сделать данные источники многочисленны и доступны.

Решение этих проблем также находится в процессе. «Сегодняшняя система больших моделей и система искусственного интеллекта сильно зависят от данных и представляют собой интеллектуальные системы, управляемые данными. Эта система предъявляет очень высокие требования к широте и объективности данных. Предполагая, что данные очень предвзяты, их трудно эффективно поддерживать. «Разработка системы искусственного интеллекта». Вэй Тао, вице-президент и главный специалист по технической безопасности Ant Group, однажды сказал, что можно увидеть, что уже существуют инструменты для обратной проверки безопасности данных ИИ.

Что касается разработки источников данных, не так давно Shenzhen Digital Exchange присоединилась к почти 50 подразделениям, чтобы создать «Альянс открытых вычислений», а соучредителями являются Tencent Cloud, Huada Genomics, Yuntian Lifei, Obi Zhongguang и UBTECH, Китай. Unicom Guangdong Branch, Huaao Data и другие предприятия, Шэньчжэньское общество искусственного интеллекта и другие ассоциации, Национальный суперкомпьютерный центр Шэньчжэня и другие аналитические центры и исследовательские институты. Одной из основных целей создания Computing Alliance является координация разработки соответствующих стандартов, таких как элементы данных, управление данными, обучающие данные, маркировка данных и синтетические данные на основе высококачественных китайских обучающих данных и мультимодальных обучающих данных. , а также способствовать обмену данными для расширения их связанных с Моделью новых категорий и новых областей.

Проблемы, возникающие при разработке генеративного ИИ, невозможно описать словами, и глобальный ИИ-шторм, вызванный ChatGPT, не заканчивается на ChatGPT. После того, как был открыт новый мир искусственного интеллекта, большие модели и генеративный ИИ в зачаточном состоянии также выявили множество проблем и поставили ряд задач, но в то же время предоставили возможности для исследований и инноваций во всех сферах жизни.

Индустрия стремится к генеративному ИИ, что отнюдь не плохо для развития искусственного интеллекта или даже людей.

Посмотреть Оригинал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.