Облако Amazon запускает функцию агента ИИ, превращая ИИ в помощника, а не просто в чат

Источник: Бумага

Репортер Шао Вэнь

Функция агентов Amazon Bedrock позволит компаниям создавать приложения с искусственным интеллектом, которые могут автоматизировать определенные задачи, такие как бронирование столиков в ресторанах, а не просто получать рекомендации о том, где поесть.

«Многие люди так сосредоточены на этих моделях и их размере, но я думаю, что действительно важно то, как создавать приложения с их помощью, и это основная причина, по которой мы выпускаем функцию агентов сегодня».

26 июля по местному времени Свами Сивасубраманян, глобальный вице-президент Amazon Cloud Technology Database, Data Analysis and Machine Learning, выступил на саммите в Нью-Йорке.

На саммите в Нью-Йорке, одном из ежегодных саммитов Amazon Web Services (AWS), несколько объявлений были посвящены генеративному искусственному интеллекту. «Эта технология достигла критической точки, — сказал Свами Сивасубраманиан, глобальный вице-президент Amazon по базам данных облачных технологий, анализу данных и машинному обучению.

26 июля по восточному поясному времени на саммите в Нью-Йорке AWS запустила функцию агентов (агентов) Amazon Bedrock, сервиса генеративного ИИ, чтобы помочь базовым моделям выполнять сложные задачи. «Это позволит компаниям создавать приложения с искусственным интеллектом, которые могут автоматизировать определенные задачи, такие как бронирование столиков в ресторанах, а не просто получать рекомендации о том, где поесть», — сказал Сивасубраманян.

Кроме того, AWS также запустила новые инструменты искусственного интеллекта, в том числе официальную доступность помощника по программированию Amazon CodeWhisperer, Amazon HealthScribe, нового интеллектуального медицинского сервиса для создания медицинских карт после посещений пациентов и сервиса анализа Amazon Entity Resolution. В то же время было объявлено, что инстансы Amazon EC2 P5 для приложений ускоренного генеративного ИИ и высокопроизводительных вычислений официально доступны.

Васи Филомин, глобальный вице-президент по генеративному ИИ в Amazon Cloud Technology, поделился с The Paper, что среди всех выпусков больше всего его беспокоит и чем он гордится, так это функция агентов». размер моделей, но я думаю, что действительно важно то, как вы строите приложения из них, и это основная причина, по которой мы выпускаем функцию агентов сегодня».

Соревнование агентов ИИ

Модели генеративного ИИ, такие как GPT-4 от OpenAI или Llama 2 от Meta, являются мощными, но они не могут фактически автоматизировать определенные задачи для пользователя без дополнительной помощи, такой как плагины.

Amazon Bedrock предлагает способ создания генеративных приложений ИИ с помощью предварительно обученных моделей от стартапов, а также самой облачной технологии Amazon без инвестиций в серверы. Функция агентов Amazon Bedrock позволяет компаниям использовать свои собственные данные для обучения базовых моделей, а затем создавать другие приложения для выполнения задач. Разработчик может выбрать, какую базовую модель использовать, предоставить некоторые инструкции и выбрать, какие данные модель считывает.

Это похоже на недавно представленную систему плагинов OpenAI для GPT-4 и ChatGPT, которая расширяет возможности моделей, позволяя им использовать сторонние API и базы данных. Фактически, в последнее время наблюдается тенденция к «персонализированным» генеративным моделям с такими стартапами, как инструменты для создания контекстного ИИ, которые дополняют модели корпоративными данными.

Например, туристическая компания может использовать генеративный искусственный интеллект для предоставления рекомендаций по поездкам, затем создать другого агента (агентов) для получения истории поездок и интересов пользователя, затем использовать агента для поиска расписания рейсов и, наконец, создать агента для бронирования выбранных вами мест. полет.

AWS не единственная компания, которая с энтузиазмом относится к агентам. В апреле генеральный директор Meta Марк Цукерберг (Mark Zuckerberg) также сообщил инвесторам, что у них есть возможность донести агентов искусственного интеллекта (Агентов) до «миллиардов людей полезным и осмысленным образом». В июле генеральный директор OpenAI Сэм Альтман подробно рассказал об агентах ИИ и о том, как их лучше всего реализовать, в интервью The Atlantic.

В июле агентство Reuters сообщило, что гонка «автономных» агентов искусственного интеллекта (агентов) охватила Силиконовую долину. В нем упоминается один стартап Inflection AI, который в конце июня привлек финансирование в размере 1,3 миллиарда долларов. По словам ее основателей в подкасте, компания разрабатывает личного помощника, который, по их словам, может выступать в качестве наставника или выполнять такие задачи, как получение кредитов на перелет и проживание в отелях после задержек в пути.

26 июля Сивасубраманян заявил в интервью СМИ, что такие клиенты, как Sony (SONY), Ryanair (Ryanair) и Sun Life (Сан Лайф), попробовали Amazon Bedrock. Сивасубраманян сказал, что Amazon Bedrock скоро станет доступен для всех клиентов. Он отказался сообщить, когда, добавив, что компания в первую очередь стремится решить вопрос о распределении затрат и корпоративном контроле.

Сервис Amazon Bedrock был запущен в апреле, когда Amazon Bedrock предложил Amazon Titan (собственная базовая модель AWS), а также модели, созданные stable.ai, AI21Labs и Anthropic.

На этот раз на саммите в Нью-Йорке AWS объявила о добавлении Cohere в качестве поставщика базовой модели, присоединившись к новейшему чат-боту базовой модели Anthropic and Stability AI. Модель генерации командного текста Cohere обучена следовать подсказкам пользователя и возвращать сводки, стенограммы и разговоры, а инструмент также может извлекать информацию и отвечать на вопросы.

Платформа AWS может вызывать чип Nvidia H100

На саммите в Нью-Йорке AWS также представила инстансы Amazon EC2 P5 на базе чипа Nvidia H100. В некотором смысле это важная веха в более чем десятилетнем сотрудничестве между AWS и Nvidia.

Одной из примечательных особенностей графического процессора H100 является оптимизация Transformer, ключевой технологии, используемой в больших языковых моделях. Инстансы Amazon EC2 P5 предлагают 8 графических процессоров NVIDIA H100 с 640 ГБ высокоскоростной памяти графического процессора, процессоры AMD EPYC 3-го поколения, 2 ТБ системной памяти и 30 ТБ локального хранилища NVMe для ускорения генеративного ИИ и приложений высокопроизводительных вычислений.

Amazon EC2 P5 сокращает время обучения до 6 раз (от дней до часов) по сравнению с инстансами на базе GPU предыдущего поколения. Согласно AWS, это повышение производительности снизит затраты на обучение на 40% по сравнению с предыдущим поколением.

Фактически, с момента запуска первого чипа Amazon Nitro в 2013 году AWS стала первым поставщиком облачных услуг, принявшим участие в разработке чипов собственной разработки. У нее уже есть три линейки продуктов: сетевые чипы, серверные чипы и самообучающиеся технологии искусственного интеллекта. разработанные чипы. В начале 2023 года будет выпущена специально созданная платформа Amazon Inferentia 2 (которая может поддерживать распределенный логический вывод посредством прямых сверхскоростных соединений между чипами), поддерживающая до 175 миллиардов параметров, что делает ее сильным претендентом на крупномасштабный логический вывод моделей.

Относительно того, беспокоился ли он о том, что предоставление чипа Nvidia H100 снизит привлекательность чипа собственной разработки AWS, Ферромин ответил Pengpai Technology («Мы приветствуем конкуренцию. Аппаратное обеспечение будет улучшаться каждые несколько лет. Это норма. Большая проблема, верно). теперь генеративный ИИ довольно дорог, поэтому никто на самом деле не использует его в производственных рабочих нагрузках, все все еще находятся на экспериментальной стадии.Как только они действительно введут его в производственные рабочие нагрузки, они поймут, что 90% стоимости генерируется В лучшем случае вы не теряете деньги на каждом звонке, вы на самом деле зарабатываете деньги. Чтобы добиться этого, я думаю, нам нужно конкурировать».

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить