OpenAI подала заявку на товарный знак GPT-5, когда он будет выпущен? Какие новые способности он принесет?

Первоисточник: Лаборатория инноваций AGI.

Источник изображения: сгенерировано Unbounded AI‌

1 августа OpenAI официально подала заявку на регистрацию товарного знака «GPT-5», которая охватывает следующее:

  • Программное обеспечение, которое искусственно генерирует человеческую речь и текст
  • Преобразование файлов аудиоданных в текст
  • Распознавание голоса и речи
  • Язык на основе машинного обучения и обработка речи

Согласно документам заявки на товарный знак GPT-5, товарный знак GPT-5 охватывает функцию ИИ для генерации речи и текста, а также может преобразовывать аудиофайлы в текст, реализовывать распознавание звука и речи и использовать технологию машинного обучения для обработки языка и речи. .

Это может означать, что GPT-5 будет поддерживать голосовые возможности, что предоставит пользователям более совершенные и эффективные возможности обработки голоса и текста, а также еще больше улучшит мультимодальные возможности.

Когда выйдет GPT-5?

Когда GPT-4 будет выпущен в марте 2023 года, ожидается, что OpenAI выпустит модель следующего поколения в декабре 2023 года. Соучредитель Runway Сики Чен ранее заявлял, что мне сказали, что GPT5 должен завершить обучение в декабре этого года, и Openai ожидает, что он сможет достичь общего искусственного интеллекта (AGI). Это означает, что мы все будем яростно спорить о том, действительно ли это AGI.

Однако, когда его спросили на мероприятии Массачусетского технологического института в апреле, обучает ли OpenAI GPT-5, генеральный директор OpenAI Сэм Альтман сказал: «Мы не будем и не будем какое-то время». В интервью в июне этого года основатель и генеральный директор OpenAI Сэм Альтман сказал, что когда его спросили, что запустило GPT-5, мне также любопытно, у нас нет ответа, у нас не будет GPT-5 в ближайшее время, мы должны сделать безопасность большой Часть этого.

Тем не менее, некоторые считают, что OpenAI может запустить GPT-4.5, промежуточную версию между GPT-4 и GPT-5, как и GPT-3.5, к октябрю 2023 года. Говорят, что GPT-4.5 в конечном итоге принесет мультимодальные возможности, возможность анализировать изображения и текст. OpenAI уже объявил и продемонстрировал мультимодальные возможности GPT-4 еще в марте 2023 года во время прямой трансляции для разработчиков GPT-4. Теперь Microsoft выпустила мультимодальные возможности GPT-4 в Bing Chat. Похоже, следующее крупное обновление GPT-4 не за горами.

Кроме того, в настоящее время OpenAI предстоит проделать большую работу над моделью GPT-4, прежде чем начать работу над GPT-5. В настоящее время время вывода GPT-4 очень велико и довольно дорого в эксплуатации. Доступ к GPT-4 API все еще трудно получить. Кроме того, OpenAI совсем недавно открыл доступ к плагинам и интерпретаторам кода ChatGPT, которые все еще находятся в стадии бета-тестирования. Просмотр Интернета был удален из GPT-4, поскольку он отображает контент с платных сайтов.

Хотя GPT-4 очень мощный, я думаю, что OpenAI понимает, что вычислительная эффективность является одним из ключевых элементов для устойчивого запуска модели. Добавьте новые функции и возможности, и вы сможете работать с более крупными инфраструктурами, гарантируя, что все контрольные точки будут запущены и надежно работают. Таким образом, можно предположить, что GPT-5, вероятно, будет выпущен в 2024 году, если мы не предполагаем никаких нормативных препятствий со стороны государственных органов.

Прогнозы: возможности и функции GPT-5

Уменьшить галлюцинации

Горячая тема в отрасли заключается в том, что GPT-5 реализует AGI (искусственный интеллект). Помимо прочего, GPT-5 должен сократить время вывода, повысить эффективность, уменьшить количество галлюцинаций и многое другое. Начнем с галлюцинаций, одной из ключевых причин, по которой большинство пользователей не очень доверяют моделям ИИ.

Согласно OpenAI, оценка GPT-4 на 40 % выше, чем у GPT-3.5, по фактической оценке внутреннего состязательного дизайна во всех девяти категориях. GPT-4 теперь на 82% реже реагирует на неточный и запрещенный контент. Это очень близко к 80% в тестах на точность по категориям. Это гигантский прыжок против иллюзии.

Теперь ожидается, что OpenAI уменьшит галлюцинации до менее чем 10% в GPT-5, что будет очень важно для того, чтобы сделать модели LLM заслуживающими доверия.

Модель эффективности расчета

Мы уже знаем, что запуск GPT-4 обходится дорого (0,03 доллара США за 1 тыс. токенов) и требует больше времени для вывода. А старшая модель GPT-3.5-turbo в 15 раз дешевле GPT-4 ($0,002 за 1K токенов). Согласно недавнему отчету SemiAnalysis, GPT-4 не является плотной моделью, а основан на архитектуре «смеси экспертов». Это означает, что GPT-4 использует 16 разных моделей для разных задач с 1,8 триллионами параметров.

При такой большой инфраструктуре стоимость эксплуатации и обслуживания модели GPT-4 становится очень высокой.

На самом деле, многие новые большие модели стали гнаться за «маленькими и изысканными», чтобы у больших моделей было как можно меньше параметров, а не больше.

В недавней интерпретации модели Google PaLM 2 параметры PaLM 2 достаточно малы, но производительность высокая.

Мультисенсорная модель ИИ

Хотя GPT-4 была объявлена мультимодальной моделью ИИ, она работает только с двумя типами данных, а именно с изображениями и текстом. С GPT-5 OpenAI может сделать гигантский шаг к настоящей мультимодальности. Он также может обрабатывать текст, аудио, изображения, видео, данные о глубине и температуре. Он сможет соединять потоки данных из разных модальностей для создания встроенных пространств.

Долгосрочная память

С выпуском GPT-4 OpenAI обеспечивает максимальную длину контекста в 32 тыс. токенов по цене 0,06 доллара за 1 тыс. токенов. Мы быстро увидели переход от стандартного токена 4K к 32K всего за несколько месяцев. Недавно Anthropic увеличила контекстное окно своего чат-бота Claude AI с 9 000 токенов до 100 000 токенов. Ожидается, что GPT-5 может обеспечить поддержку долговременной памяти за счет большей длины контекста.

Это помогает ИИ-персонажам и друзьям помнить ваших персонажей и воспоминания на долгие годы. Кроме того, вы также можете загружать книги и библиотеки текстовых документов в одном контекстном окне. Благодаря поддержке долговременной памяти может появиться множество новых приложений ИИ, и GPT-5 может сделать это возможным.

Как вы думаете, когда будет выпущен GPT-5 и какие прорывные инновации он принесет?

Использованная литература:

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить