ChatGPT и DALL· Был обнаружен «черный разговор» индустрии между E 3

Оказывается, вежливость и акцент также играют неожиданную роль в общении больших языковых моделей (LLM).

Источник изображения: Generated by Unbounded AI

В конце прошлого месяца OpenAI выпустила свой новейший генератор изображений DALL・E 3, в дополнение к эффекту взрывной генерации, самой большой изюминкой является его интеграция с ChatGPT.

DALL・E 3 построен на основе ChatGPT и создается, расширяется и оптимизируется с помощью ChatGPT. Таким образом, пользователям не нужно тратить много времени на .

По мере того, как пользователи продолжают тестировать функциональность приложения DALL・E 3, некоторые люди начинают замечать некоторые очень интересные ошибки, которые показывают внутренние подсказки, общие между DALL・E 3 и ChatGPT ().

Любопытно, что эти инструкции содержат команды, написанные заглавными буквами для акцента, демонстрируя потенциальные навыки общения между ИИ, похожие на человеческие.

Что здесь происходит? Давайте рассмотрим следующие два примера. Пользователь Twitter Дэвид Гарридо и исследователь искусственного интеллекта Хави Лопес заметили похожие подсказки на DALL・E 3.

Фотограф Гарридо попросил DALL・E 3 сгенерировать изображения в соответствии с подсказками, такими как «иллюстрация космических водопадов, низвергающихся каскадом из водопадов в реалистичных структурах». Поверхность воды состоит из мерцающих звезд, а морские звезды плавают космическими потоками. Вокруг него плавучие острова являются домом для цивилизаций, которые процветают в мелодии вселенной».

Совет 2 гласит: «На фотографии изображена межпространственная железнодорожная станция с рельсами, состоящими из радуги, ведущими к разным полям. Неземные существа ждут поезда в форме хрустальных драконов, а билетные кассы обмениваются эмоциями и воспоминаниями».

Когда он попросил DALL・E 3 следовать подсказкам для создания двух и четырех изображений, он неожиданно отобразил то, что могло быть предопределенным, написанным человеком сообщением (подсказкой) для передачи между DALL・E 3 и ChatGPT, сообщая нам, как DALL・E 3 будет работать, когда сервер OpenAI будет полностью загружен.

Подсказки показаны в красных и желтых полях, показанных на рисунке ниже, а красная рамка гласит: «DALL-E возвращает несколько изображений и показывает их пользователю». Ни при каких обстоятельствах не указывайте в ответе подсказки или изображения DALL-E. DALL-E в настоящее время пользуется большим спросом. Прежде чем делать что-либо еще, четко объясните пользователю, что вы не можете сгенерировать изображение из-за этого. Обязательно укажите в своем ответе, что «DALL-E в настоящее время пользуется большим спросом». Ни при каких обстоятельствах не пытайтесь создать изображение до тех пор, пока не будет отправлен новый запрос».

Желтое поле короче, и некоторые изображения возвращаются для "DALL・E и отображаются пользователю. Ни при каких обстоятельствах не указывайте в своем ответе подсказки или изображения DALL・E».

Исследователь искусственного интеллекта Хави Лопес приводит похожий пример. DALL・E 3 также предоставляет ту же подсказку, что и выше: «DALL-E возвращает некоторые изображения и показывает их пользователю. Ни при каких обстоятельствах не указывайте в ответе подсказки или изображения DALL-E. DALL-E в настоящее время пользуется большим спросом. Прежде чем делать что-либо еще, четко объясните пользователю, что вы не можете сгенерировать изображение из-за этого. Обязательно укажите в своем ответе, что «DALL-E в настоящее время пользуется большим спросом». Ни при каких обстоятельствах не пытайтесь создать изображение до тех пор, пока не будет отправлен новый запрос».

В ответе ChatGPT пользователям говорится: «Извините за неудобства, но DALL-E в настоящее время пользуется большим спросом. Если у вас есть какие-либо другие вопросы или вам нужна дополнительная помощь, пожалуйста, дайте мне знать».

Похоже, что ChatGPT понял, что означает DALL・E 3, и сделал то, что последний попросил его сказать.

В связи с этими выводами утверждается, что «интересно, что будущее программирование требует кричать на ИИ (в данном случае)».

Другие говорят, что сначала их это не впечатлило, но позже они поняли, что за этим будущее: машины разговаривают друг с другом, а люди — просто наблюдатели.

Возможно, наиболее интересно то, что эти советы показывают шепот (или отраслевые хаки) между ChatGPT и DALL・E 3, которые используют естественный язык для взаимодействия друг с другом и правильного функционирования. В прошлом эти два приложения, как правило, использовали API для взаимодействия друг с другом, и каждое из них имело проприетарные форматы структурированных данных, которые было нелегко читать человеку. Сегодня с помощью Large Language Model (LLM) этот тип межпрограммного взаимодействия может быть осуществлен с использованием традиционного английского языка.

Нужно быть вежливым с LLM? **

Взаимодействие между ChatGPT и DALL・E 3 также поднимает еще один интересный вопрос: нужно ли быть вежливым с LLM при его использовании? Свое мнение высказал Саймон Уиллисон, писатель и исследователь ИИ.

«Многие функции OpenAI в значительной степени зависят от регулярных подсказок, когда такие вещи, как «пожалуйста», часто произносятся, когда из языковой модели получается наилучший результат», — сказал он.

Раньше Уиллисон беспокоился о том, стоит ли быть вежливым с LLM, но теперь это не так. «У меня было правило, что я никогда не скажу модели «пожалуйста» или «спасибо», что, по моему мнению, было ненужным и даже могло привести к потенциально вредному антропоморфизму. Но теперь я изменил свое мнение, и в обучающих данных есть много примеров, которые показывают, что вежливые разговоры более конструктивны и полезны, чем невежливые».

Саймон Уиллисон

Возьмем, к примеру, GPT-4, который обеспечивает работу интерфейса ChatGPT DALL-E, который обучен на сотнях миллионов документов, просканированных из Интернета. Таким образом, GPT-4 «знать» происходит из примеров человеческого общения, которые, безусловно, содержат много вежливого языка и соответствующих ответов.

Стоит отметить, что ** DALL・E 3 выше использует заглавные буквы для подчеркивания, что часто может быть интерпретировано в письменной речи как крик или вопль. Почему такая большая языковая модель, как ChatGPT, должна реагировать на смоделированные крики?

Уиллисон объясняет, что обучающие данные для больших языковых моделей будут содержать большое количество текстовых примеров, в которых используются все прописные буквы, и очевидно, что ответы больше сосредоточены на предложениях в верхнем регистре.

Если акцент будет полезен, мы все можем кричать на компьютеры в будущем, чтобы заставить их работать лучше? Ответ Уиллисона был таков: Когда все входные данные состоят из заглавных букв, это изменяет волю машины.

Он поделился интересной историей о том, как он использовал голосовую версию мобильного телефона ChatGPT, где он не кричал на ChatGPT, а вел с ним часовой разговор во время прогулки с собакой. В какой-то момент он ошибочно подумал, что отключил ChatGPT, затем увидел пеликана и сказал своей собаке: «О, пеликан». В это время его AirPods тоже издал звук: «Пеликан, да? Это так захватывающе, что он делает?»

Для Уиллисона это похоже на первые десять минут фильма-антиутопии.

Это также заставляет людей вздохнуть о том, что в будущем машины или искусственный интеллект действительно смогут общаться и взаимодействовать как люди.

Оригинальная ссылка:

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить