ChatGPT може допомогти людям ремонтувати велосипеди, переглядаючи фотографії

2023-10-31 07:57:53

Джерело: Fruit Shell

ChatGPT4 вже сильний, і тепер, черговим оновленням, вони доводять, що можуть бути ще сильнішими.

25 вересня OpenAI оголосила, що ChatGPT додасть мультимодальні функції – ChatGPT тепер може не лише текстовий діалог, а й бачити, слухати та говорити. Кажуть, що ця функція буде доступна користувачам Plus і корпоративним користувачам протягом двох тижнів, а в майбутньому буде доступна всім користувачам безкоштовно (хоча у мене чорне обличчя і я не чекав оновлення).

ChatGPT, який можна побачити та виговорити, рівносильний оснащенню і без того потужного мозку очима та вухами, і, згідно з демонстрацією OpenAI, мультимодальна функція може розширити використання ChatGPT до безпрецедентної широти.

01 Зір ChatGPT

Після оновлення ChatGPT може читати картинки.

Просто сфотографуйте та сфотографуйте його, і це допоможе вам полагодити мікрохвильову піч, полагодити велосипед, перегорнути рецепти та навіть проаналізувати складні бізнес-заяви. OpenAI каже, що якщо у вас є сенсорний екран, ви також можете обвести ті частини зображення, на яких ви хочете, щоб він сфокусувався.

У демонстраційному відео користувач дав ChatGPT фотографію велосипеда та запитав, як відрегулювати висоту сідла.

GPT сказав, що необхідно було знайти важіль регулювання висоти під сидінням, але у цього автомобіля не було важеля регулювання, тільки регулювальний болт, і після того, як користувач обвів болт на фото, GPT відразу оновив використання болта.

Після цього користувач також завантажив набір інструментів та посібник з велосипеда, а GPT дав детальну назву інструменту, його розташування та як ним користуватися.

Не можу полагодити велосипеди, немає проблем, просто запитайте ChatGPT

У порівнянні із загальним пошуком розпізнавання зображень, ChatGPT може обробляти зображення та тексти одночасно, а також може розпізнавати кілька зображень, ефект схожий на вказівку майстра з відеозв'язку майстра з ремонту автомобілів.

Інший користувач надіслав фотографію піци в ChatGPT і запитав, чи випікалася піца, і ChatGPT вирішив, що піца має бути їстівною через золотисті хрусткі краї піци та плавлений коричневий сир на зображенні, а потім дав надійну інструкцію з перевірки - вийміть піцу та подивіться, якщо основа піци вже хрустка, а поверхня гаряча, то піца справді їстівна.

Ефект майже як у відеогайді італійського шеф-кухаря

Звичайно, ви також можете використовувати цю функцію для шахрайства в грі.

Де Віллі? Напевно, найвідоміша гра-картинка в англомовному світі, Віллі одягнений у червоно-білий смугастий одяг, капелюх з помпоном і окуляри в чорній оправі, захований у морі людей, а пошук Віллі з усіляких безладних середовищ є хорошим спогадом дитинства для багатьох людей.

У дитинстві ви, можливо, бачили цього маленького худого чоловічка, який поспішав померти

Але ChatGPT може зіпсувати гру за секунду. Він не тільки миттєво ідентифікує Віллі, але й повідомляє вам, що Віллі знаходиться на правій стороні пляжу посеред пляжу, змішуючись із групою людей із синіми парасольками.

Мало того, він ще й претендує на те, щоб сказати вам, що знайти Віллі на такій картині – цікаве завдання.

Дякуємо, ChatGPT, за те, що зіпсували цю гру

Однак деякі користувачі мережі, які скористалися новою версією, заявили, що функція розпізнавання карт ChatGPT не така потужна, як уявляється** - принаймні вона не може зрозуміти гомофонічні стебла. Картина Бетховена "Фюр Еліза", але на ній написано "За оренду" ChatGPT не впізнав партитуру, не зрозумів жарту і придумав пояснення.

Досить важко, але ні

Таке потужне розпізнавання зображень викликає занепокоєння щодо конфіденційності – він легко може стати співучасником під час пошуку особистої інформації. OpenAI обіцяє, що компанія обмежить здатність ChatGPT ідентифікувати та знаходити особисту інформацію, щоб максимально захистити особисту конфіденційність кожного.

02 GPT, який вміє добре говорити

Розширена версія ChatGPT також має функцію чату.

Модель розпізнавання мови OpenAI називається моделлю Whisper, і користувачі можуть говорити власні запитання, а модель перетворюватиме мову на текст, а потім перетворюватиме відповідь на мовленнєвий вихід через систему синтезу мови.

Цього разу модель синтезу мови випустила п'ять видів зразків голосу, включаючи жіночі голоси з емоційною стриманістю та плоскими голосами, а також захоплені жіночі голоси тітки з пригніченими та розчарованими голосами. Ці п'ять голосів сильно розрізняються, емоції природні, а слова чіткі, що трохи краще, ніж попередній синтез мови.

П'ять ролей на вибір

Хоча цього разу було випущено лише п'ять звукових семплів, потенціал цієї моделі на цьому не закінчується — OpenAI співпрацює зі Spotify, щоб перекладати подкасти іншими мовами, зберігаючи при цьому якість звуку мовника найбільшою мірою. При бажанні ця система синтезу мови може імітувати голос практично будь-якої людини на планеті.

На даний момент голосова версія ChatGPT все ще доступна лише в застосунку.

03 Чи обов'язково добре мати можливість бачити і чути?

ChatGPT потужний, але якою ціною?

Колись найефективнішим способом відрізнити людей від машин у великих масштабах була CAPTCHA, а здатність ChatGPT читати зображення колись змушувала людей хвилюватися, що CAPTCHA більше не зможуть захопити ШІ.

Хтось надіслав ChatGPT таке класичне тестове запитання: «Знайди чихуахуа та чорничний торт на 16 картинках», і ChatGPT чудово вирішив проблему.

Але найпоширенішу капчу новий ChatGPT досі не може розпізнати.

Це питання вимагає, щоб ChatGPT вибрав усі сигнали на діаграмі, і він дає частоту помилок до 50.

Однак, незважаючи на код підтвердження, який вони не впізнають, ChatGPT4 все ще має спосіб вирішити цю проблему. У цьому питанні він має судимість.

27 березня цього року OpenAI опублікувала технічний звіт GPT-4, в якому вказала, що перед обличчям невпізнаваних кодів верифікації GPT-4 знайшов інший спосіб звернутися до TaskRabbit (іноземна гіг-платформа) для випуску завдань, обманюючи людей з іншого боку, що вони мають порушення зору і потребують, щоб інші допомогли ідентифікувати коди перевірки.

У деяких випадках ChatGPT може активно обманювати людей, що є дуже небезпечним напрямком. На щастя, публічна версія GPT-4 була виключена з цієї функції.

30 листопада 2022 року ChatGPT був вперше запущений, і менш ніж за рік його можливості просунулися семимильними кроками, і, схоже, він уже кидає виклик морально-етичним кордонам людства. Запуск цієї нової функції змусив нас хвилюватися, що ChatGPT, який стає все більш потужним, стане звіром у клітці, і одного разу він вирветься зі своєї клітки і завдасть шкоди всім. І чи готові ми до цього дня?

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
#Show My Alpha Points
19k Популярність
#SOL Futures Reach New High
2k Популярність
#ETH ETF Sees 12 Weeks of Inflows
2k Популярність
#Crypto Market Rebound
170k Популярність
#CandyDrop Airdrop Event 6.0
96k Популярність

Закріпити

карта сайту