a16z розмовляє з технічним директором OpenAI: як технологія ШІ стимулюватиме майбутні інновації?

Question

Написаний Святим ПавломПісля того, як наприкінці 2022 року OpenAI випустив ChatGPT, розуміння галузі штучного інтелекту продовжувало поглиблюватись. Ланцюжок індустрії штучного інтелекту можна приблизно розділити на основних постачальників технологій, систем штучного інтелекту та користувачів штучного інтелекту. Судячи із загального сприйняття глобальних інвесторів, зараз усі усвідомлюють, що штучний інтелект, швидше за все, стане інвестиційною платформою на довгий час у майбутньому, подібно до комп’ютерів 30 років тому або Інтернету 20 років тому. А на майбутнє програми вже є реальністю.Щоб зрозуміти інвестиції в окремі галузі, нам завжди потрібно вчитися в інвесторів галузі. Відомий венчурний капіталіст A16Z продовжує робити великі ставки в сфері штучного інтелекту. Нещодавно вони розмовляли з технічним директором OpenAI Мірою Мураті. Вона поділилася історією ChatGPT і майбутнім штучного інтелекту та взаємодії людини з комп’ютером.# Резюме* ChatGPT виник із роздумів про те, як створити безпечну систему штучного інтелекту, яка використовує відгуки людини для навчання з підкріпленням.* OpenAI переосмислює те, як люди взаємодіють із цифровою інформацією, стає партнерським помічником і постійно підвищує послідовність і безпеку систем штучного інтелекту. Через ситуацію виробництва отримати відгуки від реальних користувачів — це більше, ніж просто сидіти в лабораторії.* ChatGPT додає зображення, відео та інше на основі тексту. Це дозволяє моделям надавати більш повну картину світу навколо нас, подібно до того, як ми розуміємо та спостерігаємо світ.* Хоча в майбутньому не буде єдиної моделі, яка б керувала світом, тому що люди з часом шукатимуть інструмент, який найкраще відповідає їхнім потребам.#Mira Murati Фон![](https://img-cdn.gateio.im/resized-social/moments-40baef27dd-2410a0ef7f-dd1a6f-69ad2a)Міра народилася в Албанії відразу після падіння комунізму. Албанія того часу була дуже схожа на сучасну Північну Корею. В епоху постійних змін і невизначеності освіта є ключем до всього. До того ж, окрім книжок, розваг тоді мало. У той час Міра шукала відповіді в книгах. Міра віддає перевагу тим істинам у науці, які стабільні та піддаються глибокому вивченню. А джерела таких гуманітарних предметів, як історія та соціологія, сумнівні, оскільки історія постійно змінюється. Таким чином, Міра була вихована з інтуїтивною та природною схильністю до науки та математики. По суті, Міра все ще займається математикою в Open AI.Завдяки відмінній успішності Міра отримала стипендію та закінчила останні два роки середньої школи в Канаді.У коледжі Міра вивчала машинобудування, оскільки вважала, що це найкращий спосіб застосувати знання до реальних проблем. У той час Міра була дуже зацікавлена в тому, як запровадити екологічний транспорт і сталу енергію у світі. Її дипломний проект на той час полягав у створенні гібридного гоночного автомобіля з використанням суперконденсаторів.Незабаром після цього Міра приєдналася до Tesla і взяла участь у роботі над подвійним двигуном Model S. Вона працювала з Model X з перших днів її початкового дизайну і зрештою очолила весь запуск проекту.Саме робота в Tesla зацікавила Міру застосуванням штучного інтелекту, особливо автономним водінням. Тому що він може використовувати ШІ та комп’ютерне зір, щоб зробити революцію в подорожах. Вона почала більше думати про різні застосування штучного інтелекту. Тож Міра все більше цікавилася ШІ та змінами, які він міг зробити у світі.Зокрема, їй дуже цікаво, як штучний інтелект впливає на взаємодію людини з комп’ютером і на те, як люди взаємодіють з інформацією в цілому, і її дуже цікавить просторове обчислення. Після цього вона приєдналася до компанії Leap Motion, що займається чорними технологіями, на посаду віце-президента з виробництва та розробки. Саме цей досвід ще більше зміцнив її продуктивні можливості.(До речі, засновник Leap Motion Девід Хольц після продажу Leap Motion заснував ще один популярний додаток для штучного інтелекту Midjourney).У 2018 році Міра приєдналася до OpenAI. Саме тоді вона почала більше думати про те, що станеться, якщо вона просто зосередиться на універсальності.Крім того, з обговорення Мірою методів дослідження ми можемо побачити її дослідницький дух для технологічних інновацій у невизначеному середовищі:* Іноді ти дрімаєш і прокидаєшся з новими ідеями. Протягом кількох днів або тижнів ви прийдете до остаточного рішення. Це не швидке повернення, а також часом не повторюване.* Це майже як інший спосіб мислення, ви розвиваєте інтуїцію, але також маєте дисципліну, щоб підходити до проблем і довіряти собі, щоб їх вирішити. Згодом ви розвинете інтуїцію про те, які проблеми дійсно потрібно вирішити.# Підсумок розмовиВідомий венчурний капіталіст A16Z зробив велику ставку на сферу штучного інтелекту. Наступні уривки є уривками з розмови між Мартіном, менеджером фонду A16Z, і Мірою. Міра поділилася історією ChatGPT і майбутнім штучного інтелекту та взаємодії людини з комп’ютером. Ми також бачимо, що Міра, яка має досвід роботи менеджером із продуктів, надзвичайно стурбована застосовністю продуктів.МАРТІН: Ви думаєте, що зараз це більше системна чи інженерна проблема?Міра: Обидва. Системні та інженерні проблеми величезні, і ми розгортаємо ці технології та намагаємося масштабувати їх, зробити ефективнішими та доступними. Це означає, що вам не потрібно знати тонкощі ML, щоб використовувати їх.Насправді ми бачимо контраст між наданням цих моделей через API та наданням технології через ChatGPT. По суті, це та сама технологія, за одним можливим винятком: ChatGPT має можливості навчання з підкріпленням і відгуки людини. Це означає, що реакція та здатність захопити уяву людей і дозволити їм використовувати цю технологію щодня зовсім інші.інтерфейс природною мовоюМартін: Я також вважаю, що API ChatGPT дуже цікава річ. Щоразу, коли я використовую ці моделі у своїх програмах, мені завжди здається, що я обертаю суперкомп’ютер у рахівницю. Іноді я кажу: «Я дам моделі клавіатуру та мишу, і дозволю їй програмувати.» API англійською мовою, і я скажу їй, що робити, і вона виконає все програмування. Мені цікаво, коли ви створюєте щось на зразок ChatGPT, чи думаєте ви, що з часом фактичний інтерфейс буде природною мовою, чи, на вашу думку, програми все ще відіграватимуть велику роль?Міра: Програмування стає менш абстрактним у ChatGPT, і ми можемо спілкуватися з комп’ютерами за допомогою природної мови з високою пропускною здатністю. Але, можливо, інший вектор полягає в тому, що ця технологія допомагає нам зрозуміти, як насправді з нею працювати, а не програмувати. Рівень програмування стає легшим і доступнішим, оскільки ви можете програмувати природною мовою. Але інша сторона того, що ми бачимо з ChatGPT, полягає в тому, що ви можете працювати з моделлю як партнер або колега.МАРТІН: Буде цікаво подивитися, що станеться з часом. Ви вирішили мати API у ChatGTP, але, як колега, у вас немає API. Ви розмовляєте з колегою. З часом ці речі можуть перетворитися на розмову природною мовою. Чи ви думаєте, що в системі завжди повинен бути компонент, який є кінцевим автоматом або традиційним комп’ютером?Міра: Зараз є переломний момент, коли ми переосмислюємо, як ми взаємодіємо з цифровою інформацією, і саме у формі систем штучного інтелекту ми це робимо. Можливо, у нас є кілька систем штучного інтелекту, можливо, усі вони мають різні можливості. Можливо, у нас є універсальна система, яка слідує за нами всюди, знає моє походження, що я робив сьогодні, які мої цілі в житті та роботі, допомагає мені у важкі часи, направляє мене тощо. Як ви можете собі уявити, це надзвичайно потужно.Зараз ми знаходимося на переломній точці в його новому визначенні. Ми не знаємо, як виглядатиме майбутнє, і ми наполегливо працюємо над тим, щоб зробити ці інструменти та методи доступними для багатьох інших людей, щоб вони могли експериментувати, а ми могли бачити, що станеться. Це стратегія, яку ми використовували з самого початку.У ChatGPT минулого тижня ми хвилювалися, що це недостатньо добре. Ми всі бачили, що сталося. Ми оприлюднили це, і люди сказали нам, що воно справді добре справляється з пошуком нових випадків. Ось що відбувається, коли ви робите ці речі доступними та простими у використанні, і ви робите їх легкими для всіх.**Дорожня карта розвитку OpenAI**МАРТІН: Що стосується штучного інтелекту, люди ще не вміють мислити. Має бути якесь керівництво, ви повинні зробити певний вибір. Ви в OpenAI і вам потрібно вирішити, що робити далі. Якби ви могли пройти цей процес прийняття рішень: як ви вирішуєте, що робити, на чому зосередитися, що звільнити або як позиціонувати себе?Міра: Якщо ви думаєте про те, як з’явився ChatGPT, ми хотіли запустити не той продукт. Насправді її справжнє коріння сягає понад 5 років тому, коли ми думали про те, як створити безпечну систему штучного інтелекту. Ви не обов’язково хочете, щоб цільову функцію написала людина, тому що ви не хочете, щоб це робив хтось замінник складної цільової функції, або ви не хочете робити помилки, тому що це може бути дуже небезпечно.Ось тут і з’являється навчання з підкріпленням за допомогою зворотного зв’язку людини. Чого ми справді намагаємося досягти, так це узгодити систему штучного інтелекту з людськими цінностями та дозволити їй приймати відгуки людей. Судячи з людського відгуку, ви з більшою ймовірністю зробите правильні речі і менш імовірно зробите те, чого не хочете робити. Після того, як ми розробили GPT-3 і випустили його на API, це був перший раз, коли ми фактично застосували наші дослідження безпеки в реальному світі. Це досягається за допомогою моделі виконання інструкцій.Ми використовуємо цей підхід, щоб отримати підказки від клієнтів, які використовують API, а потім ми маємо підрядників створити відгуки для моделі, щоб вчитися. Ми налаштували модель на основі цих даних і створили модель, яка дотримувалася вказівок. Вони, швидше за все, підуть намір користувача та зроблять те, що ви насправді хочете. Це дуже потужно, тому що безпека штучного інтелекту — це не просто теоретична концепція, про яку ви сидите й говорите. Насправді це стає таким: зараз ми вступаємо в еру систем безпеки зі штучним інтелектом, як інтегрувати це в реальний світ?Очевидно, що у великих мовних моделях ми бачимо чудові представлення концепцій та ідей реального світу. Але з точки зору випуску є багато проблем. Однією з найбільших проблем, очевидно, є галюцинації. Ми працювали над питаннями ілюзії та автентичності. Як змусити ці моделі виражати невизначеність?Попередником ChatGPT був інший проект, який ми назвали WebGPT, який використовував пошук для отримання інформації та цитування джерел. Згодом цей проект став ChatGPT, тому що ми вважали розмови особливими. Це дозволяє вам ставити запитання, виправляти іншу особу та висловлювати невпевненість.МАРТІН: Помилки постійно виявляють, тому що ви взаємодієте...Міра: Так, завдяки такій взаємодії ви можете зрозуміти глибшу істину. Ми почали рухатися в цьому напрямку, і в той час ми робили це з GPT-3 і GPT-3.5. З точки зору безпеки, ми дуже раді цьому. Але люди забувають одну річ, це те, що в цей час ми тренували GPT-4. У OpenAI ми дуже раді GPT-4 і маємо ChatGPT у дзеркалі заднього виду. Потім ми зрозуміли: «Ми збираємося витратити шість місяців, зосереджуючись на вирівнюванні та безпеці GPT-4», і почали думати про те, що ми можемо зробити. Однією з головних речей є передача ChatGPT в руки дослідників, і вони зможуть надати нам відгук тепер, коли ми маємо цю розмовну модель. Початкова мета — отримати відгук від дослідників і використати його, щоб зробити GPT-4 більш узгодженим, безпечним, надійним і надійним.МАРТІН: Коли ви говорите про послідовність і безпеку, ви маєте рацію включити це, що він робить все, що хоче? Або ви маєте на увазі безпечний, фактичний захист від певної шкоди?Міра: Під послідовністю я зазвичай маю на увазі, що вона відповідає намірам користувача, тож робить саме те, що ви хочете. Але безпека також включає в себе інші речі, такі як зловживання, коли користувачі навмисно намагаються використовувати модель для отримання шкідливих результатів. За допомогою ChatGPT ми намагаємося підвищити ймовірність того, що модель буде виконувати те, що ви хочете, роблячи її більш узгодженою. Ми також хотіли з’ясувати проблему галюцинацій, яка, очевидно, є надзвичайно складною проблемою.Я думаю, що цей підхід до використання людського зворотного зв’язку для навчання з підкріпленням, якщо ми спробуємо це зробити, можливо, це те, що нам потрібно.МАРТІН: Отже, немає великого плану? Що нам потрібно зробити, щоб досягти AGI? Потрібно лише робити крок за кроком.Міра: Так. І всі маленькі рішення, які ви приймаєте на цьому шляху. Можливо, це більш імовірно, оскільки кілька років тому ми прийняли стратегічне рішення розвивати цей продукт. Ми робимо це, тому що вважаємо, що неможливо просто сидіти в лабораторії та розробляти ці речі у вакуумі без зворотного зв’язку від реальних користувачів. Це припущення. Я думаю, що це допомагає нам прийняти деякі з цих рішень і побудувати базову інфраструктуру, щоб ми могли зрештою розгорнути щось на зразок ChatGPT.**Закон пропорцій**МАРТІН: Ви можете повторити закон пропорції. Я вважаю, що це велика проблема, яка є у кожного. Швидкість прогресу вражає. Але історія штучного інтелекту, здається, полягає в тому, що в якийсь момент ви досягаєте спадної віддачі, і це не параметрично. Це ніби звужується. З вашої точки зору (яка, мабуть, найрозумніша точка зору в усій галузі), чи вважаєте ви, що закон масштабування діятиме, і ми й надалі спостерігатимемо прогрес, чи, на вашу думку, ми рухаємося до зменшення прибутків?Міра: Немає доказів того, що, продовжуючи розширювати модель за осями даних і обчислень, ми не отримаємо кращих і потужніших моделей. Інше питання, чи дійде це до AGI (Artificial General Intelligence). У цьому процесі можуть знадобитися деякі інші прориви та досягнення. Щоб справді отримати багато переваг від цих більших моделей, закони масштабування ще мають пройти довгий шлях.МАРТІН: Як ви визначаєте AGI?Міра: У нашому статуті OpenAI. Ми визначаємо це як комп’ютерну систему, яка може виконувати більшість інтелектуальної роботи автономно.Мартін: Я обідав, і там був Роберт Нісіхара з Anyscale. Він запитав те, що я називаю питанням Роберта Нішіхари. Я вважаю, що це насправді гарна характеристика. Він сказав: «Існує континуум між комп’ютерами та Ейнштейнами. Ви переходите від комп’ютерів до котів, від котів до звичайних людей і від звичайних людей до Ейнштейнів». Потім він поставив запитання: «Ми знаходимося в континуумі. проблеми будуть вирішені?»Усі погоджуються, що ми знаємо, як перетворитися з кота на людину. Ми не знаємо, як перейти від комп’ютера до кота, тому що це універсальна проблема сприйняття. Ми близькі, але ми ще не зовсім там, і ми насправді не знаємо, як зробити Ейнштейна, і це налагоджене міркування.Міра: За допомогою точного налаштування можна отримати багато, але в цілому, я думаю, у більшості місій ми зараз на стажерів. Проблема в надійності. Ви не можете повністю покладатися на те, що система завжди буде робити те, що ви хочете. У багатьох завданнях він просто не може цього зробити. Як з часом підвищити надійність, а потім розширити нові можливості цих моделей?Я вважаю, що важливо звернути увагу на ці нові можливості, навіть якщо вони дуже ненадійні. Особливо для людей, які сьогодні будують компанію, ви дійсно хочете подумати про те, «Що можливо сьогодні? Що ви бачите сьогодні?» Ці моделі дуже швидко стають надійними.**Одна модель може підкорити світ? **МАРТІН: Я одразу запитаю, передбачте, яким буде майбутнє. Але перш ніж я егоїстично запитаю, як, на вашу думку, це буде економічно. Я кажу вам, що це мені нагадує. Це нагадує мені кремнієву промисловість. Я пам’ятаю, у 90-х, коли ви купували комп’ютер, було багато дивних процесорів для запису. «Це зіставлення рядків, це число з плаваючою точкою, це шифрування», — все це з’їдає ЦП.Виявляється, універсальність настільки потужна, що створює певний тип економіки, в якій і Intel, і AMD є гравцями. Звісно, виготовлення цих мікросхем коштує чималих грошей.Тож можна уявити два майбутніх. У майбутньому універсальність настільки сильна, що великі моделі з часом поглинатимуть усі функції. А ще є інше майбутнє, де буде купа різних моделей, усіляких деталей, різних точок у просторі дизайну. У вас таке відчуття: OpenAI унікальний чи він має багато моделей?Міра: Це залежить від того, що ти хочеш робити. Зрозуміло, що тепер траєкторія така, що ці системи штучного інтелекту виконуватимуть дедалі більше роботи, яку ми робимо. Вони зможуть працювати автономно, але нам потрібно буде забезпечувати вказівки, керівництво та нагляд. Але я не хочу виконувати багато повторюваної роботи, яку мені доводиться виконувати щодня. Я хочу зосередитися на інших речах. Можливо, нам не потрібно працювати по 10-12 годин на день, можливо, ми можемо працювати менше і бути більш продуктивними. Ось на що я сподіваюся. З точки зору способу роботи платформи, навіть сьогодні ви можете бачити, що через API доступно багато моделей, від дуже маленьких моделей до наших найсучасніших моделей.Не завжди потрібно використовувати найпотужнішу та потужну модель. Іноді їм просто потрібна модель, яка справді відповідає їх конкретному випадку використання, і вона набагато економніша. Думаю, що діапазон буде. Але з точки зору того, як ми уявляємо платформні ігри, ми безперечно хочемо, щоб люди будували на основі нашої моделі, і ми хочемо дати їм інструменти, щоб полегшити це, і надати їм все більше і більше доступу та контролю. Ви можете принести свої дані, ви можете налаштувати ці моделі. Ви дійсно можете зосередитися на шарах за межами моделі та визначити продукт, що насправді дуже, дуже важко. Зараз велика увага приділяється створенню нових моделей, але дуже важко створювати хороші продукти на основі цих моделей.**Наступні 5-10 років**МАРТІН: Я хотів би, щоб ви передбачили, що, на вашу думку, буде через три, п’ять чи 10 років.Міра: Я думаю, що базова модель сьогодні чудово відображає світ у тексті. Ми додаємо інші моделі, як-от зображення, відео та всілякі інші речі, щоб ці моделі могли надати більш повну картину світу навколо нас, подібно до того, як ми розуміємо та спостерігаємо світ. Світ існує не тільки в словах, а й в образах. Ми однозначно рухаємося в цьому напрямку, і ми збираємося мати ці більші моделі, які використовують усі ці шаблони в роботі перед навчанням. Ми дійсно хочемо, щоб ці попередньо підготовлені моделі розуміли світ так, як ми.У вихідній частині моделі ми представляємо навчання з підкріпленням із зворотним зв’язком людини. Ми хочемо, щоб модель дійсно виконувала те, про що ми її просимо, і ми хочемо, щоб це було надійно. Це вимагає багато роботи і, можливо, запровадження перегляду, щоб можна було отримати нову інформацію, посилатися на неї та розв’язувати галюцинації. Я не думаю, що це можливо. Я вважаю, що це досяжно.Щодо продукту, то ми хочемо об’єднати все це в колекцію продуктів, з якими люди працюють, і створити платформу, на якій люди можуть будувати. Якщо ви дійсно виходите назовні, ці моделі дуже, дуже потужні. Очевидно, з цим виникає страх, що ці дуже потужні моделі не відповідають нашим намірам. Великим викликом є Super Alignment, що є складним технічним завданням. Ціла команда в OpenAI зосереджена на цій проблемі.