Використовуйте маленькі моделі та змінюйте ситуацію на краще.
Першоджерело: Machine Energy
Джерело зображення: Створено Unbounded AI
Використання ШІ стає все більш поширеним і не обмежується його використанням окремими особами. Також стає все більш популярним на підприємствах використання штучного інтелекту для покращення робочих процесів і просування роботи. Але слід зазначити, що більш потужними часто є більші моделі, що спричинить труднощі при розгортанні на підприємстві. Сільвіо Саезе писав про свої думки з цього приводу, ** моделі не більші, але краще, маленькі моделі краще справляються з робочим змістом. **
Нижче наводиться переклад і аранжування оригінального тексту машинним серцем без зміни початкового змісту.
Оригінальна адреса:
Останніми місяцями я багато писав про те, що я називаю LAM (Large Action Model), більш активний, автономний варіант LLM. Він не тільки генерує вміст, як-от текст або зображення, але й може виконувати цілі завдання та навіть брати участь у робочих процесах, як з людьми, так і самостійно. Цього року, на виставці Dreamforce 2023, із запуском другого пілота Ейнштейна, це бачення зробило великий крок до реальності. Einstein Copilot, розмовний помічник зі штучним інтелектом Salesforce, буде розгорнутий на платформі Salesforce і готовий до інтеграції майже в усе, що роблять клієнти.
Другий пілот Ейнштейна: погляд у майбутнє генеративного ШІ
Важко не вразити Einstein Copilot з коробки. Він був розроблений з нуля, щоб бути продуктивним і безпечним способом, допомагаючи користувачам майже в усіх типах робочих процесів. Він може обробляти запитання, опубліковані природною мовою, і надавати релевантні надійні відповіді, отримані з конфіденційних даних, які захищені компанією. Це чітке уявлення про те, куди, на мою думку, рухається штучний інтелект на підприємстві: єдиний, надійний інтерфейс, розроблений для повсякденної взаємодії людини з комп'ютером і здатний допомогти з різноманітними завданнями. Це демонструє силу штучного інтелекту для забезпечення того, щоб технологія відповідала потребам бізнесу, і я не сумніваюся, що це також змінить спосіб роботи клієнтів. І LAM, розвиваючись у гнучкості та функціональності, виведе цю і без того дуже потужну силу на новий рівень.
Зробіть генеративні моделі штучного інтелекту «маленькими та великими»
Останнім часом багато тем у генеративному ШІ обертаються навколо масштабу моделі та архітектури моделі, на яких працюють LLM та LAM. Оскільки такі компанії, як OpenAI, продовжують розширювати межі масштабу, а кількість параметрів значно перевищує 100 мільярдів, неважко зробити висновок, що чим більше, тим краще. Насправді великі моделі часто можуть похвалитися тим, що їх продуктивності складно або неможливо досягти інакше. І в міру того, як розмір моделі збільшується, з'являється неймовірно складна поведінка, що свідчить про те, що більш масштабні стратегії можуть принести значну користь.
Як стратегічне скорочення моделей може принести величезні переваги
У той час як великі моделі продовжують домінувати в заголовках газет, переслідування великих моделей - не найкраща стратегія. Найбільш очевидно, що найбільші моделі зараз коштують дорого, і багато компаній знаходяться поза зоною досяжності. І навіть ті підприємства, які можуть дозволити собі їх розгорнути, повинні визнати, що високоякісна продукція, яку вони обіцяють, може бути надзвичайно повільною. Крім того, ми все ще стикаємося з проблемами довіри, безпеки, шкоди та претензій на право власності, таких як авторські права, і все це пов'язано з величезними наборами даних, отриманими з глобальних джерел, на які покладаються гіпермасштабовані моделі.
Ці недоліки роблять маленькі моделі все більш привабливими в багатьох сферах. Вони відносно економічні і можуть бути налаштовані на неймовірну швидкість. Сьогодні спеціально розроблений LLM може працювати навіть повністю на периферії в деяких випадках, включаючи мобільні пристрої кінцевих користувачів. А оскільки вони вимагають меншої підготовки, клієнти можуть взяти на себе більш активну управлінську роль у підготовці своїх наборів даних. На цьому етапі можна досягти величезних покращень з точки зору якості, безпеки та навіть юридичного статусу контенту, що міститься в наборі даних.
Зосередившись на більш вузьких областях, якість випуску малих моделей також може бути на одному рівні з їх «старшими братами». Такі моделі, як ChatGPT, по суті, створені для всіх, допомагаючи з домашніми завданнями, рецептами вечері, відповідаючи на запитання про науку, технології, історію та поп-культуру. На противагу цьому, генеративний ШІ для підприємств може і повинен зосереджуватися на менших, більш актуальних проблемних областях. Це, безумовно, безпрограшний варіант: це означає зниження вхідних бар'єрів без шкоди для якості продукції. **
Як оркестрування малих моделей відкриває великий потенціал
Навіть маленькі моделі можуть забезпечити великі рішення, просто потрібно по-іншому думати про масштаб. Замість того, щоб збільшувати саму модель, переплітайте кілька моделей для досягнення мети вищого рівня. ** Кожна модель розроблена з урахуванням конкретної мети та навчена на ретельно підібраному, ретельно перевіреному та власному наборі даних. Що, якби агентів штучного інтелекту, таких як Einstein Copilot, можна було б об'єднати або скоординувати, так само, як кілька людей могли б виконувати більше роботи як команда, ніж як окремі особи? Наприклад, ресторан, який є організацією, якої можна досягти лише командною роботою, кожен член має свої навички та напрямки діяльності: офіціанти відповідають за замовлення, кухарі – за приготування їжі, адміністратори – за обробку бронювань та замовлень, а водії – за доставку їжі. Отже, як би виглядав LAM, якби був організований подібним чином?
Останнім часом я замислювався про оркестровку, і вважаю, що це одна з найцікавіших технологій, але також і найпрактичніша, щоб забезпечити корисних, автономних агентів безпечним і ефективним способом. Найголовніше, що оркестрування означає, що навіть найамбітніші рішення є прозорими та відомими творцям і людям, які працюють разом з ними. Майте на увазі, що в цьому випадку масштаб походить не від все більших і більших нейронних мереж, а від незалежних, чітко визначених компонентів, які організовані таким чином, щоб мати сенс для людини. Наприклад, замість того, щоб навчати гігантську модель записувати нотатки про зустрічі з клієнтами, робити висновки з результатів, оновлювати відповідні записи CRM, а потім надсилати подальшу інформацію, призначте кожне з цих завдань окремо навченій моделі.
Насправді, більшу частину своєї дослідницької кар'єри я провів у робототехніці, і я не можу не дивитися далі, уявляючи, що таку хореографію можна робити в реальному просторі. На заводах, в офісах, лікарнях і навіть ресторанах макети працюють пліч-о-пліч з людьми для виконання різноманітних завдань. Звучить піднесено і відсторонено, але зараз потенціал оркестровки величезний.
Поговоримо про його переваги. Перш за все, оркестрування позбавляє нас від труднощів зібрати досить великий набір даних і зробити єдину модель настільки гнучкою для вирішення труднощів, пов'язаних з крос-доменними агентами, а також виключає ризик помістити велику кількість дуже різних даних в єдиний навчальний набір. **Крім того, кожна модель може бути додатково налаштована за допомогою RLHF. Тому в цій системі кожен компонент дуже спеціалізований і використовується для виконання критичних, але керованих кроків у більшому завданні.
Коли виникають проблеми, будь то під час введення в експлуатацію або виробництва, проблеми можна легше виявити за допомогою єдиної спеціальної моделі, щоб краще зрозуміти та вирішити їх. Навіть із серйозними несправностями можна впоратися більш надійним модульним способом. І кілька моделей працюють разом, збої легше контролювати та ізолювати, а також з'являється більше можливостей для безперервності, коли один компонент виходить з ладу.
Модерн для генеративного ШІ: дизайн на кількох моделях
Що ще важливіше, це піднімає створення корпоративних моделей штучного інтелекту з суто технічного завдання на завдання моделювання бізнес-процесів у термінах, зрозумілих зацікавленим сторонам. Подібно до того, як хороший менеджер розбиває проблему на розв'язання команді, організатор штучного інтелекту має можливість розбити проблему на серію спеціально створених моделей.
Що особливо захоплює в цьому баченні, так це те, що воно вказує на нову навичку, можна навіть назвати це новим мистецтвом, і я з нетерпінням чекаю, коли побачу, як воно розвиватиметься на підприємстві. Експерти з оркестрації LAM будуть мислити на високому рівні, розглядаючи потреби підприємства як бізнесу, а не просто технологічної платформи, і використовуватимуть цю інформацію, щоб розбити великі, значущі завдання на серію менших завдань, які будуть вирішені «командами» LAM.
У їхній роботі переплітаються інфраструктура, наука про дані та дизайн людино-машинного інтерфейсу. Перший забезпечує безпечне та ефективне розгортання цих модельних команд, тоді як другий прагне збирати унікальні набори даних для вирішення менших, менш неоднозначних проблем. Іншими словами, експерти з оркестрації можуть стати новими обличчями корпоративного ШІ, менше зосереджуючись на специфіці нейронних мереж, а більше на тому, як будувати надійні, надійні системи.
Насправді, я в кінцевому підсумку сподіваюся, що ця навичка не є ні рідкісною, ні ексклюзивною, а досить широко поширеною, перетворюючи оркестровку LAM на потужне, персоналізоване рішення, яке відіграватиме все більш важливу роль у нашому професійному житті. У міру того, як ринок з'являється, бар'єр для входу може бути знижений ще більше, пропонуючи світові рішення для оркестрації LAM, подібне до copilot, яке просто забезпечує генеративний ШІ в неймовірних масштабах.
Деякі будуть використовувати це ринкове рішення безпосередньо, роблячи оркестрацію LAM реальністю. Інші розглядатимуть їх як модулі та комбінуватимуть їх з іншими модулями, щоб сформувати рішення різних розмірів відповідно до своїх потреб. Але в будь-якому випадку, що мене найбільше хвилює, так це те, що генеративний ШІ формується не стільки елітною невеликою групою технологів, скільки творчістю та баченням професіоналів у різних галузях.
Насправді, моє бачення майбутнього роботи — це світ, де штучний інтелект підтримує людські навички та дозволяє нам мислити на вищому рівні, спрощуючи все, що ми робимо, зберігаючи при цьому креативність, стиль і перспективу, які нас відрізняють.
Підсумок
Реалізація будь-якого нового бачення відбувається поступово, і LAM не є винятком. Однак останні роки показали, що кожен крок на цьому шляху буде трансформаційним. З самого початку свого заснування LLM продемонструвала рідкісний потенціал для прориву та інновацій. Допоміжні агенти, такі як Einstein Copilot, виводять цю планку на новий рівень завдяки інтуїтивно зрозумілому інтерфейсу, сильним функціям довіри та безпеки, а також бездоганній інтеграції з традиційними системами другого пілота.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Оркестрування малої моделі, щоб 1+1_2, підприємство працювало більш гнучко та ефективно
Першоджерело: Machine Energy
Використання ШІ стає все більш поширеним і не обмежується його використанням окремими особами. Також стає все більш популярним на підприємствах використання штучного інтелекту для покращення робочих процесів і просування роботи. Але слід зазначити, що більш потужними часто є більші моделі, що спричинить труднощі при розгортанні на підприємстві. Сільвіо Саезе писав про свої думки з цього приводу, ** моделі не більші, але краще, маленькі моделі краще справляються з робочим змістом. **
Нижче наводиться переклад і аранжування оригінального тексту машинним серцем без зміни початкового змісту.
Останніми місяцями я багато писав про те, що я називаю LAM (Large Action Model), більш активний, автономний варіант LLM. Він не тільки генерує вміст, як-от текст або зображення, але й може виконувати цілі завдання та навіть брати участь у робочих процесах, як з людьми, так і самостійно. Цього року, на виставці Dreamforce 2023, із запуском другого пілота Ейнштейна, це бачення зробило великий крок до реальності. Einstein Copilot, розмовний помічник зі штучним інтелектом Salesforce, буде розгорнутий на платформі Salesforce і готовий до інтеграції майже в усе, що роблять клієнти.
Другий пілот Ейнштейна: погляд у майбутнє генеративного ШІ
Важко не вразити Einstein Copilot з коробки. Він був розроблений з нуля, щоб бути продуктивним і безпечним способом, допомагаючи користувачам майже в усіх типах робочих процесів. Він може обробляти запитання, опубліковані природною мовою, і надавати релевантні надійні відповіді, отримані з конфіденційних даних, які захищені компанією. Це чітке уявлення про те, куди, на мою думку, рухається штучний інтелект на підприємстві: єдиний, надійний інтерфейс, розроблений для повсякденної взаємодії людини з комп'ютером і здатний допомогти з різноманітними завданнями. Це демонструє силу штучного інтелекту для забезпечення того, щоб технологія відповідала потребам бізнесу, і я не сумніваюся, що це також змінить спосіб роботи клієнтів. І LAM, розвиваючись у гнучкості та функціональності, виведе цю і без того дуже потужну силу на новий рівень.
Зробіть генеративні моделі штучного інтелекту «маленькими та великими»
Останнім часом багато тем у генеративному ШІ обертаються навколо масштабу моделі та архітектури моделі, на яких працюють LLM та LAM. Оскільки такі компанії, як OpenAI, продовжують розширювати межі масштабу, а кількість параметрів значно перевищує 100 мільярдів, неважко зробити висновок, що чим більше, тим краще. Насправді великі моделі часто можуть похвалитися тим, що їх продуктивності складно або неможливо досягти інакше. І в міру того, як розмір моделі збільшується, з'являється неймовірно складна поведінка, що свідчить про те, що більш масштабні стратегії можуть принести значну користь.
Як стратегічне скорочення моделей може принести величезні переваги
У той час як великі моделі продовжують домінувати в заголовках газет, переслідування великих моделей - не найкраща стратегія. Найбільш очевидно, що найбільші моделі зараз коштують дорого, і багато компаній знаходяться поза зоною досяжності. І навіть ті підприємства, які можуть дозволити собі їх розгорнути, повинні визнати, що високоякісна продукція, яку вони обіцяють, може бути надзвичайно повільною. Крім того, ми все ще стикаємося з проблемами довіри, безпеки, шкоди та претензій на право власності, таких як авторські права, і все це пов'язано з величезними наборами даних, отриманими з глобальних джерел, на які покладаються гіпермасштабовані моделі.
Ці недоліки роблять маленькі моделі все більш привабливими в багатьох сферах. Вони відносно економічні і можуть бути налаштовані на неймовірну швидкість. Сьогодні спеціально розроблений LLM може працювати навіть повністю на периферії в деяких випадках, включаючи мобільні пристрої кінцевих користувачів. А оскільки вони вимагають меншої підготовки, клієнти можуть взяти на себе більш активну управлінську роль у підготовці своїх наборів даних. На цьому етапі можна досягти величезних покращень з точки зору якості, безпеки та навіть юридичного статусу контенту, що міститься в наборі даних.
Зосередившись на більш вузьких областях, якість випуску малих моделей також може бути на одному рівні з їх «старшими братами». Такі моделі, як ChatGPT, по суті, створені для всіх, допомагаючи з домашніми завданнями, рецептами вечері, відповідаючи на запитання про науку, технології, історію та поп-культуру. На противагу цьому, генеративний ШІ для підприємств може і повинен зосереджуватися на менших, більш актуальних проблемних областях. Це, безумовно, безпрограшний варіант: це означає зниження вхідних бар'єрів без шкоди для якості продукції. **
Як оркестрування малих моделей відкриває великий потенціал
Навіть маленькі моделі можуть забезпечити великі рішення, просто потрібно по-іншому думати про масштаб. Замість того, щоб збільшувати саму модель, переплітайте кілька моделей для досягнення мети вищого рівня. ** Кожна модель розроблена з урахуванням конкретної мети та навчена на ретельно підібраному, ретельно перевіреному та власному наборі даних. Що, якби агентів штучного інтелекту, таких як Einstein Copilot, можна було б об'єднати або скоординувати, так само, як кілька людей могли б виконувати більше роботи як команда, ніж як окремі особи? Наприклад, ресторан, який є організацією, якої можна досягти лише командною роботою, кожен член має свої навички та напрямки діяльності: офіціанти відповідають за замовлення, кухарі – за приготування їжі, адміністратори – за обробку бронювань та замовлень, а водії – за доставку їжі. Отже, як би виглядав LAM, якби був організований подібним чином?
Останнім часом я замислювався про оркестровку, і вважаю, що це одна з найцікавіших технологій, але також і найпрактичніша, щоб забезпечити корисних, автономних агентів безпечним і ефективним способом. Найголовніше, що оркестрування означає, що навіть найамбітніші рішення є прозорими та відомими творцям і людям, які працюють разом з ними. Майте на увазі, що в цьому випадку масштаб походить не від все більших і більших нейронних мереж, а від незалежних, чітко визначених компонентів, які організовані таким чином, щоб мати сенс для людини. Наприклад, замість того, щоб навчати гігантську модель записувати нотатки про зустрічі з клієнтами, робити висновки з результатів, оновлювати відповідні записи CRM, а потім надсилати подальшу інформацію, призначте кожне з цих завдань окремо навченій моделі.
Насправді, більшу частину своєї дослідницької кар'єри я провів у робототехніці, і я не можу не дивитися далі, уявляючи, що таку хореографію можна робити в реальному просторі. На заводах, в офісах, лікарнях і навіть ресторанах макети працюють пліч-о-пліч з людьми для виконання різноманітних завдань. Звучить піднесено і відсторонено, але зараз потенціал оркестровки величезний.
Поговоримо про його переваги. Перш за все, оркестрування позбавляє нас від труднощів зібрати досить великий набір даних і зробити єдину модель настільки гнучкою для вирішення труднощів, пов'язаних з крос-доменними агентами, а також виключає ризик помістити велику кількість дуже різних даних в єдиний навчальний набір. **Крім того, кожна модель може бути додатково налаштована за допомогою RLHF. Тому в цій системі кожен компонент дуже спеціалізований і використовується для виконання критичних, але керованих кроків у більшому завданні.
Коли виникають проблеми, будь то під час введення в експлуатацію або виробництва, проблеми можна легше виявити за допомогою єдиної спеціальної моделі, щоб краще зрозуміти та вирішити їх. Навіть із серйозними несправностями можна впоратися більш надійним модульним способом. І кілька моделей працюють разом, збої легше контролювати та ізолювати, а також з'являється більше можливостей для безперервності, коли один компонент виходить з ладу.
Модерн для генеративного ШІ: дизайн на кількох моделях
Що ще важливіше, це піднімає створення корпоративних моделей штучного інтелекту з суто технічного завдання на завдання моделювання бізнес-процесів у термінах, зрозумілих зацікавленим сторонам. Подібно до того, як хороший менеджер розбиває проблему на розв'язання команді, організатор штучного інтелекту має можливість розбити проблему на серію спеціально створених моделей.
Що особливо захоплює в цьому баченні, так це те, що воно вказує на нову навичку, можна навіть назвати це новим мистецтвом, і я з нетерпінням чекаю, коли побачу, як воно розвиватиметься на підприємстві. Експерти з оркестрації LAM будуть мислити на високому рівні, розглядаючи потреби підприємства як бізнесу, а не просто технологічної платформи, і використовуватимуть цю інформацію, щоб розбити великі, значущі завдання на серію менших завдань, які будуть вирішені «командами» LAM.
У їхній роботі переплітаються інфраструктура, наука про дані та дизайн людино-машинного інтерфейсу. Перший забезпечує безпечне та ефективне розгортання цих модельних команд, тоді як другий прагне збирати унікальні набори даних для вирішення менших, менш неоднозначних проблем. Іншими словами, експерти з оркестрації можуть стати новими обличчями корпоративного ШІ, менше зосереджуючись на специфіці нейронних мереж, а більше на тому, як будувати надійні, надійні системи.
Насправді, я в кінцевому підсумку сподіваюся, що ця навичка не є ні рідкісною, ні ексклюзивною, а досить широко поширеною, перетворюючи оркестровку LAM на потужне, персоналізоване рішення, яке відіграватиме все більш важливу роль у нашому професійному житті. У міру того, як ринок з'являється, бар'єр для входу може бути знижений ще більше, пропонуючи світові рішення для оркестрації LAM, подібне до copilot, яке просто забезпечує генеративний ШІ в неймовірних масштабах.
Деякі будуть використовувати це ринкове рішення безпосередньо, роблячи оркестрацію LAM реальністю. Інші розглядатимуть їх як модулі та комбінуватимуть їх з іншими модулями, щоб сформувати рішення різних розмірів відповідно до своїх потреб. Але в будь-якому випадку, що мене найбільше хвилює, так це те, що генеративний ШІ формується не стільки елітною невеликою групою технологів, скільки творчістю та баченням професіоналів у різних галузях.
Насправді, моє бачення майбутнього роботи — це світ, де штучний інтелект підтримує людські навички та дозволяє нам мислити на вищому рівні, спрощуючи все, що ми робимо, зберігаючи при цьому креативність, стиль і перспективу, які нас відрізняють.
Підсумок
Реалізація будь-якого нового бачення відбувається поступово, і LAM не є винятком. Однак останні роки показали, що кожен крок на цьому шляху буде трансформаційним. З самого початку свого заснування LLM продемонструвала рідкісний потенціал для прориву та інновацій. Допоміжні агенти, такі як Einstein Copilot, виводять цю планку на новий рівень завдяки інтуїтивно зрозумілому інтерфейсу, сильним функціям довіри та безпеки, а також бездоганній інтеграції з традиційними системами другого пілота.