Чи корисний ШІ? Консалтинговий гігант BCG провів внутрішній тест, і ефективність роботи «суттєво покращилася»!

Автор: Чан Цзяї

Джерело: Hard AI

Джерело зображення: створено Unbounded AI

Чи корисний ШІ? Це найпоширеніше питання, яке люди піднімали під час хвилі генеративного ШІ за останні шість місяців.

18 вересня дослідження, спільно проведене вченими з Гарвардського університету, Массачусетського технологічного інституту та Бостонської консалтингової групи (BCG), дало відповідь: так, ШІ може значно підвищити як ефективність, так і якість працівників!

Давайте спершу поговоримо про висновок. Результати тестування BCG показують, що у 18 різних завданнях ефективність консультантів, які використовують ChatGPT, набагато краща, ніж у консультантів, які не використовують ChatGPT.

**У середньому, порівняно з консультантами, які не використовують штучний інтелект, консультанти, які використовують штучний інтелект, виконують у середньому на 12,2% більше завдань, виконують завдання на 25,1% швидше та досягають на 40% вищої якості. **

01 Консультант "Стрибок ефективності"

Експериментальний процес такий:

По-перше, нехай команда людей-консультантів BCG поставить різні завдання навколо вигаданого виробника взуття.

Завдання включають творчі завдання (придумати щонайменше 10 нових ідей взуття для ринків із недостатнім обслуговуванням або для спорту), аналітичні завдання (сегментувати взуттєвий ринок на основі аудиторії), письмові та маркетингові завдання (чернова маркетингова копія для продукту) і переконливе завдання (написати пам'ятку, нагадавши співробітникам, чому продукт компанії кращий за конкурентів).

Варто зазначити, що хоча ця компанія є вигаданою, сценарії завдань є реальними сценаріями роботи консультантів BCG. Дослідницька група також спеціально перевіряла керівників взуттєвих брендів, щоб переконатися, що ці завдання є реальними завданнями, з якими компанія стикатиметься в щоденній діяльності.

Після постановки завдання дослідники знайшли сотні консультантів BBG, випадковим чином вибрали деяких консультантів і попросили їх використовувати для роботи GPT-4.

Як наслідок, консультанти, які використовують штучний інтелект, зазвичай працюють набагато краще. Їм знадобилося менше часу, щоб виконати завдання, і виконали більше завдань протягом обмеженого часу. Дослідники також попросили людей і штучний інтелект оцінити результати роботи цих консультантів. Результати показали, що обидва вони вірили, що консультанти, які використовували ШІ, працювали краще. Результати є кращими. **

Дослідники також помітили цікавий феномен: **Ті консультанти з найнижчим рівнем кваліфікації також відчули найбільше покращення продуктивності за допомогою ШІ, до 43%. З іншого боку, найкращі консультанти отримують дуже невеликі підвищення. **

Дослідники зазначають, що це може мати далекосяжні наслідки для робочого місця:

Так само, як і в минулому, було важливо, чи хороша чи погана здатність шахтаря викопувати каміння... але після винаходу парової лопати різниця в здатності копати більше не мала значення.

Вплив ШІ ще не досяг такого рівня, але він, безсумнівно, сприятиме вирівнюванню робочих можливостей.

02 Недоліки надмірної залежності від ШІ

Але в історії є ще щось.

Дослідницька група та BCG також розробили ще одне завдання. Це завдання є надзвичайно складним бізнес-кейсом, ретельно відібраним із питань співбесіди BCG, і було точно змінено, щоб дозволити штучному інтелекту придумати «переконливу неправильну відповідь». **

Дослідники кажуть, що їхня мета полягає в тому, щоб розробити завдання, з яким люди зможуть досягти успіху, але на яке ШІ не зможе відповісти правильно без ретельного керівництва. **

Це завдання дуже складне, і в документі не наводяться конкретні деталі, лише перераховані кроки:

Для вигаданої компанії учасники повинні шукати дані на основі деталей матеріалів інтерв’ю, наданих дослідником, а потім об’єднати вміст інтерв’ю та дані для аналізу ефективності каналу компанії, а також надати інформацію та пропозиції генеральному директору компанії для визначення який канал має потенціал зростання, максимум.

Наступним кроком є об’єднання вмісту інтерв’ю та фінансових даних для аналізу ефективності бренду компанії та пошуку брендів із найбільшим потенціалом зростання.

Для цього завдання дослідники в основному дивилися на точність відповідей.

Як результат, розрив у продуктивності між консультантами, які використовують ШІ, і тими, хто не використовує ШІ, величезний: точність перших становить лише 60%, тоді як точність співробітників, які виконують завдання вручну, досягає 84,5%.

Дослідники написали:

За межами можливостей штучного інтелекту люди з великим людським капіталом стабільно перевершують штучний інтелект у виконанні своїх завдань.

Дослідники вважають, що існує «нерівна межа» здатності генеративного ШІ виконувати завдання. **

Він чудово виконує завдання в межах кордонів, але погано виконує завдання поза межами. Більше того, завдяки тому, як працює генеративний ШІ, ця межа невидима, і її можуть сприйняти лише ті, хто добре знайомий із ШІ.

Наприклад, написання сонета та вірша рівно з 50 слів може здатися легким завданням для ШІ, але оскільки ChatGPT працює з використанням токенів, а не слів, ШІ дуже добре справляється з написанням 14-рядкових віршів. Але «написання вірш із 50 слів" — це завдання, яке виходить за межі та не може бути виконане штучним інтелектом — вірші, написані **ChatGPT, завжди містять більше або менше 50 слів. **

Це так звана зубчаста межа. Обсяг можливостей ChatGPT не є плавною лінією. Завдання з подібною складністю, засновані на людській логіці, - інша справа для ШІ.

Якщо ви використовуєте Інтерпретатор коду ChatGPT для малювання карти, нерівна межа виглядатиме так.

Крім того, дослідники також підкреслили, що експериментальні результати показують, що надмірна залежність від ШІ буде контрпродуктивною.

Посилаючись на інше дослідження корпоративних кадрів, автор зазначив, що порівняно з рекрутерами, які використовують або не використовують штучний інтелект низької якості, спеціалісти з персоналу, які використовують високоякісний штучний інтелект, стануть ледачими, недбалими та менш впевненими у власних судженнях. використав кілька якісних талантів і прийняв гірші рішення. Ця ситуація також зустрічалася в експериментах BCG.

Отже, коли штучний інтелект стане дуже хорошим, люди стануть лінивішими і дозволять ШІ взяти на себе верх, замість того, щоб використовувати його як інструмент. Фабріціо Делл'Аква, професор Гарвардської школи бізнесу, називає це явище «засипанням за кермом», стверджуючи, що воно шкодить навчанню людини, розвитку навичок і продуктивності.

03「Майбутнє тут」

Дослідники прийшли до висновку, що незалежно від того, які філософські та технічні дебати існують щодо природи та майбутнього штучного інтелекту, штучний інтелект насправді руйнує людське виробництво та спосіб життя в даний момент - це не величезна сума грошей, на яку знадобиться n років. «великий пиріг», який потребує інвестицій, уже доступний і може використовуватися на мобільних телефонах і комп’ютерах кожного.

**Інструменти, які використовуються цими консультантами BCG, цими елітними майстрами тестування в реальному світі, — це просто «звичайний» ChatGPT, без жодного спеціального API чи ексклюзивних даних — нічим не відрізняється від нас. **

Технологічні зміни відбуваються тихо. З народженням більш потужних LLM зигзагоподібні межі все ще розширюються. Людство, безсумнівно, зіткнеться з більш складним світом.

У цю епоху змін завжди важливо розуміти та контролювати ШІ та навчитися співпрацювати з ШІ.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити