Чи все ще корисно читати з ChatGPT?

Автор: Лі Цзи, доктор філософії в галузі соціології технологій, докторант кафедри медичних гуманітарних наук та етики Колумбійського університету

Джерело зображення: створено Unbounded AI‌

У першій половині року народився ChatGPT і був розкритий потенціал штучного інтелекту, що призвело до обговорення кризи виживання в багатьох галузях. GPT може складати кваліфікаційні іспити на адвокатуру та інженера, писати есе в коледжі без залишення оцінок і навіть «розуміти» жарти. Він може відповідати на запитання людей, організовувати яскраві мовні структури та імітувати різноманітні мовні стилі; а поєднання великих мовних моделей і технологій штучного інтелекту для створення зображень, таких як Midjourney, може дозволити людям, які не отримали жодної мистецької підготовки, використовувати кілька слова «Створюй» приголомшливі художні образи.

Суть ChatGPT насправді полягає у великій мовній моделі (Large Language Model, LLM), накладеній на генеративний штучний інтелект. Велика мовна модель, як випливає з назви, є великою, використовує велику кількість морфем для навчання комп’ютерної моделі за допомогою методів машинного навчання. Твірна формула використовує прогнозний метод для відображення найбільш ймовірних морфемних зв’язків під час діалогу.

Для «процесорів» і «споживачів» знань можливості великих мовних моделей і генеративного штучного інтелекту величезні. Масивні морфемні дані, глибока нейронна мережа та величезна обчислювальна потужність еквівалентні «вирівнюванню» всього знання з Інтернету, а потім «збиранню» його за допомогою взаємодії людини з комп’ютером.

**З точки зору обчислювальної логіки, ChatGPT еквівалентний більш потужній пошуковій системі. ** Звичайні пошукові системи, такі як Google і Baidu, «скребають» інформацію з усього Інтернету через режим сканера та сортують за складними алгоритмами. Метод штучного інтелекту з використанням машинного навчання еквівалентний сортуванню інформації в прогнозний спосіб відповідно до мовної логіки. Обробка знань стала зручнішою та швидшою, а споживання — лаконічнішим та зрозумілішим — часом навіть надто простим, що дає можливість шахраювати в екзаменаційних роботах.

У відповідь на це технологічні оптимісти вважають, що оскільки відтепер контент, який відтепер можуть генерувати машини, більшість людей не вимагатиме використання свого мозку, щоб його реалізувати, так само як пошукові системи замінюють бібліотечні картки, а калькулятори замінюють рахівниці. Дійсно, навіть якщо штучний інтелект не втручається в остаточне прийняття рішень, ті завдання, які вимагають багато повторюваного запису або механічного перерахування та сортування, справді можуть забезпечити значну продуктивність і допомогти людям в обробці та споживанні знань.

Отже, чи корисно читати? Чи можуть залишити роботу також співробітники великих університетів і наукових установ?

Чого може «навчитися» машина

Великі мовні моделі та генеративний штучний інтелект принесли майбутнім «виробникам» знань неминучу тему: що таке знання? Як отримати різноманітні, неупереджені та автентичні знання?

Здатність штучного інтелекту до «навчання» вражає. Існуюча велика мовна модель і застосування штучного інтелекту не можуть бути відокремлені від машинного навчання як її основи. Слово «навчання» по суті означає використання великої кількості даних для навчання моделі прогнозування та знаходження балансу між точністю та універсальністю прогнозу. Цей вид передбачення фактично базується на наявних знаннях, а передбачення мовної моделі також базується на зв’язку між існуючими мовами. Наприклад, введіть «тушкована яловичина», і машина передбачить «м’ясо»; потім на основі більшої кількості вхідних даних, таких як місцезнаходження, люди, звички тощо, вона дасть точніші прогнози, наприклад «бабусина тушкована яловичина» та так далі.

Як збулося це передбачення? Знайома нам система координат є двовимірною. Наприклад, у всій популяції існує приблизна відповідність між зростом і вагою.З огляду на зріст, машина передбачає середню вагу, яка є прогнозом на основі наявних даних. Додайте інший вимір, наприклад стать, тоді він стане тривимірною координатою, і прогнози чоловіків і жінок будуть різними. Якщо так триватиме й далі, розміри даних можуть бути нескінченними, і модель машинного навчання полягає у пошуку таких зв’язків у багатовимірному просторі, які людський мозок не може собі уявити, і постійному коригуванні вагових коефіцієнтів між різними вимірами. Наприклад, «наскільки важливим» є прогноз зростання до ваги, який можна скоригувати після великої кількості введених даних.

** Отже, штучний інтелект, заснований на машинному навчанні, з’єднає дані різних вимірів у просторі з більшою вимірністю, матиме здатність виявляти потенційні зв’язки між даними, а також «навчатиметься» деяким речам, які не існують насправді, але дуже ймовірні зв'язки. **Використаний у мовній моделі штучний інтелект також може вивчати різні мовні стилі та викопувати «сутність» і «проблеми» в існуючому тексті.

**Що більше даних, то зріліша модель і вищі її обчислювальні та видобувні можливості. **Подібно до штучного інтелекту, такого як BERT і GPT, які народилися у великих установах, багато людей вважають, що вони досягли «точки перегину» технології, і кількісні зміни не є необґрунтованими, щоб викликати якісні зміни – це добре річ для виробників знань. Однак великі моделі також мають властиві проблеми, і чим більша модель, тим гостріші проблеми, особливо щодо різноманітних, чесних і правдивих аспектів знання.

Як створити справжнє

** і неупереджені знання? **

Нові знання можуть бути створені на основі зв’язків і нових моделей існуючих знань, які є вірними незалежно від того, чи є вони на рівні людини чи машини. Однак чи достатньо наявних знань? Чи достатньо? Чи справедливо це? Якщо база існуючих знань недостатня або навіть упереджена, нові знання, побудовані на ній, також будуть упередженими.

З тих пір, як штучний інтелект з машинним навчанням був запущений у широкомасштабне застосування, вчені постійно виявляли упередження, притаманні цим моделям: сексизм, расизм, неетичний результат і так далі. Розробники використовують різні патчі та методи корекції, щоб компенсувати це, але більшість проблем приховані в процесі виробництва даних і навчання, а упередженість ШІ також є відображенням і посиленням соціальних упереджень.

Інша проблема – якість даних. Машинне навчання передбачає не лише здатність навчати моделі, а й кількість і якість даних. Існуючий процес розробки приділяє більше уваги продуктивності моделі та навіть забобонам, але ігнорує основну проблему джерел даних. Більшість даних сьогодні залежить від ручного очищення та форматування, категоризації, маркування тощо. Багато разів цей процес виробництва даних є непрозорим, навіть пописаним. Наприклад, за розробкою штучного інтелекту у великих компаніях велика кількість «брудної та безладної» робочої сили передається на аутсорсинг на «фабрики штучного інтелекту» в слаборозвинених регіонах. З одного боку, цей процес має проблеми трудової етики, а з іншого боку, він також створює проблеми для якості даних.

В епоху великих моделей ця проблема може бути прихованою глибше: не кожен дослідник або команда має можливість розробляти моделі штучного інтелекту з нуля, особливо великі мовні моделі та моделі великих зображень, більшість із яких базується на існуючих моделях, які можна тонко налаштувати. Проблеми та відхилення самої великої моделі буде перенесено на інші прикладні моделі. І чим менше відхилення, тим складніше з ним боротися за допомогою тонкого налаштування та корекції відхилення.

Режим генерації прогнозів існуючої мовної моделі навіть посилить існуюче відхилення даних, що призведе до ефекту «переобладнання»: наприклад, певна хвороба має високу частку статистичних даних у певній етнічній групі, близько 60% ; Але якщо мовна модель використовується для створення портрета пацієнта, то існує більше 90% ймовірності того, що згенерований опис пацієнта буде належати до цієї групи.

Тепер деякі моделі навчання ШІ використовують режим «взаємного бою» — так звану «генеративну змагальну мережу» (generative adversarial network), що дозволяє двом моделям безперервно генерувати та коригувати одна одну. Цей метод покращує ефективність навчання моделі, але будь-яке невелике відхилення буде збільшено в цій «взаємодії». За таким же принципом, якщо виробник знань, який тісно співпрацює з машиною, покладається на такий тип «генерації», то деякі упередження з моделі будуть вбудовані в нові знання, і нові знання будуть поглинені як дані, далі посилює упередженість моделі. **Виробники знань повинні бути пильними в цьому процесі.

**Що таке нові знання? Чи може «покоління» ШІ представляти нові знання? **

Що таке так звані нові знання? Якщо штучний інтелект буде повністю використаний для виробництва знань, то виробники знань повинні думати про це питання з точки зору поєднання людини та машини. Будь-яка інформація, а також знання, отримані людьми з реального світу, потребують «очищення» та «відформатування» в дані. Крім згаданої вище якості даних, важливий також процес генерування даних. Коротше кажучи, яку проблему хочеться вивчити? У які дані перекладено це запитання? Яким чином створюються ці дані, і чи вони повністю та справедливо представляють питання, які виробники знань хочуть вивчати?

Ця проблема також актуальна для виробників «традиційних» знань. Візьміть історію як приклад. Хоча історія вивчає минулі події, жодні минулі події не можуть бути остаточними на 100%. Науковці, як правило, постійно шукають нові історичні матеріали, щоб доповнити своє розуміння історичних питань і розкрити забуті точки зору та голоси минулого. Цікаво, що сучасна історіографія часто вдається до великої кількості даних, особливо минулих економічних, демографічних і кліматичних даних, і навіть покладається на машинне навчання, щоб привнести нове розуміння та перспективи в історію.

Подібним чином, покладаючись на машинно згенеровану інформацію та думки, можна посилити важливість певних джерел даних. Сучасні виробники знань надто покладаються на звичайну, Інтернет- та електронну інформацію, щоб створювати речі, які були «переведені» на дані іншими. **В епоху штучного інтелекту зручність і розширюваність, надані штучним інтелектом, потенційно полегшать людям ігнорувати неосновні та досвідчені знання, які не були оцифровані, електронізовані, і, таким чином, упустити можливість формування нових точок зору та перспектив . **

На більш глибокому рівні нове знання часто виникає в результаті розкопок нових матеріалів, зіткнення різних точок зору та перспектив, а також повторної деконструкції існуючих знань. Велика мовна модель надає багато можливостей для відображення знань, але її внутрішня логіка та структура можуть суперечити цьому методу виробництва.

На основі методу навчання великої мовної моделі та характеристик результату, створеного моделлю, вага вихідного вмісту з вищим рейтингом і вищою ймовірністю стане більшою, а функції стануть більш унікальними. «Створений штучним інтелектом» майже став прикметником для опису невиразних, повторюваних, безглуздих слів, які говорять так, ніби їх не було. Це правда, що для споживачів знань відповіді «швидше за все» значно знижують поріг розуміння; але для виробників знань ці речі можуть стати перешкодою.

**Куди мають рухатися виробники знань у нову еру? **

Можливо, багато дослідників соціальних наук, як я, стикалися з цією проблемою під час використання ChatGPT: попросіть його пояснити концепцію, і це логічно; Автор ніколи не писав книгу, ніколи не публікував статті. Чим вужча та більш спеціалізована сфера, тим більша ймовірність «нісенітниці».

Повертаючись до принципу штучного інтелекту, такий вид «створення» фактично є видобутком «можливих» зв’язків слів і речень у масиві даних, але цих зв’язків насправді не існує. Відверто кажучи, вони просто «звучать однаково». . Це нове явище тепер називається «галюцинацією». Для виробників знань дуже важливою навичкою є те, як використовувати штучний інтелект для видобутку шаблонів і зв’язків у існуючій базі знань, але залишатися пильним щодо «бачення» машини, того, що існує, а що є сумнівним.

Також новим навиком стане «Діалог» з ШІ. Нинішній штучний інтелект все ще є загадковим «чорним ящиком» для більшості нетехнічних людей (навіть техніків). Як почати з нижнього або середнього рівня технологій, щоб ефективніше спілкуватися з машинами, розуміти та боротися з «баченням», потрібна співпраця виробників знань і технічних практиків.

Для дослідження нових знань, нових перспектив і нових матеріалів унікальна структура та інтерпретація кожної галузі все ще є дуже важливими в даний час. Прогнозні моделі великих мовних моделей і генеративного штучного інтелекту все ще мають тенденцію бути одиничними та повторюваними, і чим обмеженіший навчальний матеріал, тим обмеженішими будуть можливості. Якщо ви хочете поєднати можливості машини та людини, ви повинні почати з джерела виробництва даних, використовувати точні, різноманітні, справедливі та нові дані для навчання моделей штучного інтелекту та створити доброякісну модель взаємодії людини та комп’ютера.

Поява великих мовних моделей і генеративного штучного інтелекту є лише початком проблем для дослідників. Замість того щоб обговорювати «заміну», краще шукати можливість обкатки і розвитку під більш розсудливим поглядом.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити