1 серпня OpenAI офіційно подав заявку на торговельну марку для "GPT-5", яка охоплює наступне:
Програмне забезпечення, яке штучно генерує людську мову та текст
Перетворення файлів аудіоданих на текст
Розпізнавання голосу та мови
Обробка мови та мовлення на основі машинного навчання
Відповідно до документів заявки на торговельну марку GPT-5, торгова марка GPT-5 охоплює функцію штучного інтелекту для генерування мови та тексту, а також може перетворювати аудіофайли в текст, здійснювати розпізнавання звуку та мови та використовувати технологію машинного навчання для обробки мови та мови .
Це може означати, що GPT-5 підтримуватиме голосові можливості, що забезпечить користувачам більш просунутий і ефективний досвід обробки голосу та тексту, а також розширить мультимодальні можливості.
Коли буде GPT-5?
Коли GPT-4 буде випущено в березні 2023 року, очікується, що OpenAI випустить модель наступного покоління в грудні 2023 року. Співзасновник Runway Siqi Chen раніше заявляв, що мені сказали, що навчання GPT5 планується завершити в грудні цього року, і Openai очікує, що він зможе досягти загального штучного інтелекту (AGI). Це означає, що ми всі будемо люто сперечатися про те, чи справді це AGI.
Однак, коли на заході Массачусетського технологічного інституту в квітні його запитали, чи навчає OpenAI GPT-5, генеральний директор OpenAI Сем Альтман відповів, що «ми не будемо, і не будемо деякий час». В інтерв’ю в червні цього року засновник і генеральний директор OpenAI Сем Альтман сказав, коли його запитали, що запустило GPT-5, мені також цікаво, ми не маємо відповіді, у нас не буде GPT-5 найближчим часом, ми повинні зробити безпеку великою її частина.
Проте деякі вважають, що OpenAI може запустити GPT-4.5, проміжну версію між GPT-4 і GPT-5, як GPT-3.5, до жовтня 2023 року. Кажуть, що GPT-4.5 зрештою надасть мультимодальні можливості, здатність аналізувати зображення та текст. OpenAI вже анонсував і продемонстрував мультимодальні можливості GPT-4 ще в березні 2023 року під час прямої трансляції для розробників GPT-4. Тепер Microsoft випустила мультимодальні можливості GPT-4 у Bing Chat. Схоже, наступне велике оновлення GPT-4 не за горами.
Крім того, наразі OpenAI має багато роботи над моделлю GPT-4, перш ніж розпочати роботу над GPT-5. Наразі час висновку GPT-4 дуже тривалий і досить дорогий у використанні. Доступ до GPT-4 API все ще важко отримати. Крім того, нещодавно OpenAI відкрив доступ до плагінів ChatGPT та інтерпретаторів коду, які все ще знаходяться в бета-версії. Перегляд Інтернету видалено з GPT-4, оскільки він відображає вміст із платних сайтів.
Хоча GPT-4 дуже потужний, я думаю, що OpenAI усвідомлює, що обчислювальна ефективність є одним із ключових елементів стабільної роботи моделі. Додайте нові функції та можливості, і ви зможете керувати більшою інфраструктурою, гарантуючи надійну роботу всіх контрольних точок. Таким чином, згідно з припущеннями, GPT-5, швидше за все, буде випущено в 2024 році, якщо ми припустимо, що державні установи не виникнуть регуляторних перешкод.
Прогнози: можливості та функції GPT-5
Зменшити галюцинації
Гарячою темою в галузі є те, що GPT-5 реалізує AGI (штучний інтелект). Крім усього іншого, GPT-5 має скоротити час висновків, підвищити ефективність, зменшити галюцинації тощо. Почнемо з галюцинацій, однієї з ключових причин, чому більшість користувачів не дуже довіряють моделям ШІ.
Відповідно до OpenAI, оцінка GPT-4 на 40% вище, ніж GPT-3,5, у фактичній оцінці внутрішньої змагальності за всіма дев’ятьма категоріями. Зараз GPT-4 має на 82% менше шансів реагувати на неточний і заборонений вміст. Це дуже близько до 80% результату в тестах на точність у різних категоріях. Це величезний стрибок проти ілюзії.
Тепер очікується, що OpenAI зменшить галюцинації до менше ніж 10% у GPT-5, що буде величезним для того, щоб зробити моделі LLM надійними.
Модель ефективності розрахунку
Ми вже знаємо, що використання GPT-4 дороге (0,03 дол. США за токен 1K) і для визначення потрібно більше часу. А старша модель GPT-3.5-turbo в 15 разів дешевша за GPT-4 ($0,002 за токен 1K). Відповідно до останнього звіту SemiAnalysis, GPT-4 не є щільною моделлю, а базується на архітектурі «суміші експертів». Це означає, що GPT-4 використовує 16 різних моделей для різних завдань з 1,8 трильйонами параметрів.
З такою великою інфраструктурою витрати на експлуатацію та обслуговування моделі GPT-4 стають дуже дорогими.
Фактично, багато нових великих моделей почали прагнути до «маленьких і витончених», щоб великі моделі мали якомога менше параметрів, не більше.
У нещодавній інтерпретації моделі Google PaLM 2 параметри PaLM 2 досить малі, але продуктивність висока.
Мультисенсорна модель ШІ
Хоча GPT-4 було оголошено мультимодальною моделлю ШІ, вона має справу лише з двома типами даних, а саме зображеннями та текстом. З GPT-5 OpenAI може зробити величезний крок до справжньої мультимодальності. Він також може обробляти текст, аудіо, зображення, відео, дані про глибину та температуру. Він зможе з’єднувати потоки даних з різних модальностей для створення вбудованих просторів.
довготривала пам'ять
З випуском GPT-4 OpenAI надає максимальну довжину контексту 32K маркерів за ціною $0,06 за 1K маркер. Ми швидко побачили перехід від стандартного токена 4K до 32K за лічені місяці. Нещодавно Anthropic збільшив контекстне вікно свого чат-бота Claude AI з 9K токенів до 100K. Очікується, що GPT-5 може забезпечити підтримку довгострокової пам’яті завдяки більшій довжині контексту.
Це допомагає персонажам зі штучним інтелектом і друзям запам’ятовувати ваших персонажів і спогади на довгі роки. Крім того, ви також можете завантажувати книги та бібліотеки текстових документів в одному контекстному вікні. Завдяки підтримці довготривалої пам’яті можуть з’явитися різноманітні нові додатки штучного інтелекту, і GPT-5 може зробити це можливим.
Як ви думаєте, коли буде випущено GPT-5 і які революційні інновації він принесе?
Література:
Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
OpenAI подала заявку на торгову марку GPT-5, коли вона буде випущена? Які нові здібності це принесе?
Джерело: AGI Innovation Lab
1 серпня OpenAI офіційно подав заявку на торговельну марку для "GPT-5", яка охоплює наступне:
Відповідно до документів заявки на торговельну марку GPT-5, торгова марка GPT-5 охоплює функцію штучного інтелекту для генерування мови та тексту, а також може перетворювати аудіофайли в текст, здійснювати розпізнавання звуку та мови та використовувати технологію машинного навчання для обробки мови та мови .
Це може означати, що GPT-5 підтримуватиме голосові можливості, що забезпечить користувачам більш просунутий і ефективний досвід обробки голосу та тексту, а також розширить мультимодальні можливості.
Коли буде GPT-5?
Коли GPT-4 буде випущено в березні 2023 року, очікується, що OpenAI випустить модель наступного покоління в грудні 2023 року. Співзасновник Runway Siqi Chen раніше заявляв, що мені сказали, що навчання GPT5 планується завершити в грудні цього року, і Openai очікує, що він зможе досягти загального штучного інтелекту (AGI). Це означає, що ми всі будемо люто сперечатися про те, чи справді це AGI.
Однак, коли на заході Массачусетського технологічного інституту в квітні його запитали, чи навчає OpenAI GPT-5, генеральний директор OpenAI Сем Альтман відповів, що «ми не будемо, і не будемо деякий час». В інтерв’ю в червні цього року засновник і генеральний директор OpenAI Сем Альтман сказав, коли його запитали, що запустило GPT-5, мені також цікаво, ми не маємо відповіді, у нас не буде GPT-5 найближчим часом, ми повинні зробити безпеку великою її частина.
Проте деякі вважають, що OpenAI може запустити GPT-4.5, проміжну версію між GPT-4 і GPT-5, як GPT-3.5, до жовтня 2023 року. Кажуть, що GPT-4.5 зрештою надасть мультимодальні можливості, здатність аналізувати зображення та текст. OpenAI вже анонсував і продемонстрував мультимодальні можливості GPT-4 ще в березні 2023 року під час прямої трансляції для розробників GPT-4. Тепер Microsoft випустила мультимодальні можливості GPT-4 у Bing Chat. Схоже, наступне велике оновлення GPT-4 не за горами.
Крім того, наразі OpenAI має багато роботи над моделлю GPT-4, перш ніж розпочати роботу над GPT-5. Наразі час висновку GPT-4 дуже тривалий і досить дорогий у використанні. Доступ до GPT-4 API все ще важко отримати. Крім того, нещодавно OpenAI відкрив доступ до плагінів ChatGPT та інтерпретаторів коду, які все ще знаходяться в бета-версії. Перегляд Інтернету видалено з GPT-4, оскільки він відображає вміст із платних сайтів.
Хоча GPT-4 дуже потужний, я думаю, що OpenAI усвідомлює, що обчислювальна ефективність є одним із ключових елементів стабільної роботи моделі. Додайте нові функції та можливості, і ви зможете керувати більшою інфраструктурою, гарантуючи надійну роботу всіх контрольних точок. Таким чином, згідно з припущеннями, GPT-5, швидше за все, буде випущено в 2024 році, якщо ми припустимо, що державні установи не виникнуть регуляторних перешкод.
Прогнози: можливості та функції GPT-5
Зменшити галюцинації
Гарячою темою в галузі є те, що GPT-5 реалізує AGI (штучний інтелект). Крім усього іншого, GPT-5 має скоротити час висновків, підвищити ефективність, зменшити галюцинації тощо. Почнемо з галюцинацій, однієї з ключових причин, чому більшість користувачів не дуже довіряють моделям ШІ.
Відповідно до OpenAI, оцінка GPT-4 на 40% вище, ніж GPT-3,5, у фактичній оцінці внутрішньої змагальності за всіма дев’ятьма категоріями. Зараз GPT-4 має на 82% менше шансів реагувати на неточний і заборонений вміст. Це дуже близько до 80% результату в тестах на точність у різних категоріях. Це величезний стрибок проти ілюзії.
Тепер очікується, що OpenAI зменшить галюцинації до менше ніж 10% у GPT-5, що буде величезним для того, щоб зробити моделі LLM надійними.
Модель ефективності розрахунку
Ми вже знаємо, що використання GPT-4 дороге (0,03 дол. США за токен 1K) і для визначення потрібно більше часу. А старша модель GPT-3.5-turbo в 15 разів дешевша за GPT-4 ($0,002 за токен 1K). Відповідно до останнього звіту SemiAnalysis, GPT-4 не є щільною моделлю, а базується на архітектурі «суміші експертів». Це означає, що GPT-4 використовує 16 різних моделей для різних завдань з 1,8 трильйонами параметрів.
З такою великою інфраструктурою витрати на експлуатацію та обслуговування моделі GPT-4 стають дуже дорогими.
Фактично, багато нових великих моделей почали прагнути до «маленьких і витончених», щоб великі моделі мали якомога менше параметрів, не більше.
У нещодавній інтерпретації моделі Google PaLM 2 параметри PaLM 2 досить малі, але продуктивність висока.
Мультисенсорна модель ШІ
Хоча GPT-4 було оголошено мультимодальною моделлю ШІ, вона має справу лише з двома типами даних, а саме зображеннями та текстом. З GPT-5 OpenAI може зробити величезний крок до справжньої мультимодальності. Він також може обробляти текст, аудіо, зображення, відео, дані про глибину та температуру. Він зможе з’єднувати потоки даних з різних модальностей для створення вбудованих просторів.
довготривала пам'ять
З випуском GPT-4 OpenAI надає максимальну довжину контексту 32K маркерів за ціною $0,06 за 1K маркер. Ми швидко побачили перехід від стандартного токена 4K до 32K за лічені місяці. Нещодавно Anthropic збільшив контекстне вікно свого чат-бота Claude AI з 9K токенів до 100K. Очікується, що GPT-5 може забезпечити підтримку довгострокової пам’яті завдяки більшій довжині контексту.
Це допомагає персонажам зі штучним інтелектом і друзям запам’ятовувати ваших персонажів і спогади на довгі роки. Крім того, ви також можете завантажувати книги та бібліотеки текстових документів в одному контекстному вікні. Завдяки підтримці довготривалої пам’яті можуть з’явитися різноманітні нові додатки штучного інтелекту, і GPT-5 може зробити це можливим.
Як ви думаєте, коли буде випущено GPT-5 і які революційні інновації він принесе?
Література: