Це занадто кучеряве! 36 Примітки та правда про великі моделі та AIGC

2023-09-14 10:51:21

**Джерело:**i dark horse

Удень 12 вересня пекінська штаб-квартира Startup Dark Horse відкрила хвилю «нових сил ШІ».

Huawei Cloud, APUS, Tors, SenseTime, Kuaishou, 360 Group, Qingbo Intelligence, Dark Horse Tianqi, MiniMax, Sinovation Ventures, Qiji Chuangtan, Китайська академія інформаційних і комунікаційних технологій... Є перелічені компанії, провідні компанії та тварини-єдинороги. компанії, а також провідні інвестиційні установи та науково-дослідні інститути у сфері ШІ.

Гості зустрічі відразу перейшли до теми——

«Поточний статус великих моделей у галузі? Як компаніям краще комерціалізувати? На які нові тенденції та можливості варто звернути увагу?»

Для мене велика честь брати участь у цій закритій зустрічі штучного інтелекту. Я поділюся з вами 38 нотатками та істинами.

Скільки томів має галузь?

Згідно з останніми статистичними даними, у Китаї було запущено понад 130 великих моделей, а в Адміністрації кіберпростору Китаю зареєстровано понад 70 моделей алгоритмів. Такі інтернет-гіганти, як BAT, випустили великі моделі штучного інтелекту. Лише у 2023 році понад 60 стартапів отримали фінансування, а продукти містять базові рівні, рівні моделей і рівні додатків. Новому поколінню генеративного штучного інтелекту, можливо, доведеться озирнутися на підводні камені попереднього покоління штучного інтелекту та уникнути самовдоволення галузі, щоб уникнути реінкарнації минулої зими. Практики в цій галузі повинні чітко бачити інволюцію галузі та больові точки клієнтів, і не обманюйте себе курячим супом великих хлопців.

Тепер до нас приходить клієнт і каже, що є 20 сцен, і кожна сцена коштує X мільйонів юанів? Тоді я ходив від дверей до дверей, щоб запитати ціни. Чи зробить це Huawei? Чи зробить це Alibaba? Чи зробить це Baidu? Якщо ви будете так продовжувати, ви не заробите грошей.
80%-90% грошей, зібраних усіма, йдуть на обчислювальну потужність. Це нинішня ситуація. Ви знаєте, зараз це просто навчання. Вартість навчання можна контролювати, але вартість висновків неконтрольована.
У нас є 30 000 графічних процесорів і обчислювальна потужність 6000 p. До кінця року ми будемо прагнути мати обчислювальну потужність понад 12 000 p. З точки зору даних, 2 трильйони токенів очищаються та анотуються щомісяця, а до кінця року їх буде 10 трильйонів.
Наразі в галузі все ще не вистачає деяких руйнівних додатків-убивць, що ускладнює реалізацію комерціалізації.
Як знайти баланс між вартістю та ефектом Це складний момент. Всі вони використовують великі моделі, а вартість занадто висока.
Через деякий час усі конкуруватимуть за можливість оптимізувати інфраструктуру. Наприклад, з точки зору можливостей оптимізації мережі, якщо ви продовжите, коли інші зазнають невдачі, ви зможете тренуватися більше разів, ніж інші.
У разі обмеженої обчислювальної потужності ми робимо деякі перспективні технічні спроби. Можливо, ви не думали, що в нашій великій модельній компанії більше студентів займаються інфраструктурою, ніж моделюванням. Ціни на них, як правило, досить високі, і їх важко залучити.
Великі моделі зараз у незручній ситуації. Вони не можуть продавати себе за високу ціну. Зрештою, гроші заробляють лише ті, хто продає хмари, карти та обчислювальну потужність.
Спочатку я думав, що модель досить цінна, але тепер вона знову впала в інволюцію. Деякий час тому я зустрів клієнта, і BAT та інші цитували його. Початкова ціна була досить дорогою, понад 10 мільйонів. Хтось знає, якою була остаточна ціна за одиницю? Занадто кучеряве.
Великі моделі з десятками мільярдів параметрів деякі спеціальні клієнти вважають безкоштовними.

Голоси з передової

Компанії у сфері штучного інтелекту повинні завжди пам’ятати слова голови Мао: «Переходьте від практики до практики». Лише знявши халат і мандариновий піджак і вирушивши до полів, ви можете отримати найдостовірніший відгук, перебуваючи поруч зі своїми клієнтами. Зараз занадто багато псевдоекспертів у сфері штучного інтелекту, тому краще більше прислухатися до голосів з передової.

Ми спілкувалися з приблизно 150 клієнтами. Вимоги до великої моделі в основному поділяються на дві категорії. Одним з них є текстові вимоги до великої моделі. Вимоги клієнтів до великої мовної моделі є 100% точними. Інший — це агент штучного інтелекту, який включає виклики функцій, відображення коду та виклики інструментів сторонніх розробників.
Під час нашої співпраці виник конфлікт. Клієнти відчують, що дані не можуть бути передані вам, перш ніж вони вирішать розгорнути їх усередині. Але без цих даних, як ми можемо навчити модель, яка відповідає потребам клієнтів?
Коли ми працювали над проектом, ми виявили, що користувачі не готові платити за великі моделі, але вони все одно платять за ваш додаток. Деякі клієнти прямо запитають у великих моделях, чи деякі з попередніх інтелектуальних середніх платформ і граф знань більше не потрібні? Зрештою я зрозумів, що стрижнем є сцена.
Нам потрібно знайти сексуальні сцени. Є кілька критеріїв. По-перше, невеликий розріз. По-друге, відповідайте перевагам великих моделей. По-третє, нехай користувачі, які приймають рішення про оплату, мають чітке сприйняття. Наприклад, якщо раніше для отримання певних даних, висновків чи послуг були потрібні різні процеси, то тепер, завдяки великим моделям, особи, які приймають рішення, можуть швидко отримати та виконати їх на мобільних пристроях.
Щоб досягти успіху у великій моделі, необхідні три речі: 1) Чи можете ви отримати достатньо грошей, щоб купити обчислювальну потужність. 2) Чи можемо ми отримати достатньо даних? 3) Чи достатньо висока щільність талантів – справа не в кількості, а в тому, чи достатньо висококваліфікованих науковців.
Зараз ми стикаємося з трьома типами клієнтів. Один тип – це тривожні клієнти, наприклад фінансові клієнти, які хочуть це зробити, тому що це роблять їхні конкуренти, але вони не знають, які їхні потреби. Один тип - клієнти, які хочуть скоротити витрати. Керівництво замовника вважає, що це в основному питання скорочення витрат і скорочення витрат. Однак важко судити про конкретне значення того, скільки економії досягла модель. Остання категорія - це клієнти, які сподіваються заробити гроші, використовуючи моделі з відкритим вихідним кодом. Вони покладаються на цю модель для отримання доходу. Таким клієнтам найзручніше платити.

ToC чи ToB?

Зрозуміло, що одноразове навчання GPT-4 коштує приблизно 63 мільйони доларів США і вимагає величезної кількості параметрів у 1,8 трильйона. Для деяких великих моделей, які зараз випущені в Китаї, напрямок ToC все ще є безкоштовною моделлю Інтернету. Але всі практики знають, що розробка та експлуатація великих моделей вимагають великих витрат, що полегшує безперебійну роботу бізнес-моделі ToB. З точки зору дослідження комерціалізації, ToB або ToC завжди були предметом занепокоєння для галузі. Під час закритого засідання ми неодноразово чули два ключових слова: 1) гени і 2) трансгресія. «Ти не можеш бути тим, ким ти не є».

Ми вважаємо, що можливості все ще лежать у вертикальній моделі tob, а головним моментом є самі дані та сценарій, які є ядром.
Ми самі також думаємо про те, як штучний інтелект можна поєднати з Інтернетом, оцифруванням тощо, і як краще зробити оригінальні сцени інтелектуальнішими.
ToC або ToB, відверто кажучи, це пов’язано з генами кожного. Те, що ми не можемо цього зробити, не означає, що інші не можуть цього зробити. Наприклад, у деякі додатки ToC грають діти, народжені у 2000 або 10 роках, що є поза межами нашого розуміння віку.
Toc і Tob все ще дуже різні. ToC має відносно високий рівень відмовостійкості. TOB навпаки. Візьмемо, наприклад, розумне питання і відповідь. Як забезпечити точність? Як і в уряду, є червоні лінії. Зараз досліджується, як уникнути ілюзії моделі.
Навпаки, ми вважаємо, що в ToC легше заробляти гроші. Виникла проблема з ToB. Процес проекту відносно тривалий. Грошовий цикл дуже довгий від затвердження бюджету клієнта до створення та реалізації проекту.
Я думаю, що зараз надто багато можливостей. Не розподіляйте ресурси туди, де ви не кваліфіковані. Дуже важливо зробити стратегічний вибір.

ToB і ToG також дуже складні

Найбільша помилка на стороні B полягає в тому, що в кінцевому підсумку це був передовий аутсорсинг персоналу.
Усі проекти мають цикли, і всі платежі базуються на вузлах циклу. Я не можу допомогти вам навчити й оптимізувати модель без обмежень.
Творіння AIGC більш толерантні та можуть мати деякі помилки. Але коли йдеться про виробництво та виготовлення деякими компаніями, вимоги до точності дуже високі. Часто нам простіше вибрати один-два кращих корпусу з моделі, але підтримувати його на високому рівні без поганих корпусів все одно досить складно.
Коли ми працювали над проектом розумного цифрового уряду в економічно розвиненій провінції, ми просували більше 5 сценаріїв, і замовник остаточно схвалив 3 сценарії. Потім ми дійдемо до суті питань безпеки, даних і нижнього рівня. Тоді я запитаю, які відмінності та переваги між вами та іншими великими моделями? Нарешті, усі сторони мають сісти та розробити систему оцінювання. Після проходження системи оцінювання нам ще потрібно оцінити продуктивність.

Використовуйте проекти для інкубації продуктів і рішень

Використовуйте проекти для інкубації продуктів Після завершення кількох проектів витягуйте відповідні технічні рішення. Цей набір рішень, швидше за все, є не моделлю, а великою моделлю + маленькими моделями і, нарешті, комплексним рішенням, сформованим кількома моделями.
За останні один або два роки це може бути процес інновацій та виробництва продукції, і цикл відновлення готівки буде відносно довгим.

Агент

Уявіть, що ШІ імітує повсякденні людські завдання, щоб справлятися зі складною соціальною поведінкою багатьох людей. Стаття Стенфордського університету під назвою «Генеративні агенти: інтерактивні симулякри людської поведінки під назвою» детально розглядає агентів ШІ, які запам’ятовують, реагують і планують. AI Agent вважається наступним напрямком зусиль OpenAI. Співзасновник OpenAI також сказав на нещодавньому заході: «Порівняно з методами навчання моделей, OpenAI наразі приділяє більше уваги змінам у сфері агентів. Щоразу, коли з’явиться нова стаття про агентів штучного інтелекту, ми будемо дуже раді й обговорюватимемо її. внутрішньо серйозно».

Ми завжди уявляємо, що великі моделі всесильні і можуть вирішити різні проблеми? Це так? Великі моделі - це просто великі моделі.
Ми керуємо внутрішнім ШІ, який називається невидимим ШІ. Перед користувачами ми не будемо акцентувати увагу на тому, що це за модель і скільки у неї параметрів. Наше визначення ШІ – це допомога людини.
Оминаючи модель і обчислювальну потужність, наступною можливістю може бути Агент.
Найбільша проблема, яка зараз впливає на використання клієнтами: співвідношення витрат і випуску. Коли ви закінчите розмову з клієнтом і поговорите про бюджет проекту, якщо він пов’язаний суто з текстом, а інвестиція становитиме кілька мільйонів або кілька мільйонів, клієнт не буде дуже задоволений. Крім того, якщо великі моделі вбудовуються в реальне виробниче середовище за допомогою агентів ШІ для вирішення реальних проблем, клієнти будуть дуже готові платити.
Базуючись на великій моделі, AI Agent має розширені можливості, такі як пам’ять, планування та виконання. Цього разу ми інвестували в понад 60 стартап-проектів, понад 20 з яких є агентами.
Продукти ToC, платіжні форми та форми продуктів дуже відрізняються між Китаєм та іншими країнами. Нещодавно ми інвестували в деякі агентські компанії.
Однак на цьому етапі AI Agent знаходиться лише на новій експериментальній стадії, і все ще існує певний розрив між ним і загальним інтелектом. У майбутньому, окрім всеосяжних можливостей одного агента ШІ, також потрібно буде вирішити проблеми співпраці та емоційних можливостей між кількома агентами ШІ.
Великі зразкові гравці повинні бути впевнені, що вони залишаються за покерним столом, щоб мати шанс побачити нові речі, які з’являються в другій половині.

(над)

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

1 лайків

Нагородити
1
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
1/3
1Gate ETH 10th Anniversary Celebration
2k Популярність
2Trump’s AI Strategy
2k Популярність
3RWA Boom
2k Популярність
4Altcoin Season Coming?
39k Популярність
5Stablecoin Regulation Crackdown
29k Популярність

Закріпити

карта сайту