Завіса відкривається, де комерційні герої AIGC?

Question

Джерело: Альфа КомунаАвтор: Сюй СіцінМинулого четверга ряд великих мовних моделей, таких як Baidu Wenxinyiyan і iFlytek Spark Model, були офіційно схвалені для надання послуг. ШІ спровокував зміну парадигми штучного інтелекту, і в той же час люди природно запитують – а де гроші на зміну парадигми? Який головний герой?На додаток до легенди про MidJourney (дохід 11 людей досяг 100 мільйонів доларів США у 2022 році), підприємці та інвестори завжди мали надію та з нетерпінням чекали вивчення бізнес-моделей, створених AIGC (генеративний штучний інтелект). Ця стаття намагається проаналізувати можливості для підприємництва та інвестицій з точки зору складу великих моделей, і, до речі, наприкінці розповідає підприємницьку історію «потрапити в очі грошей».![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-9d6ad33dab-dd1a6f-6d2ef1) Малюнок 1: Приклад зображення Вінкентія — жінки-вбивці під дощем у стилі кіберпанк (Це зображення створено HiDream’s Pixeling V1.0.)## **LLM (Large Language Model) – Великі компанії витрачають гроші на створення екосистеми, пастка для підприємців**Давайте поглянемо на архітектуру додатків великої мовної моделі (див. малюнок нижче). Неважко помітити, що нижній рівень побудований на міцній апаратній основі. Наразі є виробники графічних процесорів, представлені NVIDIA та постачальники обчислювальної потужності в особі CoreWeave. Як і мобільні телефони, апаратне забезпечення завжди є останнім словом у комерціалізації Це одна з можливостей для бізнесу, але для підприємців та інвесторів небагато можливостей, за винятком оптимізації платформ обчислювальної потужності для великих моделей.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-bb1cc82231-dd1a6f-6d2ef1) Рисунок 2: Структура великої мовної моделі та деякі репрезентативні компаніїПо той бік океану наразі існує лише кілька основних великих моделей. OpenAI, Meta, Google та інші великі компанії почали будувати свої плани на основі великих моделей. Є також LLM (Adept, Cohere, Character. ai) заснований авторами трансформерів, які є більш трендовими. Диференціація, а не однорідність.З цього ми бачимо більше екологічних битв великих виробників - якщо у вас немає власних великих моделей, не буде майбутнього. Люди з оптимізмом дивляться на Microsoft над Amazon, тому що вона має перевагу та використовує переваги двох основних моделей OpenAI та Meta Llama, а всі її продукти використовують штучний інтелект. Ті, хто виграють модель, завоюють світ. Є базова платформа, створена з великими моделями, і додатки побудовані на платформі. Вони намагаються вкрасти клієнтів у Amazon, виймаючи всі можливості.Основна великомасштабна модель - це величезний звір, що поглинає золото. Великі заводи навчені конкурувати за землю та зводити великі рахунки. У маленьких заводів майже немає шансів, крім вертикальних моделей. Підприємцям слід бути обережними.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-6aeed166c5-dd1a6f-6d2ef1) Рисунок 3: Еволюція моделей AI (джерело зOpenAI і моделі великих заводів належать до першої хвилі, а великі моделі авторів-трансформерів належать до другої хвилі.Різноманітні моделі, які продовжують з’являтися пізніше, незалежно від того, практикуються вони самостійно чи використовують моделі з відкритим кодом, повинні належати до третьої хвилі. Тенденція розвитку великих мовних моделей полягає від базових великих моделей до вертикальних моделей, а потім до моделей з довгим хвостом, орієнтованих на корпоративні програми.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-90cdbe71eb-dd1a6f-6d2ef1) Малюнок 4: Огляд китайських LLMs (зображення з Інтернету)Слід зазначити, що вітчизняний LLM переважає. За винятком кількох великих виробників, ми маємо підстави припускати, що більшість із них є моделями, навченими з моделями з відкритим кодом (без достатньої кількості графічних процесорів, звідки може вийти порцелянова робота?), належить до модернізація моделі, яка зберігає зв’язок перед навчанням, який споживає майже 99% обчислювальної потужності (див. статтю Alpha Commune: Метавелика мовна модель Llama 2 — перевертаючи таблицю та починаючи нову главу | За словами інвесторів), як швидкий Це економічний і гідний визнання, але більшість із них є вертикальними моделями або великими моделями партії А, і не є справжніми основними великими моделями.Навчання базових великомасштабних моделей є трудомістким і легко може коштувати десятки мільйонів доларів.Це гра для багатих, тому підприємцям слід бути обережними.Причина дуже проста: коли ми підраховуємо суму, яку залучають стартап-компанії, порівняно з іноземними підприємцями того ж типу, сума фінансування становить близько 1/10, чого недостатньо для навчання моделі. Якщо ви справді виконуєте попереднє навчання з нуля, графічний процесор нагріється, і зібрані гроші будуть використані незабаром після його ввімкнення.## **Інструмент штучного інтелекту - продаж кирок під час золотої лихоманки, високий технічний вміст**Хоча генеративний штучний інтелект створює нову парадигму, він також створює велику кількість нових інструментальних можливостей. Ці інструменти варіюються від моделей оцінки, моделей експлуатації та технічного обслуговування, покращених систем до операційних інструментів, усі з яких є новими можливостями, створеними зміною парадигми.Особливої уваги заслуговують інструменти для управління та навчання різних типів даних, а також система захисту безпеки. Інструменти безпеки включають як традиційні інструменти безпеки, так і модельно-орієнтовану безпеку та відповідність. Тільки подумайте про це, втрата даних – це вже жахливо. Якщо навчена модель буде вторгнута, чи не буде це ефективним інструментом, щоб навчити людей вторгатися у власну конфіденційність?Безпека насправді має бути не просто інструментом, а важливою інфраструктурою.Є стільки старих інструментів, які вже не можна використовувати, підприємці мають більше можливостей проявити свої таланти.## **Нова програма AI-Цвітучий рай**Прикладний рівень — це багата шахта з багатьма підприємницькими можливостями.Незалежно від того, чи це додатки toB чи додатки toC, нова парадигма, створена новим поколінням штучного інтелекту, надає безмежні можливості.Особливістю toC є його революційний вихід на нові сцени, тоді як toB — це співіснування старого та нового.Ми можемо описати C як неглибокий додаток. Його характеристика полягає в тому, що менеджери продуктів мають багато можливостей для інновацій і можуть подавати програми, які подобаються користувачам, без необхідності глибоко копатися в моделі.Неважко передбачити, що група видатних китайських менеджерів із продукції стане основним міжнародним гравцем у хвилі зміни парадигми.Можливо, швидко з’являється нове покоління Чжан Іміна.Додаток до B перевіряє розуміння практиками проблемних точок потреб підприємства та використання нових засобів для вирішення старих проблем. За винятком кількох проривних інновацій, більшість із них розвиваються на шляху зниження вартості та підвищення ефективності підприємства. Технологічні зміни дають можливість широко використовувати один трюк, але революцію нелегко досягти. Зрештою, традиційні гравці займають усі сценарії застосування, а нові методи та інструменти відіграють інноваційну роль. Це має бути шаблон, де старе і нове співіснують.Широкомасштабна модель Сторони А, яка розгортається приватно, повинна мати швидке зростання попиту протягом тривалого часу.Єдине, що варто відзначити, це те, що існують величезні відмінності між китайським ринком toB і американським ринком toB через різний склад клієнтів і купівельну поведінку. Підприємці не повинні копіювати їх. За останні два дні я збираюся відвідати китайський саміт ІТ-директорів у Санью. Я з нетерпінням чекаю можливості обговорити це з експертами галузі. Ця тема буде зарезервована для майбутніх спеціальних обговорень.## **Wensheng Vision - перевірене золото; китайська версія MidJourney - продукт і задоволення, і болю**MidJourney безпосередньо звертається до дизайнерів і значно підвищує ефективність художнього дизайну. Він може створювати зображення за лічені секунди. Можна сказати, що він повністю змінив метод виробництва. Користувачі мають сильну готовність платити. 11 людей заробляють 100 мільйонів доларів США рік, поки що ставши AIGC.На початку цього року автор і дизайнер тривалий час працювали разом, вивчаючи MidJourney, і на місці відчули оплату на стороні С і оплату на стороні В - сувору правду бізнес-моделі.У той же час я також твердо вважаю, що поріг для використання високий – великий художник постійно коригує складні та професійні описи англійською мовою, а також через «ремонт» (підказки), щоб створювати задовільні творчі малюнки, водночас переживаючи недоліки китайського стилю моделі - —Оскільки на той час існувала лише така модель, як MidJourney, яка знала лише англійську мову та вивчала лише західні культурні матеріали, дизайнери були змушені використовувати різні засоби, щоб покращити точність англійської мови, і довелося витримати дилему вираження «китайського» як японського чи корейського стилю.Підривні засоби спричиняють революцію в ефективності дизайну. Дизайнери одночасно терплять невідповідність між мовою та стилем живопису. Поєднання інтенсивного задоволення та болю змушує нас твердо вірити, що Китаю потрібен власний MidJourney. Мало того, ми також вважаємо, що MJ слід перевершити з двох причин: по-перше, ринок вимагає інструментів, які розуміють людську мову краще, ніж MidJourney; по-друге, китайські елементи або глобальні місцеві елементи повинні бути добре виражені. Крім того, електронна комерція та реклама мають величезний ринок для високоефективних виробничих інструментів з великою кількістю зображень і коротких відео в якості ядра, а також для стикувальних виробничих систем.Богом надана можливість, і я порозумівся з академіком Мей Тао, учнем HKUST, який кілька років намагався «робити речі» разом. Ветеран, який розуміє алгоритми, знає моделі та багато років практикував у галузі , тому ми маємо початкову підтримку від випускників Alpha Commune і HKUST. HiDream започатковано академіком Мей Тао (перегляньте статтю: Які ще підприємницькі можливості має AIGC у Китаї? Про це говорять академічні підприємці та інвестори-ангели | Клуб засновників Alpha). Всього за кілька місяців HiDream продемонстрував неймовірну швидкість ітерацій і приголомшливі результати, повністю перевернувши давню «упередженість наукового підприємництва» в галузі.Нижче наведено порівняльну таблицю прикладів, згенерованих MidJourney і Hidream за однакових умов.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-93a722a936-dd1a6f-6d2ef1) ：Портрет персонажа Dungeons and Dragons, темна жінка з коротким волоссям, слідопит Дикого Заходу з латунною підзорною трубою, Емма Стоун, розумна, оптимістична, дотепна та сильна![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7200c548e6-dd1a6f-6d2ef1) ：Молодий французький бульдог виглядає збентеженим після того, як потрапив у засідку, широко розплющені очі та приголомшені, стиль Pixar![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-2a3d80e6c4-dd1a6f-6d2ef1) ：Інопланетянин має дивний милий щасливий маленький зайчикМалюнок 5-7: Графіки MidJourney і Hidream, згенеровані тим самимMidJourney виконали важливу новаторську роботу. Якщо ті, хто запізнився, зможуть краще застосовувати трансформатори, створювати потужніші можливості моделі та більше не покладатися просто на модель дифузії (MJ продовжує оптимізувати поточний інструмент на основі цієї моделі), вони повинні ще багато чого зробити . Ми також твердо віримо, що MJ скористається раннім стартом, позбудеться залежності від дифузійної моделі та продовжить приносити сюрпризи на ринок.Незалежно від того, чи це інструменти, поверхневі додатки чи глибокі корпоративні додатки, усі вони знаходяться на ранніх стадіях масштабування та підпільних течій. AIGC тільки розпочався, і ми з нетерпінням чекаємо на інновації та ітерацію алгоритмів, щоб і надалі показувати нові блискучі глави для галузі.**Рано вранці 6 вересня 2023 року в Хефеї. ****Автор цієї статті — Сюй Сіцін, партнер-засновник і генеральний директор Alpha Commune. **