Se abre el telón, ¿dónde están los protagonistas comerciales de AIGC?

Fuente: Comuna Alfa

Autor: Xu Siqing

El jueves pasado, varios modelos de lenguajes importantes, como Baidu Wenxinyiyan e iFlytek Spark Model, fueron aprobados oficialmente para brindar servicios. La IA ha provocado un cambio en el paradigma de la inteligencia artificial y, al mismo tiempo, la gente se pregunta naturalmente: ¿dónde está el dinero en el cambio de paradigma? ¿Cuál es el protagonista?

Además de la leyenda de MidJourney (los ingresos de 11 personas alcanzaron los 100 millones de dólares en 2022), los empresarios e inversores siempre han tenido esperanzas y ganas de explorar los modelos de negocio que ofrece la AIGC (inteligencia artificial generativa). Este artículo intenta analizar las oportunidades de emprendimiento e inversión desde la perspectiva de la composición de grandes modelos y, por cierto, al final, cuenta una historia empresarial de "caer en los ojos del dinero".

Figura 1: Ejemplo de una imagen vicenciana: una asesina de estilo cyberpunk bajo la lluvia (esta imagen fue generada por Pixeling V1.0 de HiDream).

LLM (modelo de lenguaje grande): las grandes empresas gastan dinero para construir un ecosistema, una trampa para los emprendedores

Echemos un vistazo a la arquitectura de las aplicaciones de modelos de lenguaje grandes (consulte la figura a continuación). No es difícil ver que la capa inferior está construida sobre una base de hardware sólida. Actualmente, hay fabricantes de GPU representados por NVIDIA y proveedores de potencia informática. representado por CoreWeave. Al igual que los teléfonos móviles, el hardware es siempre la última palabra en la comercialización, lo que constituye una de las oportunidades de negocio, pero no hay muchas oportunidades para emprendedores e inversores, salvo la optimización de las plataformas de potencia informática para modelos grandes.

Figura 2: La estructura del modelo de lenguaje grande y algunas empresas representativas.

Al otro lado del océano, actualmente solo existen unos pocos modelos grandes convencionales: OpenAI, Meta, Google y otras compañías importantes han comenzado a trazar sus planes basándose en modelos grandes. También hay LLM (Adept, Cohere, Character. ai) fundado por los autores de Transformer, que tienen más tendencia: diferenciación que homogeneidad.

A partir de esto, vemos más batallas ecológicas de los grandes fabricantes: si no tienes tus propios grandes modelos, no habrá futuro. La gente es optimista sobre Microsoft sobre Amazon porque tiene la ventaja y ha aprovechado los dos modelos principales de OpenAI y Meta Llama, y todos sus productos adoptan la IA. Aquellos que ganen el modelo ganarán el mundo. Hay una plataforma básica construida con modelos grandes y las aplicaciones se construyen en la plataforma. Están tratando de robar clientes de Amazon haciendo todo lo posible.

El modelo básico a gran escala es una enorme bestia devoradora de oro. Las grandes fábricas están capacitadas para competir por la tierra y saldar grandes cuentas. Las fábricas pequeñas casi no tienen ninguna posibilidad excepto en los modelos verticales. Los empresarios deben ser cautelosos.

Figura 3: Evolución de los modelos de IA (procedente de

OpenAI y los modelos de grandes fábricas pertenecen a la primera ola, y los grandes modelos de autores de transformadores pertenecen a la segunda ola. Los diversos modelos que continúan surgiendo, ya sea practicados por uno mismo o utilizando modelos de código abierto, deberían pertenecer a la tercera ola. La tendencia de desarrollo de los modelos de lenguajes grandes es desde modelos grandes básicos hasta modelos verticales y luego modelos de cola larga centrados en aplicaciones empresariales.

Figura 4: Descripción general de los LLM de China (imágenes de Internet)

Cabe señalar que el LLM nacional es abrumador. A excepción de algunos fabricantes importantes, tenemos razones para suponer que la mayoría de ellos son modelos entrenados con modelos de código abierto (sin suficientes GPU, ¿cómo puede venir el trabajo de porcelana? ), pertenece a reingeniería del modelo, que ahorra el enlace de capacitación previa que consume casi el 99% de la potencia informática (consulte el artículo de Alpha Commune: Modelo de lenguaje meta grande Llama 2: girando la mesa y comenzando un nuevo capítulo | Los inversores dijeron), cómo rápido Es económico y digno de reconocimiento, pero la mayoría de ellos son modelos verticales o modelos grandes del Partido A, y no son verdaderos modelos grandes básicos.

La formación de modelos básicos a gran escala requiere mucha mano de obra y fácilmente puede costar decenas de millones de dólares. Es un juego para los ricos, por lo que los empresarios deben tener cuidado.

La razón es muy simple: cuando calculamos la cantidad de dinero recaudada por las nuevas empresas, en comparación con los empresarios extranjeros del mismo tipo, la cantidad de financiación es aproximadamente 1/10, lo que no es suficiente para entrenar el modelo. Si realmente realiza un entrenamiento previo desde cero, la GPU se calentará y el dinero recaudado se agotará poco después de encenderla.

Herramienta de IA: venta de picos en la fiebre del oro, alto contenido técnico

Si bien la inteligencia artificial generativa crea un nuevo paradigma, también crea una gran cantidad de nuevas oportunidades de herramientas. Estas herramientas van desde modelos de evaluación, modelos de operación y mantenimiento, sistemas mejorados hasta herramientas operativas, todas las cuales son nuevas oportunidades generadas por cambios de paradigma.

Particularmente dignas de atención son las herramientas para administrar y entrenar varios tipos de datos, así como el sistema de protección de seguridad. Las herramientas de seguridad incluyen tanto herramientas de seguridad tradicionales como seguridad y cumplimiento orientados a modelos. Piénselo, perder datos ya es terrible. Si se invade el modelo entrenado, ¿no sería una herramienta eficaz para enseñar a las personas a invadir su propia privacidad?

En realidad, la seguridad debería ser más que una simple herramienta, sino una infraestructura esencial.

Hay tantas herramientas antiguas que ya no se pueden utilizar... Los emprendedores tienen más oportunidades de mostrar sus talentos.

Nueva aplicación de IA: un paraíso en flor

La capa de aplicación es una mina rica con muchas oportunidades empresariales.

Ya sean aplicaciones toB o toC, el nuevo paradigma creado por la nueva generación de inteligencia artificial ofrece infinitas oportunidades.

La característica de toC es su entrada revolucionaria en nuevos escenarios, mientras que toB es la coexistencia de lo viejo y lo nuevo.

Podemos describir a C como una aplicación superficial. Su característica es que los gerentes de producto tienen muchas oportunidades de innovación y pueden enviar aplicaciones que gusten a los usuarios sin tener que profundizar en el modelo.

No es difícil predecir que un grupo de destacados gerentes de productos chinos se convertirán en actores internacionales importantes en la ola de cambio de paradigma. Quizás esté surgiendo rápidamente una nueva generación de Zhang Yiming.

La aplicación to B pone a prueba la comprensión de los profesionales sobre los puntos débiles de las necesidades empresariales y el uso de nuevos medios para resolver viejos problemas. Excepto por unas pocas innovaciones disruptivas, la mayoría de ellas se desarrollan a lo largo del camino del valor empresarial de reducción de costos y aumento de la eficiencia. Los cambios tecnológicos brindan la oportunidad de utilizar ampliamente un truco, pero la revolución no es fácil de tener éxito. En última instancia, los actores tradicionales ocupan todos los escenarios de aplicación, y los nuevos métodos y herramientas desempeñan un papel innovador. Debería ser un patrón en el que lo viejo y lo nuevo coexisten.

El modelo a gran escala del Partido A implementado de forma privada debería tener un rápido crecimiento de la demanda durante mucho tiempo.

Lo único que vale la pena señalar es que existen enormes diferencias entre el mercado toB de China y el mercado toB de EE. UU. debido a las diferentes composiciones de clientes y comportamientos de compra. Los empresarios no deben copiarlos. "Iré a Sanya para asistir a la Cumbre de CIO de China en los últimos dos días. Espero explorarla con expertos de la industria. Este tema se reservará para futuras discusiones especiales.

Wensheng Vision: una bonanza comprobada; la versión china de MidJourney: un producto tanto de placer como de dolor

MidJourney atrae directamente a los diseñadores y mejora en gran medida la eficiencia del diseño artístico. Puede producir una imagen en segundos. Se puede decir que ha cambiado completamente el método de producción. Los usuarios están muy dispuestos a pagar. 11 personas ganan 100 millones de dólares estadounidenses. un año, convirtiéndose hasta el momento en el AIGC, el plato fuerte del negocio.

A principios de este año, el autor y el diseñador trabajaron juntos durante mucho tiempo, estudiaron MidJourney y experimentaron in situ el pago del lado C y el pago del lado B: la dura verdad del modelo de negocio.

Al mismo tiempo, también creo firmemente que el umbral de uso es alto: un gran artista corrige constantemente descripciones complejas y profesionales en inglés, y mediante "reparación" (indicaciones), para producir dibujos creativos satisfactorios, mientras que al mismo tiempo soportar los defectos del estilo chino del modelo - —Dado que en ese momento solo había un modelo como MidJourney que solo sabía inglés y solo había estudiado materiales culturales occidentales, los diseñadores se vieron obligados a utilizar varios medios para mejorar la precisión del inglés, y Tuve que soportar el dilema de expresar "chino" como estilo japonés o coreano.

Los medios subversivos provocan una revolución en la eficiencia del diseño. Los diseñadores soportan simultáneamente el desajuste entre el lenguaje y el estilo de la pintura. La combinación de intenso placer y dolor nos hace creer firmemente que China necesita su propio MidJourney. No sólo eso, también creemos que MJ debería ser superado por dos razones: en primer lugar, el mercado exige herramientas que comprendan el lenguaje humano mejor que MidJourney; en segundo lugar, los elementos chinos o los elementos locales globales deberían estar bien expresados. Además, el comercio electrónico y la publicidad tienen un mercado enorme para herramientas de producción de alta eficiencia con una gran cantidad de imágenes y videos cortos como núcleo, y para sistemas de producción acoplados.

Oportunidad dada por Dios, me llevé bien con el académico Mei Tao, un discípulo de HKUST que ha estado tratando de "hacer cosas" juntos durante varios años. Un veterano que comprende algoritmos, conoce modelos y ha practicado en la industria durante muchos años. , por lo que contamos con el apoyo de la ronda inicial de Alpha Commune y ex alumnos de HKUST. HiDream fue iniciado por el académico Mei Tao (ver artículo: ¿Qué otras oportunidades empresariales tiene AIGC en China? Académicos emprendedores e inversores ángeles dicen esto | Alpha Founders Club). En solo unos meses, HiDream ha demostrado una velocidad de iteración inimaginable y resultados sorprendentes, anulando por completo el antiguo "sesgo empresarial académico" en la industria.

El siguiente es un cuadro comparativo de ejemplos generados por MidJourney y Hidream en las mismas condiciones.

:Retrato de personajes de Dragones y Mazmorras, mujer oscura de pelo corto, rastreador del Lejano Oeste sosteniendo un catalejo de latón, Emma Stone, inteligente, optimista, ingeniosa y fuerte.

:Un joven Bulldog Francés parece confundido después de haber sido emboscado, con los ojos muy abiertos y aturdido, al estilo Pixar.

:Extraño con aspecto extraño, lindo y feliz conejito.

Figura 5-7: Gráficos MidJourney e Hidream generados por el mismo

MidJourney ha realizado un valioso trabajo pionero. Si los recién llegados pueden aplicar mejor los transformadores, desarrollar capacidades de modelo más sólidas y ya no depender simplemente del modelo de difusión (MJ continúa optimizando la herramienta actual basada en este modelo), deberían Hay mucho por hacer . También creemos firmemente que MJ aprovechará el comienzo temprano, se librará de la dependencia del modelo de difusión y seguirá trayendo sorpresas al mercado.

Ya sean herramientas, aplicaciones superficiales o aplicaciones empresariales profundas, todas se encuentran en las primeras etapas de generación de escala y corrientes subyacentes. AIGC acaba de comenzar y esperamos que la innovación y la iteración de algoritmos continúen mostrando capítulos más brillantes para la industria.

**En la madrugada del 6 de septiembre de 2023 en Hefei. **

**El autor de este artículo es Xu Siqing, socio fundador y director ejecutivo de Alpha Commune. **

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)