4 años de decenas de miles de millones de valoración, gran modelo nacional de emprendimiento TOP 1, hecho en Tsinghua

Fuente: Qubits

La gran empresa modelo Zhipu AI anunció el monto de financiamiento para el año: 2.500 millones de yuanes.

Tal cantidad, ¿cuál es el concepto? Ha actualizado el monto de financiamiento acumulado de las startups nacionales de grandes modelos, con una valoración de más de 10.000 millones.

Esta empresa de 4 años de antigüedad se ha convertido en la empresa de reconocimiento más valiosa y absorbente de oro para los modelos grandes nacionales.

En la "segunda fase de la IA generativa" en la guerra de los 100 modelos, ¿el progreso financiero del líder Zhipu también es una prueba del efecto Matthew de la industria?

Las empresas que son optimistas tendrán más recursos, mientras que las empresas que no demuestren su autoestima se enfrentan a la baraja y a perderse la siguiente etapa de las carreras.

Desde la perspectiva de las startups, esto es más como el final de la primera mitad del emprendimiento de gran modelo, ha aparecido el punto de inflexión del patrón y el asiento ecológico ha comenzado a estar claro.

**¿Por qué Espectro de Sabiduría? **

Antes de averiguar por qué la potencia de financiación de modelos nacionales a gran escala es un espectro de sabiduría, primero debemos rastrear la fuente y conocer su origen.

Antes de eso, probablemente pertenecía al estado de ser bien conocido en el círculo y desconocido fuera del círculo.

Zhipu AI, fundada en junio de 2019, se transforma con éxito a partir de la tecnología del Laboratorio de Ingeniería del Conocimiento (KEG) del Departamento de Ciencias de la Computación de la Universidad de Tsinghua.

Los miembros del equipo central son casi todos de la línea de sangre Tsinghua, entre ellos, ** CEO Zhang Peng ** se graduó del Departamento de Ciencias de la Computación de la Universidad de Tsinghua y es un líder de innovación de 2018 de la Universidad de Tsinghua con un doctorado en ingeniería.

En KEG Lab, el equipo investigó principalmente cómo aplicar el aprendizaje automático, la minería de datos, los gráficos de conocimiento, etc. a la práctica de la ingeniería, y comenzó a entrenar modelos de IA en 2017.

En el primer aniversario de la creación de Zhipu, OpenAI lanzó GPT-3.

Desde entonces, toda la empresa se ha dedicado por completo al desarrollo de grandes modelos de preformación lingüística. En el camino hacia los grandes modelos, OpenAI eligió GPT, Google eligió BERT y Zhipu eligió GLM (General Language Model).

Casi todas las historias posteriores giraron en torno a la arquitectura única de pre-entrenamiento GLM de Zhipu:

En 2022, Zhipu y Tsinghua cooperaron para desarrollar el modelo bilingüe GLM-130B de 100 mil millones de dólares, usándolo como base, y comenzaron a construir la plataforma de modelos grandes y la matriz de productos.

En 2023, Zhipu llevará a cabo acciones muy frecuentes, empezando por el lanzamiento del modelo de diálogo ChatGLM y el modelo de versión de código abierto de una sola tarjeta ChatGLM-6B, seguido del modelo visual Visual-6B, el modelo de código modelo CodeGeeX2, el modelo matemático MathGLM, el modelo multimodal CogVLM-17B y el modelo Agent de la serie AgentLM, y todos ellos son de código abierto.

El 31 de agosto de este año, Zhipu Qingyan, un asistente de IA generativa basado en el modelo de diálogo bilingüe chino-inglés ChatGLM2, se convirtió en uno de los primeros 11 productos de gran tamaño que volaron a los hogares de la gente común a través de la presentación.

Se puede decir que en los últimos años, lo principal de Zhipu en el campo de los modelos grandes es muy claro, es decir, embestir los cimientos (modelo base) con una mano y luego construir varios edificios modales y funcionales sobre los cimientos.

Vale la pena mencionar que Zhipu puede apoyarse con capacidades de servicio del lado B desde el período embrionario, que es la confianza de la empresa frente a la realidad aceptada de "grandes modelos que gastan dinero como agua corriente", pero también desarrollan y lanzan con frecuencia nuevos modelos y nuevos productos.

Por supuesto, esta no es la única razón.

Además de las capacidades de servicio y las capacidades de ingresos que las acompañan, Zhipu también cuenta con un sólido equipo de talentos y fuerza técnica.

Como se mencionó anteriormente, Zhipu nació de Tsinghua, y ** "Tsinghua Department" se ha convertido en una marca prestigiosa en este campo **.

La razón es que el Departamento de Computación de Tsinghua se dedicó a la investigación de modelos grandes anteriormente, tiene experiencia a largo plazo y ha cultivado muchos talentos: los jugadores que se pueden llamar en el mercado ahora, representados por Zhipu, así como el lado oscuro de la luna, la tecnología Shenyan, la tecnología de primera clase, la inteligencia de Baichuan, la inteligencia de la pared facial, la tecnología Yuanyuan, la tecnología Shengshu, etc., son todos linajes de Tsinghua.

El número de citas de sus artículos publicados y la capacidad verificable de los modelos publicados son una prueba contundente de esta "etiqueta reconocida".

Además, según la información pública, Zhipu es la única empresa de gran tamaño financiada y desarrollada en el país.

Tal experiencia empresarial hace que Zhipu tenga su propia preparación y estrategia en la interminable discusión y controversia de "seguridad del modelo, seguridad de datos y seguridad del contenido".

Se informa que con el fin de cooperar con el desarrollo de GPU domésticas, Zhipu ahora está aterrizando en el plan de adaptación de chips domésticos del modelo de lenguaje universal GLM.

Específicamente, es cooperar con los fabricantes nacionales de chips de potencia informática para adaptar los algoritmos del modelo y adaptar los chips nacionales en el extremo de inferencia del lado del algoritmo, y hay casi 10 tipos de chips domésticos que se pueden adaptar.

** Después de recaudar tanto dinero, ¿qué hacer a continuación? **

La boleta de calificaciones anterior y la singularidad pueden haberse convertido en la razón clave por la que Zhipu ha sido muy optimista y se ha destacado todo el tiempo.

Sin embargo, debido a que es altamente favorable, el espectro de sabiduría que ha acumulado suficiente capital también muestra la determinación de construir competitividad a largo plazo.

Después de recaudar 2.5 mil millones de RMB en financiamiento en 10 meses, Zhipu AI declaró oficialmente:

La financiación anterior se utilizará para una mayor investigación y desarrollo del modelo base, un mejor apoyo a la ecología de la industria y un rápido desarrollo con los socios.

El núcleo se reduce a dos aspectos:

  • Primero, hazlo más grande, más fuerte y más sólido, y la base del modelo grande.
  • El segundo es ampliar la ecología y el círculo de amigos.

Debe haber profundidad y amplitud.

** En primer lugar, haga que la base del modelo sea más grande y más fuerte, y "desarrolle aún más" el modelo grande base. **

En la actualidad, el modelo grande que Zhipu considera como base es el modelo denso bidireccional bilingüe GLM-130B lanzado en 2021, con 130 mil millones de parámetros.

En ese momento, debido a muchas limitaciones como la tecnología, los datos y la potencia de cómputo, entrenar un modelo grande con esta cantidad de parámetros era suficiente para quedarse calvo, pero los resultados fueron notables y el GLM-130B funcionó mejor que GPT-3 y PaLM.

Sin embargo, hoy en día, la demanda provocada por los datos y el crecimiento modal, el gigante de los 130.000 millones de parámetros del pasado, parece ser un poco inadecuada.

La última noticia de Qubit es que este viernes (27 de octubre), Zhipu tendrá una nueva acción: el lanzamiento de una nueva generación de grandes modelos de pedestales. **

** En segundo lugar, ampliar la ecología y el círculo de amigos. **

Cuando se trata de acciones concretas, no deberíamos ser capaces de eludir el principio consistente del espectro de sabiduría: el código abierto continuo.

Esta empresa siempre ha sido uno de los actores más abiertos en el campo de los grandes modelos, ya en la era anterior a ChatGPT, ha sido transparente y abierta junto con Baidu (ERNIE2.0), Ali (AliceMind), Zhiyuan (Qingyuan CPM), Lanzhou (Mencius Big Model) y otros.

Mirando el primer informe de GLM de Zhipu, están las palabras "Invitamos a todos a unirse a su comunidad abierta para promover el desarrollo de modelos preentrenados a gran escala". Ahora, la compañía sigue utilizando el código abierto para hacerse amigo de los desarrolladores y los usuarios de la industria.

Este hábito continúa hasta el día de hoy.

Combinado con los datos actuales, podemos ver más claramente la insistencia de Zhipu en el código abierto y qué resultados escalonados se han obtenido:

Comunidad de desarrolladores, ChatGLM-6B ocupó el primer lugar en la lista de tendencias cuatro semanas después de su lanzamiento, con un total acumulado de más de 10 millones de descargas, y GitHub destacó 5w+.

Por otro lado, el sitio web oficial de Zhipu enumeró ** socios para construir un entorno ecológico, "69 países, 1000+ instituciones de investigación". Además, se han verificado qubits, con más de 1.000 clientes y 200-300 ecosistemas de código abierto.

Una vez que se establece la ecología del gran modelo, puede integrar mejor los recursos de la capa básica, la capa intermedia y la capa de aplicación del gran modelo, optimizar la asignación y lograr el efecto de una interacción saludable y la coevolución.

Entre ellos, el modelo grande de pedestal se ubica en el núcleo de la ecología del modelo grande en virtud de su fundamento y versatilidad. Para entender esto, no es difícil entender las ventajas y la necesidad de que Zhipu se comprometa a expandir la ecología y el círculo de amigos.

Gran modelo de emprendimiento, entrando en un momento decisivo

A finales del pasado mes de noviembre, OpenAI envió ChatGPT al mundo. Inmediatamente después, la tendencia de la tecnología de los grandes modelos desencadenó oleada tras oleada a una velocidad sin precedentes.

Los datos intuitivos son asombrosos y la velocidad de presentación es asombrosa.

Cientos de millones de actividad de usuarios, miles de millones de ingresos, decenas de miles de millones de valoraciones... El gran modelo está barriendo el mundo sin hablar de la virtud marcial, y todo el mundo está mirando y explorando, pensando en lo amplios que pueden ser los límites de esta tecnología de inteligencia artificial, y ¿cómo pueden los productos que apoya ejercer el poder de la tecnología?

Como resultado, hay pioneros como OpenAI y Anthropic en el extranjero, y hay decenas de miles de millones de unicornios como Zhipu AI y MiniMax en China.

El jade perlado está por delante, algunos de los problemas técnicos y de ingeniería no se pueden adelantar y omitir, y luego la alineación de estrellas, y luego la financiación astronómica, siempre que tome el camino de los modelos grandes, debe experimentarlo usted mismo.

El desafío es abrumador, pero los retadores están felices de seguir su ejemplo.

Fuente: Sequoia

Hoy, casi un año después, somos testigos del desarrollo de la tecnología de grandes modelos y de cómo la innovación y la competencia están dando forma al campo.

Lo que se puede ver más claramente es que el gigante ** completó la ranura inicial de la tarjeta, la empresa emergente comenzó a barajar y apareció el patrón de la primera etapa. **

Así es, una empresa no puede hacer todo dentro de las capacidades del modelo grande, pero los boletos para el modelo grande general son tan limitados, y los jugadores que no tienen la capacidad de obtenerlo comienzan a desviarse: o van al especial y hacen el modelo de la industria; O bien renunciar a la capa del modelo para iniciar un negocio, empezar a pararse sobre los hombros de otros modelos, y pasar a la capa intermedia, la capa de aplicación...

El emprendimiento de los grandes modelos está entrando en un momento decisivo.

A partir de ahora, es probable que el progreso de la financiación de las grandes startups de modelo recaude cada vez más de lo que es ahora. Cientos de millones de dólares continuarán acumulándose en empresas de "no menos dinero".

El efecto Matthew en la industria se está intensificando. La cantidad total de capital es limitada, cuanto más valiosa sea la empresa, mejor se verá y los mejores y más recursos se enviarán al caballo con más potencial.

En el mercado de capitales, la única desventaja de las empresas caras es que son caras, y la única ventaja de las empresas baratas es que son baratas.

La primera mitad del gran modelo de emprendimiento está llegando a su fin.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)