Oportunidades de negocio bajo la "emergencia" de los grandes modelos: quién ganará la "Guerra de los Cien Modelos"

Fuente: El Papel

Autor: El reportero del periódico Huan Yanhong pasante Chen Xiaorui

Fuente de la imagen: Generada por la herramienta de IA Unbounded

La tecnología de IA generativa está cambiando la industria de la inteligencia artificial. Después de solo medio año, el desarrollo de modelos domésticos a gran escala ha completado el salto de tecnología a producto y luego a negocio, y ha penetrado en industrias verticales. Durante la Conferencia Mundial de Inteligencia Artificial del 6 de julio, The Paper invitó a Wang Danjun, vicepresidente del Instituto de Investigación de Gestión del Talento Beisen, Yu Zhonghai, subdirector general del departamento de investigación de CICC, y Zhang Jie, vicepresidente de Zhongguancun Kejin Technology, a la sala de chat Metaverse para discutir oportunidades de innovación empresarial bajo la "emergencia" de modelos grandes. El diálogo fue presentado por Shao Wen, un reportero de The Paper.Durante el diálogo de una hora, los invitados discutieron una serie de temas relacionados, que incluyen:

¿Cómo encuentran su propio valor los modelos grandes de uso general y los modelos a gran escala de campo vertical en futuros escenarios comerciales?

¿Cómo pueden las empresas aprovechar las oportunidades comerciales de los grandes modelos? ¿Cuál es el punto clave para aprovechar la oportunidad?

La vida pasada y el futuro de la gran modelo

**澎湃科技: En la actualidad, el mercado nacional ha formado una situación de "guerra de los cien modelos". ¿Crees por qué los modelos nacionales a gran escala se están desarrollando tan rápido? ¿Qué impacto tiene en su campo? **

**Wang Danjun (Vicepresidente del Instituto de Investigación de Gestión del Talento Beisen): **Desde un punto de vista técnico, el desarrollo de modelos grandes no es algo que haya sucedido en los últimos dos años. En el campo académico hace muchos años que todo el mundo se ha puesto a investigar. Es solo que con el aumento en el volumen de datos y la mejora del nivel de tecnología en los últimos años, especialmente después de que OpenAI lanzó ChatGPT, ha atraído una atención generalizada.

Para cada campo, todos piensan en cómo aplicar una tecnología tan nueva a su propio campo y cómo mejorar su modelo de negocio.

Por ejemplo, nuestro Instituto de Investigación de Gestión del Talento Beisen pertenece a la industria de recursos humanos, y los clientes a los que servimos son todos grupos de empresas de RRHH (recursos humanos). Creemos que la aplicación de grandes modelos en el campo de los recursos humanos puede producir algún valor disruptivo en el futuro, por ejemplo, de hecho puede mejorar mejor la eficiencia del trabajo de todos; ayudará hasta cierto punto a nuestros socios, ya sean recursos humanos o Puede orientar mejor el desarrollo de los empleados y, al mismo tiempo, también puede ayudar a las empresas a responder muchas preguntas sobre la gestión de recursos humanos, incluido lo que solemos preguntar cuando contratamos empleados: quién es más adecuado y quién puede traer más beneficios. , cómo debe determinarse el salario, etc. Creo que el desarrollo y la aplicación de modelos grandes transformarán la industria de recursos humanos en un período de tiempo muy corto.

**Yu Zhonghai (Gerente General Adjunto del Departamento de Investigación de CICC): **Dean Wang mencionó un punto muy importante, es decir, la tecnología de modelos a gran escala no sucedió hoy. En 2017, Google escribió un famoso artículo llamado Attention Is All You Need (la atención es todo lo que necesitas) y propuso la arquitectura del transformador.

De hecho, los profesionales de la industria de la inteligencia artificial de China descubrieron muy pronto el potencial de la tecnología de modelos a gran escala. También escribimos un informe de investigación relacionado en 2021. En ese momento, nos sorprendió el desarrollo de modelos de inteligencia artificial. Ahora, el producto específico de ChatGPT hace que el modelo grande sea conocido por la gente común. No importa si entiendes la tecnología o no, puedes sentir su encanto mientras lo juegas, por lo que el modelo grande es popular.

La capacidad de que los modelos grandes se apliquen en miles de industrias con tanta rapidez también depende de la igualdad de derechos en tecnología, que es un concepto muy importante que presentamos. Gracias al desarrollo de la comunidad de código abierto y la difusión natural del conocimiento, muchas empresas han creado rápidamente sus propios modelos grandes.

Además, me gustaría agregar que esta vez hemos visto a todo el círculo tecnológico e incluso a toda la sociedad formar una fuerza conjunta, es decir, "todo el mundo piensa que esto es muy importante", lo que rara vez se ve en el pasado.

**Zhang Jie (vicepresidente de Zhongguancun Kejin Technology): **Creo que el primer año del modelo grande se remonta al lanzamiento de GPT3 en 2020. ¿Por qué se ha desarrollado tan rápido en los últimos seis meses? Creo que hay tres razones:

El primer aspecto es que algunas empresas y universidades tienen mucha acumulación antes, como Baidu, Huawei, la Universidad de Tsinghua, etc., tienen modelos de lenguaje pre-entrenados o modelos grandes antes, y los últimos seis meses han sido una actualización de versión. iteración para ellos;

El segundo aspecto es que varias empresas, incluidas algunas instituciones de inversión, han aumentado su inversión;

El tercer aspecto es confiar en el código abierto. La comunidad de código abierto ha llevado a las empresas a lanzar varios modelos de dominio grandes.

En cuanto al impacto de los modelos grandes en el campo, es un beneficio de dos vías para los clientes y para nosotros. Zhongguancun Kejin es un proveedor líder de soluciones de tecnología de inteligencia artificial conversacional. El modelo grande reduce nuestro costo de personalización y desarrollo de varios modelos de escena, lo cual es una buena noticia para nosotros. Para nuestros clientes, la reducción de costos de los proyectos inteligentes ha llevado a muchas pequeñas y medianas empresas a considerar el establecimiento de proyectos, y todo el mercado ha crecido en tamaño.

**澎湃科技: Recientemente, Tencent Cloud y OpenAI han propuesto sucesivamente una tienda modelo a gran escala para software modelo personalizado, que es algo similar a la forma de una tienda de aplicaciones. ¿Cómo entiendes esta tendencia? **

**Wang Danjun:**Ya seas un inversionista o un profesional en este campo, creo que todos esperan ver esta tendencia, porque alienta a más personas a participar en la creación conjunta de este campo. Creemos que para los proveedores de servicios básicos, definitivamente se inclinarán por el modelo de tienda en el futuro, lo que facilitará la cercanía con los clientes. El modelo de tienda modelo grande también permite a los usuarios que reciben servicios utilizar mejor el modelo grande para crear nuevos escenarios de aplicaciones y valor de servicio.

Yu Zhonghai: En realidad, este es un problema que preocupa mucho al mercado de capitales. Creo que el desarrollo de modelos grandes será más como la nube pública y la nube privada de China en el futuro.

La nube pública en realidad se llamaba IaaS (Infraestructura como servicio, infraestructura como servicio) en ese momento. Cuando se trata de modelos grandes, lo llamamos MaaS (Modelo como servicio). Hay una empresa extranjera muy conocida llamada Hugging Face, que pone muchos modelos en Internet, y puede usar diferentes modelos de IA simplemente llamando a su API (Interfaz de programa de aplicación, interfaz de programación de aplicaciones).

Sin embargo, también hay muchas empresas que necesitan implementar su propio modelo a gran escala y utilizar su propio conocimiento para mejorarlo y realizar su propio ajuste fino debido a requisitos como el cumplimiento de la seguridad y la implementación de escenas subdivididas. Esto puede ser como la nube privada. mercado en China. .

En términos generales, los modelos grandes en realidad no son adecuados para que todos los usen directamente, incluido ChatGPT, que en realidad está empaquetado en un producto basado en el modelo grande, para que todas las personas comunes puedan experimentarlo. Por lo tanto, hacer aplicaciones basadas en modelos grandes es en realidad un mercado muy amplio, que puede generar muchos modelos de negocios, como empleados digitales y el concepto de tienda de aplicaciones que acaba de mencionar el anfitrión.

De hecho, ChatGPT también es considerado por muchas personas como un portal de tráfico. Hasta donde yo sé, algunos fabricantes de teléfonos móviles a gran escala también pueden terminar haciendo búsquedas. Entonces este asunto es completamente diferente. Su mercado alcanzable será el de la empresa. El gasto en TI se convierte en gasto en marketing. Las empresas chinas pueden gastar un promedio del 1% al 3% de los ingresos en TI, pero pueden gastar el 30% de los ingresos en marketing. Entonces, cuando tienes tráfico, el modelo de negocio puede cambiar mucho, lo cual es muy interesante.

Zhang Jie: Creo que OpenAI y Tencent Cloud tienen énfasis diferentes. El enfoque de OpenAI puede seguir estando en el modelo grande básico. Utiliza algunos socios ecológicos para ayudarlo a compensar la falta de precisión o profesionalismo del modelo grande básico en algunos escenarios fragmentados. Sin embargo, Tencent Cloud no enfatiza demasiado su propio modelo básico, pero enfatiza la necesidad de ser un gran modelo para las industrias verticales.

Sus diferentes énfasis muestran un problema común, es decir, el modelo grande básico no se puede utilizar directamente en algunas industrias o escenarios específicos con alta profesionalidad, y también necesita una capa de adaptación. Creo que aquí puede haber un nuevo modelo de negocio, es decir, cada vez se puede capitalizar más conocimiento en el futuro. Resulta que cuando todos usan IA, el paradigma técnico es diferente. Por lo tanto, los activos que todos pueden compartir son algunos datos sin procesar. Después de obtener los datos sin procesar, se utilizan diferentes medios técnicos para procesarlos. Durante este proceso, la forma intermedia de los datos no se puede comercializar.

Sin embargo, el modelo grande básicamente unifica muchas tareas de IA, y todo el paradigma de investigación y el flujo de procesamiento convergen, lo que hace que muchos productos intermedios sean negociables, como datos etiquetados, datos para la alineación de instrucciones, palabras indicadoras y La cadena indicadora compuesta de frases indicadoras. , etc., e incluso robots o asistentes entrenados en escenarios específicos, pueden hacer algunas transacciones y ser capitalizadas.Este puede ser un nuevo modelo de negocio en el futuro.

Modelo grande general VS modelo grande de campo vertical

**Tecnología del papel: De hecho, hace un momento, ustedes tres mencionaron dos caminos comerciales diferentes, el gran modelo de dominio y el gran modelo general. ¿Puede hablar sobre las oportunidades y los desafíos de estos dos modelos comerciales diferentes en detalle? **

Wang Danjun: En el futuro, los negocios en torno a modelos grandes definitivamente se convertirán en una ecología empresarial, y la característica central de la ecología empresarial es que tendrá capas. En primer lugar, habrá algunos fabricantes que brinden servicios básicos, porque los modelos grandes requieren base de datos y poder de cómputo. El modelo grande sirve como motor subyacente y, aunque tiene capacidades sólidas, no comprende el conocimiento de dominios específicos, modelos de servicio y necesidades del cliente.

Junto con eso vienen grandes maquetas de verticales. Algunos de los modelos grandes en estos dominios verticales son los propios modelos grandes de los fabricantes de dominios y algunos están entrenados en base a los modelos grandes básicos. En términos sencillos, es hacer de estos modelos un experto. Por ejemplo, en el campo financiero, puede haber algunos servicios que se dediquen a ayudar a los inversores a tomar decisiones comerciales, y en el campo de recursos humanos, puede haber servicios que se dediquen a ayudar a las empresas a tomar decisiones de talento.

Puede haber muchos campos subdivididos. Estas subdivisiones también pueden requerir la acumulación de la industria, la capacitación y la comprensión de cómo resolver los problemas de los clientes, e incluso involucrarse en el nivel de experiencia del usuario de la interfaz interactiva. Estas acumulaciones son en realidad algunas de las capacidades detrás de la tienda de aplicaciones de las que hablamos anteriormente.

Yu Zhonghai: Desde nuestro punto de vista, estos dos tipos de mercados son bastante diferentes.

En primer lugar, también es importante construir un buen volante de datos para el modelo grande general.

Por ejemplo, hoy les enseño a jugar tenis de mesa y les digo que deben jugar así. Luego sirvo una pelota y no la atrapas, sabes que no es la forma correcta de golpearla. Luego cambia de otra forma, esta vez lo atrapas, recordarás la forma correcta. Luego sigo sirviéndote la pelota y tú sigues atrapándola, ajustando tu memoria muscular poco a poco para encontrar la mejor manera. De hecho, la formación del modelo también es un proceso de este tipo. Cada vez que se comunique con ChatGPT, habrá un Me gusta o No me gusta debajo. O hay momentos en los que no dices nada y estás muy decepcionado de haber regenerado uno. O por ejemplo, cada vez que uses Midjourney para dibujar, mostrará cuatro imágenes, y luego seleccionas la tercera por defecto, la amplías, la descargas, y sabrá que esta parece ser mejor, y se irá. a esto en el futuro La dirección es un poco más sesgada, y el modelo aprenderá un poco. Sin retroalimentación de datos, el modelo se queda aquí y no puede mejorar. Así que este es el volante de datos que enfatizamos, enfatizando la posición de la tarjeta de la escena. Como modelo grande de propósito general, lo más importante es que alguien lo use, lo que también es una ventaja de China. A los chinos les gusta adoptar la tecnología y aceptan más los modelos grandes. Tenemos mucha gente para dar su opinión.

Para los modelos de dominio grande, creo que lo que es más importante es el conocimiento (el conocimiento técnico y la experiencia necesarios para participar en una determinada industria o realizar un determinado trabajo).

La clave del modelo de dominio grande es satisfacer las necesidades de los clientes y comprender el conocimiento de los clientes en un determinado dominio profundo. Las empresas como Zhongguancun Kejin tienen sus ventajas aquí, entienden el conocimiento del cliente y entienden los puntos débiles del cliente en escenarios de campo específicos.

**Zhang Jie: **Gracias por su reconocimiento. Entiendo que el modelo grande general y el modelo grande de dominio son una relación ascendente y descendente, no una relación competitiva. El modelo general es grande y completo, y el modelo de dominio es un negocio pequeño pero hermoso.

El modelo general a gran escala se caracteriza por "tres máximos", es decir, alta inversión y alto rendimiento, pero también alta incertidumbre. Porque entrenar un modelo grande básico requiere altos requisitos en términos de algoritmos, datos y talentos. Por ejemplo, la potencia informática debe ser de al menos 10 000 kat de potencia informática.

¿Por qué la incertidumbre es tan alta? Debido a que los fabricantes preseleccionados son básicamente grandes empresas de Internet o gigantes tecnológicos, los requisitos técnicos son muy altos para que los grandes modelos capacitados tengan capacidades generales y capacidades emergentes. Si desea hacerse un hueco en el mercado, al menos debe poder ejecutar Sólo ganando el modelo de código abierto puede sobrevivir. En el mercado futuro, creo que coexistirán muchos modelos grandes básicos, pero puede que no haya demasiados.

Una maqueta de dominio puede ser una pista pequeña pero hermosa. El entrenamiento de un modelo de dominio grande no requiere una potencia informática muy alta. Según nuestros experimentos, solo lleva una semana iterar el modelo de dominio grande. Dos cartas pueden hacer algo de razonamiento en tiempo real. Luego, en términos de datos, todavía tenemos que establecer algunos umbrales propios, que es el efecto volante de datos que acaba de mencionar el Sr. Yu.

El punto más importante de la competencia es el talento. El modelo de dominio grande ha aplanado la cadena tecnológica de toda la industria. Sus talentos no solo deben comprender algoritmos, sino también saber cómo diseñar algoritmos bien, comprender escenarios, comprender negocios e incluso comprender el diseño de productos. Es necesario estimular la capacidad compuesta de los talentos y luego estimular la iniciativa y la creatividad de los talentos, que es una prueba de la capacidad organizativa.

**¿En qué campo es más útil el modelo grande? **

**Tecnología del papel: ¿Cuáles son las tres direcciones de aplicación vertical más prometedoras? **

Yu Zhonghai: Hemos mirado muchas direcciones, y la dirección más prometedora ahora es AI Answer, que es una palabra que creamos nosotros mismos, que se refiere a una categoría de productos. Por ejemplo, hoy me pusiste a prueba en un asunto y me preguntaste qué marca de cochecito es mejor comprar. Creo que todos deberían tener una situación similar. Pregúntele a tres amigos, lea cinco artículos de Xiaohongshu y luego busque diez publicaciones en Internet. Finalmente, después de leerlo, resumí tres modelos, miré el precio y tomé una decisión.

De hecho, lo mismo ocurre con muchas cosas cuando le preguntas a la inteligencia artificial. El modelo grande tiene cierta memoria. Sabe que estas cosas están relacionadas, pero tendrá alucinaciones. ¿Qué aspecto tiene? Entonces, lo que las empresas suelen hacer es hacer ciertas consultas basadas en la base de conocimiento interna y luego hacer un resumen basado en estas cosas. Además, hay una pregunta y respuesta, un resumen o una comparación basada en un documento, como una cláusula de seguro basada en cientos de páginas. O dar una respuesta basada en una búsqueda. Nos referimos colectivamente a estos productos como AI Answer. Además, también prestamos más atención a oportunidades como el trabajo de oficina y las máquinas de aprendizaje de IA.

Zhang Jie: Creo que podemos verlo primero por industria y luego por escena. La industria ideal para modelos de dominio a gran escala es una con alta densidad de conocimiento, una lógica de proceso sólida y sensible a la seguridad y la privacidad. Por ejemplo, industrias como finanzas, atención médica, leyes y asuntos gubernamentales pueden ser industrias ideales para la implementación. de modelos de dominio a gran escala en el futuro.

La escena puede estar habilitada para empleados internos al principio. Por ejemplo, haga algunas pruebas de conocimiento, seguidas de entrenamiento y combate. Después de empoderar a los empleados internos, veamos cómo brindar algún servicio a C (a los clientes), o empoderar al personal de ventas y al personal de atención al cliente para que se conviertan en asistentes de atención al cliente de marketing. En resumen, al aplicar, primero puede considerar comenzar desde la escena con una tolerancia a fallas relativamente alta.

Wang Danjun: También creemos que en la experiencia de aplicación de todos, los modelos grandes nos ayudan a resolver la mayoría de los problemas en industrias intensivas en conocimiento. En el campo To B como Beisen o Zhongguancun Kejin, habrá algunas empresas que probablemente se beneficien de él. Por ejemplo, en la gestión de recursos humanos de una empresa, todos esperan que el gran modelo pueda resolver algunas cosas aburridas y aburridas para las personas, como responder a varias preocupaciones comunes de los empleados. Beisen y Zhongguancun Kejin también están discutiendo la cooperación en esta área, con la esperanza de establecer algunos empleados digitales a través de las instalaciones subyacentes del modelo grande en el futuro y responder a estas preguntas que no parecen requerir experiencia ni conocimiento humano.

Además, encontramos que hay algunas áreas de alto valor, como el coaching de liderazgo corporativo. Una empresa tiene múltiples niveles de gerentes, y cada gerente enfrentará varios desafíos todos los días, pero no tiene tantas oportunidades para pedir consejo a otros. Creemos que AIGC puede brindar una muy buena ayuda en este escenario, y bien puede cumplir con algunos requerimientos personales de privacidad.

**澎湃科技:Microsoft anunció recientemente una cooperación con OpenAI para abrir la ecología de las aplicaciones. Zhongguancun Kejin es un representante de los fabricantes de aplicaciones a gran escala en China. ¿Cuál es el progreso actual de la llegada y aplicación de productos? ¿Cada empresa tendrá su propio modelo exclusivo en el futuro? **

Zhang Jie: Creo que no todas las empresas necesitan su propio modelo exclusivo, porque creo que la tecnología de modelos grandes se puede dividir en tres capas, de superficial a profunda:

En el primer nivel, si la industria o empresa no tiene tanto conocimiento o documentos, o la particularidad de la empresa en sí misma no es fuerte, no hay necesidad de usar un modelo dedicado y se puede usar directamente un modelo grande general. En el modelo grande general, de acuerdo con los requisitos específicos de la escena, es suficiente para ajustar (prompt). Durante este período, lo que las empresas necesitan es una herramienta de administración de palabras rápida con una buena experiencia de usuario y un umbral bajo. Puede ser necesario que algunos expertos en negocios acumulen algunos avisos útiles en escenarios específicos; para los más complicados, es necesario convertir algunos avisos en un pequeño conjunto de avisos y luego formar cadenas entre diferentes conjuntos, y las cadenas se secuencian Lógicamente relación, basta con tener una herramienta de gestión de la cadena puntual.

La segunda capa es un poco más complicada. Algunas empresas tienen mucho conocimiento fragmentado. En este momento, las palabras rápidas o las cadenas rápidas pueden no ser suficientes. Es necesario agregar una base de conocimientos además del modelo grande general para administrar el conocimiento de cola larga y de baja frecuencia. Cuando el modelo grande general enfrenta problemas específicos, vaya a la base de conocimiento para encontrar respuestas. Esta es la ruta técnica del modelo grande general + base de conocimiento + ingeniería rápida.

La tercera capa, para empresas con una gran cantidad de conocimiento de dominio, es necesario construir un modelo de dominio grande exclusivo para la empresa e ingresar el conocimiento general en el dominio en el cerebro del modelo grande, que no solo mantiene un dominio común general sentido y razonamiento, pero también tiene la experiencia en el campo. El conocimiento y las habilidades hacen grandes modelos, desde estudiantes de artes liberales hasta expertos en el campo. Esta es una ruta de modelo de dominio grande + base de conocimiento de dominio + ingeniería rápida.

Zhongguancun Kejin tiene alguna práctica de aplicación para las tres situaciones anteriores. Hemos estado tratando de resolver tres dificultades técnicas hace algún tiempo, y después de resolverlas, hemos formado dos conjuntos de aplicaciones auxiliares. ¿Cuáles son las tres dificultades técnicas?

El primero es solucionar el problema de las alucinaciones que suelen darse en los modelos grandes, es decir, tonterías graves. Esto requiere una base de conocimiento en el campo para que el modelo grande sepa que cuando se le hace una pregunta, necesita encontrar el conocimiento relevante en la base de conocimiento. Al crear una base de conocimiento, a menudo es necesario procesar documentos en formato de texto enriquecido.Es necesario que el modelo grande comprenda primero el diseño del documento y luego comprenda el contenido interno.

El segundo es evitar el problema de los olvidos durante el proceso de entrenamiento cuando se entrenan modelos grandes en el dominio. De lo contrario, cuando introduzca nuevos conocimientos en su cerebro, olvidará los antiguos. Aquí se utilizarán medios técnicos de ajuste fino eficientes, para que no solo pueda tener el conocimiento general original, sino también aprender el sentido común en el campo.

El tercero es cómo hacer que los usuarios lo utilicen de forma más cómoda y económica. Ya sea que se trate de un modelo de dominio grande, una base de conocimiento de dominio o palabras rápidas, no se puede lograr de la noche a la mañana y requiere retroalimentación e iteración continuas. Esto requiere que los clientes tengan capacidades de mantenimiento, y el diseño del producto y el paquete de ingeniería deben realizarse bien en el nivel de herramienta.

**澎湃科技: Me gustaría preguntarle al Sr. Yu desde la perspectiva de la inversión, en comparación con la lógica de inversión en la era de Internet móvil y la tecnología dura, en esta ronda de aumento del modelo a gran escala, el enfoque central de la selección de proyectos , incluidos los puntos de toma de decisiones de inversión ¿qué es? **

**Yu Zhonghai:**Esta también es una pregunta que el capital ha estado explorando. En los últimos seis meses, el mercado de modelos grandes también ha experimentado muchas rondas de evolución. Al principio, mucha gente lo consideró como una inversión temática, en ese momento se especulaba con las empresas relacionadas con la IA y las empresas con capacidades reales subyacentes de modelos a gran escala eran muy valoradas por todos. Más tarde, apareció la "Guerra de los Cien Modelos". Todos sintieron que el modelo grande parecía un poco demasiado complicado. Descubrieron que el poder de cómputo parecía ser el beneficiario de comprar palas de los Nuggets, por lo que la valoración de las empresas relacionadas con el poder de cómputo subió un poco. lote. Para mayo y junio de este año, propusimos que "las aplicaciones de IA marcaron el comienzo de un período cámbrico explosivo". Muchas empresas han creado sus propios productos y la aplicación de la IA ha comenzado a aumentar nuevamente.

De hecho, el ritmo de inversión de los modelos grandes también es gradual. Desde el principio, siempre que sea una empresa de IA, puede aumentar, y luego saldrá con una aplicación, y luego todos comenzarán a explorar si esta aplicación tiene clientes que pagan por él, y si hay pedidos reales. Creo que tal vez en un año más o menos, todos pensarán si existen barreras para esta aplicación y si el negocio es sostenible a largo plazo. De hecho, en lo que somos más optimistas es en el nivel de aplicación. Damos gran importancia a las empresas que realmente pueden conectar grandes modelos y aplicaciones empresariales, y que realmente pueden crear valor.

**The Paper: La siguiente pregunta es para Dean Wang. Desde la perspectiva de los talentos, el gran modelo ahora está construyendo una nueva relación de producción de colaboración hombre-máquina. Entonces, ¿qué impacto tendrá esto en la gestión del talento de las empresas? **

Wang Danjun: Esta es una pregunta particularmente buena. Porque vemos que a nivel social, todo el mundo puede estar muy interesado en discutir "¿Será sustituida mi obra por una gran maqueta en el futuro?" Respecto a esta pregunta, sugiero que podemos mirarla desde dos vertientes:

Por un lado, lo que todos discutieron más es que la capacidad de los modelos a gran escala es cada vez más fuerte, y la aplicación de campos verticales es cada vez más profunda, lo que puede reemplazar el trabajo de muchos empleados generales en el futuro. En los últimos años, incluso sin antecedentes de desarrollo de modelos a gran escala, todos están muy preocupados por reducir los costos y aumentar la eficiencia, lo que implica la proporción de los costos laborales en las empresas. Si se pueden utilizar algunas tecnologías nuevas para reducir los costos laborales, será muy valioso para la empresa, lo cual es una razón importante para su desarrollo sostenible.

Por otro lado, la aparición de modelos grandes y la aparición de más herramientas de campo vertical en el futuro serán una bendición para los empleados. En el lado positivo, si los empleados pueden hacer un mejor uso de la colaboración hombre-máquina, puede crear más valor para la empresa.

Prevemos que habrá algunos cambios en la forma organizativa en el futuro. La mayoría de las empresas ahora tienen una estructura funcional, diferentes funciones atienden a los mismos clientes, hay muchos problemas de colaboración y comunicación entre funciones, lo que es un gran consumo para la empresa. Pero en el futuro, cuando los empleados individuales o los grupos tengan capacidades integrales con la ayuda de herramientas, la unidad organizativa inevitablemente será más pequeña y será más ágil, flexible y receptiva.

**Tecnología del papel: Me gustaría preguntarles a ustedes tres qué tipo de capacidades necesitan más las empresas en el contexto de la Guerra de los Cien Modelos. **

**Zhang Jie: **Para los fabricantes de modelos básicos a gran escala, lo que más necesitan es tener capacidades técnicas particularmente sólidas y únicas. Para superar a los modelos a gran escala de código abierto y luego tener algunas tecnologías únicas en multimodal o Razonamiento complejo sexo. Para los fabricantes de modelos a gran escala en el campo, los talentos compuestos son los más necesarios y las habilidades organizativas son muy importantes. Porque es necesario dar rienda suelta a la iniciativa y la creatividad de los talentos, conectarlo con algunas oportunidades comerciales de vanguardia y hacerle saber lo que necesitan los clientes. Además, debe haber algunas capacidades de ingeniería y capacidades algorítmicas.

Yu Zhonghai: Creo que los datos son muy importantes, especialmente para las empresas que quieren usar modelos grandes, los datos son realmente importantes. De hecho, los datos pronto se convertirán en una barrera para nosotros. Empresas como Zhongguancun Kejin, que proporcionan aplicaciones de modelos a gran escala, tienen su mayor ventaja en los datos.

**Wang Danjun: **En realidad, para la gran mayoría de las empresas, es más probable que sean consumidores de modelos grandes en el futuro, en lugar de creadores de modelos grandes. La adopción activa de modelos grandes puede acelerar en gran medida su proceso de gestión digital. . Es posible que tanto las organizaciones como las personas deban adoptar el cambio. Los líderes de todos los niveles deben aumentar su conciencia de aprovechar esta nueva oportunidad, y los empleados deben mantener capacidades de aprendizaje continuas y autodirigidas.

**Tecnología del papel: en este proceso, las empresas en el campo vertical tienen la ventaja del conocimiento de la industria. ¿Son más fáciles de atravesar los puntos de la tarjeta de datos de modelos grandes? **

Zhang Jie: Creo que el conocimiento de la industria debe analizarse en detalle, y puede haber varias formas que requieran atención especial.

La forma más obvia de conocimiento de la industria son algunos datos en documentos, que son expresiones simbólicas. Cómo desenterrar (palabras indicadoras) o cadenas de indicadores del documento es un tipo de problema que debe abordarse en la etapa actual. Muchas empresas tienen una gran cantidad de documentos y muchos de estos documentos están en formato PPT o PDF. Es necesario entender tanto su formato como su contenido.

Además del know-how de este tipo de industria, también existe el conocimiento oculto en la mente de los expertos de la industria o expertos en escenarios. Se le debe dar una herramienta, que se puede resumir en palabras. La plantilla es la industria. know-how con mayor densidad.

También hay un tipo relativamente oculto de conocimiento industrial, que es la sabiduría colectiva escondida en los registros del sistema. Después de extraer estos registros, es posible convertir el conocimiento disperso en conocimiento en cadena estructurado. Luego, de las miles de cadenas, se resume y se convierte en la mejor práctica bajo un escenario específico. Por ejemplo, los vendedores hacen muchas llamadas telefónicas todos los días y hay millones de registros de conversaciones acumulados todos los días. Al adaptarlos de acuerdo con diferentes resultados, como finalización de pedidos, orden de flujo o colgar llamadas, las mejores habilidades de habla para comercializar nuevos los productos pueden ser precipitados.práctica.

Estos tres tipos de preguntas son en realidad muy buenos conocimientos de la industria. También hay algunos desafíos técnicos aquí, como por ejemplo, cómo extraer palabras y cadenas de indicaciones de documentos y registros. doc2 y log2 son el foco de investigación en el que vale la pena invertir.

Yu Zhonghai: De hecho, Zhang Jie siempre tenía un dicho que me impresionó profundamente. Dijo que registrar las órbitas de los ocho planetas del sistema solar durante decenas de millones de años no es tan bueno como una ley abstracta de la gravedad que puede explicar mejor las cosas.La naturaleza.

Creo que esto es saber hacer. Las empresas en campos verticales tienen mucha experiencia en campos relacionados, déjame darte un ejemplo, después de que la inteligencia artificial se hizo popular, todos dijeron que hay una nueva profesión llamada ingeniero con un salario anual de un millón.

Es el ingeniero que fue a escribir. Entonces, ¿por qué son tan valiosos? También uso herramientas de pintura de inteligencia artificial. Una vez quise dibujar a un hombre con traje, pero probé muchas palabras clave y no funcionó. Más tarde, escribí "corbata", y la persona inmediatamente se puso un traje, y encontrarás que esta es la palabra mágica.

El modelo grande es un poco como un juego de probabilidad, en realidad tiene muchas probabilidades previas. En la escena de ahora, corbata es la palabra muy importante correspondiente a traje. Y el ingeniero sabe qué palabras clave pueden perturbar el modelo, y sabe qué tipo de cosas queremos escribir, ese es su valor. Entonces, si ponemos este asunto en el escenario de la aplicación, en realidad es el valor de las empresas en campos verticales. Entiende tanto la inteligencia artificial como el conocimiento de la industria.

Wang Danjun: En la actualidad, parece que, además de las empresas modelo básicas a gran escala, las empresas de campo vertical son el segundo lote de empresas a las que todos prestarán mucha atención en el mercado. Creo que será un gran desafío para ellos en el próximo período de tiempo. La experiencia de las empresas en campos verticales no necesariamente se transforma directamente en nueva creatividad bajo la bendición de las nuevas tecnologías. Necesito pasar más tiempo para aprender primero, para comprender cuál es la lógica subyacente de la operación del modelo grande, para aprender cómo puede ayudarme, incluso para ayudarme a extraer nuestro conocimiento o ayudarnos a brindar servicios a los clientes. Creo que durante algún tiempo, ellos enfrentarán este desafío primero. Sobre estas bases, encontrar nuevas oportunidades para crear valor para los clientes en base a estos modelos.

**Tecnología del papel: Ha habido algunas tendencias nuevas recientemente, como la desaceleración en la cantidad de visitantes de ChatGPT. En realidad, no existía como una súper entrada. Existe la opinión de que ChatGPT no puede representar el futuro de GPT, sino que es solo un producto presentado por OpenAI y Microsoft al mercado. ¿Qué pensáis vosotros tres sobre este punto de vista? **

Yu Zhonghai: Este punto de vista es bastante interesante. Personalmente, soy relativamente optimista, porque soy una persona que suele utilizar productos a gran escala. Y me gustaría agregar que el ChatGPT actual no es su forma final. Creo que Google Assistant (Asistente de Google) en el sistema Android de próxima generación de Google será compatible con su propio modelo grande, porque también es una entrada de tráfico muy importante.

Wang Danjun: Para muchas personas en la industria, todos son muy optimistas. Como producto nuevo, en esta etapa de desarrollo, naturalmente habrá cierta diferenciación. Los usuarios finales estarán interesados en dichas herramientas, dispuestos a probarlas y seguir utilizándolas. Incluso si la frecuencia de uso está disminuyendo y el grado de atención está disminuyendo, el comportamiento de los usuarios es difícil de cambiar.

Zhang Jie: Creo que la desaceleración de la tasa de crecimiento de ChatGPT es algo que ocurrirá tarde o temprano. Después de todo, el tráfico tiene un techo. Tarde o temprano, el tráfico alcanzará su punto máximo o el entusiasmo del público por los escenarios de aplicación del chat disminuirá.Después de todo, el chat no es una demanda rígida de alta frecuencia, pero le brinda una inspiración particularmente buena.

Por un lado, existen muchas aplicaciones alrededor de Chat, como generar imágenes, videos, informes, PPT, etc. a través del chat, como ChatDoc, ChatPdf y ChatBI. Otro escenario es el modelo de dominio grande que acabamos de mencionar, como el GPT financiero, el GPT legal y el GPT médico. Todos estos pueden ser nuevas entradas de negocios en el futuro.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)