Tencent Cloud Wu Yunsheng: el modelo general y el modelo de la industria no son opuestos

Fuente de la imagen: Generada por Unbounded AI

"Preferimos resolver el 100% del problema de un cliente que resolver el 70%-80% de 100 problemas de clientes".

El 7 de julio, en el Tencent Forum de la Conferencia Mundial de Inteligencia Artificial (WAIC) de 2023, cuando se le preguntó por qué se lanzó primero el modelo a gran escala orientado a la industria, Wu Yunsheng, vicepresidente de Tencent Cloud y director de Tencent Cloud Intelligence, respondió de esta manera .

Los modelos a gran escala son el tema más candente en el mundo de la IA este año. En comparación con Baidu, Ali y otros gigantes que lanzaron por primera vez el modelo subyacente a gran escala de uso general, Tencent centró su atención directamente en la industria: antes de que se celebrara WAIC, el 19 de junio, Tencent Cloud anunció oficialmente el MaaS (Modelo como servicio). ) panorama, que ha sido Las 10 principales industrias han exportado más de 50 soluciones, que cubren muchos escenarios diferentes, como el turismo cultural, las finanzas, los medios, la educación y los asuntos gubernamentales.

Naturalmente, la aplicación de escenarios y el aterrizaje se convirtieron en el tema a lo largo del Foro Tencent de WAIC.

"Los modelos grandes de propósito general no son la única dirección para las aplicaciones de modelos. Los modelos para industrias verticales se convertirán en el punto de inflexión del valor de los modelos grandes", predijo Li Qiang, vicepresidente de Tencent y presidente de negocios gubernamentales y empresariales de Tencent, en el foro.

Wu Yunsheng tomó como ejemplo el servicio de atención al cliente inteligente de la OTA (agencia de viajes en línea) y explicó que los usuarios a menudo tienen múltiples intenciones mezcladas en el proceso de comunicación real. En el proceso de comunicación, la intención también puede cambiar en cualquier momento.

"(El usuario) acaba de proponer reservar el hotel el día 10, y la máquina estaba a punto de responder, y de repente dijo, déjame ver el hotel el día 11". modelo a gran escala no puede perfectamente Para completar la tarea, es necesario reconstruir algunos modelos complejos en combinación con escenarios específicos.

Sin embargo, el modelo actual a gran escala de propósito general aún se encuentra en la etapa inicial de investigación y desarrollo, y enfrentará el problema del alto costo en aplicaciones industriales. Wu Yunsheng dijo que en algunos escenarios específicos, dado que el modelo grande de propósito general -El modelo a escala no puede satisfacer las necesidades al 100%, entonces "juzgando el nivel del costo de la solución, no tiene demasiado sentido". Aunque las soluciones para diferentes industrias y escenarios variarán mucho, no hay problema en mejorar la eficiencia de las empresas en más del 30% en general.

Wu Yunsheng, vicepresidente de Tencent Cloud y jefe de Tencent Cloud Intelligence. Fuente: Tencent

En el foro, Tencent Cloud también presentó las importantes actualizaciones recientes en torno al modelo grande. Sus dos bases técnicas principales, la red Xingmai y la base de datos vectorial, han experimentado actualizaciones de capacidad. La red informática de alto rendimiento Xingmai mejorada puede aumentar la utilización de la GPU en un 40 %, ahorrar costos de capacitación de modelos entre un 30 % y un 60 % y mejorar el rendimiento de comunicación de los modelos grandes de IA casi 10 veces.

Y solo el 4 de julio, Tencent Cloud lanzó oficialmente la base de datos de vectores nativos de IA. En comparación con el método tradicional, se utiliza para la clasificación, deduplicación y limpieza de datos de preentrenamiento de modelos grandes, y la base de datos puede lograr un 10 veces aumento de la eficiencia. Usarlo como una base de conocimientos externa para la inferencia de modelos puede reducir el costo entre 2 y 4 órdenes de magnitud.

En la WAIC de este año, también apareció un fenómeno interesante: en la reunión se dieron a conocer más de 30 modelos a gran escala industriales y de propósito general, y todos dijeron que hacían modelos a gran escala. El tema de la homogeneización se convirtió inmediatamente en el centro de la discusión: ¿sigue siendo significativo el espíritu empresarial en el campo de la IA? Cada gran fábrica tiene su propio gran modelo, si todo el mundo lo posee, ¿el gran modelo seguirá siendo un Game Changer?

Wu Yunsheng cree que en la etapa inicial del desarrollo de modelos grandes, no hay necesidad de apresurarse a emitir juicios sobre estos temas. "Me gustaría ver que cuando la industria esté en pleno florecimiento, a través de la combinación de tecnología e industria, explore varias posibilidades y mejore la eficiencia de las industrias y las industrias", dijo Wu Yunsheng.

Este juicio también proviene de su optimismo sobre el potencial comercial de los modelos grandes de IA. En la última ola de IA con avances de un solo punto, muchas empresas de IA cayeron en el dilema de la entrega e implementación de proyectos y privatizaciones, y no pudieron lograr la rentabilidad.

"En la era de los modelos grandes, la situación puede ser diferente a la anterior". Wu Yunsheng cree que con el desarrollo de la tecnología, incluido el desarrollo de la potencia informática subyacente y los chips GPU, los parámetros de los modelos que costaron cientos de miles de millones en el pasado son cada vez más pequeños; Tencent También hay mucho progreso en el refuerzo del entrenamiento y el refuerzo del razonamiento, y el costo está cayendo rápidamente. Por otro lado, las posibilidades en la aplicación de modelos grandes se expanden constantemente y el valor aumenta constantemente.

Hoy, Tencent está expandiendo su tecnología y ecología de aplicaciones en torno a modelos grandes de IA, y también está fortaleciendo su vínculo con la industria. El 6 de julio, la Organización de las Naciones Unidas para el Desarrollo Industrial y Huawei y otros socios anunciaron conjuntamente el establecimiento de la "Alianza mundial de inteligencia artificial industrial y de fabricación" en WAIC.

Wu Yunsheng también enfatizó que la actualización de la base técnica es "practicar la fuerza interna": "No importa si se trata de un modelo a gran escala de uso general o un modelo industrial a gran escala, debe tener las capacidades de soporte subyacentes , incluida una enorme potencia informática, datos, etc.".

"En la era de los modelos a gran escala, la apertura es muy importante y todos deberían estar abiertos. La tecnología subyacente cambia demasiado rápido y las capacidades de extensión son muy amplias. Cuando se combina con industrias específicas, habrá mucha investigación y costos de desarrollo". Wu Yunsheng dijo que solo a través de la apertura se pueden crear más industrias. Solo cuando se unen expertos y personal diverso se puede crear un ecosistema más saludable y crear más posibilidades.

El siguiente es el registro de la entrevista de los medios y Wu Yunsheng, editado por 36 Krypton:

**Medios:**Tencent Cloud lanzó un modelo a gran escala orientado a la industria al principio, en lugar de un modelo a gran escala de propósito general. ¿Es una consideración de ingresos?

Wu Yunsheng: Esto no tiene nada que ver con el costo y la inversión. Siempre hemos enfatizado que queremos resolver los problemas de los clientes. Preferimos resolver el problema de un cliente al 100% que resolver los problemas de 100 clientes en un 70%-80%. Podemos hacer que el problema sea menor, pero debemos resolver este problema.

Medios: Parece que el modelo general y el modelo de la industria están en oposición ¿Cómo ve la relación futura entre los dos?

Wu Yunsheng: En primer lugar, quiero dejar en claro que personalmente no me opongo a los dos. Una maqueta base es algo así como un pedestal que resuelve una necesidad sin una personalización especial. El modelo de la industria debe basarse en el modelo general para mejorar efectivamente la productividad y servir al público. Solo profundizando en la industria podemos resolver problemas particularmente importantes.

La función de mapa de Vincent también tendrá puntos de la industria muy detallados y específicos, por ejemplo, generar un mapa publicitario para un paquete, y algunos clientes tendrán necesidades especiales, como alguna certificación especial. Cuando se enfrentan a problemas prácticos, se requiere un enfoque diferente.

Medios:¿En qué áreas se centrará Tencent este año y qué objetivos de desarrollo tendrá? ¿Cuáles son las actualizaciones e iteraciones recientes?

**Wu Yunsheng:**Nuestra gran estrategia es enfocarnos en la implementación de problemas prácticos, con la esperanza de resolver el 100 % de los problemas de los clientes en cada escenario específico, en lugar de encontrar 100 productos para resolver el 70 %-80 % de los problemas. Por lo tanto, nos concentraremos en industrias específicas y trabajaremos con los clientes para resolver los problemas de la industria.

Por ejemplo, en la industria de viajes culturales, los clientes en el campo de la OTA (agencia de viajes en línea) combinarán sus propios escenarios comerciales, utilizarán tecnología modelo a gran escala en los procesos comerciales y utilizarán recursos relacionados con datos para afinar los escenarios comerciales a gran escala. modelo. En términos de desarrollo tecnológico, nuestro modelo y red de potencia de cómputo han sido iterados y actualizados, y continuaremos iterando tecnologías relacionadas.

**Medios: **Desde la última versión del modelo de la industria, ¿ha habido algún cambio significativo en la cantidad de empresas que acceden al modelo?

Wu Yunsheng: Tenemos muchos contactos con empresas y estudiaremos honestamente los escenarios reales de los clientes y cómo satisfacer las necesidades comerciales actuales. "Acceso" no está específicamente definido. Hay varias necesidades en el proceso de exploración. Tal vez usted suele ver AIGC con más frecuencia.

Digo algo un poco diferente. Tenemos un cliente de la empresa que hace software de nivel empresarial y necesita hacer formularios inteligentes. Por ejemplo, en una reunión de gestión, se agrega un nuevo formulario. Algunos elementos del formulario son obligatorios, otros no y algunos menús desplegables solo pueden seleccionar 4 o 5 opciones. Una vez completada la opción, debe convertirse en un proceso aprobado por A, B y C, y la aprobación de cada persona es diferente.

El método original es diseñar el formulario en el sistema con sus propias herramientas y códigos de lenguaje, compilar todo el proceso y luego llamar a la organización interna para realizar el proceso. Pero el requisito actual es tomar una foto y ponerla en el sistema, y describirla con el código del sistema (lenguaje de secuencias de comandos propio). Las personas solo necesitan comunicación y comunicación en lenguaje natural simple, como cuáles se requieren y cuáles no. requerido El primer paso Dónde ir, dónde ir en el segundo paso, use su propio lenguaje de sistema para diseñar el proceso de acoplamiento.

Este ejemplo es un requisito muy específico que no puede ser abordado completamente por un modelo general. Por lo tanto, tendremos intercambios profundos con las empresas para ver de qué campos se trata la tabla y cuál es el lenguaje de programación. La tecnología de propósito general puede resolver directamente el 60%-70% de los problemas, pero si los clientes quieren resolver el 100% de los problemas, necesitan una comunicación más profunda.

**Medios: **¿Cuánto se ahorrará la empresa con la implementación del modelo de industria a gran escala? En comparación con los modelos a gran escala de uso general, ¿en qué campos tendrán ventajas los modelos industriales a gran escala?

**Wu Yunsheng: **El costo ahorrado en realidad varía mucho en diferentes compañías y diferentes escenarios. Por ejemplo, en el escenario de servicio al cliente, hay una gran diferencia en el tamaño del servicio al cliente en sí mismo en la empresa y cuánto presupuesto tiene. En términos de experiencia real, creo que no hay problema para aumentar la eficiencia en más del 30%.

Cuando un modelo grande general se enfrenta a una industria específica, es posible que no pueda resolver completamente los problemas que enfrenta la industria. Por ejemplo, lo que necesita el servicio de atención al cliente no son simples chats de preguntas y respuestas, sino robots y modelos grandes que puedan comprender las intenciones humanas, buscar bases de datos, extraer la información requerida y luego combinarlos en texto comprensible para los humanos para las respuestas.

Lo más importante es que el proceso de comunicación real del usuario a menudo se mezcla con múltiples intenciones. Hay muchos requisitos en una descripción, y la intención puede cambiar en cualquier momento durante el proceso de comunicación. Es muy difícil y el proceso es muy complicado. especialmente al interactuar con el sistema del cliente modelo complejo. Este proceso no debe resolverse con un gran modelo general y debe combinarse con escenarios específicos.

Medios:¿Qué tipo de rango puede Tencent controlar el costo del modelo a gran escala de la empresa?

Wu Yunsheng: Hacemos hincapié en que a través de esta tecnología, las empresas pueden reducir costos, aumentar la eficiencia y mejorar la eficiencia de la producción, pero nunca diremos a qué nivel controlar los costos. Nuestro producto se lanzó hace menos de un mes y contamos con cierta cooperación en la etapa inicial, pero ciertamente no podemos brindar datos generales.

**36 Krypton:**En la última ola de IA, las aplicaciones tecnológicas encabezadas por CV (reconocimiento de imágenes) eran más aplicaciones de un solo punto, como llamar a la facturación de API, pero después de eso, las empresas comenzaron a trabajar en proyectos y la privatización lo hace difícil obtener ganancias. ¿Los grandes modelos de IA experimentarán lo mismo en el futuro?

Wu Yunsheng: Sigo siendo optimista. A juzgar por el momento actual, habrá desafíos relativamente grandes. Pero ya sea que espere medio año o prediga medio año en el futuro, el desarrollo de la tecnología es muy rápido, incluida la potencia informática subyacente y los chips GPU. El modelo grande solía ser un modelo con cientos de miles de millones de parámetros, pero con el desarrollo de la tecnología, los parámetros del modelo son cada vez más pequeños y la capacidad aún se mantiene en un nivel muy fuerte. Al mismo tiempo, hemos progresado mucho en el refuerzo del entrenamiento y el refuerzo del razonamiento, y el costo está cayendo rápidamente.

Por otro lado, en términos de aplicación, vemos más posibilidades, y la tendencia de aplicación y valor que se puede generar está en constante aumento.

**Medios: **¿Qué piensa del equilibrio entre el desarrollo de capacidades subyacente y la implementación de escenarios?

Wu Yunsheng: Nunca hemos querido mirar modelos grandes desde una sola perspectiva. Independientemente del modelo a gran escala de propósito general o del modelo industrial a gran escala, se requieren las capacidades de soporte subyacentes, que incluyen una gran potencia informática, datos, etc., que es la dimensión de la fuerza interna. La escena es otra dimensión. Para resolver un problema práctico, usa el 50% de la fuerza interna, el otro 30% de la fuerza externa y agrega otro 20%. En la ecología del modelo grande, miramos el problema desde diferentes perspectivas. Pero si solo hablas de fuerza interna, definitivamente no hay problema.

**Medios:**Muchos directores ejecutivos han mencionado que el modelo grande es un cambio de juego para la industria informática. Ahora que todos los principales fabricantes están lanzando modelos a gran escala, ¿es insostenible este juicio? ¿Necesitamos tantos modelos grandes de uso general o ya son redundantes?

Wu Yunsheng: Vea cómo definir un cambio de juego. En esta etapa, la industria de modelos a gran escala se encuentra en una etapa relativamente temprana y han surgido muchas posibilidades. Al mismo tiempo, vemos que los modelos grandes provocan cambios tecnológicos y tienen un gran potencial.

Mi punto de vista personal es que no hay necesidad de estar demasiado ansioso para sacar una conclusión ahora, me gustaría ver que en la etapa en que cien flores están floreciendo en la industria, a través de la combinación de tecnología e industria, varias posibilidades se exploran para mejorar la eficiencia de industrias e industrias.

**Medios: **La combinación de modelo e industria está en una etapa inicial ¿Qué problemas existirán en esta etapa? Existe la opinión de que, en comparación con el modelo a gran escala de propósito general, es posible que el costo del modelo industrial a gran escala no se optimice, pero puede ser mayor. ¿Qué opina de este punto de vista?

**Wu Yunsheng: **La tecnología de modelos grandes existe desde hace poco tiempo y se está desarrollando rápidamente. La comprensión de la industria del gran modelo aún se encuentra en una etapa temprana: no sé qué puede hacer el gran modelo y qué tan profundo puede combinarse con la industria. Efectivamente, hay cambios en la relación entre el modelo de industria y el modelo básico, así como el tema de los costos.

De hecho, existe la opinión de que si un modelo grande resuelve todos los problemas, el costo será menor, y también existe la opinión de que para cierta industria, no se necesita un modelo grande y se puede usar un modelo pequeño.

Este tema no puede ser juzgado desde una sola dimensión, sino que debe ser visto de manera objetiva y completa. He estado enfatizando que los modelos grandes generales pueden resolver problemas generales que no están estrechamente integrados con la industria. Pero si quieres ir más profundo, tienes que ir más lejos en la escena. Muchos problemas parecen ser los mismos, pero si profundiza, es posible que no resuelva el mismo problema. En este caso, no tiene mucho sentido juzgar el costo de la solución.

Medios: Desde la perspectiva de la industria, ¿cómo juzgar el incremento del mercado y el escenario incremental provocado por el cambio tecnológico a gran escala en todo el mercado de computación en la nube?

Wu Yunsheng: Se puede ver que después del advenimiento de la era de los modelos a gran escala, la demanda de potencia informática se ha promovido en gran medida, especialmente para la potencia informática relacionada con la IA. Sin embargo, en términos de la cuantificación específica de la computación en la nube, es difícil dar un número y aún se encuentra en un proceso de desarrollo continuo.

En términos de escenas, todos los ámbitos de la vida ahora combinan modelos grandes, y las escenas son muy ricas, incluidas las escenas generales y las escenas de la industria. Los escenarios comunes incluyen actualizaciones de conferencias inteligentes. El servicio al cliente Qidian de Tencent y el análisis Qidian publicado en 619 también están haciendo un trabajo inteligente. También hacemos algunos asistentes de código en la nube. En términos de aplicación universal y actualización de eficiencia, también hay muchas aplicaciones. Además, cada industria tiene aplicaciones en varias industrias, lo que también traerá mucha demanda.

Medios: Además de la escena de aterrizaje de modelos a gran escala, ¿Tencent brindará servicios para otras empresas de modelos a gran escala? El motor del volcán dijo que el 70% de los usuarios de modelos a gran escala están en el volcán.¿Cuáles son los datos de Tencent?

**Wu Yunsheng:**Proporcionamos una serie de capacidades o soporte en la nube para empresas unicornio u otras soluciones modelo a gran escala. Hemos lanzado HCC de computadora de alto rendimiento, base de datos vectorial y capacidades de aceleración mejoradas, que se pueden proporcionar a los fabricantes.

Además de las capacidades subyacentes, también contamos con una solución de ajuste fino integrada basada en el modelo grande de la plataforma TI, así como una serie de herramientas, procesos y soporte de servicios.

**Medios:**Muchos proveedores de servicios SaaS se han acumulado durante muchos años. ¿Nuestro MaaS (Modelo como servicio) es para ellos o para los principales clientes de la industria?

Wu Yunsheng: Estos son nuestros clientes.

**Medios: combinar ** con la industria es el enfoque actual de Tencent. Ayer Huawei estableció una alianza ¿Significa que la competencia es más fácil que formar una contienda entre gigantes?

Wu Yunsheng: No veo este problema de esa manera. Creo que la apertura es muy importante en la era de los modelos grandes, y todo el mundo debería estar abierto. La tecnología subyacente cambia demasiado rápido, y la capacidad de extensión de la tecnología es muy amplia, y costará mucho dinero integrarla en industrias específicas. En este caso, solo la apertura puede generar el mayor valor. Solo al abrirse y permitir que se unan más expertos de la industria y personal en diversos roles, todo el ecosistema puede ser más saludable y crear más posibilidades.

Medios: ¿La apertura a cada empresa es la misma?

Wu Yunsheng: La apertura que mencioné se refiere al desarrollo de capacidades y la apertura ecológica. Por ejemplo, construir un gran modelo financiero no requiere que una persona resuma todos los grandes modelos financieros, diferentes personas tienen una gran experiencia en diferentes campos, y construir juntos es una especie de apertura. Abrirse directamente a los clientes de la industria también es un tipo de apertura.

Además, en función de las capacidades proporcionadas por el modelo grande, los socios actualizan la aplicación de herramientas de eficiencia o soluciones industriales y combinan diferentes formas de aplicaciones. En términos de fortalecer la fuerza interna del modelo grande, los socios están floreciendo y todos presentan diferentes aplicaciones, lo que también es una especie de apertura.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)