¡Lanzamiento de Wenxin Big Model 4.0! Afirmaciones para comparar GPT 4.0

Fuente del artículo: Geek Park

Autor | Li Yuan

Editar | Jing Yu

Desde la búsqueda, la biblioteca hasta el análisis empresarial, los grandes modelos de IA se han convertido en la "línea vertical" de Baidu.

"¡Bienvenidos a la era de la IA generativa! **」

El 17 de octubre de 2023, vestido con una camisa blanca y pequeños zapatos blancos, Robin Li, fundador, presidente y director ejecutivo de Baidu, anunció la llegada de una nueva era al escenario.

En esta conferencia de prensa llamada "Generando el futuro", Robin Li lanzó oficialmente la última versión 4.0 del gran modelo de lenguaje de la compañía, Wenxin Big Model, y enseñó a las personas cómo usar palabras rápidas para hacer que se aplique el gran modelo mejorado de Wenxin, ayudando a las personas a usar el fondo de previsión de Beijing para comprar casas en Hebei, hacer anuncios y videos, y crear novelas en línea.

Robin Li comparó directamente el modelo Wenxin 4.0 con GPT-4 en la reunión|Baidu

En la reunión, **Robin Li declaró con confianza que las capacidades de la versión 4.0 del modelo Wen Xin son "no menos que GPT-4".

Al mismo tiempo, la afirmación de que "vale la pena reconstruir todas las aplicaciones con modelos grandes" anunciada hace medio año también tuvo resultados en la reunión del mismo día. Desde la búsqueda comercial principal hasta la biblioteca Baidu, el disco de red, el mapa y otras aplicaciones de bucket de la familia Baidu, se han conectado al modelo grande de Wenxin, mostrando mejores capacidades lógicas y de interacción.

En el lado B, Robin Li también expuso herramientas GBI (análisis generativo de negocios), así como asistentes de oficina con grandes capacidades de modelo "Ruliu".

Si la IA generativa activa todo el mundo de la tecnología, entonces Baidu puede ser el gigante que más se beneficie.

01 Wen Xin 4.0 Benchmark directo GPT-4

Tan pronto como comenzó la conferencia de prensa, Robin Li anunció por primera vez el lanzamiento de la versión 4.0 del modelo Wenxin.

Baidu divide cuatro criterios definitorios para las capacidades de los modelos grandes: comprensión, generación, lógica y memoria. Esta vez la gran actualización del modelo 4.0 de Wen Xin, la infraestructura sigue siendo la misma que la de las versiones 3.0 y 3.5, pero afirma haber mejorado mucho en términos de lógica y memoria.

Robin Li anuncia Wenxin Grand Model 4.0|Baidu

Según el CTO de Baidu, Wang Haifeng, la mejora de la comprensión y la capacidad de generación de Wenxin Big Model 4.0 es similar, mientras que la mejora de la lógica es 3 veces mayor que la de la comprensión, y la mejora de la memoria es 2 veces mayor que la de la comprensión**.

Cuatro capacidades diferentes pueden mejorar la eficiencia de diferentes escenarios de aplicación. Por estas habilidades, Li Yanhong lo mostró en el acto.

La comprensión es la base para que la IA conversacional ayude a los usuarios, y es muy importante en asuntos gubernamentales, marketing, servicio al cliente y otros campos.

En cuanto a la capacidad de comprensión, la escena utilizó una inversión del orden de las palabras y una expresión vaga (indicación) para poner a prueba la capacidad de la modelo: "Quiero volver a Chengde para comprar una casa, ¿puedo utilizar el préstamo del fondo de previsión?" ¿Y los procedimientos? Trabajo en Pekín".

Para entender esta frase, AI debe entender que "trabajar en Pekín" y "volver a Chengde para comprar una casa" en realidad tienen "un fondo de previsión de pago en Pekín, y el hukou está en Chengde". Este tipo de subtexto con características chinas puede dar las respuestas precisas que los usuarios necesitan. Y, efectivamente, Wen Xin entendió rápidamente la clave de la pregunta e hizo una respuesta correcta.

Robin Li explica las cuatro capacidades principales de AI|Baidu

La capacidad de generación puede mejorar principalmente la eficiencia del marketing de marca, la redacción publicitaria y el trabajo creativo.

En la escena, Li Yanhong mostró que, de acuerdo con una imagen, con indicaciones de lenguaje natural, puede realizar la transformación del fondo, el desenfoque del sujeto y generar carteles y redacción de acuerdo con la información del sitio web oficial.

Además de estos procesamientos de imágenes tradicionales, Baidu también demostró su capacidad para generar vídeo. A través del lenguaje natural, en la demostración en vivo, Wen Xin generó un anuncio de video oral humano digital casi sin demora. El video incorpora imágenes de productos, agrega mucho fondo de transición y una persona digital con traje aparece de vez en cuando para presentar las características del producto recopiladas del sitio web oficial.

Visualización en directo de las capacidades de generación de publicidad del Wenxin Model 4.0|Baidu

El efecto que solo podía lograrse mediante la cooperación de múltiples productos AIGC se integró a la perfección en esta pantalla. Una película publicitaria, 5 textos publicitarios y un póster tardaron menos de 3 minutos en generarse.

Razonamiento lógico, generalmente manifestado como una prueba de lógica matemática. En esta muestra, Baidu destacó su potencial en la educación.

Li Yanhong dio un problema de aplicación que involucraba la transformación de un volumen cónico en un volumen cúbico, y Wen Xin no solo dio la solución, sino que también resolvió el problema paso a paso y analizó los puntos de conocimiento involucrados en cada paso.

Usar la inteligencia artificial generativa para dar clases particulares a los niños con los deberes es más sencillo|Baidu

Para la visualización de la capacidad de memoria, la elección de Baidu es más especial.

Baidu eligió dejar que Wen Xin escribiera el esquema de una novela de artes marciales. Una vez completada la escritura, en el esquema original, deje que el modelo grande aumente la relación entre los personajes y aumente el conflicto dramático, para mostrar que el modelo grande puede recordar la configuración del esquema original y la capacidad del personaje después de agregar información compleja, sin usar la imaginación sin rumbo.

Baidu también compartió el soporte técnico para la mejora de las capacidades de los modelos grandes de Wenxin.

Baidu ha anunciado previamente que el modelo Wenxin es el primer modelo grande entrenado utilizando el clúster Wanka en China, y muchas personas especulan que se espera que la escala de parámetros del modelo Wenxin 4.0 supere el nivel del billón. Sin embargo, en esta conferencia, Baidu no hizo hincapié en el nivel de parámetros del modelo grande.

Además de la capacitación de Wanka, el CTO de Baidu también mencionó que el promedio semanal de estabilidad de la capacitación del algoritmo de Baidu ha superado el 98%, y se ha llevado a cabo la tecnología de mejora de puntos de conocimiento en términos de entrada y salida.

02 "Refactorización" de la familia Baidu

Aunque se muestran por separado, de hecho, la mayoría de las veces, las cuatro capacidades básicas de los modelos grandes se aplican en combinación.

En mayo, Baidu anunció el uso de modelos grandes para reconstruir las aplicaciones de Baidu. En esta conferencia, Baidu también demostró los últimos logros de la aplicación de Baidu de la reconstrucción de modelos grandes de Wenxin.

Entre ellos, el más sorprendente es la refactorización de la búsqueda.

En febrero, Microsoft lanzó New Bing basado en la tecnología de GPT para refactorizar su búsqueda. En su último testimonio, Nadella, de Microsoft, dijo que la participación de Microsoft en el mercado de búsquedas apenas ha cambiado desde que agregó capacidades de inteligencia artificial a Bing.

El Nuevo Bing de Microsoft lanzó principalmente un sistema de bots conversacionales que pueden chatear con el Nuevo Bing para hacer preguntas y obtener información integrada con enlaces. Bard de Google es similar.

Baidu utiliza la IA para reconstruir su principal búsqueda de negocio|Baidu

Sin embargo, la reconstrucción de búsqueda de Baidu esta vez profundiza en todo el sistema de búsqueda. Baidu lo describe como "máxima satisfacción, estimulación de recomendaciones y múltiples rondas de interacción".

La máxima satisfacción se refleja en la introducción de una pregunta en el cuadro de búsqueda, La búsqueda ya no puede dar un enlace, sino generar directamente la mejor respuesta.

En la presentación, Robin Li planteó la cuestión de cuál es la clasificación del valor agregado industrial de varios países en los últimos 20 años.

A diferencia de New Bing y Bard, que pueden dar una respuesta de datos vinculados, el nuevo Baidu puede dar directamente un gráfico de tabla dinámico, en forma de gráfico de barras, que muestra los valores de crecimiento industrial de diferentes países. Este gráfico es incluso dinámico, creciendo y cambiando con el tiempo.

La función de excitación de recomendación es algo equivalente a las preguntas relevantes del motor de búsqueda actual, que puede incitar al usuario a continuar entendiendo algunas preguntas relacionadas de acuerdo con la indicación, como "¿Cuál es la relación entre el valor agregado industrial y el PIB?" "¿Cuál es el impacto de la industria en el desarrollo de la economía nacional?".

Robin Li comparte la experiencia de la IA en la aplicación de buckets de la familia Baidu|Baidu

Y las múltiples rondas de interacción también son muy interesantes.

En la ola actual de emprendimiento de grandes modelos lingüísticos, uno de los muchos emprendedores está trabajando arduamente para usar, es decir, usar grandes modelos lingüísticos con motores de recomendación para realizar múltiples rondas de diálogo para brindar a los usuarios la mejor opción.

En septiembre, Baidu llevó a cabo el proyecto de competencia de emprendimiento Wenxin Cup, y el ganador del primer premio, Buysmart.AI, fue el líder en esta dirección. Los usuarios utilizan el lenguaje natural y los clics para aclarar constantemente sus necesidades, y Buysmart.AI utiliza el motor de recomendación para, en última instancia, recomendar los productos que los usuarios más necesitan.

La búsqueda reconstruida de Baidu añade directamente una función de dirección similar a la búsqueda.

En la demostración, el mensaje de búsqueda de Baidu pregunta "¿Dónde ir de excursión por Pekín?" Después de dar múltiples respuestas como Baihuashan, Haituo Mountain, etc., el motor de búsqueda permite a los usuarios hacer más clic para complementar y elegir su propia situación. Por ejemplo, si eliges agregar principiantes en senderismo de padres e hijos, el motor de búsqueda cambiará para recomendar lugares como Xishan y Baiwangshan, que son relativamente fáciles de escalar y más amigables para las actividades de padres e hijos.

Además de la reconstrucción de la búsqueda, Baidu también mostró la reconstrucción del disco de red de Baidu, el mapa de Baidu, la biblioteca de Baidu y otras aplicaciones.

La nube de Baidu Network Disk, un asistente personal en la nube, ya se ha lanzado antes. Como el primer asistente personal en la nube del mundo, actualmente cuenta con 20 millones de usuarios. Puede usar el lenguaje natural para comunicarse con el asistente, encontrar un video en la nube personal en una oración, comprender el contenido del video, encontrar un determinado contenido en el video, resumir la oración dorada del video, etc.

Baidu Map, según la promoción de Baidu, es el primer producto de mapas nativos de IA del mundo. Hablar con el asistente del mapa permite acceder a miles de servicios en un menú de varios niveles en un solo paso. También puede recomendar restaurantes con ubicaciones adecuadas, elegir entre el entorno del restaurante y, finalmente, reservar un taxi directamente.

Basándose en miles de millones de recursos de manuscritos anteriores, Baidu Wenku puede seleccionar directamente el tipo de artículo necesario, literatura académica seria o materiales para el público en general después de que los usuarios busquen información sobre temas específicos y generar artículos con un solo clic.

La biblioteca reconstruida de Baidu también agrega la función de generación de PPT, que puede comprender si las vistas se yuxtaponen o son progresivas, y cambiar el estilo de estilo PPT con un solo clic, afirma Baidu que "mucho más allá de otras herramientas de generación de PPT en el mercado".

03 Potencia Cara B

En esta demostración, Baidu también mostró algunas nuevas aplicaciones de la cara B.

Entre ellos, Baidu se centró en el lanzamiento de un producto de inteligencia empresarial. Baidu GBI, Inteligencia de Negocios Generativa.

Se trata de un nuevo producto lanzado por Baidu, que es el primer producto de inteligencia empresarial generativa en China, con la capacidad de soportar la interacción del lenguaje natural, el análisis entre bases de datos y el aprendizaje de conocimientos profesionales, acortando el trabajo de análisis de datos que los analistas de negocio pueden completar en unos pocos días o minutos.

Productos Baidu GBI dirigidos a la cara B|Baidu

En el comercial, la pregunta "¿Cuál es el costo estimado?" ¿Cuál es el precio mínimo sin perder dinero? El cliente nos pidió que completáramos la entrega en un plazo de 3 meses, ¿podemos hacerlo? ¿Cuánto tiempo es el más rápido? Si la competencia es correcta, como nuestro bajo precio, ¿qué se puede hacer?" Para esta serie de preguntas relacionadas con el análisis financiero, la interacción del proyecto y el análisis del usuario, Baidu GBI puede dar respuestas directamente a través del diálogo en lenguaje natural y generar respuestas ilustradas.

No se requiere ningún experto ni operaciones adicionales para acceder a los datos de las bases de datos y las tablas. Además, las empresas también pueden capacitarlos para que aprendan conocimientos profesionales y se conviertan en expertos de la industria.

Otro producto de la cara B es Ruliu. Después de utilizar la IA generativa para la refactorización, como Flow, puede generar actas de reuniones con un solo clic, resumiendo el contenido de miles de grupos de trabajo. Combinado con el sistema CRM de la empresa, proponga los antecedentes del proyecto y la discusión del proyecto para los gerentes. De acuerdo con el itinerario personal, planifique planes de trabajo, envíe invitaciones a reuniones, etc.

Además de habilitar la oficina, Baidu también demostró el empoderamiento de los grandes modelos para la conducción autónoma, la cabina inteligente y los proyectos de monitoreo inteligente del gobierno.

Desde su lanzamiento hace más de medio año, Wenxin ha iterado rápidamente para reconstruir las aplicaciones de Baidu y, al mismo tiempo, está estableciendo gradualmente el ecosistema de Wenxin.

Baidu también presentó la plataforma Lingjing recientemente lanzada en la conferencia de prensa. Ya sea que se trate de datos o aplicaciones personales o empresariales, se pueden convertir rápidamente en un complemento en la plataforma Lingjing, y la API se puede usar para acceder a la capacidad del modelo grande de Wenxin.

Robin Li predice la próxima era ecológica de la IA|Baidu

Baidu presentó que en el mes actual desde el lanzamiento de la plataforma Lingjing, 27,000 desarrolladores han solicitado instalarse, cubriendo más de 20 campos, incluida la consulta legal, la generación de currículums, la producción de mapas cerebrales, la práctica oral y otras aplicaciones nativas en varios escenarios. Se puede acceder fácil y rápidamente a los datos privados de la empresa con las capacidades de este modelo grande de última generación sin riesgo de fuga.

"China tiene una gran cantidad de escenarios de aplicación, y los usuarios chinos están naturalmente dispuestos a adoptar nuevas tecnologías, y con grandes modelos básicos avanzados, podemos construir un ecosistema de IA próspero y crear conjuntamente una nueva ronda de crecimiento económico". Dijo Li Yanhong.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)