El viento comienza al final de Qingping, y los accidentes y las inevitabilidades del destino a menudo se entrelazan.
2019 es el año más oscuro de toda la historia de la inteligencia artificial. Tras la derrota de Lee Sedol por parte de AlphaGo en 2016, la aparición de la arquitectura Tansformer en 2017, que condujo a una explosión tecnológica a gran escala, y el auge empresarial en 2018. En 2019, el reflujo del capital, el período de cuello de botella técnico y la dificultad de aterrizar escenas abrieron una "era caótica" en la historia de la inteligencia artificial.
Nadie sabe cuándo llegará la IA general, al igual que un trisolariano no sabe cuándo saldrá el sol. **
Ese año, un gran número de empresas de IA cayeron en despidos, cadenas de capital rotas y una producción difícil de productos, y quedaron pocas para persistir.
Pero también fue en 2019 cuando se comenzó a concebir una nueva esperanza para la IA: OpenAI aceptó la inversión y la profunda cooperación de Microsoft con ella en julio, y fue a partir de ese año que se comenzó a desarrollar GPT-3, que ahora es impactante para el mundo; Baidu, el primero en establecer una estrategia de IA en China, ha llevado a cabo un ajuste de personal de medio año desde principios de año, y ahora parece que la reorganización de las tropas parece haber abierto un período de cuatro años de perseverancia.
En 2019, Wang Haifeng fue ascendido a CTO del Grupo y continuó desempeñándose como jefe general del Sistema de Plataforma Tecnológica de IA (AIG) y el Sistema de Tecnología Básica (TG), que son las bases técnicas más importantes de Baidu; Shen fue ascendido a vicepresidente sénior, responsable del grupo de negocios del ecosistema móvil, y luego transferido a Baidu Intelligent Cloud en 2022, convirtiéndose en el pionero de la segunda curva de crecimiento de Baidu. Entre las nuevas fuerzas introducidas en 2019, He Junjie es el único vicepresidente de Baidu posterior a los años 80, primero responsable de fusiones y adquisiciones de inversiones e inversiones estratégicas, y luego reutilizado, responsable del grupo de negocios ecológicos móviles vacante de Shen Jing, con más poder real.
Ha llegado el momento de 2023, y la capacidad de Transformer finalmente ha roto el techo de OpenAI en este año, avanzando a un nuevo nivel, y el avance de la tecnología ha convertido a OpenAI en la empresa más observada del mundo. Microsoft eclipsó la brillantez tecnológica de Google.
** En los últimos cuatro años, el negocio principal de Baidu ha formado una estructura triangular liderada por la nube inteligente Shen Tian, He Junjie es responsable de la ecología móvil, Wang Haifeng presiona la tecnología de matriz, y Baidu finalmente terminó el período de silencio y comenzó a convertir la defensa en ataque, y la acción es continua. **
"Hacer todas las aplicaciones de nuevo" es la primera espada brillante después de medio año de acumular poder, y ahora Baidu es como un planeta, a punto de encontrarse con un enorme "campo gravitacional tecnológico" y cambiar completamente su órbita.
Víspera de la aparición de los modelos grandes
En 2017, Google propuso la arquitectura Transformer en un documento llamado "Attention Is All You Need" para reemplazar los modelos tradicionales de bucle RNN y CNN, que mostró que la precisión de entrenamiento del Transformer es mayor que la de todos los modelos anteriores, el tiempo de entrenamiento es significativamente menor que el modelo anterior y el efecto de entrenamiento también es bueno cuando el contenido del conjunto de entrenamiento es pequeño.
Desde entonces, la arquitectura Transformer ha sido rápidamente aceptada y aplicada en el campo de la PNL y la CV, especialmente en el campo de la PNL, donde el mecanismo de atención permite a las máquinas comprender la semántica con mayor precisión y generarla, así como reducir la duplicación de información.
Como una de las primeras empresas en descubrir y seguir la ruta de la tecnología Transformer, Baidu ha estado investigando en el campo de la PNL durante más de diez años y ha formado un equipo de PNL formado por los mejores expertos como Wang Haifeng, Wu Tian, Wu Hua, etc.
Wang Haifeng
En ese momento, la primera tarea importante del equipo de PNL fue construir la traducción de Baidu. Wang Haifeng aplica audazmente el aprendizaje profundo y las redes neuronales a la traducción para mejorar la comprensión del contexto por parte de la máquina y formar una traducción más fluida. Este audaz intento también convirtió a Baidu Translate en el primer sistema de traducción compatible con más de 200 idiomas, incluso un año y 3 meses antes que Google.
** Este es también el prototipo de la capacidad de comprensión en las cuatro capacidades básicas del gran modelo "comprensión, generación, lógica y memoria". **
Pero Wang Haifeng siente que la PNL no es suficiente. Fue especialmente a la oficina de Li Yanhong para informar y propuso la próxima "Normandía desembarcada": el reconocimiento de voz. Su razonamiento es que la tecnología de reconocimiento de voz está a punto de alcanzar el punto crítico de la industrialización, y una vez que se abra paso, pronto se comercializará a gran escala.
Con su propio juicio sobre la tecnología, Li Yanhong decidió apoyar a Wang Haifeng nuevamente y estableció sucesivamente el "departamento de reconocimiento de voz", el "departamento de reconocimiento de imágenes" y el "departamento de gráficos de conocimiento" paralelos al departamento de PNL.
La operación de Wang Haifeng desconcertó a muchos estudiantes de Baidu: "Estas tecnologías no tienen nada que ver con los productos actuales de Baidu, ¿es para ahorrar para el Año Nuevo para crear tantos departamentos en un solo cerebro?" "
En ese momento, Wang Haifeng vio que los datos de búsqueda tienen un apoyo muy fuerte para la lógica de la formación de modelos grandes. "Baidu tiene el motor de búsqueda más grande del mundo, que no solo tiene una gran puntualidad de la información, sino que también tiene una alta tasa de precisión, lo que puede construir el gráfico de conocimiento más completo", explicó Wang en una entrevista pública. **
Antes de crear Wenxin, Baidu precipitó un gráfico de conocimiento multiheterogéneo a gran escala con más de 5 mil millones de entidades y 55 mil millones de hechos, y pudo obtener una comprensión unificada del mundo a través del lenguaje, la audición, la visión, etc. Su modelo de mejora del conocimiento lanzado en 2021, ERNIE (Wenxin) 3.0, es el predecesor de Wenxin Yiyan, y el proyecto es el principal responsable de Wu Tian.
Wu Tian
En 2019 nuevamente, se lanzó Baidu Wenxin 1.0 y se iteraron 3 versiones en 4 años. En noviembre de 2022, Wu Tian anunció simultáneamente 11 modelos de industria que Wenxin ha acumulado en la cumbre pública, que cubren la electricidad, el gas, las finanzas, la industria aeroespacial y otros campos, y la ecología industrial se ha formado inicialmente.
** Todo esto ha presagiado y allanado el camino para que Baidu publique preventivamente las palabras de Wen Xin. El 16 de marzo, después de que se publicaron las palabras de Wen Xin, Baidu volvió a ser el centro de atención, pero más que afirmado, era dudoso. **
"En el caso de una demanda tan fuerte del mercado, sigue siendo muy significativo quién lo hace primero", dijo una vez Li Yanhong en una entrevista, incluso si el producto no está completamente maduro, pero aún debe lanzarse: "Después de la publicación de las palabras de Wenxin, innumerables personas, personas que no han estado en contacto conmigo en el pasado o que están lejos de mí en la industria se preguntan, ¿cómo podemos cooperar con Baidu, cómo probarlo lo antes posible?"
** Desde un punto de vista técnico, los modelos grandes son iteraciones de alta velocidad de "cada vez más usados". ** "Durante la prueba interna, el empleado preguntó, ¿cómo puede Wen Xin esconder la cabeza y escribir mal un poema? Dije que esperara, supongo que puedo aprenderlo pasado mañana, y se podrá usar al día siguiente, y el progreso del gran modelo también es un proceso de aprendizaje continuo", dijo Wang Haifeng con una sonrisa.
En medio año, Wenxin Yiyan ha llevado a cabo tres iteraciones de la versión 3.0 a la 3.5 y luego a la versión 4.0, según Wang Haifeng en la reunión, la escala de usuarios de Wenxin Yiyan ha alcanzado los 45 millones, 54,000 desarrolladores, 4,300 escenarios, 825 aplicaciones y más de 500 complementos.
El agua regada en PNL, el fertilizante aplicado, finalmente marcó el comienzo de una cosecha abundante en 2023 y, como dijo Li Yanhong, el camino del desarrollo tecnológico es el proceso de "dos vidas, dos vidas tres, tres vidas y todas las cosas".
Fuerza interna detrás de los grandes modelos
Después del estallido de la inteligencia artificial general, la atención de la computación en la nube y la atención de las empresas alcanzó su punto máximo, y también llegó el "momento iPhone".
La aparición de grandes modelos, lo que resulta en una enorme brecha de poder de cómputo, la computación en la nube no solo para que el modelo grande brinde soporte de poder de computación en la nube, sino también el mejor punto de aterrizaje para las grandes empresas de aterrizaje de modelos, ya sea Baidu o cualquier empresa con un modelo grande, cuando salga el modelo grande, el siguiente enfoque es promover en el mercado, dejar que las empresas lo usen.
** Para Baidu, tal carga recae sobre los hombros de Shen Shu. **
Shen tembló
Entre los seis líderes de grupos empresariales de Baidu, a excepción del director de tecnología Wang Haifeng, Shen es el único vicepresidente sénior. Aunque ambos provienen de una formación técnica, a diferencia del papel de "ingeniero" de Wang Haifeng, Shen ha sido responsable del crecimiento de negocios clave desde que se unió a Baidu.
En los 10 años transcurridos desde que se unió a Baidu, Shen ha integrado sucesivamente el sistema de publicidad y ha mejorado la capacidad de monetización del sistema; Combine los flujos de búsqueda y alimentación; Integra el grupo de negocios del ecosistema móvil actualizado por búsqueda para completar el territorio del ecosistema móvil de Baidu.
** Si Wang Haifeng creó un cuchillo afilado, entonces Shen Shu es un funcionario pionero que puede usar este cuchillo afilado para abrir territorio, en palabras de Li Yanhong, "atrévete a pelear una batalla dura y puede ganar una batalla". **
En mayo de 2022, Shen Jixing fue nombrado presidente del Grupo de Negocios Baidu Intelligent Cloud (ACG). Para Baidu, no apostó completamente por la computación en la nube al principio, pero fue precisamente con el desarrollo continuo de la tecnología de inteligencia artificial que Baidu se dio cuenta de las deficiencias de la computación en la nube y comenzó a cultivar en secreto la segunda curva de crecimiento.
** Debido a la falta de la ventaja de ser el primero en moverse, el objetivo de Baidu Cloud en los últimos 10 años es muy claro, no competir con las "armas viejas" en la escala de la capa IaaS, sino a través de la combinación de PaaS + SaaS y capacidades inteligentes, para jugar a la diferenciación y cortar la digitalización empresarial en pequeñas batallas. **
En la Conferencia Mundial de Baidu 2023, Shen propuso una vez más la estrategia de "integración de inteligencia en la nube": "La profunda combinación de inteligencia artificial y computación en la nube es la clave para que las empresas implementen rápidamente aplicaciones nativas de IA. En la actualidad, todas las aplicaciones y servicios del Grupo Baidu se ejecutan en Baidu Intelligent Cloud basado en la arquitectura tecnológica 'Cloud-Intelligence Integration'".
** De acuerdo con la observación del cono óptico, el núcleo de la estrategia de integración de inteligencia en la nube es que, por un lado, confiando en Baidu Intelligent Cloud, puede proporcionar rápidamente a las empresas un conjunto completo de servicios de gran modelo; Por otro lado, los modelos grandes también empujan el umbral para que la digitalización de las empresas sea más bajo. **
En los cinco meses posteriores a la adquisición de ACG, Shen integró rápidamente la "superfábrica de servicios de grandes modelos": Wen Xin Qianfan en respuesta a las necesidades básicas de las empresas en la era de los grandes modelos, y dividió a los usuarios en cinco categorías de usuarios según sus necesidades.
En primer lugar, en vista de la brecha de demanda causada por los recursos de potencia de cómputo, la plataforma Qianfan proporciona varios tipos de potencia de cálculo heterogénea. Por ejemplo, en el enlace de capacitación más costoso, a través de la capacitación paralela distribuida y las capacidades de interconexión a nivel de microsegundos, la plataforma Qianfan puede lograr una tasa de aceleración de capacitación del 95 % y una relación de tiempo de capacitación efectiva del 96 %, lo que reduce en gran medida la potencia informática y los costos de tiempo del cliente.
En segundo lugar, a nivel de modelo, para los clientes que desean llamar directamente a los modelos grandes existentes, las empresas pueden llamar rápidamente a varios modelos grandes, incluido Wen Xin Yiyan, mientras que la plataforma Qianfan proporciona herramientas como la mejora del chino, la mejora del rendimiento y la mejora del contexto. Según Shen Ji, la plataforma Qianfan ha atendido a más de 17.000 clientes.
** Para los clientes con necesidades de desarrollo secundarias, la plataforma Qianfan proporciona una cadena de herramientas de ciclo de vida completo, como el reentrenamiento, el ajuste, la evaluación y la implementación de modelos grandes, con el mayor número de 41 conjuntos de datos de la industria de alta calidad, y los optimiza rápidamente para sus propios escenarios comerciales.
La conferencia también llevó a cabo una demostración práctica de cómo desarrollar rápidamente aplicaciones de preguntas y respuestas de conocimiento para Sany Heavy Industry basadas en el marco de generación de mejora de recuperación (RAG, Retri Augmented Generation): simplemente seleccione el marco RAG preestablecido en el entorno de trabajo de aplicaciones nativas de Qianfan AI y configure los parámetros correspondientes para realizar rápidamente el desarrollo y lanzamiento de la aplicación inteligente de servicio al cliente en el sitio web oficial de Sany Heavy Industry.
** Shen dijo que la construcción de un "asistente tan pequeño", incluso si necesita procesar documentos de miles de miles de palabras, el costo es de solo unos pocos cientos de yuanes; Después de eso, cada consulta del usuario solo cuesta unos pocos centavos. **
Durante mucho tiempo, la industria a gran escala, la manufactura y la agricultura han sido áreas profundas de digitalización, y la razón principal es que la complejidad de la industria ha llevado a un alto umbral para la digitalización y es difícil de aterrizar.
Sin embargo, a través del modelo grande, no solo se reduce el umbral de uso, sino que también se reduce el costo de uso. No es necesario construir ningún sistema nuevo, ni requiere participación manual, es un método de aplicación más avanzado de componentes técnicos, ** la combinación de los dos, pero también gira el volante de inteligencia de la nube, acumulándose gradualmente. **
Retos de innovación para modelos grandes
El pasado es una conclusión inevitable, pero el futuro puede cambiar.
Todos los proveedores con modelos grandes han encontrado oportunidades en la capa de aplicación. Microsoft comenzó a trabajar en la línea completa de productos, incluidos los sistemas Bing, Office y Windows, en marzo, y Ali Daniel Zhang dijo: "Debemos usar el modelo grande para rehacer todos los productos", pero esta frase, simple de decir, es el mayor desafío de innovación en la era de los modelos grandes.
¿Cómo refactoriza la IA las aplicaciones? Esto requiere no solo capacidad empresarial, sino también imaginación, y ante una nueva era de IA, Baidu también ha puesto el testigo en manos de los jóvenes. **
Después de mayo de 2022, Shen Jie fue sucedido como jefe del grupo empresarial MEG por He Junjie, el vicepresidente de la generación posterior a los 80 introducido en el plan de construcción de escalón de talento de Baidu. Si Shen Zhan es una "facción de guerra dura", entonces He Junjie es una verdadera "facción joven y fuerte". Como dijo Ren Zhengfei, es necesario "dejar que aquellos que escuchan el cañón comanden la batalla".
** La refactorización de la aplicación no está rota ni en pie, por el contrario, Baidu es de hecho "particularmente despiadado" consigo mismo. **
En la Conferencia Mundial de Baidu, centrada en la "ecología", He Junjie entregó las respuestas de "ecología móvil", "ecología de contenidos" y "ecología empresarial".
Entre ellos, el ecosistema móvil abarca aplicaciones nativas de IA como "New Search", "New Wenku", Wenxin Yiyan APP y el comercio electrónico de Baidu "Huibexing"; A nivel ecológico de contenidos, una serie de aplicaciones como Baidu APP "AI Editor" potencian el ecosistema de creadores; A nivel de ecología empresarial, se lanzó la plataforma de marketing AI Native "Light". Además, He Junjie también anunció la ecología del plug-in Wen Xin Yiyan: "Spirit Matrix", que ahora está completamente abierta.
**La nueva búsqueda definida por Baidu es exactamente la lógica de cálculo de cajas propuesta por Robin Li en 2010. **Tiene tres características: máxima satisfacción, estimulación de recomendación e interacción multi-ronda. Es decir, cuando los usuarios buscan preguntas, "ya no te dan un montón de enlaces", sino que a través de la comprensión del contenido, generan respuestas multimodales como texto, imágenes y gráficos dinámicos; La estimulación de recomendaciones puede recomendar los problemas que preocupan a los usuarios en tiempo real; En respuesta a necesidades complejas, la interacción de varias rondas puede satisfacer las necesidades de búsqueda personalizadas de los usuarios a través de indicaciones, ajustes, etc.
El proceso de la demanda a la coincidencia, también conocido como búsqueda "de extremo a extremo", pero esto romperá el modelo de clasificación de ofertas en el que alguna vez confió Baidu, y los ingresos publicitarios siempre han sido la mayor fuente de ingresos de Baidu.
Las capacidades de AIGC han dado nueva vitalidad a algunas de las antiguas aplicaciones de Baidu, como los documentos de Baidu actualizados de herramientas de recuperación de contenido a herramientas de producción de contenido, y Baidu Editor se ha convertido en una herramienta de generación de contenido; La otra parte también explora nuevos escenarios, como la generación integral de contenido de marketing de Baidu Diager a través de AIGC y la entrega inteligente, combinada con la plataforma digital de generación humana "Huaicast Star" para ayudar a los comerciantes a expandir su alcance y escenarios de marketing.
** Al mismo tiempo, con el aterrizaje gradual de las aplicaciones de modelos grandes, Baidu también se dio cuenta de que confiar en su propia fuerza es en última instancia limitado, y que el infinito es vertical y horizontal. **
Este es el valor de Spirit Matrix, una plataforma que reduce en gran medida el costo del desarrollo de plug-ins de gran tamaño, permitiendo que personas comunes con creatividad e ideas se conviertan en desarrolladores de plug-ins. Li Yanhong dijo que el complemento es una aplicación nativa de IA especial, y también es la aplicación nativa de IA con el umbral más bajo y la más fácil de comenzar.
La característica del plug-in es la "interfaz universal", que puede conectar búsquedas, mini programas, plataformas de contenido o cualquier entrada, de modo que el uso de "plug and play" permite a los desarrolladores y creadores unirse rápidamente al ecosistema.
He Junjie reveló que un mes después de su lanzamiento, Lingjing Matrix ha recibido 27,000 solicitudes de registro de desarrolladores, que cubren más de 20 campos verticales, incluidas empresas, instituciones y desarrolladores individuales.
Un informante de Baidu le dijo a Light Cone Intelligence: "El complemento de modelo grande de la capa de aplicación toma Lingjing como la plataforma principal y se colocará en Wenxin Yiyan y la aplicación Baidu. Qianfan está más en el nivel inferior, y el reino espiritual está más arriba, e incluso es posible reemplazar a Qianfan en el nivel de complementos de aplicaciones en el futuro".
Conclusión
En 2016, Li dijo que Baidu estaba a solo 30 días de la bancarrota. "El dinosaurio pisó una pala en su pie, y su cerebro tardó horas en reaccionar. Así que no importa cuán grandes crezcan los dinosaurios, se extinguirán".
Baidu no quiere ser un dinosaurio, y a nivel de conciencia, siempre piensa a diez pasos de distancia.
Afortunadamente, Baidu esperó la nueva era y superó los momentos más difíciles; Desafortunadamente, al comienzo de esta nueva era, cualquier arrebato minucioso parecerá insignificante bajo la larga competencia.
Pero obtener un nuevo boleto es al menos un nuevo comienzo.
Referencia:
Expertos transfronterizos en diversos campos de la inteligencia artificial - Transformer"
El viaje es largo: esculpen almas para la inteligencia artificial
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
¿Puede la IA generativa generar el futuro de Baidu?
Fuente original: Light Cone Intelligence
Autor: Liu Yuqi
El viento comienza al final de Qingping, y los accidentes y las inevitabilidades del destino a menudo se entrelazan.
2019 es el año más oscuro de toda la historia de la inteligencia artificial. Tras la derrota de Lee Sedol por parte de AlphaGo en 2016, la aparición de la arquitectura Tansformer en 2017, que condujo a una explosión tecnológica a gran escala, y el auge empresarial en 2018. En 2019, el reflujo del capital, el período de cuello de botella técnico y la dificultad de aterrizar escenas abrieron una "era caótica" en la historia de la inteligencia artificial.
Nadie sabe cuándo llegará la IA general, al igual que un trisolariano no sabe cuándo saldrá el sol. **
Ese año, un gran número de empresas de IA cayeron en despidos, cadenas de capital rotas y una producción difícil de productos, y quedaron pocas para persistir.
Pero también fue en 2019 cuando se comenzó a concebir una nueva esperanza para la IA: OpenAI aceptó la inversión y la profunda cooperación de Microsoft con ella en julio, y fue a partir de ese año que se comenzó a desarrollar GPT-3, que ahora es impactante para el mundo; Baidu, el primero en establecer una estrategia de IA en China, ha llevado a cabo un ajuste de personal de medio año desde principios de año, y ahora parece que la reorganización de las tropas parece haber abierto un período de cuatro años de perseverancia.
En 2019, Wang Haifeng fue ascendido a CTO del Grupo y continuó desempeñándose como jefe general del Sistema de Plataforma Tecnológica de IA (AIG) y el Sistema de Tecnología Básica (TG), que son las bases técnicas más importantes de Baidu; Shen fue ascendido a vicepresidente sénior, responsable del grupo de negocios del ecosistema móvil, y luego transferido a Baidu Intelligent Cloud en 2022, convirtiéndose en el pionero de la segunda curva de crecimiento de Baidu. Entre las nuevas fuerzas introducidas en 2019, He Junjie es el único vicepresidente de Baidu posterior a los años 80, primero responsable de fusiones y adquisiciones de inversiones e inversiones estratégicas, y luego reutilizado, responsable del grupo de negocios ecológicos móviles vacante de Shen Jing, con más poder real.
Ha llegado el momento de 2023, y la capacidad de Transformer finalmente ha roto el techo de OpenAI en este año, avanzando a un nuevo nivel, y el avance de la tecnología ha convertido a OpenAI en la empresa más observada del mundo. Microsoft eclipsó la brillantez tecnológica de Google.
** En los últimos cuatro años, el negocio principal de Baidu ha formado una estructura triangular liderada por la nube inteligente Shen Tian, He Junjie es responsable de la ecología móvil, Wang Haifeng presiona la tecnología de matriz, y Baidu finalmente terminó el período de silencio y comenzó a convertir la defensa en ataque, y la acción es continua. **
"Hacer todas las aplicaciones de nuevo" es la primera espada brillante después de medio año de acumular poder, y ahora Baidu es como un planeta, a punto de encontrarse con un enorme "campo gravitacional tecnológico" y cambiar completamente su órbita.
Víspera de la aparición de los modelos grandes
En 2017, Google propuso la arquitectura Transformer en un documento llamado "Attention Is All You Need" para reemplazar los modelos tradicionales de bucle RNN y CNN, que mostró que la precisión de entrenamiento del Transformer es mayor que la de todos los modelos anteriores, el tiempo de entrenamiento es significativamente menor que el modelo anterior y el efecto de entrenamiento también es bueno cuando el contenido del conjunto de entrenamiento es pequeño.
Desde entonces, la arquitectura Transformer ha sido rápidamente aceptada y aplicada en el campo de la PNL y la CV, especialmente en el campo de la PNL, donde el mecanismo de atención permite a las máquinas comprender la semántica con mayor precisión y generarla, así como reducir la duplicación de información.
Como una de las primeras empresas en descubrir y seguir la ruta de la tecnología Transformer, Baidu ha estado investigando en el campo de la PNL durante más de diez años y ha formado un equipo de PNL formado por los mejores expertos como Wang Haifeng, Wu Tian, Wu Hua, etc.
En ese momento, la primera tarea importante del equipo de PNL fue construir la traducción de Baidu. Wang Haifeng aplica audazmente el aprendizaje profundo y las redes neuronales a la traducción para mejorar la comprensión del contexto por parte de la máquina y formar una traducción más fluida. Este audaz intento también convirtió a Baidu Translate en el primer sistema de traducción compatible con más de 200 idiomas, incluso un año y 3 meses antes que Google.
** Este es también el prototipo de la capacidad de comprensión en las cuatro capacidades básicas del gran modelo "comprensión, generación, lógica y memoria". **
Pero Wang Haifeng siente que la PNL no es suficiente. Fue especialmente a la oficina de Li Yanhong para informar y propuso la próxima "Normandía desembarcada": el reconocimiento de voz. Su razonamiento es que la tecnología de reconocimiento de voz está a punto de alcanzar el punto crítico de la industrialización, y una vez que se abra paso, pronto se comercializará a gran escala.
Con su propio juicio sobre la tecnología, Li Yanhong decidió apoyar a Wang Haifeng nuevamente y estableció sucesivamente el "departamento de reconocimiento de voz", el "departamento de reconocimiento de imágenes" y el "departamento de gráficos de conocimiento" paralelos al departamento de PNL.
La operación de Wang Haifeng desconcertó a muchos estudiantes de Baidu: "Estas tecnologías no tienen nada que ver con los productos actuales de Baidu, ¿es para ahorrar para el Año Nuevo para crear tantos departamentos en un solo cerebro?" "
En ese momento, Wang Haifeng vio que los datos de búsqueda tienen un apoyo muy fuerte para la lógica de la formación de modelos grandes. "Baidu tiene el motor de búsqueda más grande del mundo, que no solo tiene una gran puntualidad de la información, sino que también tiene una alta tasa de precisión, lo que puede construir el gráfico de conocimiento más completo", explicó Wang en una entrevista pública. **
Antes de crear Wenxin, Baidu precipitó un gráfico de conocimiento multiheterogéneo a gran escala con más de 5 mil millones de entidades y 55 mil millones de hechos, y pudo obtener una comprensión unificada del mundo a través del lenguaje, la audición, la visión, etc. Su modelo de mejora del conocimiento lanzado en 2021, ERNIE (Wenxin) 3.0, es el predecesor de Wenxin Yiyan, y el proyecto es el principal responsable de Wu Tian.
En 2019 nuevamente, se lanzó Baidu Wenxin 1.0 y se iteraron 3 versiones en 4 años. En noviembre de 2022, Wu Tian anunció simultáneamente 11 modelos de industria que Wenxin ha acumulado en la cumbre pública, que cubren la electricidad, el gas, las finanzas, la industria aeroespacial y otros campos, y la ecología industrial se ha formado inicialmente.
** Todo esto ha presagiado y allanado el camino para que Baidu publique preventivamente las palabras de Wen Xin. El 16 de marzo, después de que se publicaron las palabras de Wen Xin, Baidu volvió a ser el centro de atención, pero más que afirmado, era dudoso. **
"En el caso de una demanda tan fuerte del mercado, sigue siendo muy significativo quién lo hace primero", dijo una vez Li Yanhong en una entrevista, incluso si el producto no está completamente maduro, pero aún debe lanzarse: "Después de la publicación de las palabras de Wenxin, innumerables personas, personas que no han estado en contacto conmigo en el pasado o que están lejos de mí en la industria se preguntan, ¿cómo podemos cooperar con Baidu, cómo probarlo lo antes posible?"
** Desde un punto de vista técnico, los modelos grandes son iteraciones de alta velocidad de "cada vez más usados". ** "Durante la prueba interna, el empleado preguntó, ¿cómo puede Wen Xin esconder la cabeza y escribir mal un poema? Dije que esperara, supongo que puedo aprenderlo pasado mañana, y se podrá usar al día siguiente, y el progreso del gran modelo también es un proceso de aprendizaje continuo", dijo Wang Haifeng con una sonrisa.
En medio año, Wenxin Yiyan ha llevado a cabo tres iteraciones de la versión 3.0 a la 3.5 y luego a la versión 4.0, según Wang Haifeng en la reunión, la escala de usuarios de Wenxin Yiyan ha alcanzado los 45 millones, 54,000 desarrolladores, 4,300 escenarios, 825 aplicaciones y más de 500 complementos.
El agua regada en PNL, el fertilizante aplicado, finalmente marcó el comienzo de una cosecha abundante en 2023 y, como dijo Li Yanhong, el camino del desarrollo tecnológico es el proceso de "dos vidas, dos vidas tres, tres vidas y todas las cosas".
Fuerza interna detrás de los grandes modelos
Después del estallido de la inteligencia artificial general, la atención de la computación en la nube y la atención de las empresas alcanzó su punto máximo, y también llegó el "momento iPhone".
La aparición de grandes modelos, lo que resulta en una enorme brecha de poder de cómputo, la computación en la nube no solo para que el modelo grande brinde soporte de poder de computación en la nube, sino también el mejor punto de aterrizaje para las grandes empresas de aterrizaje de modelos, ya sea Baidu o cualquier empresa con un modelo grande, cuando salga el modelo grande, el siguiente enfoque es promover en el mercado, dejar que las empresas lo usen.
** Para Baidu, tal carga recae sobre los hombros de Shen Shu. **
Entre los seis líderes de grupos empresariales de Baidu, a excepción del director de tecnología Wang Haifeng, Shen es el único vicepresidente sénior. Aunque ambos provienen de una formación técnica, a diferencia del papel de "ingeniero" de Wang Haifeng, Shen ha sido responsable del crecimiento de negocios clave desde que se unió a Baidu.
En los 10 años transcurridos desde que se unió a Baidu, Shen ha integrado sucesivamente el sistema de publicidad y ha mejorado la capacidad de monetización del sistema; Combine los flujos de búsqueda y alimentación; Integra el grupo de negocios del ecosistema móvil actualizado por búsqueda para completar el territorio del ecosistema móvil de Baidu.
** Si Wang Haifeng creó un cuchillo afilado, entonces Shen Shu es un funcionario pionero que puede usar este cuchillo afilado para abrir territorio, en palabras de Li Yanhong, "atrévete a pelear una batalla dura y puede ganar una batalla". **
En mayo de 2022, Shen Jixing fue nombrado presidente del Grupo de Negocios Baidu Intelligent Cloud (ACG). Para Baidu, no apostó completamente por la computación en la nube al principio, pero fue precisamente con el desarrollo continuo de la tecnología de inteligencia artificial que Baidu se dio cuenta de las deficiencias de la computación en la nube y comenzó a cultivar en secreto la segunda curva de crecimiento.
** Debido a la falta de la ventaja de ser el primero en moverse, el objetivo de Baidu Cloud en los últimos 10 años es muy claro, no competir con las "armas viejas" en la escala de la capa IaaS, sino a través de la combinación de PaaS + SaaS y capacidades inteligentes, para jugar a la diferenciación y cortar la digitalización empresarial en pequeñas batallas. **
En la Conferencia Mundial de Baidu 2023, Shen propuso una vez más la estrategia de "integración de inteligencia en la nube": "La profunda combinación de inteligencia artificial y computación en la nube es la clave para que las empresas implementen rápidamente aplicaciones nativas de IA. En la actualidad, todas las aplicaciones y servicios del Grupo Baidu se ejecutan en Baidu Intelligent Cloud basado en la arquitectura tecnológica 'Cloud-Intelligence Integration'".
En los cinco meses posteriores a la adquisición de ACG, Shen integró rápidamente la "superfábrica de servicios de grandes modelos": Wen Xin Qianfan en respuesta a las necesidades básicas de las empresas en la era de los grandes modelos, y dividió a los usuarios en cinco categorías de usuarios según sus necesidades.
En primer lugar, en vista de la brecha de demanda causada por los recursos de potencia de cómputo, la plataforma Qianfan proporciona varios tipos de potencia de cálculo heterogénea. Por ejemplo, en el enlace de capacitación más costoso, a través de la capacitación paralela distribuida y las capacidades de interconexión a nivel de microsegundos, la plataforma Qianfan puede lograr una tasa de aceleración de capacitación del 95 % y una relación de tiempo de capacitación efectiva del 96 %, lo que reduce en gran medida la potencia informática y los costos de tiempo del cliente.
En segundo lugar, a nivel de modelo, para los clientes que desean llamar directamente a los modelos grandes existentes, las empresas pueden llamar rápidamente a varios modelos grandes, incluido Wen Xin Yiyan, mientras que la plataforma Qianfan proporciona herramientas como la mejora del chino, la mejora del rendimiento y la mejora del contexto. Según Shen Ji, la plataforma Qianfan ha atendido a más de 17.000 clientes.
** Para los clientes con necesidades de desarrollo secundarias, la plataforma Qianfan proporciona una cadena de herramientas de ciclo de vida completo, como el reentrenamiento, el ajuste, la evaluación y la implementación de modelos grandes, con el mayor número de 41 conjuntos de datos de la industria de alta calidad, y los optimiza rápidamente para sus propios escenarios comerciales.
La conferencia también llevó a cabo una demostración práctica de cómo desarrollar rápidamente aplicaciones de preguntas y respuestas de conocimiento para Sany Heavy Industry basadas en el marco de generación de mejora de recuperación (RAG, Retri Augmented Generation): simplemente seleccione el marco RAG preestablecido en el entorno de trabajo de aplicaciones nativas de Qianfan AI y configure los parámetros correspondientes para realizar rápidamente el desarrollo y lanzamiento de la aplicación inteligente de servicio al cliente en el sitio web oficial de Sany Heavy Industry.
** Shen dijo que la construcción de un "asistente tan pequeño", incluso si necesita procesar documentos de miles de miles de palabras, el costo es de solo unos pocos cientos de yuanes; Después de eso, cada consulta del usuario solo cuesta unos pocos centavos. **
Durante mucho tiempo, la industria a gran escala, la manufactura y la agricultura han sido áreas profundas de digitalización, y la razón principal es que la complejidad de la industria ha llevado a un alto umbral para la digitalización y es difícil de aterrizar.
Sin embargo, a través del modelo grande, no solo se reduce el umbral de uso, sino que también se reduce el costo de uso. No es necesario construir ningún sistema nuevo, ni requiere participación manual, es un método de aplicación más avanzado de componentes técnicos, ** la combinación de los dos, pero también gira el volante de inteligencia de la nube, acumulándose gradualmente. **
Retos de innovación para modelos grandes
El pasado es una conclusión inevitable, pero el futuro puede cambiar.
Todos los proveedores con modelos grandes han encontrado oportunidades en la capa de aplicación. Microsoft comenzó a trabajar en la línea completa de productos, incluidos los sistemas Bing, Office y Windows, en marzo, y Ali Daniel Zhang dijo: "Debemos usar el modelo grande para rehacer todos los productos", pero esta frase, simple de decir, es el mayor desafío de innovación en la era de los modelos grandes.
¿Cómo refactoriza la IA las aplicaciones? Esto requiere no solo capacidad empresarial, sino también imaginación, y ante una nueva era de IA, Baidu también ha puesto el testigo en manos de los jóvenes. **
Después de mayo de 2022, Shen Jie fue sucedido como jefe del grupo empresarial MEG por He Junjie, el vicepresidente de la generación posterior a los 80 introducido en el plan de construcción de escalón de talento de Baidu. Si Shen Zhan es una "facción de guerra dura", entonces He Junjie es una verdadera "facción joven y fuerte". Como dijo Ren Zhengfei, es necesario "dejar que aquellos que escuchan el cañón comanden la batalla".
** La refactorización de la aplicación no está rota ni en pie, por el contrario, Baidu es de hecho "particularmente despiadado" consigo mismo. **
En la Conferencia Mundial de Baidu, centrada en la "ecología", He Junjie entregó las respuestas de "ecología móvil", "ecología de contenidos" y "ecología empresarial".
Entre ellos, el ecosistema móvil abarca aplicaciones nativas de IA como "New Search", "New Wenku", Wenxin Yiyan APP y el comercio electrónico de Baidu "Huibexing"; A nivel ecológico de contenidos, una serie de aplicaciones como Baidu APP "AI Editor" potencian el ecosistema de creadores; A nivel de ecología empresarial, se lanzó la plataforma de marketing AI Native "Light". Además, He Junjie también anunció la ecología del plug-in Wen Xin Yiyan: "Spirit Matrix", que ahora está completamente abierta.
**La nueva búsqueda definida por Baidu es exactamente la lógica de cálculo de cajas propuesta por Robin Li en 2010. **Tiene tres características: máxima satisfacción, estimulación de recomendación e interacción multi-ronda. Es decir, cuando los usuarios buscan preguntas, "ya no te dan un montón de enlaces", sino que a través de la comprensión del contenido, generan respuestas multimodales como texto, imágenes y gráficos dinámicos; La estimulación de recomendaciones puede recomendar los problemas que preocupan a los usuarios en tiempo real; En respuesta a necesidades complejas, la interacción de varias rondas puede satisfacer las necesidades de búsqueda personalizadas de los usuarios a través de indicaciones, ajustes, etc.
Las capacidades de AIGC han dado nueva vitalidad a algunas de las antiguas aplicaciones de Baidu, como los documentos de Baidu actualizados de herramientas de recuperación de contenido a herramientas de producción de contenido, y Baidu Editor se ha convertido en una herramienta de generación de contenido; La otra parte también explora nuevos escenarios, como la generación integral de contenido de marketing de Baidu Diager a través de AIGC y la entrega inteligente, combinada con la plataforma digital de generación humana "Huaicast Star" para ayudar a los comerciantes a expandir su alcance y escenarios de marketing.
** Al mismo tiempo, con el aterrizaje gradual de las aplicaciones de modelos grandes, Baidu también se dio cuenta de que confiar en su propia fuerza es en última instancia limitado, y que el infinito es vertical y horizontal. **
Este es el valor de Spirit Matrix, una plataforma que reduce en gran medida el costo del desarrollo de plug-ins de gran tamaño, permitiendo que personas comunes con creatividad e ideas se conviertan en desarrolladores de plug-ins. Li Yanhong dijo que el complemento es una aplicación nativa de IA especial, y también es la aplicación nativa de IA con el umbral más bajo y la más fácil de comenzar.
La característica del plug-in es la "interfaz universal", que puede conectar búsquedas, mini programas, plataformas de contenido o cualquier entrada, de modo que el uso de "plug and play" permite a los desarrolladores y creadores unirse rápidamente al ecosistema.
He Junjie reveló que un mes después de su lanzamiento, Lingjing Matrix ha recibido 27,000 solicitudes de registro de desarrolladores, que cubren más de 20 campos verticales, incluidas empresas, instituciones y desarrolladores individuales.
Un informante de Baidu le dijo a Light Cone Intelligence: "El complemento de modelo grande de la capa de aplicación toma Lingjing como la plataforma principal y se colocará en Wenxin Yiyan y la aplicación Baidu. Qianfan está más en el nivel inferior, y el reino espiritual está más arriba, e incluso es posible reemplazar a Qianfan en el nivel de complementos de aplicaciones en el futuro".
Conclusión
En 2016, Li dijo que Baidu estaba a solo 30 días de la bancarrota. "El dinosaurio pisó una pala en su pie, y su cerebro tardó horas en reaccionar. Así que no importa cuán grandes crezcan los dinosaurios, se extinguirán".
Baidu no quiere ser un dinosaurio, y a nivel de conciencia, siempre piensa a diez pasos de distancia.
Afortunadamente, Baidu esperó la nueva era y superó los momentos más difíciles; Desafortunadamente, al comienzo de esta nueva era, cualquier arrebato minucioso parecerá insignificante bajo la larga competencia.
Pero obtener un nuevo boleto es al menos un nuevo comienzo.
Referencia:
Expertos transfronterizos en diversos campos de la inteligencia artificial - Transformer"
El viaje es largo: esculpen almas para la inteligencia artificial