modelo grande + modelo plug-in es probablemente una de las respuestas a la comercialización de modelos grandes de IA.
El 17 de octubre, en la "Conferencia Mundial de Baidu 2023", Robin Li lanzó oficialmente la última versión del modelo Wenxin 4.0.
Durante un tiempo, se realizaron diversas evaluaciones, y los principales medios científicos y tecnológicos realizaron evaluaciones integrales del modelo desde los aspectos de comprensión, generación, lógica y capacidad de memoria.
Sin embargo, además de la repetida y comentada Wenxin 4.0, otra función ligeramente discreta en la conferencia de prensa también mostró fríamente la tendencia de desarrollo de los futuros modelos grandes.
**Esta es la función plug-in de Baidu Wenxin 4.0. **
En la actualidad, Wenxin 4.0 tiene 8 plug-ins solos, incluida una sombra de flujo de espejo (texto a video), por ejemplo, pintura de imágenes (mira imágenes y habla), E Yan Yi Tu (análisis de datos visuales), etc.
Estos complementos también se pueden combinar libremente para realizar tareas más complejas.
No solo eso, la plataforma de desarrollo de plug-ins de gran tamaño Baidu Wenxin, Lingjing Matrix Platform, ha sido aplicada por 27,000 desarrolladores durante un mes después de su lanzamiento, y los desarrolladores individuales representan más del 30%.
Entonces, ¿por qué Baidu concede tanta importancia a los plugins? ¿Y qué significa la prosperidad del ecosistema de plug-ins para el gran modelo?
**Plugin, deja que el modelo grande sea como un ala de tigre **
Hasta cierto punto, los plug-ins son equivalentes a otra "aplicación asesina" oculta para modelos grandes. "
Sin mejorar el algoritmo y los parámetros del modelo, es posible ampliar y mejorar significativamente las capacidades del modelo con un simple complemento.
Anteriormente, GPT-4 ha logrado el efecto de fortalecer al tigre a través de la función de complemento. El mundo exterior incluso llamó a ese aumentoLa llegada de GPT-4.5.
El 9 de julio de este año, OpenAI anunció que el plugin oficial Code Interpreter (Code Interpreter) estará disponible para todos los usuarios de ChatGPT Plus a través del panel Beta en Configuración.
Entonces, ¿qué puede hacer exactamente Code Interpreter?
En pocas palabras, equivale a una gran expansión del límite de capacidad de GPT-4, lo que permite a GPT-4 hacer muchas cosas que antes no eran posibles.
Por ejemplo, después del lanzamiento del complemento, el usuario de Twitter @歸藏 demostrado el proceso de análisis de los datos de los suscriptores del boletín con un analizador de código.
El analizador de código no necesita usar ningún software complicado, desde el análisis de datos hasta el mapeo, solo diga algo tan contundente: "Quiero analizar la tendencia del crecimiento de suscriptores en el último mes".
Además, las personas también pueden usar directamente el "habla humana" para permitir que GPT haga algunas imágenes GIF visuales a partir de datos.
Por ejemplo, si las personas quieren hacer un icono geográfico de un faro estadounidense, sólo tienen que subir los datos de ubicación geográfica, y GPT puede crear automáticamente el siguiente GIF a través de la función de plug-in.
E incluso si desea generar video a partir de imágenes, CodeInterpreter puede hacerlo al alcance de su mano. Después de habilitar el complemento, simplemente dígale a GPT: "Quiero usar esta imagen para hacer un video de panorámica de derecha a izquierda". "
GPT realizará automáticamente un video de las imágenes generadas por Midjourney de acuerdo con sus requisitos.
El internauta ChaseLean usa ChatGPT para generar un video de hamburguesa
Incluso las personas con poca experiencia en código y programación pueden usar el complemento CodeInterpreter para hacer un juego simple en 5 minutos.
Con solo unas pocas indicaciones, se completa un minijuego simple
En general, CodeInterpreter incluye funciones que cubren muchas tareas diferentes, como romper barreras modales, convertir formas de materiales y realizar análisis de datos.
La razón por la que el plugin tiene una función tan "desafiante del cielo" es porque rompe la barrera entre el lenguaje natural y el lenguaje de código. **
Con él, los usuarios pueden eliminar procesos de código complejos y completar directamente varias tareas intersectoriales y intermodales a través de la interacción del lenguaje natural (el llamado "habla humana").
Debido a esto, algunas personas exclamaron que este plug-in que duplica las capacidades del modelo es la llegada de GPT-4.5.
Por lo tanto, no es difícil entender por qué Baidu concede tanta importancia al desarrollo de complementos.
Para los grandes equipos de desarrollo de modelos, es imposible y poco realista hacer que un modelo incluya todas las necesidades de los usuarios. Porque en el proceso de evolución de la IA, los usuarios inevitablemente generarán más ideas y necesidades nuevas e impredecibles.
En este momento, una variedad de plug-ins flexibles se han convertido en una "prótesis" que amplía la capacidad de los modelos grandes.
Floración de plugins
Además de los plugins nativos que vienen con OpenAI, han surgido otros plugins en la pista actual de la IA.
Aquí, haremos una enumeración simple para ver qué diversos complementos de extensiones con diferentes funciones aportarán a modelos más grandes.
ChatPDF
ChatPDF es una poderosa herramienta de PDF en línea, los usuarios solo necesitan cargar archivos PDF en ChatPDF, ChatPDF puede usar rápidamente IA para analizar el contenido del archivo PDF y generar respuestas precisas para responder a las preguntas de los usuarios.
Además de la función inteligente de preguntas y respuestas, ChatPDF también ofrece edición en línea, conversión y compresión de archivos. Si los usuarios desean agregar o eliminar elementos de un archivo PDF, o cambiar algún texto o imágenes, la función de edición en línea de ChatPDF será muy útil.
### Mónica
Un complemento de la barra lateral de la página web que se conecta a la interfaz API de ChatGPT y, cuando se inicia, Monica puede usar la capacidad de ChatGPT para interpretar cualquier información o texto, o discutir el contenido de la página y proporcionar traducciones al navegar por cualquier sitio web.
Cabe mencionar que además de ChatGPT, Mónica también integra las interfaces de otras IA como Claued y Bard, y por si esto fuera poco, los usuarios también pueden buscar y agregar otras herramientas de IA por su cuenta en la biblioteca de IA a la que acceden, para que puedan satisfacer sus diversas necesidades a través de diferentes IA.
### ChatHub
Es un complemento que le permite usar diferentes chatbots en una aplicación, actualmente es compatible con ChatGPT y el nuevo BingChat, e integrará más chatbots como Google Bard en el futuro. Los usuarios pueden comunicarse con varios chatbots al mismo tiempo y comparar fácilmente sus respuestas.
### NoteGPT
Se trata de un plugin que utiliza ChatGPT para resumir vídeos. Admite la toma de capturas de pantalla y la toma de notas en sitios web de videos con un solo clic.
Después de iniciar el complemento, los usuarios pueden usar rápidamente ChatGPT para obtener información clave sobre el contenido de video y generar resúmenes y resúmenes cuando se enfrentan a ciertos videos largos, al mismo tiempo que toman capturas de pantalla o graban notas con marca de tiempo mientras ven videos con un solo clic.
### Asistente de IA Smart Star
Este es el primer producto de modelo cognitivo de IA en China que admite complementos, y Zhixing AI actualmente tiene acceso a 7 complementos, que incluyen consultas meteorológicas, búsqueda de Bing, Wolfram, etc., que pueden proporcionar rápidamente información meteorológica en tiempo real, responder problemas matemáticos avanzados y realizar análisis financieros en profundidad.
En comparación, ChatGPT solo puede usar 3 complementos a la vez, mientras que Smartstar AI no tiene límite en la cantidad de complementos.
### WPSAI
Es equivalente a la versión doméstica de Microsoft365 Copilot, con abreviatura, expansión, continuación, cambio de estilo de escritura, resumen y resumen de los puntos principales del artículo, generación rápida de esquemas PPT, producción de plantillas PPT con un solo clic, procesamiento inteligente de tablas de Excel y otras funciones, y tiene nuevas características de interacción de voz, que se pueden usar para la oficina móvil en terminales de pantalla pequeña como teléfonos móviles.
Ambición en el plugin
Además de los diferentes tipos de funciones de plug-ins de terceros mencionados anteriormente, los principales gigantes tecnológicos también han mostrado un impulso en la dirección de los plug-ins.
Por ejemplo, la plataforma de complementos de IA de Microsoft proporciona una serie de herramientas y servicios que permiten a los desarrolladores usar ChatGPT de Microsoft y el nuevo Bing para crear e implementar varios complementos de IA, incluidas clases de modelos de capacidad, clases de datos, clases de aplicaciones, etc. Sus complementos abarcan múltiples escenarios y productos, como Dynamics 365, Microsoft 365 y más. **
En China, Baidu también ha lanzado la plataforma "Spirit Matrix", que es conocida por permitir que todo el mundo desarrolle plug-ins de IA, tratando de construir un enorme ecosistema de plug-ins basado en las palabras de Wen Xin.
Detrás de este gran trazado, al menos las intenciones de los gigantes se revelan en dos aspectos:
**1. Tomar los plug-ins como un punto de avance para abrir el camino de la comercialización a gran escala; **
**2. Con un enorme ecosistema de plug-ins, construye barreras de software como CUDA de NVIDIA. **
Respecto al primer punto, ¿por qué el modelo de modelo grande + modelo plug-in es probablemente la respuesta a la comercialización a gran escala de la IA?
La razón es en realidad muy simple, el modelo grande anterior, ya sea texto de IA, dibujo, su campo de habilitación solo puede limitarse a un alcance único y estrecho.
Un modelo grande puede tener un buen nivel de escritura, pero en realidad, ¿cómo resolver las tareas específicas y multicategoría de comparación de productos básicos y análisis financiero?
Las necesidades de las personas en la vida son diversas y multinivel, desde este punto de vista, cuando el modelo grande rompe la limitación de un solo modo y satisface esta demanda diversificada, es el comienzo de su verdadera comercialización a gran escala. **
¿Y las funciones de plug-in de cada externo son equivalentes a las de los modelos grandes? "Ojo" y "mano" hacen que ya no se limite a un solo campo y al alcance de la modalidad.
En el futuro, es posible que los usuarios solo necesiten una entrada de modelo grande para completar tareas como reservar boletos, pedir comida, pedir comida y pedir comida para llevar.
Esto también nos lleva al segundo punto, es decir, la barrera ecológica dominada por ** plug-ins. **
En la pista actual de modelos grandes, aunque hay innumerables aplicaciones de IA derivadas en el país y en el extranjero, cuando una parte considerable de ellas todavía son productos "shell" basados en ChatGPT.
Esta realidad también se refleja por un lado: en la elección de modelos grandes, la mayoría de los desarrolladores y usuarios todavía solo reconocen los productos de cabeza más fuertes.
A16Z, una conocida institución de inversión, anunció el mes pasado que una parte considerable de los 50 principales sitios web de IA por tráfico son aplicaciones "shell"
En otras palabras, para modelos grandes, siempre que el usuario encuentre uno que sea el mejor para usar, es menos probable que use el otro.
Bajo esta lógica, si muchas empresas no quieren caer en la situación de repetir la rueda, la mejor opción debe ser cambiar su enfoque hacia el lado de la aplicación.
La experiencia histórica demuestra que en la competencia de software y aplicaciones, ¿quién puede proporcionar a los desarrolladores un entorno de desarrollo amigable y de bajo umbral, quién puede tomar la iniciativa en el establecimiento de sus propias barreras ecológicas?
En este sentido, se puede decir que CUDA de NVIDIA ha sido un excelente ejemplo.
Después de una evolución continua, CUDA ha formado un ecosistema rico y maduro. NVIDIA también ha logrado una profunda vinculación de software y hardware: con su software, debe comprar su hardware, y comprar su hardware usando CUDA puede ser el doble de efectivo.
En la actualidad, el diseño de los principales gigantes de los plug-ins también es bastante similar al CUDA de NVIDIA: si los desarrolladores o usuarios quieren lograr un desarrollo de aplicaciones de IA rápido y de bajo umbral, deben basarse en las capacidades de sus grandes modelos.
A su vez, la prosperidad de la ecología de aplicación fortalecerá la confianza de las personas en su gran modelo.
Quien tome la iniciativa en la realización de un ecosistema de este tipo que se promueva y complemente con aplicaciones será el primero en erigir sus propias barreras ecológicas en la era de la IA.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Plugins: aplicaciones nativas alternativas a la IA con la barrera de entrada más baja
Fuente: AI New Intelligence
El 17 de octubre, en la "Conferencia Mundial de Baidu 2023", Robin Li lanzó oficialmente la última versión del modelo Wenxin 4.0.
Durante un tiempo, se realizaron diversas evaluaciones, y los principales medios científicos y tecnológicos realizaron evaluaciones integrales del modelo desde los aspectos de comprensión, generación, lógica y capacidad de memoria.
**Esta es la función plug-in de Baidu Wenxin 4.0. **
En la actualidad, Wenxin 4.0 tiene 8 plug-ins solos, incluida una sombra de flujo de espejo (texto a video), por ejemplo, pintura de imágenes (mira imágenes y habla), E Yan Yi Tu (análisis de datos visuales), etc.
No solo eso, la plataforma de desarrollo de plug-ins de gran tamaño Baidu Wenxin, Lingjing Matrix Platform, ha sido aplicada por 27,000 desarrolladores durante un mes después de su lanzamiento, y los desarrolladores individuales representan más del 30%.
Entonces, ¿por qué Baidu concede tanta importancia a los plugins? ¿Y qué significa la prosperidad del ecosistema de plug-ins para el gran modelo?
**Plugin, deja que el modelo grande sea como un ala de tigre **
Hasta cierto punto, los plug-ins son equivalentes a otra "aplicación asesina" oculta para modelos grandes. "
Sin mejorar el algoritmo y los parámetros del modelo, es posible ampliar y mejorar significativamente las capacidades del modelo con un simple complemento.
Anteriormente, GPT-4 ha logrado el efecto de fortalecer al tigre a través de la función de complemento. El mundo exterior incluso llamó a ese aumentoLa llegada de GPT-4.5.
Entonces, ¿qué puede hacer exactamente Code Interpreter?
En pocas palabras, equivale a una gran expansión del límite de capacidad de GPT-4, lo que permite a GPT-4 hacer muchas cosas que antes no eran posibles.
Por ejemplo, después del lanzamiento del complemento, el usuario de Twitter @歸藏 demostrado el proceso de análisis de los datos de los suscriptores del boletín con un analizador de código.
El analizador de código no necesita usar ningún software complicado, desde el análisis de datos hasta el mapeo, solo diga algo tan contundente: "Quiero analizar la tendencia del crecimiento de suscriptores en el último mes".
Por ejemplo, si las personas quieren hacer un icono geográfico de un faro estadounidense, sólo tienen que subir los datos de ubicación geográfica, y GPT puede crear automáticamente el siguiente GIF a través de la función de plug-in.
GPT realizará automáticamente un video de las imágenes generadas por Midjourney de acuerdo con sus requisitos.
Incluso las personas con poca experiencia en código y programación pueden usar el complemento CodeInterpreter para hacer un juego simple en 5 minutos.
En general, CodeInterpreter incluye funciones que cubren muchas tareas diferentes, como romper barreras modales, convertir formas de materiales y realizar análisis de datos.
La razón por la que el plugin tiene una función tan "desafiante del cielo" es porque rompe la barrera entre el lenguaje natural y el lenguaje de código. **
Con él, los usuarios pueden eliminar procesos de código complejos y completar directamente varias tareas intersectoriales y intermodales a través de la interacción del lenguaje natural (el llamado "habla humana").
Debido a esto, algunas personas exclamaron que este plug-in que duplica las capacidades del modelo es la llegada de GPT-4.5.
Para los grandes equipos de desarrollo de modelos, es imposible y poco realista hacer que un modelo incluya todas las necesidades de los usuarios. Porque en el proceso de evolución de la IA, los usuarios inevitablemente generarán más ideas y necesidades nuevas e impredecibles.
En este momento, una variedad de plug-ins flexibles se han convertido en una "prótesis" que amplía la capacidad de los modelos grandes.
Floración de plugins
Además de los plugins nativos que vienen con OpenAI, han surgido otros plugins en la pista actual de la IA.
Aquí, haremos una enumeración simple para ver qué diversos complementos de extensiones con diferentes funciones aportarán a modelos más grandes.
ChatPDF
ChatPDF es una poderosa herramienta de PDF en línea, los usuarios solo necesitan cargar archivos PDF en ChatPDF, ChatPDF puede usar rápidamente IA para analizar el contenido del archivo PDF y generar respuestas precisas para responder a las preguntas de los usuarios.
Además de la función inteligente de preguntas y respuestas, ChatPDF también ofrece edición en línea, conversión y compresión de archivos. Si los usuarios desean agregar o eliminar elementos de un archivo PDF, o cambiar algún texto o imágenes, la función de edición en línea de ChatPDF será muy útil.
Un complemento de la barra lateral de la página web que se conecta a la interfaz API de ChatGPT y, cuando se inicia, Monica puede usar la capacidad de ChatGPT para interpretar cualquier información o texto, o discutir el contenido de la página y proporcionar traducciones al navegar por cualquier sitio web.
Cabe mencionar que además de ChatGPT, Mónica también integra las interfaces de otras IA como Claued y Bard, y por si esto fuera poco, los usuarios también pueden buscar y agregar otras herramientas de IA por su cuenta en la biblioteca de IA a la que acceden, para que puedan satisfacer sus diversas necesidades a través de diferentes IA.
Es un complemento que le permite usar diferentes chatbots en una aplicación, actualmente es compatible con ChatGPT y el nuevo BingChat, e integrará más chatbots como Google Bard en el futuro. Los usuarios pueden comunicarse con varios chatbots al mismo tiempo y comparar fácilmente sus respuestas.
Se trata de un plugin que utiliza ChatGPT para resumir vídeos. Admite la toma de capturas de pantalla y la toma de notas en sitios web de videos con un solo clic.
Después de iniciar el complemento, los usuarios pueden usar rápidamente ChatGPT para obtener información clave sobre el contenido de video y generar resúmenes y resúmenes cuando se enfrentan a ciertos videos largos, al mismo tiempo que toman capturas de pantalla o graban notas con marca de tiempo mientras ven videos con un solo clic.
Este es el primer producto de modelo cognitivo de IA en China que admite complementos, y Zhixing AI actualmente tiene acceso a 7 complementos, que incluyen consultas meteorológicas, búsqueda de Bing, Wolfram, etc., que pueden proporcionar rápidamente información meteorológica en tiempo real, responder problemas matemáticos avanzados y realizar análisis financieros en profundidad.
En comparación, ChatGPT solo puede usar 3 complementos a la vez, mientras que Smartstar AI no tiene límite en la cantidad de complementos.
Es equivalente a la versión doméstica de Microsoft365 Copilot, con abreviatura, expansión, continuación, cambio de estilo de escritura, resumen y resumen de los puntos principales del artículo, generación rápida de esquemas PPT, producción de plantillas PPT con un solo clic, procesamiento inteligente de tablas de Excel y otras funciones, y tiene nuevas características de interacción de voz, que se pueden usar para la oficina móvil en terminales de pantalla pequeña como teléfonos móviles.
Ambición en el plugin
Además de los diferentes tipos de funciones de plug-ins de terceros mencionados anteriormente, los principales gigantes tecnológicos también han mostrado un impulso en la dirección de los plug-ins.
Por ejemplo, la plataforma de complementos de IA de Microsoft proporciona una serie de herramientas y servicios que permiten a los desarrolladores usar ChatGPT de Microsoft y el nuevo Bing para crear e implementar varios complementos de IA, incluidas clases de modelos de capacidad, clases de datos, clases de aplicaciones, etc. Sus complementos abarcan múltiples escenarios y productos, como Dynamics 365, Microsoft 365 y más. **
Detrás de este gran trazado, al menos las intenciones de los gigantes se revelan en dos aspectos:
**1. Tomar los plug-ins como un punto de avance para abrir el camino de la comercialización a gran escala; **
**2. Con un enorme ecosistema de plug-ins, construye barreras de software como CUDA de NVIDIA. **
La razón es en realidad muy simple, el modelo grande anterior, ya sea texto de IA, dibujo, su campo de habilitación solo puede limitarse a un alcance único y estrecho.
Un modelo grande puede tener un buen nivel de escritura, pero en realidad, ¿cómo resolver las tareas específicas y multicategoría de comparación de productos básicos y análisis financiero?
Las necesidades de las personas en la vida son diversas y multinivel, desde este punto de vista, cuando el modelo grande rompe la limitación de un solo modo y satisface esta demanda diversificada, es el comienzo de su verdadera comercialización a gran escala. **
En el futuro, es posible que los usuarios solo necesiten una entrada de modelo grande para completar tareas como reservar boletos, pedir comida, pedir comida y pedir comida para llevar.
Esto también nos lleva al segundo punto, es decir, la barrera ecológica dominada por ** plug-ins. **
En la pista actual de modelos grandes, aunque hay innumerables aplicaciones de IA derivadas en el país y en el extranjero, cuando una parte considerable de ellas todavía son productos "shell" basados en ChatGPT.
Esta realidad también se refleja por un lado: en la elección de modelos grandes, la mayoría de los desarrolladores y usuarios todavía solo reconocen los productos de cabeza más fuertes.
En otras palabras, para modelos grandes, siempre que el usuario encuentre uno que sea el mejor para usar, es menos probable que use el otro.
Bajo esta lógica, si muchas empresas no quieren caer en la situación de repetir la rueda, la mejor opción debe ser cambiar su enfoque hacia el lado de la aplicación.
La experiencia histórica demuestra que en la competencia de software y aplicaciones, ¿quién puede proporcionar a los desarrolladores un entorno de desarrollo amigable y de bajo umbral, quién puede tomar la iniciativa en el establecimiento de sus propias barreras ecológicas?
En este sentido, se puede decir que CUDA de NVIDIA ha sido un excelente ejemplo.
En la actualidad, el diseño de los principales gigantes de los plug-ins también es bastante similar al CUDA de NVIDIA: si los desarrolladores o usuarios quieren lograr un desarrollo de aplicaciones de IA rápido y de bajo umbral, deben basarse en las capacidades de sus grandes modelos.
A su vez, la prosperidad de la ecología de aplicación fortalecerá la confianza de las personas en su gran modelo.
Quien tome la iniciativa en la realización de un ecosistema de este tipo que se promueva y complemente con aplicaciones será el primero en erigir sus propias barreras ecológicas en la era de la IA.