360 Group Peng Hui: ¡La tendencia de desarrollo de modelos grandes es la verticalización! ChatGPT de nivel empresarial solo necesita estos 4 pasos...

2023-08-25 03:37:44

Fuente: caballo oscuro de IA

Autor: Vicepresidente de Peng Hui 360 Group

01. La tendencia de desarrollo de modelos grandes es la "verticalización"

Con sus características inclusivas, ubicuas y universales, el modelo a gran escala llegará a miles de hogares y potenciará a miles de industrias en el futuro.

Entonces, tenemos esta vista:

Cada familia, cada gobierno y cada empresa tendrá uno o más modelos grandes.

También creemos que el desarrollo de China y Estados Unidos en el mercado To B es muy diferente. No habrá monopolio en China y definitivamente no habrá solo entre 3 y 5 modelos grandes.

En el futuro, los grandes modelos deben ser omnipresentes y las futuras oportunidades de desarrollo deben estar en el mercado empresarial.

Todo el mundo sabe que la digitalización se ha convertido en una estrategia central de nuestro país y que la digitalización industrial será un enorme mercado incremental descentralizado en el futuro.

Por lo tanto, al fabricar modelos a gran escala en China, creemos firmemente que debemos aprovechar esta oportunidad estratégica para potenciar la industria, anclar el mercado a nivel industrial y sacar modelos a gran escala del llamado mercado centralizado. la productividad y la eficiencia productiva del gobierno y las empresas.

Por supuesto, en este proceso, los modelos grandes encontrarán enormes desafíos en el proceso de aterrizaje en el mercado empresarial.

Lo resumo en cuatro aspectos:

Falta de conocimiento profesional.

Todo el mundo sabe que utilizaremos una gran cantidad de corpus de Internet para alimentar el modelo grande, es como un estudiante de secundaria, como máximo un graduado universitario. Sin embargo, es extremadamente deficiente en algunos conocimientos del dominio profesional, conocimiento de la industria y conocimiento interno de la empresa. Ni siquiera actualizado a tiempo. Entonces, este es un gran problema, la falta de experiencia.

Delirios alucinatorios ocasionales.

Todo el mundo dice una palabra a menudo y la gran modelo dirá tonterías en serio. Tendrá conocimiento ambiguo e ilusión de conocimiento. Debido a que los datos y el conocimiento son como bases de datos estructuradas, están codificados en los parámetros y pesos de nuestra red neuronal profunda en otra forma matricial y vectorial. Sin embargo, quiero llamarlo, usarlo y, de hecho, necesito hacer un mejor trabajo de arranque. En este proceso, su mecanismo algorítmico producirá una ilusión de contenido que no puede garantizar la autenticidad y credibilidad.

Cuestiones de seguridad.

Las empresas no están dispuestas a aportar sus habilidades únicas al gran modelo público ni a capacitarlas para que se adapten a un gran modelo público.

Cuestiones de costos.

Ahora el suministro de Nvidia H100 está agotado y ChatGPT afirma poder entrenar decenas de miles de tarjetas a la vez. Por tanto, este tipo de inversión es muy difícil para una empresa normal. Es posible que hayamos reducido la mano de obra, pero no hemos reducido los costos.

Entonces, ¿cómo solucionar estos problemas?

Creemos que una tendencia de desarrollo en el futuro debe ser hacia la verticalización y la creación de grandes modelos verticales pequeños pero especializados.

Es imposible confiar en un único modelo grande de propósito general para resolver todos los problemas de descomposición de tareas, interacción persona-computadora y respuesta a preguntas de conocimiento. Debemos confiar en corpus de datos de nivel empresarial y datos de alta calidad para entrenar grandes modelos verticales propietarios a pequeña escala.

Los modelos grandes se convertirán en una configuración estándar y un componente de todos los sistemas digitales en el futuro.

02 ¿Cómo se puede implementar rápidamente GPT a nivel empresarial?

Entrevistamos a más de 100 clientes y socios corporativos y básicamente todos tienen un consenso:

Los grandes modelos no lo son todo en este momento.

Entonces, la pregunta es: ¿cómo aplicarlo mejor a escenarios empresariales?

Necesitamos profesionalizar a los llamados generalistas y convertirnos en verdaderos expertos gubernamentales y empresariales.

En este momento, necesitamos encontrar una pequeña incisión y aprovechar al máximo sus puntos fuertes.

Creemos que las capacidades actuales del gran modelo se reflejan principalmente en las dos capacidades de generación de texto o creación de contenido y respuesta a preguntas de conocimiento. Podemos empezar con estas dos habilidades.

Cada vez más profesionales de la industria de modelos a gran escala creen que en escenarios de aplicación relativamente específicos y estrechos, los modelos grandes más pequeños y ajustados cumplirán más rápidamente con los requisitos de precisión del extremo To B.

Por lo tanto, debemos proceder paso a paso, dejar que el modelo grande sea primero un buen asistente y dejar que el modelo grande sea primero una buena navegación.

Centrándonos en dicho escenario, encontramos escenarios de aplicación correspondientes que se adaptan a estos cuatro productos para ejercer rápidamente su productividad y efectividad desde las cuatro dimensiones superior, inferior, interna y externa.

En el ámbito interno, pensamos que se trata más de escribir y resumir la oficina.
En el escenario externo, comenzaron a aparecer una gran cantidad de personas digitales en el escenario de atención al cliente.
En el escenario anterior, enfatizamos el resumen y análisis de la información y la inteligencia.
En el siguiente escenario, podemos dejar que el gran modelo realice una serie de capacitaciones sobre conocimientos corporativos e incluso habilidades laborales.

Por lo tanto, durante todo el proceso de implementación, nos dimos cuenta de un punto muy importante. En el futuro, más del 80% de nuestros escenarios comerciales estarán estrechamente relacionados con la base de conocimientos de la empresa.

En el pasado, cuando trabajábamos en big data, todos nos quedábamos en la aplicación de datos estructurados. Debe saber que el 80% del conocimiento y los datos no estructurados se abandonan o se dejan en paz, y esta parte del big data se convertirá en el corpus para el entrenamiento de modelos a gran escala.

Por lo tanto, cómo extraer conocimientos valiosos y datos de precisión de alta calidad de una gran base de datos de la empresa, transformarlos en una base de conocimientos de dominio privado de la empresa y potenciar el modelo grande mediante la corrección y mejora de la recuperación, puede producir contenido verdaderamente creíble. y actualizaciones oportunas de contenido en el escenario empresarial To B, así como la seguridad del contenido, como la descentralización y división de dominios.

Los datos se dividen en tres puertas:

La primera puerta puede ser datos abiertos de Internet, la segunda puerta son datos de la industria semipública o datos empresariales, y parte de ellos son datos confidenciales dentro de la empresa.

Para este tipo de datos confidenciales y autorizados de una empresa, debemos colocarlos en la base de conocimiento de una empresa, o en una base de datos vectorial, para que pueda generar una especie de gestión con autoridad y auditoría, a través de una especie de gestión de autoridad de Conocimiento empresarial clasificado y jerárquico, mejorado mediante la recuperación de grandes modelos, para proporcionar conocimiento y empoderamiento más precisos.

Otro aspecto es la aplicación. A nivel de aplicación todo el mundo ha estado expuesto a ChatGPT. ¿Crees que es fácil de usar?

Por qué hace algún tiempo todos los cerebros mencionaban que en el futuro habrá muchos puestos y roles que sugerirían ingenieros, de hecho es muy complicado.

Queremos que escriba un buen artículo y tenemos que darle muchas sugerencias, ideas centrales, resúmenes y esquemas antes de que pueda escribir un buen artículo. Le dejamos hacer una imagen, usar Midjourney, incluso tienes que hacerlo. dígale cuántos milímetros de lente, distancia focal, apertura y profundidad de campo necesita usar, qué tipo de entorno puede hacer una imagen generada realmente hermosa como esta, pero un proyecto de pistas de este tipo en realidad solo se puede utilizar, pero es muy incómodo y difícil de usar.

Por lo tanto, en el proceso de desarrollo futuro, no sea supersticioso con respecto a la llamada interfaz de usuario del lenguaje, y las interfaces más tradicionales no se eliminarán.

Además, se generará en grandes cantidades en escenarios futuros como redacción de oficina, creación de imágenes, creatividad de marketing, etc., e incluso escenarios de preguntas y respuestas sobre conocimiento gubernamental, porque proporciona más intuición y aplicabilidad.

Por ejemplo, Lao Zhou solía decir que quería comer un plato de patatas ralladas. Yo quería patatas fritas en lugar de vinagre. El clic puede ser del nivel de un segundo y ya he terminado con este asunto.

360 lanzará todo el marco del sistema de producto de su propio GPT de nivel empresarial. En la capa inferior, todavía creemos que los datos y el conocimiento se convertirán en la base de los grandes modelos de nivel empresarial en el futuro, que no pueden separarse de la acumulación de todos los datos en el pasado, solo que debemos adaptarnos a la necesidades de grandes modelos y desestructurar los datos acumulados por todas las empresas en el pasado. Contenido y documentos, incluidos gráficos multimedia de audio y video, datos de imágenes, a través de múltiples conectores de datos y robots de seguimiento del conocimiento, se incorpora un motor de procesamiento que promueve datos de múltiples fuentes. Ingrese a nuestra base de conocimiento empresarial, a través de índices vectoriales, índices abstractos en el sentido tradicional, índices de texto e índices multimodales, construya una base de conocimiento de un modelo grande a nivel empresarial y luego, a través de nuestra búsqueda y mejora del conocimiento, potencie nuestra empresa vertical profesional. grande El modelo proporciona servicios hacia arriba.

03, 3 prácticas y el mejor proceso para conseguir modelos grandes

Escritura de oficina.

Ocultaremos los proyectos complejos detrás de las diferentes plantillas grandes de 15 categorías y las plantillas de documentos subdivididos de casi 80 categorías. Utilice dicha herramienta para completar de manera eficiente la redacción de documentos oficiales y resolver eficazmente los problemas de redacción de documentos oficiales que requieren mucho tiempo y son de baja calidad.

Servicios gubernamentales.

A través del modelo grande y la base de conocimiento de los asuntos gubernamentales, podemos hacer que el modelo grande comprenda la semántica como un ser humano a través de múltiples rondas de diálogo, complemente la información relevante a través de preguntas de seguimiento y seguimiento, y finalmente forme una pregunta y respuesta. Puede responder de manera objetiva y precisa todas las preguntas que la gente común tiene en el proceso de hacer negocios.

Turismo cultural personas digitales.

Lao Zhou también mencionó a Wenlv Digital People en muchas ocasiones. Todo el mundo ha planificado sus viajes. ¿Puede el llamado plan de itinerario de viaje resolver sus problemas de viaje?

Lo que nos importa es que después de aterrizar en un destino, tengamos un amigo local y un guía turístico local. Las vistas, la comida, las anécdotas y los chistes que me interesan, ¿cómo se convierten en un compañero digital centrado en el destino? Queremos crear un compañero digital de este tipo. En el futuro, bajo el liderazgo del gobierno, abriremos gradualmente las capacidades de China y Taiwán, y luego conectaremos nuestras OTA, hoteles y restaurantes locales.

En combinación con el propio Grupo 360 y más de 100 clientes y socios corporativos, hemos formado el proceso de implementación de las mejores prácticas hasta el momento.

El primer paso es el análisis de negocio y la selección de escenarios.

El segundo paso es la recopilación de datos y la preparación de la limpieza.

El tercer paso es entrenar el modelo grande propietario de la empresa.

El cuarto paso es desarrollar aplicaciones de escenarios empresariales.

Creemos que cuando todos los modelos a gran escala se implementen en escenarios de nivel empresarial, una de las principales prioridades seguirá siendo el análisis empresarial. No es diferente de la digitalización.

Todavía necesitamos encontrar los puntos débiles del negocio en el proceso de análisis comercial, para encontrar un escenario adecuado y, después de seleccionar este escenario, definir nuestra solución.

Luego, recopile y limpie datos y conocimientos sobre esta escena para formar nuestros datos etiquetados de alta calidad. Después de ingresar a la base de datos, parte de ella se envía a nuestro gran modelo vertical como corpus para capacitación, y parte de ella ingresa a nuestra base de conocimiento empresarial para realizar una búsqueda de mejora del conocimiento. El siguiente paso es el desarrollo de asistentes inteligentes, empleados digitales y humanos digitales, mediante la disposición de modelos de aplicaciones y la apertura de API para integrarse con los sistemas comerciales existentes.

Durante el proceso de implementación del gran modelo a nivel empresarial, enfatizamos que es inseparable de la estrecha colaboración de los expertos técnicos y comerciales de ambas partes.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.