¿Qué tipo de modelos grandes necesita la industria?

Question

Fuente original: cerebro cuerpo polar![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d7e4b77d0a-dd1a6f-69ad2a) Fuente de la imagen: Generada por IA ilimitadaEl motivo por el que escribí este artículo ocurrió no hace mucho.Participamos en un foro temático que combinó grandes modelos con industria. Después del evento, un representante del organizador de la industria se comunicó con nosotros y dijo: "Han estado hablando de modelos grandes. ¿Qué es exactamente un modelo grande? ¿Qué tamaño tiene un modelo grande? ¿Por qué no podemos usar modelos pequeños?"Esta serie de preguntas nos hace darnos cuenta una vez más de que los lados inteligentes de la oferta y la demanda se encuentran a menudo en dos sistemas de discurso. Usted ha estado hablando de Transfomer y Agent durante mucho tiempo, pero es posible que todavía se pregunte de dónde provienen las palabras "modelo grande".Esta brecha es especialmente grave en la era de la IA. Debido a que la tecnología de IA implica una cadena más larga: quienes crean algoritmos, quienes crean nubes, quienes fabrican hardware, quienes crean soluciones de TI y quienes finalmente pagan la factura, es posible que todos estén hablando de sus propias opiniones, y nadie tiene la intención de hacerlo. entender verdaderamente a nadie.Hoy en día, todo el mundo habla de grandes modelos industriales y de grandes modelos industriales. De hecho, desde un punto de vista de la lógica técnica, es fácil descubrir que los modelos grandes pueden generar enormes aumentos de productividad en muchas industrias. Desde una perspectiva técnica, las empresas chinas son más receptivas y tienen una mayor demanda de inteligencia. Mover grandes modelos hacia la industria para lograr la integración digital-real es la línea más distintiva de la IA de China, y tiene una gran importancia macroestratégica en el contexto de la China digital.Pero en la práctica, este camino está plagado de desafíos y malentendidos.Después de todo, nueve de cada diez empresas de algoritmos de IA no pueden hacerlo. Antes de que aparezca la nueva ventana de oportunidad para el modelo grande B, primero debemos determinar qué tipo de modelo grande necesita la industria.## **Un modelo industrial grande no es un modelo**El mayor malentendido cuando las empresas de IA desarrollan modelos a gran escala y combinan industrias es que no pueden comprender la relación entre oferta y demanda.Es cierto que el reconocimiento y la aceptación actuales de los modelos grandes por parte de la industria es relativamente bueno, pero los proyectos inteligentes siguen siendo un mercado de compradores absoluto. Los proveedores de tecnología deben adaptarse a las necesidades, habilidades, antecedentes e incluso habilidades de comunicación y hábitos comerciales de los usuarios finales.Sin embargo, debido a que las empresas fabrican modelos de IA a gran escala, se ha invertido una gran cantidad de talento y fondos en el campo de Internet. La lógica de oferta y demanda de Internet es que un único punto de oferta satisface una gran cantidad de demanda. Tengo un truco para traer nuevas ideas de todo el mundo. Es fácil pensar en la adaptación de modelos grandes en muchas industrias. Por ejemplo, una fábrica necesita un análisis de ingredientes y un banco necesita un análisis de inversiones, ¿no puede mi modelo grande analizarlo también?Por lo tanto, bajo tal "pensamiento al aire libre", muchas empresas de IA han caído en un gran malentendido: piensan que, dado que tengo un modelo grande, los clientes de todas las industrias deberían acudir a mí. Presento casos de dos o tres industrias, que deberían ser reconocidas por otras industrias. Este modelo grande mío se puede usar en todas partes, por eso se llama modelo grande industrial.Si estos profesionales de la IA realmente creen que los modelos grandes son iguales a la panacea de la industria, o simplemente se jactan así deliberadamente. Desde la perspectiva de los clientes industriales, esta escena equivale a una tontería. ¿Pensarán que la tecnología utilizada en la industria financiera no tiene nada que ver con nuestras minas de carbón? Si existiera un alimento que pudieran comer los gatos, las vacas, los humanos o incluso los gatos, ¿te atreverías a comerlo?**Lo primero que la industria debe hacer con los modelos grandes es no resumir las industrias tan diferentes en la palabra "industria" y ponerle fin. Incluso dentro de una determinada industria, los modelos grandes sólo pueden resolver uno o unos pocos problemas en la industria, y es imposible que un modelo "arregle todas las industrias". **Cualquiera que trabaje en TI sabe que para tener productos se necesitan servicios y, para comprender la tecnología, es necesario comprender la industria. Sin embargo, las empresas de IA, especialmente aquellas que están invirtiendo dinero caliente en el ámbito de los modelos grandes, generalmente carecen de comprensión y respeto por las diferencias en las necesidades de la industria.Por supuesto, diferentes industrias también tienen necesidades comunes de modelos grandes. Por ejemplo, diálogo básico, CV y capacidades multimodales. Pero la mayoría de las veces, cada industria tiene diferentes requisitos, capacidades digitales básicas e incluso requisitos de seguridad, requisitos de latencia y requisitos de operación y mantenimiento. En la etapa actual, es muy difícil replicar y promover un modelo grande en una industria específica, y mucho menos cubrir varias o incluso docenas de industrias de una sola vez.Cuando se trata de inteligencia industrial, la prioridad siempre es la industria sobre la inteligencia.## **No mencionar la reducción de hardware e ingeniería es una pérdida de tiempo**Muchas empresas que se dedican a la digitalización y la inteligencia se sorprenderán con esto después de observar el entorno del cliente: lo que el cliente gastó mucho dinero en comprar es en realidad un software muy simple sellado en una caja y luego fabricado de acuerdo con la industria. requisitos Botones, interfaz de usuario y cosas así. Muchos de estos software incluso están reempaquetados a partir de software extranjero de código abierto muy antiguo y desde hace mucho tiempo están rezagados técnicamente. En este momento, se lamentarán de que sea tan fácil estafar a los clientes de la industria con su dinero.Pero aquí surge la pregunta: si pensamos en este problema desde otro ángulo, ¿cómo lo utilizaría una empresa sin esta capa de encapsulación? ¿Es necesario que una fábrica, una mina o una granja forestal reclute y capacite a una gran cantidad de talentos en computación en la nube y algoritmos de inteligencia artificial? ¿Y dejar que estos talentos digitales guíen la producción, las operaciones y las ventas de toda la empresa? Obviamente esto no es confiable.Por lo tanto, un hecho un tanto contrario a la intuición es que los usuarios de la industria tienden a preocuparse más por el "caparazón" que por las deslumbrantes tecnologías avanzadas. Esa capa de cáscara se refiere al hardware y la ingeniería, que encapsula, gestiona y mantiene las capacidades técnicas de acuerdo con los requisitos de uso final. Aunque el objeto ensamblado final puede ser difícil de usar y puede que no sea avanzado, para los usuarios de la industria, la condición más importante para la inteligencia es que pueda usarse y que los empleados puedan aprenderla.Cuando hablamos de modelos de grandes industrias, hoy en día a menudo caemos en este malentendido. Los profesionales tienden a prestar demasiada atención al liderazgo y la internacionalidad de la capa del algoritmo, compiten con la escala de parámetros y los registros de prueba y se centran en el software. Pero lo que la industria necesita que hagan los modelos grandes es competir con los sistemas digitales anteriores, con los costos de uso y con los umbrales operativos. Esto requiere un modelo grande que considere el entorno de hardware, el entorno de red, los recursos informáticos y de almacenamiento, el sistema operativo e incluso el suministro de energía, la humedad y la temperatura del entorno de implementación.**Lo segundo que deben hacer los grandes modelos industriales es tener en cuenta cuestiones de ingeniería y adaptación del hardware. **La implementación del modelo grande depende de encontrar el escenario adecuado. Pero ¿qué es una escena? El último lugar que funciona se llama escenario.La gran mayoría de las empresas no están orientadas a las TI. Incluso la mayoría de las empresas no pueden enviar personal dedicado a comprender cuidadosamente qué es un modelo grande. Esto no se puede cambiar durante mucho tiempo.La montaña no vendrá a verte, así que tienes que ver la montaña.Mucha gente compara un modelo grande con una mina de oro, por lo que entrenar un modelo grande es simplemente excavar la mina de oro. A través de métodos de ingeniería y la integración del modelo grande en la infraestructura digital existente de la industria, la mina de oro puede transportarse fuera de la montaña.## **Los expertos eventualmente tendrán que ir a la fábrica**Ya sea que estén contando historias a los clientes o comunicándose con el público, muchos fabricantes de IA siempre mencionarán esto: no se preocupe, tenemos expertos y postdoctorados arraigados en la industria. Fui a fábricas y tierras de cultivo y permanecí allí durante varios meses.Si usted es un usuario potencial de modelos grandes en la industria, simplemente escuche esta historia. Es cierto que hay expertos estacionados en la fábrica, pero lo más probable es que esa fábrica no sea la suya.De hecho, tener expertos en IA en la primera línea de la industria es una forma eficaz de acortar la brecha entre la demanda de la industria y la oferta de modelos grandes. Este es también un proceso de desarrollo necesario para la inteligencia industrial.Pero este proceso debe ser sólo temporal y no puede durar mucho. Imagínese, los modelos grandes están ahora a la vanguardia, ¿cuánto valen los expertos? Un equipo de expertos está apostado en el lugar. ¿Qué entidad puede soportar este coste salarial?Los expertos que las empresas de inteligencia artificial afirman que están estacionados en la fábrica en realidad están realizando casos y pruebas. Generalmente cooperan con los principales clientes del sector y los fabricantes están dispuestos a revisar los modelos sin saber qué hacer para observar los problemas específicos.**Los expertos pueden ir a las fábricas, pero ciertamente no pueden estar destinados en una fábrica tras otra, año tras año. ** Esta es una acción estándar cuando los fabricantes de IA ingresan a una industria, pero a menudo se entiende como una acción de rutina, intencional o no, pero si realmente tienes que confiar en expertos para ir a la fábrica a promocionar modelos grandes, entonces la IA nunca lo hará. No se puede implementar debido al costo y nadie puede permitírselo.La tercera cosa que los grandes modelos industriales deben hacer es que la tecnología tenga una replicabilidad de bajo umbral dentro de la industria y no pueda depender en gran medida de una cooperación manual personalizada. **Lo que hay que señalar especialmente es que en esta etapa, las empresas grandes y medianas se están volviendo cada vez más cautelosas a la hora de invertir en inteligencia, y el costo del ensayo y error no puede ser demasiado alto. Los planes de implementación de modelos a gran escala que son demasiado experimentales e inciertos son difíciles de obtener el reconocimiento de los grandes clientes en la etapa actual, y mucho menos de miles de pequeños y medianos clientes, y es imposible depender de grandes inversiones manuales para promoverlos.En resumen, existen tres desafíos en la implementación de modelos industriales a gran escala en la etapa actual:1. Los fabricantes de IA siempre imaginan los modelos grandes como una panacea, pero lo que la industria necesita es comprensión y concentración.2. Los fabricantes de IA siempre se centran en la innovación de algoritmos, pero lo que la industria necesita es ingeniería y operatividad.3. Los fabricantes de IA promueven una gran cantidad de casos que dependen de las capacidades del talento, pero lo que la industria necesita es bajo costo y replicabilidad.El sol sale cuando se lanzan modelos grandes al mercado, pero también hay que quitar conscientemente un poco de nieve. Cuando regresa a la interfaz de usuario, a menudo puede encontrar respuestas a más preguntas.