ChatGPT se ha disparado en los últimos seis meses: dinero especulativo, gigantes y supervisión

Después de medio año de bautismo en IA, puede ser difícil encontrar una palabra más apropiada que "respuesta al estrés" para describir el estado actual de todos en la industria de la tecnología: tensión, estimulación y presión.

La "respuesta de estrés" se refiere a una serie de respuestas que los organismos producen para mantener la homeostasis del cuerpo cuando se encuentran con amenazas o presiones ambientales externas. Es una respuesta natural de los organismos para adaptarse al medio ambiente y asegurar la supervivencia. Esta respuesta puede ser de corta duración o de larga duración.

El 26 de julio, el Twitter oficial de OpenAI anunció que la versión de Android de ChatGPT está disponible para descargar en los Estados Unidos, India, Bangladesh y Brasil, y planea expandirse a más países en un futuro cercano. ChatGPT está expandiendo canales, ganando más usuarios y una mayor permanencia en el uso, y la ola de IA generativa continúa aumentando.

A principios de julio, en la Conferencia Mundial de Inteligencia Artificial (WAIC, por sus siglas en inglés) de 2023 en Shanghái, una técnica de una empresa emergente de modelos a gran escala se desplazaba por la sala de exposiciones con la intención de encontrar una solución de chip doméstico rentable para la empresa. para usar en el entrenamiento de modelos a gran escala.

"Tenemos 1000 A100, pero no son suficientes", le dijo a Huxiu.

A100 es una GPU de gama alta de Nvidia y la base de hardware para el desarrollo de ChatGPT. Algunos datos públicos muestran que en el proceso de entrenamiento de los modelos de la serie GPT, la cantidad de GPU Nvidia utilizadas por OpenAI es de aproximadamente 25,000. Por lo tanto, para hacer un modelo grande, primero debe evaluar cuántas tarjetas gráficas A100 puede obtener, lo que se ha convertido casi en una práctica en esta industria.

¿Dónde están las GPU? ¿Dónde puedo encontrar potencia informática barata? Este es solo un microcosmos de las muchas preguntas en la conferencia 2023WAIC.

Casi todas las personas que han estado "estresadas" en los últimos seis meses están ansiosas por encontrar más respuestas sobre la IA en este "evento".

sitio 2023WAIC

Un técnico de un expositor de chips le dijo a Tiger Sniff que durante los pocos días de la conferencia WAIC, muchos gerentes de productos llegaron a su stand de "modelos grandes" con la esperanza de encontrar aquí definiciones de productos para el negocio de modelos grandes de la compañía.

En el Foro de Zhongguancun del 28 de mayo, el "Informe de investigación de mapas de modelos a gran escala de inteligencia artificial de China" publicado por el Instituto de Información Científica y Tecnológica de China mostró que, a fines de mayo, 79 modelos a gran escala con una escala de parámetros de se habían liberado más de mil millones en China. En los próximos dos meses, se lanzaron una serie de modelos grandes de IA como Tongyi Wanxiang de Alibaba Cloud, Pangu 3.0 de Huawei Cloud y Youdao "Ziyue". Según estadísticas incompletas, los modelos grandes de IA domésticos actuales han superado los 100.

La acción de las empresas nacionales que luchan por lanzar grandes modelos de IA es la mejor encarnación de la "respuesta al estrés". La ansiedad provocada por esta "reacción" se está transmitiendo a casi todo el personal relevante de la industria, desde el CEO de un gigante de Internet hasta un investigador de una institución de investigación de IA, desde un socio de un fondo de capital de riesgo hasta el fundador de una Compañía de IA, e incluso muchos profesionales legales relacionados con la IA, así como reguladores de seguridad de datos y redes.

Para las personas fuera de la industria, esto puede ser solo un carnaval de corta duración, pero ¿cuántas personas se atreven a decir que están fuera de la IA hoy en día?

La IA está marcando el comienzo de una nueva era, y vale la pena remodelar todo con un gran modelo. Cada vez más personas comienzan a pensar en las consecuencias de la difusión de la tecnología.

Los fondos están llegando, los volantes están aquí

Un mes después del nacimiento de ChatGPT, Li Zhifei, el fundador de ChatGPT, fue a Silicon Valley dos veces y habló sobre modelos grandes con todos. Cuando habló con Huxiu, Li Zhifei dijo sin rodeos que este era su último "All-in".

En 2012, Li Zhifei fundó Mobwenwen, una empresa de inteligencia artificial con interacción de voz y la combinación de software y hardware como núcleo, que ha experimentado los altibajos de las dos olas de inteligencia artificial de China. Durante el período más caluroso de la última ola de inteligencia artificial, la valoración de Momenwenbang alguna vez fue empujada al nivel del unicornio, pero también ha experimentado un período de soledad desde entonces. No fue hasta el surgimiento de ChatGPT que la industria de la inteligencia artificial que había estado en silencio durante muchos años. Se abrió un agujero.

En el mercado primario, "está entrando dinero especulativo".

Este es el consenso de la industria cuando se trata de modelos grandes en los últimos seis meses. Lu Qi, fundador de Qiji Forum, cree que los modelos a gran escala de IA son un "volante", y el futuro será una era en la que los modelos serán omnipresentes. "Este volante ya ha comenzado", y la mayor fuerza impulsora es el capital.

A principios de julio, los datos publicados por la plataforma de información empresarial Crunchbase mostraron que las empresas clasificadas como IA recaudaron 25.000 millones de dólares en la primera mitad de 2023, lo que representa el 18 % de la financiación mundial. Si bien esta cifra ha disminuido en comparación con los US$29 mil millones del primer semestre de 2022, el monto total de financiamiento de diversas industrias en el mundo en el primer semestre de 2023 ha disminuido en un 51% en comparación con el mismo período de 2022, lo que demuestra que el monto de financiamiento en el campo de la IA es el más grande del mundo, la proporción del financiamiento total casi se ha duplicado. Crunchbase escribió en el informe: "Sin el auge de la inteligencia artificial desencadenado por ChatGPT, la cantidad de financiamiento en 2023 será aún menor".

Hasta ahora, la mayor financiación en la industria de la IA en 2023 es la inversión de 10.000 millones de dólares de Microsoft en OpenAI en enero.

Tiger Sniff Según las estadísticas públicas, entre las startups a gran escala en los Estados Unidos, Inflection AI puede convertirse en la segunda startup más grande en el campo de la inteligencia artificial después de Open AI, seguida de Anthropic ($ 1.5 mil millones), Cohere ($ 445 millones), Adept ($415 millones), Runway ($195,5 millones), Character.ai ($150 millones) y Stability AI (alrededor de $100 millones).

En China, en la primera mitad de 2023, hubo 456 incidentes de inversión y financiación pública en la industria nacional de inteligencia artificial. Y esta estadística es 731, 526, 353, 631 y 648 en los cinco años de 2018 a 2022.

Eventos de inversión pública y financiamiento en la industria nacional de inteligencia artificial en el primer semestre del año

Otro evento que desencadenó el volante fue el lanzamiento de la interfaz API por parte de ChatGPT. Cuando OpenAI abrió la interfaz API de ChatGPT por primera vez en marzo, hubo casi un consenso dentro y fuera de la industria de la IA: la industria está a punto de cambiar. A medida que se conectan más aplicaciones a modelos grandes, crece un bosque más frondoso sobre la IA.

"La construcción de modelos a gran escala y la creación de aplicaciones deben separarse". Los inversores siempre tienen un agudo sentido del olfato. Según Chen Runze, director ejecutivo de Source Code Capital, la IA tiene la misma lógica que la división del trabajo en los semiconductores. Después de la prosperidad de los modelos a gran escala de IA, pronto Pronto veremos un auge en las aplicaciones de IA.

A principios de este año, cuando Chen Runze y sus colegas fueron a Silicon Valley, encontraron que Y Combinator, una incubadora de empresas emergentes muy conocida en Silicon Valley (el CEO de OpenAI, Sam Altman, se desempeñó como presidente de esta incubadora durante muchos años), la mitad de los proyectos se han transformado en IA generativa. El entusiasmo por los modelos grandes no es menor que el de China al otro lado del océano.

Sin embargo, también encontró que tanto el capital como los empresarios en los Estados Unidos son más optimistas sobre las aplicaciones ecológicas basadas en modelos grandes que el emprendimiento a gran escala.Después de todo, empresas como OpenAI ya han surgido en este camino.Al mismo tiempo, el Estados Unidos tiene un fuerte suelo ecológico de aplicaciones ToB, por lo que más empresas estadounidenses están tratando de hacer aplicaciones empresariales basadas en la ecología de modelos grandes.

Las observaciones de Chen Runze se están confirmando. Chen Ran, cofundador de la plataforma de servicio de modelos a gran escala OpenCSG, le dijo a Huxiu que hoy, más del 90% de las empresas en el Área de la Bahía de los Estados Unidos han utilizado modelos a gran escala. capacidades en todos los aspectos. En cuanto a China, Chen Ran cree que muchos clientes lo usarán antes de fin de año.

Alrededor de marzo de este año, Chen Runze y su equipo comenzaron a buscar empresas en China que hicieran aplicaciones basadas en modelos grandes, pero descubrieron que había muy pocas de esas empresas. Una gran cantidad de capital ha ingresado a la industria de la inteligencia artificial, pero si rastrea el flujo de estos fondos, encontrará que aún hay más dinero concentrado en las principales empresas.

"Incluso ahora, de 10 proyectos relacionados con la IA generativa, no es fácil invertir en 1-2". Además de Source Code Capital, Huxiu también se comunicó con muchos inversores en tecnología dura, y todos dijeron, aunque hay muchos proyectos para ver, hay muy pocos verdaderamente confiables.

Esta actitud del lado de la aplicación, a los ojos de muchas personas en la industria, ya es la norma.

Yu Kai, cofundador de Aspire, cree que la pista aparentemente animada en la superficie es en realidad más una competencia nominal, y los resultados no son más que dos situaciones: "Una es puramente orientada al capital para recaudar dinero; la otra es Una empresa que fabrica un modelo universal a gran escala realmente necesita gritar, y los demás no lo sabrán si no gritan”.

Algunas estadísticas nacionales también ilustran este problema. Según las estadísticas de una organización externa, Niu, a partir de julio de 2023, hay 242 empresas AIGC en China, y ha habido 71 incidentes de financiación de vías AIGC desde enero. Hay 67 empresas en la pista del modelo a gran escala de IA, y solo ha habido 21 eventos de financiación desde el lanzamiento de ChatGPT.

Los eventos de financiación de la pista AIGC y la pista de modelos grandes de IA desde el lanzamiento de ChatGPT|Fuente de datos: Enniu Data

“En el mercado doméstico de IA, hay muy pocos objetivos buenos.” Un inversionista le dijo a Tiger Sniff que los buenos proyectos son demasiado caros y los baratos no son confiables. Aunque la cantidad de modelos de IA a gran escala lanzados en China actualmente supera los cien, entre las empresas de modelos a gran escala en China, no muchas, o incluso unas pocas, han obtenido una gran financiación.

Muchas inversiones en IA se han convertido al final en inversores: antiguos fundadores de empresas unicornio, gigantes de Internet, personas con experiencia empresarial relacionada con modelos a gran escala, etc.

| | | | | | | --- | --- | --- | --- | --- | | Tipo de empresa | Empresa | Fecha de establecimiento | Modelos grandes y productos relacionados | | Compañía de Internet | Baidu | 2012 | Wenxin Yiyan | Listado | | Aliyun | 2008 | Tongyi Qianwen | Listado | | | Laboratorio de IA de Tencent | 1998 | Hunyuan | Listado | | | Nube de Huawei | 2019 | Pangu | No listado | | | ByteDance | 2016 | Arca Volcánica | No listado | | | JD Cloud | 2012 | Yanxi | Listado | | | Kunlun Wanwei | 2008 | Tiangong | Listado | | | 360 | 1992 | 360 Zhinao | Listado | |

| | | | | | | --- | --- | --- | --- | --- | | Tipo de empresa | Empresa | Fecha de establecimiento | Modelos grandes y productos relacionados | | Compañía de IA | SenseTime | 2014 | Nuevo diario | Listado | | HKUST Xunfei | 1999 | Chispa Xunfei | Listado | | | Tecnología Yuncong | 2015 | Calma | Listado | | | Datos de Daguan | 2015 | Cao Zhi | Ronda C | | | Sal y pregunta | 2014 | Secuencia Mono | Ronda D | | | Zhipu Al | 2019 | ChatGLM | Ronda B | | | Tecnología Lanzhou | 2021 | Mencius | Ronda Pre-A | | | MiniMax | 2021 | Glow | Inversión de capital | | | Tecnología Facewall | 2022 | VisCPM | Rueda angular | | | Tecnología Shenyan | 2022 | CPM | Inversión de capital | | | Mind Intelligence | 2021 | Al Utopía | Ronda Pre-A | | | Tecnología Lianyuan | 2021 | ProductGPT | Rueda de ángel | | | Aspire | 2007 | DFM-2 | Terminación de IPO | |

| | | | | | | --- | --- | --- | --- | --- | | Tipo de empresa | Empresa | Fecha de establecimiento | Modelos grandes y productos relacionados | | Se establecerá una nueva empresa de IA en 2023 | A años luz de distancia | 2023 | No | Una ronda | | Baichuan inteligente | 2023 | baichuan | Inversión de capital | | | Cero Uno Todo | 2023 | Ninguno | Inversión de capital | |

Estadísticas parciales de empresas relacionadas con modelos domésticos de IA a gran escala

Entre los proyectos estrella de IA de este año, Zhipu AI, Lingxin Intelligence, Shenyan Technology y Facewall Intelligence son empresas incubadas por Tsinghua Lab. Tanto Shenyan Technology como Facewall Smart se establecieron en 2022 y cuentan con el respaldo técnico de reconocidos académicos en la industria de la IA.

El tiempo de establecimiento de estas empresas de IA con sede en Tsinghua es más corto que el de las empresas de IA fundadas por algunos líderes de la industria de Internet. Light Years Beyond, Baichuan Intelligent y Zero One Wanwu se establecieron después del inicio de esta ola de modelos a gran escala.

Wang Huiwen, cofundador de Meituan, una vez recaudó 50 millones de dólares a años luz de su establecimiento a principios de 2023, que fue uno de los pocos casos de financiación en la industria de modelos a gran escala de China en ese momento. A diferencia de Zhipu AI y Xihu Xinchen, que ya tienen empresas basadas en modelos a gran escala, a años luz de distancia comenzará en febrero de 2023. Es difícil construir un modelo a gran escala desde cero. El 29 de junio, Meituan anunció la adquisición de todos los intereses más allá de Light Years, con una consideración total de aproximadamente US $ 233 millones (1,67 mil millones de yuanes) en efectivo, aproximadamente 367 millones de yuanes en deuda y 1 yuan en efectivo.

"Al menos debe haber personas con experiencia en procesamiento de lenguaje natural, personas con cierta experiencia práctica en entrenamiento de modelos a gran escala y profesionales en procesamiento de datos, clústeres de potencia informática a gran escala, etc. Si quieres hacer aplicaciones al mismo tiempo, debe tener los correspondientes gerentes de productos y talentos operativos en el campo”. Chen Runze describió la configuración estándar de un equipo central modelo a gran escala.

MEJOR LA IA DE LAS GRANDES EMPRESAS

En los últimos seis meses, las noticias de IA de los gigantes establecidos de Internet han estado volando por todo el cielo. La inversión en modelos grandes de IA parece estar persiguiendo puntos calientes, pero las apuestas hechas por grandes empresas como Baidu, Ali y Huawei en IA obviamente no siguen la tendencia.

Las apuestas de los gigantes por la IA han comenzado hace mucho tiempo, para estas empresas la IA no es un tema nuevo. Tiger Sniff, según las estadísticas incompletas de los datos de búsqueda empresarial, las principales fábricas han invertido en empresas relacionadas con la inteligencia artificial en diversos grados desde 2018. Desde la perspectiva de las empresas de inversión, la mayoría de ellas son empresas en la aplicación de inteligencia artificial, aunque algunos de ellos son empresas de chips de IA involucradas, pero el número no es grande, casi no hay empresas involucradas en modelos a gran escala, y la mayoría de las empresas relacionadas con la inteligencia artificial en las que invierten los principales fabricantes están estrechamente relacionadas con su negocio.

| | | | | | | --- | --- | --- | --- | --- | Instituciones de inversión de Dachang|Número de empresas invertidas|Proporción media de participación accionaria|Proporción máxima de participación accionaria|Número de empresas con participación del 100 %| | Alibaba | 23 | 36.25% | 100% | 5 | | Capital de riesgo de Baidu | 25 | 5.50% | 15% | 0 | | Inversión Tencent | 54 | 17.54% | 100% | 2 |

La inversión de tres grandes empresas de Internet en empresas relacionadas con la IA|Fuente de datos: Qichacha

En 2017, se estableció el Instituto Alibaba Dharma. Sus objetos de investigación cubren múltiples campos industriales, como la inteligencia artificial, las redes inteligentes y la tecnología financiera. Potencia las capacidades de la inteligencia artificial en varias líneas de negocios de Ali. En 2018, Baidu propuso la estrategia "All in AI".

La diferencia es que la aparición de la IA generativa parece ser un punto de inflexión. Para los gigantes tecnológicos con ventajas en datos, poder de cómputo y recursos de algoritmos, la inteligencia artificial no solo es un escenario propicio para ellos, sino que también debe asumir el papel de infraestructura.Después de todo, el surgimiento de la IA generativa significa que la industria de la inteligencia artificial La ha comenzado la división del trabajo.

Las grandes empresas representadas por Baidu, Alibaba, Huawei y Tencent, los cuatro proveedores de la nube, han anunciado sus propias estrategias de IA, pero obviamente cada una tiene su propio enfoque.

En los últimos seis meses, los gigantes han lanzado sus propios productos modelo a gran escala. Para grandes empresas como Baidu y Ali, no es demasiado tarde para entrar en el gran modelo, básicamente en 2019.

Baidu ha estado desarrollando modelos de precapacitación desde 2019 y ha lanzado sucesivamente la serie de modelos Knowledge Enhanced Wenxin (ERNIE). El modelo Tongyi Thousand Questions de Ali también comenzó en 2019. Además de los modelos grandes de propósito general de Baidu y Ali, el 19 de junio, Tencent Cloud lanzó el progreso de investigación y desarrollo de los modelos grandes de la industria. El 7 de julio, HUAWEI CLOUD lanzó el producto modelo industrial Pangu 3.0.

Estos enfoques también se hacen eco del negocio general, la estrategia de nube y el diseño a largo plazo de cada empresa en el mercado de IA.

La rentabilidad de la principal línea de negocios de Baidu ha fluctuado mucho en los últimos cinco años. Baidu ha visto durante mucho tiempo los problemas del negocio de la publicidad basada en búsquedas en el mercado nacional. En este sentido, Baidu decidió invertir fuertemente en tecnología de IA para encontrar nuevas oportunidades. A lo largo de los años, Baidu no solo ha invitado a Wu Enda, Lu Qi y otros líderes de la industria para que se desempeñen como ejecutivos, sino que también tiene mucho más entusiasmo por la conducción autónoma que otras empresas importantes. Baidu, que está tan preocupado por la IA, seguramente hará grandes apuestas en esta ola de competencia de modelos a gran escala.

Ali también mostró gran entusiasmo por los modelos grandes en general. Durante mucho tiempo, Aliyun ha tenido grandes esperanzas y Ali espera tomar la ruta técnica para crear la segunda curva de crecimiento del grupo. En el contexto de una competencia cada vez más feroz en el negocio del comercio electrónico y la desaceleración del crecimiento del mercado, las nuevas oportunidades en la industria de la IA creadas por Evian son, sin duda, una buena oportunidad para que Alibaba Cloud haga más esfuerzos en el mercado de la nube nacional.

En comparación con Baidu y Ali, Tencent Cloud optó por dar prioridad a los modelos industriales a gran escala en términos de modelos a gran escala, mientras que Huawei Cloud declaró públicamente que solo se centraría en modelos industriales a gran escala.

Para Tencent, el crecimiento de su negocio principal ha sido constante y positivo en los últimos años. En una etapa en la que el futuro de los modelos a gran escala de propósito general aún no está claro, Tencent es relativamente cauteloso al apostar por modelos de IA a gran escala. Cuando Ma Huateng habló sobre el modelo a gran escala en la conferencia telefónica de ganancias anterior, dijo: "Tencent no tiene prisa por mostrar los productos semiacabados. La clave es hacer un buen trabajo en los algoritmos subyacentes, el poder de cómputo y datos. La escena cae".

Por otro lado, desde la perspectiva de Tencent Group, Tencent actualmente tiene 4 AI Labs, y el año pasado lanzó un modelo de elementos mixtos a gran escala con billones de parámetros. "Pon todos tus huevos en una canasta" estrategia de apuestas.

Para Huawei, siempre ha sido una gran apuesta por la investigación y el desarrollo. En los últimos 10 años, la inversión total de Huawei en investigación y desarrollo ha superado los 900 mil millones de yuanes. Sin embargo, debido a los obstáculos encontrados en el desarrollo del negocio de la telefonía móvil, la estrategia general de Huawei en muchas investigaciones y desarrollos tecnológicos también puede estar enfrentando ajustes.

Por un lado, el negocio de la telefonía móvil es la mayor exportación de la tecnología de extremo C de Huawei. Si el negocio de la telefonía móvil no paga por el modelo a gran escala de uso general, entonces la motivación de Huawei para desarrollar un modelo a gran escala de uso general el modelo caerá significativamente. Para Huawei, apostar por un modelo de industria a gran escala que se pueda realizar rápidamente parece ser la solución óptima en este juego de IA. Como dijo Zhang Pingan, CEO de Huawei Cloud, "Huawei no tiene tiempo para escribir poesía".

Sin embargo, para los gigantes de la tecnología, no importa cuán grande sea la apuesta, siempre que puedan hacer la apuesta correcta, podrán apoderarse de la participación de mercado de la infraestructura y ganar el derecho a hablar en la era de la inteligencia artificial.

Toma un martillo por un clavo

Para las empresas comerciales, todas las decisiones aún recaen en los libros económicos.

Incluso con una gran inversión, cada vez más fundadores de empresas con visión de futuro se dan cuenta de que esto es algo que debe hacerse en el futuro, incluso si la inversión inicial puede no ver ningún retorno.

La investigación y el desarrollo de grandes modelos de IA requieren una gran inversión, pero cada vez más fundadores de empresas e inversores creen que se trata de una "inversión necesaria", incluso si no hay ningún retorno.

Como resultado, muchas empresas de inteligencia artificial que nacieron bajo la última ola de IA han visto un nuevo amanecer después de un largo período de silencio.

"Hace tres años, todos dijeron que GPT-3 es la posibilidad de conducir a la inteligencia artificial general". Li Zhifei dirigió a un grupo de personas para estudiar GPT-3 en 2020. En ese momento, estaba en un punto de inflexión en su desarrollo. ., Querían explorar nuevos negocios, pero después de un período de investigación, el proyecto de modelo a gran escala de Li Zhifei se suspendió. Una de las razones fue que el modelo no era lo suficientemente grande en ese momento, y la otra era que no había escena de aterrizaje comercial.

Sin embargo, después del lanzamiento de ChatGPT a fines de 2022, Li Zhifei pareció recibir una inyección de energía porque, como todos los demás, vio nuevas oportunidades para modelos grandes. En abril de este año, Going Out and Asking lanzó un producto modelo a gran escala de desarrollo propio: Sequence Monkey. En este momento, se están preparando para correr a la Bolsa de Valores de Hong Kong con el modelo a gran escala recientemente lanzado "Serial Monkey", y ya presentaron el prospecto a fines de mayo.

Otra empresa establecida de inteligencia artificial también está haciendo un seguimiento. En julio del año pasado, Aspire presentó una solicitud de oferta pública inicial a la Junta de Innovación Científica y Tecnológica, que fue rechazada por el comité de revisión de cotizaciones en mayo de este año.

Yu Kai dijo con franqueza que incluso OpenAI entrenó con el V100 de Microsoft durante casi un año en la etapa GPT2, y su poder de cómputo es varios órdenes de magnitud peor que el del A100. En la etapa inicial de acumulación de modelos grandes, Aspire también utiliza tarjetas más económicas para el entrenamiento. Por supuesto, esto lleva el tiempo como precio.

En comparación con los grandes modelos de desarrollo propio, algunas empresas orientadas a aplicaciones tienen sus propias opciones.

Zhang Wang (seudónimo), presidente de una empresa de educación en línea, le dijo a Huxiu que en los últimos seis meses no escatimaron esfuerzos para explorar escenarios de aplicación de modelos a gran escala, pero pronto descubrieron que había muchos problemas en el proceso de implementación. , como el costo y la inversión. El equipo de I + D de la compañía tiene entre 50 y 60 personas. Desde que comenzaron a hacer investigaciones de modelos a gran escala, han ampliado el equipo de I + D y han contratado algunos nuevos talentos en modelos a gran escala. Zhang Wang dijo que los talentos en modelos de bajo nivel son muy caro.

Zhang Wang nunca pensó en desarrollar un modelo grande desde cero y, considerando cuestiones como la seguridad de los datos y la estabilidad del modelo, no tiene la intención de acceder directamente a la API para la aplicación. Su enfoque es referirse al modelo grande de código abierto y usar sus propios datos para el entrenamiento. Esta es también la práctica actual de muchas empresas de aplicaciones: además del modelo grande, utilizan sus propios datos para crear un modelo de industria pequeña. De cara al futuro, comenzaron con un modelo de 7 mil millones de parámetros, llegaron a 10 mil millones y ahora están probando un modelo de 30 mil millones. Pero también encontraron que a medida que aumenta la cantidad de datos, el entrenamiento de modelos grandes conducirá al hecho de que la nueva versión puede no ser tan buena como la versión anterior, y los parámetros deben ajustarse uno por uno. un desvío que debe tomarse", dijo Zhang Wang.

Zhang Wang le dijo a Huxiu que su requisito para el equipo de I+D es explorar escenarios de modelos a gran escala de IA basados en el negocio de la empresa.

Esta es una forma de encontrar un "clavo" con un "martillo", pero no es fácil.

"El mayor problema en este momento es encontrar una escena adecuada. De hecho, hay muchas escenas. Incluso si se usa IA, el efecto no se puede mejorar mucho", dijo Zhang Wang, por ejemplo, en la escena de clase, AI grande Los modelos se pueden usar para potenciar algunos modos interactivos, como recordar a los estudiantes que asistan a clases, responder preguntas y etiquetar, etc., pero después de probar el modelo grande de IA, descubrieron que la precisión no era buena y la capacidad de comprensión y salida no era ideal. El equipo de Zhang Wang decidió abandonar temporalmente la IA en esta escena después de intentarlo durante un tiempo.

Otro proveedor de servicios de Internet, Xiaogetong, también comenzó a explorar negocios relacionados inmediatamente después del estallido del modelo de IA. El negocio principal de Little Goose es proporcionar herramientas de operación digital para comerciantes en línea, incluido el marketing, la gestión de clientes y la monetización comercial.

Fan Xiaoxing, cofundador y director de operaciones de Goose Communication, le dijo a Huxiu que en abril de este año, cuando nacieron más y más aplicaciones basadas en IA generativa, Goose Communication vio el potencial detrás de esta tecnología. La mejora de la eficiencia en la generación de imágenes de diseño es, de hecho, obvio para todos”. Fan Xiaoxing y los demás organizaron especialmente la línea comercial de investigación de IA internamente, buscando casos de aterrizaje relacionados con su propio negocio.

Fan Xiaoxing dijo que en el proceso de integración del modelo grande en el negocio, lo que consideró fue el costo y la eficiencia. "El costo de entrada del modelo grande sigue siendo bastante alto", dijo.

Los "clavos" de la industria de Internet son fáciles de encontrar. La verdadera dificultad para implementar la IA radica en las industrias físicas, como la industria y la fabricación.

Yu Kai le dijo a Huxiu que esta ola de IA todavía está subiendo en espiral y avanzando en oleadas, y las contradicciones en la implementación de la industria no han cambiado en absoluto, solo cambiaron el caparazón. Entonces, en este sentido, las leyes de las dos ondas de IA son las mismas, y la mejor manera es aprender de la historia: "Lecciones de la última ola de IA, no las repita esta vez".

Aunque muchos fabricantes han gritado el eslogan de "la industria primero" en la implementación de modelos grandes de IA, es realmente difícil para muchos escenarios industriales físicos igualar los modelos grandes de IA actuales. Por ejemplo, el sistema de inspección visual de IA aplicado en algunos escenarios de inspección industrial, incluso si la demanda del modelo de IA no es tan alta como mil millones de parámetros, los datos de entrenamiento inicial aún se estiran.

Tomando como ejemplo una simple escena de inspección de energía eólica, la cantidad de inspecciones en un parque eólico alcanza las 70,000 unidades, pero los mismos datos de crack pueden aparecer solo una vez, y la cantidad de datos que las máquinas pueden aprender está lejos de ser suficiente. Ke Liang, director de producto de Broadbo Intelligent Wind Power Hardware, dijo a Tiger Sniff que, en la actualidad, los robots de inspección de palas de aerogeneradores no pueden analizar con precisión las grietas de las palas al 100 % porque la cantidad de datos disponibles para la formación y el análisis es demasiado pequeña. la identificación también requiere una gran cantidad de acumulación de datos y análisis manual.

Sin embargo, en escenarios con una buena acumulación de datos industriales, los modelos grandes de IA ya pueden ayudar en la gestión de bibliotecas de piezas de modelos 3D complejas. La biblioteca de piezas de una empresa nacional de fabricación de aeronaves ha implementado una herramienta auxiliar de biblioteca de piezas basada en el modelo grande del cuarto paradigma "Shishuo". Entre más de 100,000 piezas de modelado 3D, la búsqueda de modelos 3D se puede realizar a través del lenguaje natural, el modelo 3D se puede buscar por modelo 3D e incluso se puede completar el ensamblaje automático del modelo 3D. Estas funciones requieren operaciones de varios pasos en muchas herramientas CAD y CAE que están atascadas en la industria manufacturera.

Los modelos a gran escala de hoy enfrentan los mismos problemas de aterrizaje que la IA hace unos años, y también tienen que encontrar clavos con un martillo. Algunas personas creen con optimismo que el martillo de hoy es completamente diferente al del pasado, pero cuando se trata de pagar la IA con dinero real, el resultado es algo diferente.

Según la encuesta Markets Live Pulse publicada por Bloomberg el 30 de julio, entre los 514 inversores encuestados, alrededor del 77 % planea aumentar o mantener la inversión en acciones tecnológicas en los próximos seis meses, y solo menos del 10 % de los inversores cree que la tecnología La industria se enfrenta a una grave crisis de burbujas. Sin embargo, solo la mitad de estos inversores que son optimistas sobre el desarrollo de la industria tecnológica están abiertos a la tecnología de IA.

El 50,2% de los encuestados indicaron que no tienen intención de pagar por la compra de herramientas de IA en este momento, y la mayoría de las empresas de inversión no tienen planes de aplicar IA a transacciones o inversiones a gran escala.

Pala Pala

"Si fueras a California a buscar oro durante la fiebre del oro en 1848, mucha gente moriría, pero las personas que vendían cucharas y palas siempre podían ganar dinero", dijo Lu Qi en un discurso.

Gao Feng (seudónimo) quiere ser un "vendedor de palas", para ser precisos, una persona que pueda "vender buenas palas en China".

Como investigador de chips, Gao Feng dedica la mayor parte de su tiempo de investigación científica a los chips de IA. En los últimos uno o dos meses, sintió una especie de urgencia: quería ser una empresa de CPU basada en la arquitectura RISC-V. En una casa de té, Gao Feng le describió el futuro a Huxiu.

Sin embargo, hacer un chip de IA desde cero, ya sea en la industria de chips o en el círculo tecnológico, es como una "Noche árabe".

Cuando el volante del modelo grande de IA comenzó rápidamente, el poder de cómputo detrás de él comenzó a fallar gradualmente para seguir el ritmo de los jugadores en esta pista. La creciente demanda de potencia informática ha convertido a Nvidia en el mayor ganador. Pero la GPU no es la solución completa para la potencia informática. La CPU, la GPU y varios chips innovadores de IA forman el principal centro de suministro de energía informática del modelo grande.

"Puede comparar la CPU con el área urbana, y la GPU es el suburbio del desarrollo". Gao Feng dijo que la CPU y el chip AI deben conectarse a través de un canal llamado PCIE, y los datos se transmiten al chip AI, y luego el chip AI envía los datos de regreso a la CPU. Si el volumen de datos del modelo grande aumenta, un canal se congestionará y la velocidad no aumentará. Por lo tanto, este camino debe ampliarse, y solo la CPU puede determinar el ancho de este canal y cuántos carriles deben ser establecido

Esto significa que incluso si China supera el chip de IA en el modelo grande, todavía es difícil atravesar la CPU más crítica. Incluso en el entrenamiento de IA, se pueden asignar más y más tareas a la GPU, pero la CPU sigue siendo el rol de "administrador" más crítico.

Algunos chips domésticos exhibidos en el área de exhibición de modelos grandes 2023WAIC

Han pasado más de 50 años desde que Intel creó la primera CPU del mundo en 1971. En los mercados de servidores civiles y PC, Intel y AMD han sido el mundo durante mucho tiempo. Intel ha establecido un sistema que cubre los derechos de propiedad intelectual, la acumulación de tecnología, el costo de escala, y la ecología del software Toda la barrera del modelo de negocio, y esta barrera nunca ha disminuido.

Es necesario abandonar por completo la arquitectura X86 y la arquitectura ARM, y desarrollar un chip de CPU completamente independiente basado en una nueva arquitectura, una arquitectura de código abierto como RISC-V que no ha sido completamente desarrollada y verificada.

El conjunto de instrucciones es como un pedazo de tierra. Desarrollar chips basados en el conjunto de instrucciones es equivalente a comprar un terreno y construir una casa. La arquitectura de X86 es de código cerrado y solo se permiten chips ecológicos de Intel. La arquitectura de ARM debe pagar tarifas de licencia de IP, mientras que RISC-V es una arquitectura gratuita de código abierto.

La industria y la academia ya ven tales oportunidades.

En 2010, el equipo de investigación de dos profesores de Berkeley, California, desarrolló un nuevo conjunto de instrucciones desde cero, a saber, RISC-V. Este conjunto de instrucciones es completamente de código abierto. Creen que el conjunto de instrucciones de la CPU no debe pertenecer a ningún compañía.

"RISC-V puede ser el comienzo de la CPU china", dijo Gao Feng. En 2018, incubó una empresa de chips de IA en el instituto. En ese momento, dijo que no quería perder la oportunidad para el desarrollo de la ola de IA. Esta vez, todavía quería aprovecharla, y esto el punto de entrada fue RISC-V. En la era de los modelos grandes y la sustitución doméstica, esta demanda es aún más urgente. Después de todo, si un día las empresas chinas ya no pueden usar A100, ¿qué deberían hacer?

"Si desea reemplazar ARM y X86, la CPU RISC-V debe ser más poderosa y debe participar en el desarrollo del código con personas que son sistemas operativos comerciales en Linux", dijo Gao Feng.

Gao Feng no es la primera persona en darse cuenta de esta oportunidad. Un inversionista en la industria de chips le dijo a Tiger Sniff que una vez conversó con el fundador de una empresa nueva de chips sobre la oportunidad de usar la arquitectura RISC-V para fabricar GPU. Hoy en día, ya hay algunas empresas en China que fabrican GPU basadas en la arquitectura RISC-V, pero la ecología sigue siendo el mayor problema al que se enfrentan.

"Linux ha demostrado que este camino se puede pasar." Gao Feng dijo que en el sistema operativo de código abierto de Linux, nacieron empresas de código abierto como Red Hat, y muchos servicios en la nube ahora se basan en el sistema Linux. "Se necesitan suficientes desarrolladores" Gao Feng propuso un método. Este camino es difícil, pero será un camino brillante si lo atraviesa.

el volante gira demasiado rápido

Bajo la "respuesta de estrés" del modelo grande, no es solo el pico el que siente la urgencia.

Lianchuang, una empresa nacional de modelos de inteligencia artificial a gran escala, le dijo a Tiger Sniff que también lanzaron brevemente un modelo de diálogo a gran escala a principios de este año, con muchas solicitudes de rectificación.

"Hasta que no haya una política regulatoria específica, no abriremos fácilmente el producto a los usuarios comunes. La razón principal es la lógica de To B". Zhang Chao, director ejecutivo de Left Hand Doctor, cree que antes de que se emitieran las "Medidas administrativas". , la IA generativa El producto está abierto a usuarios finales C, lo cual es muy arriesgado. "En esta etapa, por un lado, continuamos optimizando iterativamente y, por otro lado, también continuamos prestando atención a las políticas y regulaciones para garantizar la seguridad de la tecnología".

"El enfoque regulatorio para la IA generativa aún no está claro, y los productos y servicios de las empresas modelo a gran escala son generalmente de muy bajo perfil". Un proveedor de tecnología digital lanzó un producto de aplicación basado en un modelo general a gran escala desarrollado por una nube. fabricante en junio En la reunión, la persona a cargo de la tecnología de la compañía le dijo a Huxiu que el proveedor de la nube les exigía que mantuvieran la confidencialidad estrictamente, y si revelaban de quién era el modelo grande que se usaba, se consideraría que habían violado el contrato. En cuanto a por qué se debe mantener el secreto del caso, el responsable analizó que gran parte del motivo puede ser para evitar riesgos regulatorios.

En un momento en que el mundo está aumentando su vigilancia contra la IA, ningún mercado puede aceptar un "período de vacío" de regulación.

El 13 de julio, siete departamentos, incluida la Administración del Ciberespacio de China, publicaron oficialmente las "Medidas provisionales para la administración de los servicios de inteligencia artificial generativa" (en adelante, las "Medidas administrativas"), que entrarán en vigor el 15 de agosto de 2023.

"Después de que se emitan las 'Medidas administrativas', la política cambiará de un desarrollo orientado a problemas a un desarrollo orientado a objetivos, que es nuestro objetivo". Wang Yuwei, socio de Guantao Law Firm, cree que las nuevas regulaciones enfatizan el "drenaje" en lugar de que "bloquear".

Explorar la biblioteca de gestión de riesgos en los Estados Unidos es una tarea diaria para Wang Yuwei: "Estamos brindando soluciones de cumplimiento y control de riesgos para aplicaciones comerciales utilizando GPT y otros modelos grandes para segmentar industrias, y estableciendo un marco de gobierno de cumplimiento", dijo Wang Yuwei. .

Los gigantes de la IA de Estados Unidos se están alineando para mostrar su lealtad al Congreso. El 21 de julio, Google, OpenAI, Microsoft, Meta, Amazon, las startups de IA Inflection, Anthropic, las siete empresas estadounidenses de IA más influyentes, firmaron un compromiso voluntario en la Casa Blanca. Asegúrese de que los expertos en seguridad independientes puedan probar sus sistemas antes de lanzarlos al público. Y compartir datos sobre la seguridad de sus sistemas con gobiernos y academia. También desarrollarán sistemas para advertir al público cuando la IA genere imágenes, video o texto, utilizando un método conocido como "marca de agua".

Representantes de 7 gigantes estadounidenses de IA firmaron el compromiso de IA en la Casa Blanca

Anteriormente, en una audiencia en el Congreso de EE. UU., el fundador de OpenAI, Sam Altman, dijo que se debe crear un conjunto de estándares de seguridad para los modelos de inteligencia artificial, incluida la evaluación de sus capacidades peligrosas. Por ejemplo, los modelos deben pasar ciertas pruebas de seguridad, como si pueden "replicarse a sí mismos" e "infiltrarse en la naturaleza".

Quizás el mismo Sam Altman no esperaba que el volante de la IA girara tan rápido que incluso hubiera riesgo de perder el control.

"No nos dimos cuenta de la urgencia de este asunto al principio", dijo Wang Yuwei, hasta que más y más fundadores de empresas vinieron a consultar. Siente que esta ola de inteligencia artificial está experimentando cambios completamente diferentes a los del pasado.

A principios de este año, una empresa de Wenshengtu que fue la primera en acceder a modelos a gran escala se acercó a Wang Yuwei. La empresa quería introducir su negocio en China, por lo que querían saber sobre el negocio de cumplimiento de datos en esta área. Inmediatamente después, Wang Yuwei descubrió que había más y más consultas de este tipo, y el cambio más obvio fue que ya no era el asesor legal de la empresa sino el fundador quien acudía a consultar. "Con el surgimiento de la IA generativa, la lógica regulatoria original es difícil de aplicar", dijo Wang Yuwei.

Wang Yuwei, quien se ha dedicado al trabajo legal de big data durante muchos años, descubrió que la IA generativa y la ola anterior de IA están mostrando cambios más fundamentales. Por ejemplo, la última vez que la IA se basó más en recomendaciones basadas en algoritmos, y algunos reconocimientos faciales estaban dirigidos a una escena, y algunos modelos pequeños fueron entrenados en escenarios de aplicaciones específicas. Los problemas legales involucrados no eran más que derechos de propiedad intelectual. , Privacidad cuestiones de protección. Los diferentes roles en este ecosistema generativo de IA, como la empresa que proporciona el modelo grande subyacente, la empresa que se conecta al modelo grande para crear aplicaciones y el proveedor de la nube que almacena datos, etc., tienen una supervisión correspondiente diferente.

En la actualidad, existe un consenso sobre los riesgos asociados que traen los modelos grandes. La industria entiende que las aplicaciones comerciales inevitablemente amplificarán dichos riesgos. Para mantener la continuidad del negocio, es necesario prestar atención a la supervisión.

La dificultad es: "Cómo encontrar un camino que pueda regular bien sin afectar el desarrollo de la industria", dijo Wang Yuwei.

Conclusión

Para toda la industria, además de profundizar la discusión sobre tecnología, también está desencadenando un pensamiento de mayor alcance.

Cuando la IA está ocupando gradualmente una posición dominante en la industria de la tecnología, ¿cómo garantizar la equidad, la equidad y la transparencia de la tecnología? ¿Cómo garantizar que las pequeñas y medianas empresas y las empresas emergentes no queden marginadas cuando las empresas líderes controlan estrictamente la tecnología y los flujos de capital? El desarrollo y la aplicación de modelos a gran escala tiene un gran potencial, pero ¿seguir ciegamente la tendencia hará que ignoremos otras tecnologías innovadoras?

"A corto plazo, el gran modelo de IA se sobreestima seriamente. Pero a largo plazo, el gran modelo de IA se subestima seriamente".

En medio año, la ola de calor de la IA se disparó. Sin embargo, para las empresas chinas de nueva creación y los gigantes tecnológicos, la clave para probar su verdadera fuerza y visión será cómo mantener un juicio claro y hacer una planificación e inversión a largo plazo en la acalorada atmósfera del mercado.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)