Diálogo con Ji Xinhua, CEO de Youkede: Los grandes modelos competitivos no solo se acuestan y ganan si tienen una tarjeta

Autor| He Sisi

Editar | Zhang Jin

Fuente de la imagen: Generada por Unbounded AI

"Hasta cierto punto, la prohibición del poder de cómputo en los Estados Unidos limitará el desarrollo de modelos domésticos a gran escala, porque no hay forma de entrenar modelos sin poder de cómputo central". Ji Xinhua, presidente y director ejecutivo de UKED Dilo.

Desde que el modelo grande se hizo popular en China en febrero de este año, la potencia informática se ha convertido instantáneamente en el tema más preocupante de la industria, y también se ha convertido en un obstáculo difícil de superar en la capacitación nacional de modelos grandes. De hecho, desde otra perspectiva, el crecimiento explosivo del poder de la computación también ha brindado oportunidades de desarrollo sin precedentes para los proveedores nacionales de computación en la nube.

En este sentido, Ji Xinhua también estuvo de acuerdo. Dijo que la desactivación de la potencia informática es algo malo y bueno. Por un lado, si desea resolver el problema del cuello de botella dentro de uno o dos años, debe acelerar la investigación y el desarrollo de chips domésticos, que no es una tarea fácil, por otro lado, las empresas están prestando cada vez más atención a la potencia informática, esto en cambio promoverá el desarrollo de chips domésticos.

Como fabricante neutral de computación en la nube, Youkede ha sentido durante mucho tiempo que detrás de la competencia de los modelos grandes, el mercado de la potencia informática marcará el comienzo de grandes cambios.

"Entré en contacto con Stable Diffusion por primera vez en noviembre del año pasado. En ese momento, pensé que su efecto era increíble, así que comencé a prestar atención al modelo grande". Ji Xinhua explicó a Leifeng.com por qué pagó atención al modelo grande Al mismo tiempo, también reveló que debido a que en ese momento, las empresas chinas no habían comenzado a prestar atención a los modelos a gran escala, y no sabían cuánto valor podría crear, por lo que no se decidieron a hacer negocios a gran escala relacionados con modelos en ese momento.

La aplicación real de modelos a gran escala y el servicio de empresas modelo a gran escala por parte del Reino Unido comenzarán en febrero de este año, que también es el momento para que los modelos a gran escala salgan del círculo en China.

Leifeng.com se enteró de que UKED desarrolló primero cuatro productos de IA para uso interno basados en el modelo a gran escala, la plataforma de preguntas y respuestas de conocimiento "Shiwen", la plataforma de asistente de código UCoder, la plataforma de asistente de pintura de IA y el plataforma de gestión de seguridad de modelos a gran escala. Para un centro de datos autoconstruido de bajo costo y alto valor agregado, UKED ha creado una base de potencia informática AIGC, que proporciona de manera flexible una variedad de recursos de potencia informática GPU para entrenamiento de modelos grandes, razonamiento y procesamiento de datos.

Inmediatamente después, UKED lanzó un modelo de máquina todo en uno privatizado a gran escala, que incorporó la plataforma de nube privada de pila completa UCloudStack desarrollada de forma independiente por UKED, proporcionando soluciones de privatización para virtualización, almacenamiento, red y modelos MaaS, combinados con modelos verticales de la industria a gran escala Las empresas pueden implementar aplicaciones de modelos grandes con un solo clic.

En cuanto al posicionamiento de UKED en la era de los grandes modelos, Ji Xinhua volvió a hacer hincapié en el principio de "neutralidad". Explicó que la neutralidad significa que el Reino Unido no solo no tiene competencia con los clientes, sino que también ayuda a las grandes empresas modelo a encontrar clientes. En este sentido, Ji Xinhua también se burló públicamente de que en la era de los modelos grandes, lo que Youke tiene que hacer es "casamentero".

De la respuesta de Ji Xinhua, también podemos obtener indirectamente las razones de la I+D interna de UKED y la aplicación de productos de modelos a gran escala. Una es que los empleados de la empresa entiendan los modelos a gran escala y aprendan a utilizarlos. Sobre esta base, pueden comprender profundamente los modelos a gran escala, cuáles son los puntos débiles y en qué escenarios se pueden implementar, para servir mejor a los clientes.

Cuando se trata del futuro de los modelos grandes, Ji Xinhua dijo que hay demasiadas incertidumbres en el futuro, pero pase lo que pase, la industria de Internet o la industria de la inteligencia artificial necesitan poder de cómputo. Las capacidades de interconexión son limitadas, por lo que el trabajo futuro de UKEDE El objetivo es construir una base de poder de cómputo a gran escala.

La siguiente es la conversación entre Leifeng.com y Ji Xinhua:

Los modelos grandes competitivos no solo se acuestan y ganan si tienen cartas, las capacidades de ingeniería son cruciales para el entrenamiento del modelo.

**Leifeng.com:**Muchas personas dicen que solo unos pocos proveedores de la nube finalmente pueden participar en la competencia de modelos a gran escala. No todos tienen redes de alta velocidad. ¿Cuáles cree que son las barreras para la competencia?

Ji Xinhua: Así es, las tecnologías como las redes de alta velocidad no son el umbral principal para los modelos grandes de la competencia. Incluido Youkede y la mayoría de los proveedores de la nube son capaces de hacerlo. Ahora la red tiene dos estructuras: la primera es la red RoCE, que UKED ya tiene esta capacidad en 2019.

La segunda es la solución de red IB, recomendada por Nvidia.Esta solución es relativamente simple y solo necesita implementación y mantenimiento. Por lo tanto, para los proveedores de la nube o las empresas particularmente grandes, la tecnología no es el umbral principal.

**Leifeng.com:**En realidad, se dice que muchas empresas a gran escala han comenzado a acumular tarjetas.

Ji Xinhua: Sí, especialmente algunos de los principales fabricantes están acumulando tarjetas, incluidas A800, H800, etc. Por un lado, su propio negocio de IA necesita usar tarjetas, y con más inversión de capital, comprará una gran cantidad de tarjetas antes; por otro lado, la atención nacional a gran escala de modelos grandes comenzó en febrero de este año, y varios fabricantes Debido a la importancia, también acelerará la velocidad de acaparamiento de tarjetas.

Leifeng.com: ¿Significa que cuantas más cartas tengas, más ganarás? ¿Cómo compiten otros proveedores de nube con los grandes jugadores?

Ji Xinhua: No me acosté y gané. Muchas empresas de modelos de IA a gran escala ahora usan nuestras tarjetas. Este fenómeno es muy común.

Hay varias razones: primero, no es suficiente usar una sola tarjeta, y segundo, ¿por qué la gran compañía de modelos está dispuesta a cooperar con Youkede? Es porque sienten que las grandes fábricas tienen poder de cómputo, algoritmos, datos y escenarios, y al final les preocupa la competencia comercial cuando cooperan con las grandes fábricas. Como proveedor de nube neutral y seguro, Ukerd no tiene competencia con las empresas a gran escala. Al mismo tiempo, UKDE puede desarrollar plataformas de potencia informática, bibliotecas de modelos, etc. desde el centro de datos y la arquitectura subyacente, con una gran acumulación técnica y capacidades de servicio de ingeniería de sistemas integrales.

Haga un buen trabajo en el servicio de potencia informática y haga un buen trabajo en el papel del gran modelo "casamentero"

**Leifeng.com: **¿Cuándo comenzó Youkede a prestar atención a los modelos grandes?

**Ji Xinhua: **El primer contacto fue durante el Día Nacional del año pasado. Lo primero que vi fue Stable Diffusion. En ese momento, pensé que su efecto era increíble, así que comencé a prestar atención al modelo grande, así que Hicimos un seguimiento de ChatGPT anteriormente.

Leifeng.com: ¿Decidiste hacer esto durante el Día Nacional del año pasado?

Ji Xinhua: Después del Día Nacional del año pasado, UKED estableció AIGC como objetivo para este año y lanzó la imagen de la plataforma de pintura AI en noviembre del año pasado. En febrero de este año, después de comunicarme con las principales empresas de modelos a gran escala en China, me di cuenta de que el mercado de potencia informática nacional tendrá un desarrollo explosivo, por lo que decidí hacerlo a fines de marzo.

Leifeng.com: ¿Cuántos clientes potenciales hay en estas empresas modelo a gran escala?

Ji Xinhua: Llegamos a la conclusión de que hay 130 empresas modelo a gran escala en China, 78 empresas de propósito general y 52 empresas verticales. Y sigue aumentando, más de 30 de ellos ya son nuestros clientes.

Leifeng.com: ¿De qué forma se exportará el servicio?

Ji Xinhua: Uno es nuestro poder de cómputo y el otro son los servicios de sala de cómputo, porque algunas compañías compran su propio equipo y lo ponen en nuestra sala de cómputo.

Leifeng.com: ¿Cómo entiendes el servicio de sala de informática? ¿Es porque el propio cliente no tiene capacidades operativas?

Ji Xinhua: La empresa misma necesita una sala de computadoras sin importar dónde se encuentre. La sala de computadoras requerida por un modelo grande tiene dos características: una es que consume mucha energía y la otra es que el consumo de energía de una máquina H100 supera los 10 kW. La sala de ordenadores no puede satisfacer esta demanda, y el centro de datos Ulanqab de Youkede es especialmente adecuado. Además, muchas empresas ahora tienen el problema de tener servidores pero no pueden utilizarlos, Ukerde les puede ayudar a construir una plataforma de potencia informática y realizar los trabajos de mantenimiento posteriores.

Leifeng.com: Además de proporcionar potencia informática, ¿Youkede también lanzó "Shiwen" hace algún tiempo?

Ji Xinhua: UKED ha construido cuatro plataformas internas: plataforma de preguntas y respuestas de conocimiento "Shiwen", plataforma de asistente de código UCoder, plataforma de asistente de pintura AI y plataforma de gestión de seguridad de modelos grandes. De hecho, antes del "conocimiento", lo primero que hicimos fue el sistema de gestión de aplicaciones modelo a gran escala. Este es nuestro primer producto, y esperamos que todos puedan usar el modelo a gran escala en el futuro;

En segundo lugar, para resolver problemas de seguridad comercial, hemos realizado algunas restricciones, incluidas sus preguntas y archivos cargados, los registraremos y filtraremos para evitar que la información confidencial de la empresa se filtre en Internet;

En tercer lugar, para los problemas de los usuarios, incluidos los problemas internos de los empleados y la comunicación y los comentarios externos, el sistema registrará automáticamente, de modo que la empresa pueda continuar llevando a cabo su propia capacitación modelo en la etapa posterior.

Leifeng.com: ¿Por qué hiciste estos cuatro productos? ¿Puede salir al exterior?

Ji Xinhua: Primero, para que los empleados de la empresa puedan comprender y utilizar modelos a gran escala. Sobre esta base, pueden comprender profundamente cuáles son los puntos débiles de las empresas modelo a gran escala y en qué escenarios se implementarán, a fin de servir mejor a los clientes.Proporcionar servicios.

Estos cuatro productos actualmente son utilizados internamente por la empresa, pero si los clientes lo necesitan, también podemos comunicar más.

Leifeng.com: ¿En qué modelo se basan estas plataformas?

**Ji Xinhua: **Entrene con GPT 4 primero, realice la verificación del modelo y luego use gradualmente modelos grandes nacionales o modelos grandes de código abierto para optimizar. En este sentido, también mencioné un concepto llamado "afilar armas en el extranjero y luchar en casa".

Leifeng.com: ¿Sobre qué otros escenarios es optimista en el futuro?

Ji Xinhua: Si se distingue según la tolerancia a la naturaleza imprecisa del contenido de salida de ChatGPT, hemos dividido 10 escenarios.

El primero es la traducción y el doblaje. La habilidad en esta área ya es muy alta y puede reemplazar completamente a los humanos; el segundo es el NPC del juego; el tercero es la interacción social; el cuarto es la salida de contenido del comercio electrónico; el quinto es el diseño de juegos; el sexto es el servicio al cliente; el séptimo es la asistencia documental y de programación; el octavo es la gestión del conocimiento dentro de la empresa; el noveno es la educación y los escenarios de seguros; y el último es la asistencia a abogados y médicos.

Leifeng.com: ¿Estas 10 escenas se harán al mismo tiempo? O paso a paso?

Ji Xinhua: Ucar no fabrica modelos grandes, solo conectamos a clientes y socios, lo que puede entenderse como el papel de "casamentero". Por ejemplo, conecte a los clientes de juegos con MiniMax y conecte a los clientes de las industrias de comercio electrónico y educación con Zhipu Huazhang.

Es difícil que los modelos domésticos a gran escala se pongan al día con GPT4, y hay más oportunidades para las empresas de nueva creación

Leifeng.com: ¿En cuántos tipos cree que se pueden dividir las grandes empresas nacionales? ¿Quiénes son los clientes clave de Youkede?

Ji Xinhua: Estamos divididos en cinco categorías. La primera categoría son los gigantes, incluidos Ali, Baidu, Toutiao, Huawei, JD.com, etc. La segunda categoría la inician científicos, como Zhipu Huazhang; la tercera categoría es la empresa de IA original, AI Four Tigers, Daguan, Yunzhisheng, 4Paradigm, etc.; la cuarta categoría son empresas emergentes, como MiniMax; la quinta categoría es que las empresas cotizadas originales cambiaron a modelos a gran escala, como Kunlun, 360, y también incluyen líderes empresariales como Wang Xiaochuan y Li Kaifu.

El primer tipo de grandes fabricantes no son los clientes objetivo de Youkede, y los últimos tipos son nuestros clientes clave.

Leifeng.com: Es decir, las grandes fábricas tienen la capacidad de construirse a sí mismas, ¿pero otras empresas no tienen la capacidad de construirse a sí mismas?

Ji Xinhua: Debido a que involucra el campo de la inteligencia artificial, no es solo un problema de red, sino también una serie de problemas como el almacenamiento y las salas de computadoras. Por ejemplo, las empresas nuevas también pueden construir su propia computadora. poder, pero el ciclo será muy largo. Espere a que él mismo lo construya. Después de eso, la competencia ha terminado. La competencia de modelos grandes tiene que ver con la velocidad, y quien tenga la velocidad más rápida puede ocupar las alturas dominantes.

Leifeng.com: Para una gran fábrica, ¿cuántas etapas y nodos hay para un modelo grande?

Ji Xinhua: El primero es el lanzamiento del modelo grande y el segundo es la verificación del efecto después del lanzamiento. En la actualidad, se sabe que se han lanzado empresas como MiniMax, Zhipu, Baidu, Ali, HKUST Xunfei, etc.

Leifeng.com:¿Cuál es mejor? ¿Depende principalmente de la potencia informática que utiliza?

Ji Xinhua: No lo creo. Más poder de cómputo para el entrenamiento puede no necesariamente producir un buen modelo, pero si el enlace de inferencia se usa más, significa que hay una gran cantidad de usuarios y más comentarios. se obtendrá Es propicio para entrenar un buen modelo.

**Leifeng.com:**Independientemente de la capacitación o el razonamiento, para construir un modelo grande, primero debe tener poder de cómputo.

Ji Xinhua: Sí, lo primero es tener una tarjeta. Si no tienes una tarjeta, definitivamente estarás atrasado. Alrededor del 40-50%. Si se resuelven los dos problemas anteriores, es un problema de seguridad y el problema del flujo también es muy importante.

Leifeng.com: ¿Cuál es el nivel de los modelos domésticos? Mucha gente dice que alcanzará a GPT4 a finales de este año.

Ji Xinhua: Actualmente, no hay ningún modelo que supere GPT3.5 en China. Por supuesto, en realidad es muy fácil superar GPT3.5 en cierto aspecto. Es difícil superar GPT4, la clave es que los papeles anteriores a GPT3.5 son públicos, pero GPT4 aún no se ha hecho público, por lo que no todos saben qué hacer.

Leifeng.com: ¿Estos grandes fabricantes nacionales no tienen la oportunidad de ponerse al día?

Ji Xinhua: Creo que el efecto de las grandes empresas no es tan bueno como el de las empresas emergentes. Porque algunas empresas emergentes con creencias e ideales ya han comenzado a hacerlo, y Dachang realmente comenzó después de ver la popularidad de ChatGPT.

Leifeng.com: Es lógico que los grandes fabricantes hayan acumulado tecnología, ¿entonces no tienen más oportunidades?

Ji Xinhua: Hay muchas direcciones para la IA. En el pasado, la mayoría de las empresas pensaban que los modelos verticales a gran escala tenían oportunidades, pero no pensaban que los modelos a gran escala de propósito general tenían oportunidades. Por lo tanto, en el pasado Algunos años, fueron algunos equipos empresariales con convicción y equipos de investigación científica, como Zhipu Huazhang, MiniMax, Academia de Ciencias de China, etc.

Para los grandes fabricantes, es más ver que los países extranjeros hacen un seguimiento después de hacer esto, y no ha estado a la altura de la estrategia de la compañía, por lo que no tienen mucha acumulación en modelos grandes de uso general.

Leifeng.com: El problema de la potencia informática se resolverá tarde o temprano, entonces, ¿cuáles son las ventajas de UKEDe en términos de modelos grandes?

Ji Xinhua: Se puede resumir en tres puntos: primero, mantener la neutralidad y no tener una relación competitiva con los usuarios. En segundo lugar, tiene la capacidad de crear un conjunto completo de soluciones AIGC para centros de datos, redes y almacenamiento de datos, lo que puede ayudar a las pequeñas y medianas empresas a crear rápidamente plataformas y resolver el problema de eficiencia del uso de modelos grandes; en tercer lugar, puede ayudar mejor a las grandes empresas modelo a expandir clientes.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)