La potencia computacional se convierte en un nuevo modelo de negocio, la ola de "refinamiento de modelos grandes" podría pasar.
La competencia por la potencia computacional desatada por el entrenamiento de grandes modelos está impulsando los servicios de potencia computacional a convertirse en un nuevo modelo de negocio. Sin embargo, en la industria se considera que la actual ola de grandes modelos eventualmente se desvanecerá, y los proveedores de servicios de potencia computacional deben prepararse con anticipación y ajustar oportunamente su dirección estratégica.
Recientemente, un joven que se graduó de la Universidad de Tsinghua hace tres años utilizó 200 tarjetas GPU y pasó aproximadamente dos meses entrenando un gran modelo meteorológico con una cantidad de parámetros en el nivel de cientos de millones. Se estima que el costo de entrenamiento de este gran modelo en el campo vertical supera los 2 millones de yuanes. Si se tratara de entrenar un gran modelo general, el costo podría multiplicarse por cien.
Actualmente, en China ya hay más de 100 modelos de gran escala con 10 mil millones de parámetros. Sin embargo, la industria enfrenta problemas generales como la escasez de GPU de alta gama y el alto costo de la potencia computacional. Un ejecutivo de una gran empresa admitió: "La falta de potencia computacional es un hecho, pero no podemos hacer nada al respecto." La demanda de GPU de alta gama supera la oferta, los precios se disparan y los costos de alquiler también aumentan, pero aun así, puede que no se puedan comprar los chips.
Frente a esta situación, las empresas están respondiendo activamente. Algunas compañías están mejorando la eficiencia mediante el uso de datos de entrenamiento de mayor calidad, mientras que otras se centran en mejorar la capacidad de la infraestructura para lograr un funcionamiento estable de clústeres de GPU a gran escala. También hay fabricantes que eligen hacer la transición de arquitecturas de computación en la nube a arquitecturas de supercomputación, o utilizar plataformas nacionales en lugar de GPU de Nvidia.
Los expertos señalan que para lograr la aplicación a gran escala de la tecnología de inteligencia artificial, se necesita una gran cantidad de Potencia computacional barata y fácil de usar, para que las pequeñas y medianas empresas también puedan utilizarla de manera conveniente. La Potencia computacional se ha convertido gradualmente en un nuevo modelo de servicio en medio de la demanda y la iteración tecnológica.
La cadena de la industria de servicios de potencia computacional está en formación; la parte superior proporciona recursos básicos, la parte media se encarga de la producción y programación de potencia computacional, y la parte inferior son los usuarios de la industria. Los proveedores de servicios en la nube, entre otros, están explorando nuevos modelos comerciales de servicios de potencia computacional, como el cobro por uso, tarifas anuales o mensuales, etc.
A pesar de que la escasez actual de GPUs de alta gama ha llevado a una lucha por la Potencia computacional, los expertos de la industria creen que esto es solo un fenómeno temporal. A largo plazo, la servitización de la Potencia computacional es una tendencia inevitable. Los proveedores de Potencia computacional necesitan planificar con anticipación y prepararse para la transformación una vez que el mercado regrese a la racionalidad.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
16 me gusta
Recompensa
16
3
Republicar
Compartir
Comentar
0/400
GasWaster
· hace9h
los precios de las gpu van brrrr... al igual que el gas de eth en 2021 smh
Ver originalesResponder0
DefiPlaybook
· hace9h
El costo de la alquimia es comparable al de las primeras Rig de Minera de Bit, ya no se puede aprovechar.
La batalla por la potencia computacional de los grandes modelos: la estrategia a largo plazo detrás de la ola de entusiasmo a corto plazo.
La potencia computacional se convierte en un nuevo modelo de negocio, la ola de "refinamiento de modelos grandes" podría pasar.
La competencia por la potencia computacional desatada por el entrenamiento de grandes modelos está impulsando los servicios de potencia computacional a convertirse en un nuevo modelo de negocio. Sin embargo, en la industria se considera que la actual ola de grandes modelos eventualmente se desvanecerá, y los proveedores de servicios de potencia computacional deben prepararse con anticipación y ajustar oportunamente su dirección estratégica.
Recientemente, un joven que se graduó de la Universidad de Tsinghua hace tres años utilizó 200 tarjetas GPU y pasó aproximadamente dos meses entrenando un gran modelo meteorológico con una cantidad de parámetros en el nivel de cientos de millones. Se estima que el costo de entrenamiento de este gran modelo en el campo vertical supera los 2 millones de yuanes. Si se tratara de entrenar un gran modelo general, el costo podría multiplicarse por cien.
Actualmente, en China ya hay más de 100 modelos de gran escala con 10 mil millones de parámetros. Sin embargo, la industria enfrenta problemas generales como la escasez de GPU de alta gama y el alto costo de la potencia computacional. Un ejecutivo de una gran empresa admitió: "La falta de potencia computacional es un hecho, pero no podemos hacer nada al respecto." La demanda de GPU de alta gama supera la oferta, los precios se disparan y los costos de alquiler también aumentan, pero aun así, puede que no se puedan comprar los chips.
Frente a esta situación, las empresas están respondiendo activamente. Algunas compañías están mejorando la eficiencia mediante el uso de datos de entrenamiento de mayor calidad, mientras que otras se centran en mejorar la capacidad de la infraestructura para lograr un funcionamiento estable de clústeres de GPU a gran escala. También hay fabricantes que eligen hacer la transición de arquitecturas de computación en la nube a arquitecturas de supercomputación, o utilizar plataformas nacionales en lugar de GPU de Nvidia.
Los expertos señalan que para lograr la aplicación a gran escala de la tecnología de inteligencia artificial, se necesita una gran cantidad de Potencia computacional barata y fácil de usar, para que las pequeñas y medianas empresas también puedan utilizarla de manera conveniente. La Potencia computacional se ha convertido gradualmente en un nuevo modelo de servicio en medio de la demanda y la iteración tecnológica.
La cadena de la industria de servicios de potencia computacional está en formación; la parte superior proporciona recursos básicos, la parte media se encarga de la producción y programación de potencia computacional, y la parte inferior son los usuarios de la industria. Los proveedores de servicios en la nube, entre otros, están explorando nuevos modelos comerciales de servicios de potencia computacional, como el cobro por uso, tarifas anuales o mensuales, etc.
A pesar de que la escasez actual de GPUs de alta gama ha llevado a una lucha por la Potencia computacional, los expertos de la industria creen que esto es solo un fenómeno temporal. A largo plazo, la servitización de la Potencia computacional es una tendencia inevitable. Los proveedores de Potencia computacional necesitan planificar con anticipación y prepararse para la transformación una vez que el mercado regrese a la racionalidad.