Desafío del modelo de IA de código abierto en la nube de Alibaba Meta Llama 2

Esto sigue al lanzamiento de Meta de su propio LLM de código abierto, Llama 2, en julio.

Alibaba Cloud, el brazo de computación en la nube del gigante tecnológico chino Alibaba Group, ha presentado dos modelos de lenguaje de inteligencia artificial (IA) de código abierto llamados Gwen-7B y Gwen-7B-Chat. Cada modelo tiene hasta 7 mil millones de parámetros, convirtiéndose en la primera empresa a gran escala en China en LLM de código abierto. En un comunicado de prensa oficial del 3 de agosto, la compañía dijo que los dos modelos de lenguaje de código abierto se construyeron con hasta 7 mil millones de parámetros cada uno, lo que los convierte en serios contendientes en el espacio de la IA.

Esto sigue al lanzamiento de Meta de su propio LLM de código abierto, Llama 2, en julio. Los modelos Gwen de Alibaba tienen 7 mil millones de parámetros cada uno, mientras que Llama 2 de Meta (la versión comercial de su modelo de código abierto Llama) tiene 70 mil millones de parámetros, lo que lo convierte en uno de los LLM de código abierto más grandes del mundo. La semana pasada, Alibaba Cloud se asoció con Meta para poner Llama a disposición de las empresas chinas, lo que les permitió crear aplicaciones de IA personalizadas.

Aliyun proporciona nuevos modelos de inteligencia artificial de forma gratuita

La división Alibaba Cloud había lanzado previamente un LLM llamado "Unified Qianwen" en abril, que ofrece múltiples versiones con diferentes números de parámetros. Los nuevos Gwen-7B y Gwen-7B-Chat de código abierto son versiones más pequeñas de Unified Qian Wen, diseñadas para satisfacer las necesidades de las pequeñas y medianas empresas que buscan aprovechar el poder de la inteligencia artificial.

El objetivo de la empresa es brindar a los usuarios, incluidos investigadores académicos y organizaciones comerciales de todo el mundo, acceso gratuito al código, los pesos de los modelos y la documentación de ambos modelos. Sin embargo, las entidades con más de 100 millones de usuarios activos mensuales necesitan una licencia de Alibaba para utilizar estos modelos. Asimismo, Llama 2 de Meta requiere una licencia de la compañía con más de 700 millones de usuarios.

El código abierto de estos grandes modelos de lenguaje es parte de un esfuerzo para ayudar a democratizar la tecnología de IA. Al hacer que estos modelos estén disponibles gratuitamente, más empresas y desarrolladores podrán usarlos para desarrollar nuevas aplicaciones de IA.

Los modelos LLM AI pueden procesar grandes cantidades de datos y generar contenido en varios formatos, incluidos texto, imágenes, audio y video. Estas herramientas son la columna vertebral de los chatbots de IA como ChatGPT, impulsan la innovación y mejoran la experiencia del usuario en múltiples dominios.

Las autoridades chinas alientan el desarrollo de la inteligencia artificial a nivel nacional

Si bien Alibaba Cloud aún tiene que revelar una versión de alto parámetro de Tongyi Qianwen, la medida marca un gran paso adelante para que China alcance a Estados Unidos en inteligencia artificial. El gobierno chino alienta activamente a las empresas locales como Alibaba, Tencent y Huawei a desarrollar modelos de inteligencia artificial competitivos y "controlables" para desafiar el dominio de la tecnología de inteligencia artificial estadounidense.

Se espera que el código abierto de Alibaba Cloud LLM mejore las capacidades técnicas y las aplicaciones industriales del LLM de mi país. Además, estas herramientas simplificarán el proceso de implementación y capacitación de modelos de las empresas, reducirán el umbral de la aplicación de inteligencia artificial y crearán LLM específicos de la industria con mayor eficiencia.

Mientras tanto, además de Alibaba y Meta, otros gigantes tecnológicos como Google y Microsoft también están trabajando en modelos de lenguaje a gran escala para diversas aplicaciones, incluida la generación de texto, la traducción de idiomas y los sistemas de respuesta a preguntas.

El panorama global de IA está experimentando una competencia intensa y una rápida innovación, lo que impulsa el crecimiento y la adopción de tecnologías de IA en varias industrias, incluidas las criptomonedas.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)