Isso segue o lançamento da Meta de seu próprio LLM de código aberto, Llama 2, em julho.
O Alibaba Cloud, o braço de computação em nuvem do gigante chinês de tecnologia Alibaba Group, introduziu dois modelos de linguagem de inteligência artificial (IA) de código aberto chamados Gwen-7B e Gwen-7B-Chat. Cada modelo tem até 7 bilhões de parâmetros, tornando-se a primeira empresa de grande escala na China a abrir o código LLM. Em um comunicado de imprensa oficial em 3 de agosto, a empresa disse que os dois modelos de linguagem de código aberto foram construídos com até 7 bilhões de parâmetros cada, tornando-os sérios concorrentes no espaço de IA.
Isso segue o lançamento da Meta de seu próprio LLM de código aberto, Llama 2, em julho. Os modelos Gwen da Alibaba têm 7 bilhões de parâmetros cada, enquanto o Llama 2 da Meta (a versão comercial de seu modelo de código aberto Llama) tem 70 bilhões de parâmetros, tornando-o um dos maiores LLMs de código aberto do mundo. Na semana passada, o Alibaba Cloud fez parceria com a Meta para disponibilizar o Llama para empresas chinesas, permitindo que essas empresas criem aplicativos personalizados de IA.
Aliyun fornece novos modelos de inteligência artificial gratuitamente
A divisão Alibaba Cloud já havia lançado um LLM chamado "Unified Qianwen" em abril, oferecendo várias versões com diferentes números de parâmetros. O Gwen-7B e o Gwen-7B-Chat, de código aberto, são versões menores do Unified Qian Wen, projetados para atender às necessidades de pequenas e médias empresas que buscam aproveitar o poder da inteligência artificial.
O objetivo da empresa é fornecer aos usuários, incluindo pesquisadores acadêmicos e organizações comerciais em todo o mundo, acesso gratuito ao código, pesos de modelo e documentação para ambos os modelos. No entanto, entidades com mais de 100 milhões de usuários ativos mensais precisam de uma licença do Alibaba para usar esses modelos. Da mesma forma, o Llama 2 da Meta requer uma licença da empresa com mais de 700 milhões de usuários.
O código aberto desses grandes modelos de linguagem faz parte de um esforço para ajudar a democratizar a tecnologia de IA. Ao disponibilizar esses modelos gratuitamente, mais empresas e desenvolvedores poderão usá-los para desenvolver novos aplicativos de IA.
Os modelos LLM AI podem processar grandes quantidades de dados e gerar conteúdo em vários formatos, incluindo texto, imagens, áudio e vídeo. Essas ferramentas são a espinha dorsal dos chatbots de IA como o ChatGPT, impulsionando a inovação e aprimorando a experiência do usuário em vários domínios.
As autoridades chinesas incentivam a inteligência artificial a se desenvolver domesticamente
Embora o Alibaba Cloud ainda não tenha revelado uma versão de alto parâmetro de Tongyi Qianwen, o movimento marca um grande passo para a China alcançar os Estados Unidos em inteligência artificial. O governo chinês incentiva ativamente empresas locais como Alibaba, Tencent e Huawei a desenvolver modelos de inteligência artificial competitivos e "controláveis" para desafiar o domínio da tecnologia de inteligência artificial americana.
Espera-se que o código aberto do Alibaba Cloud LLM aprimore os recursos técnicos e as aplicações da indústria do LLM do meu país. Além disso, essas ferramentas simplificarão o processo de treinamento e implantação de modelos de empresas, reduzirão o limite de aplicação de inteligência artificial e criarão LLMs específicos do setor com maior eficiência.
Enquanto isso, além de Alibaba e Meta, outros gigantes da tecnologia, como Google e Microsoft, também estão trabalhando em modelos de linguagem em grande escala para várias aplicações, incluindo geração de texto, tradução de idiomas e sistemas de resposta a perguntas.
O cenário global de IA está enfrentando intensa concorrência e rápida inovação, impulsionando o crescimento e a adoção de tecnologias de IA em vários setores, incluindo criptomoedas.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Alibaba Cloud Open Source AI Model Challenge Meta Llama 2
Isso segue o lançamento da Meta de seu próprio LLM de código aberto, Llama 2, em julho.
O Alibaba Cloud, o braço de computação em nuvem do gigante chinês de tecnologia Alibaba Group, introduziu dois modelos de linguagem de inteligência artificial (IA) de código aberto chamados Gwen-7B e Gwen-7B-Chat. Cada modelo tem até 7 bilhões de parâmetros, tornando-se a primeira empresa de grande escala na China a abrir o código LLM. Em um comunicado de imprensa oficial em 3 de agosto, a empresa disse que os dois modelos de linguagem de código aberto foram construídos com até 7 bilhões de parâmetros cada, tornando-os sérios concorrentes no espaço de IA.
Isso segue o lançamento da Meta de seu próprio LLM de código aberto, Llama 2, em julho. Os modelos Gwen da Alibaba têm 7 bilhões de parâmetros cada, enquanto o Llama 2 da Meta (a versão comercial de seu modelo de código aberto Llama) tem 70 bilhões de parâmetros, tornando-o um dos maiores LLMs de código aberto do mundo. Na semana passada, o Alibaba Cloud fez parceria com a Meta para disponibilizar o Llama para empresas chinesas, permitindo que essas empresas criem aplicativos personalizados de IA.
Aliyun fornece novos modelos de inteligência artificial gratuitamente
A divisão Alibaba Cloud já havia lançado um LLM chamado "Unified Qianwen" em abril, oferecendo várias versões com diferentes números de parâmetros. O Gwen-7B e o Gwen-7B-Chat, de código aberto, são versões menores do Unified Qian Wen, projetados para atender às necessidades de pequenas e médias empresas que buscam aproveitar o poder da inteligência artificial.
O objetivo da empresa é fornecer aos usuários, incluindo pesquisadores acadêmicos e organizações comerciais em todo o mundo, acesso gratuito ao código, pesos de modelo e documentação para ambos os modelos. No entanto, entidades com mais de 100 milhões de usuários ativos mensais precisam de uma licença do Alibaba para usar esses modelos. Da mesma forma, o Llama 2 da Meta requer uma licença da empresa com mais de 700 milhões de usuários.
O código aberto desses grandes modelos de linguagem faz parte de um esforço para ajudar a democratizar a tecnologia de IA. Ao disponibilizar esses modelos gratuitamente, mais empresas e desenvolvedores poderão usá-los para desenvolver novos aplicativos de IA.
Os modelos LLM AI podem processar grandes quantidades de dados e gerar conteúdo em vários formatos, incluindo texto, imagens, áudio e vídeo. Essas ferramentas são a espinha dorsal dos chatbots de IA como o ChatGPT, impulsionando a inovação e aprimorando a experiência do usuário em vários domínios.
As autoridades chinesas incentivam a inteligência artificial a se desenvolver domesticamente
Embora o Alibaba Cloud ainda não tenha revelado uma versão de alto parâmetro de Tongyi Qianwen, o movimento marca um grande passo para a China alcançar os Estados Unidos em inteligência artificial. O governo chinês incentiva ativamente empresas locais como Alibaba, Tencent e Huawei a desenvolver modelos de inteligência artificial competitivos e "controláveis" para desafiar o domínio da tecnologia de inteligência artificial americana.
Espera-se que o código aberto do Alibaba Cloud LLM aprimore os recursos técnicos e as aplicações da indústria do LLM do meu país. Além disso, essas ferramentas simplificarão o processo de treinamento e implantação de modelos de empresas, reduzirão o limite de aplicação de inteligência artificial e criarão LLMs específicos do setor com maior eficiência.
Enquanto isso, além de Alibaba e Meta, outros gigantes da tecnologia, como Google e Microsoft, também estão trabalhando em modelos de linguagem em grande escala para várias aplicações, incluindo geração de texto, tradução de idiomas e sistemas de resposta a perguntas.
O cenário global de IA está enfrentando intensa concorrência e rápida inovação, impulsionando o crescimento e a adoção de tecnologias de IA em vários setores, incluindo criptomoedas.