Wenxin Big Model 4.0 Lançado! Reivindicações para benchmark GPT 4.0

Fonte do artigo: Geek Park

Autor | Li Yuan

Editar | Jing Yu

Da pesquisa, biblioteca e análise de negócios, os grandes modelos de IA se tornaram a "linha vertical" do Baidu.

"Bem-vindo à era da IA generativa! **」

Em 17 de outubro de 2023, vestindo uma camisa branca e pequenos sapatos brancos, Robin Li, fundador, presidente e CEO da Baidu, anunciou a chegada de uma nova era no palco.

Nesta conferência de imprensa chamada "Gerando o Futuro", Robin Li lançou oficialmente a última versão 4.0 do modelo de linguagem grande da empresa, Wenxin Big Model, e ensinou as pessoas a usar palavras rápidas para fazer o modelo Wenxin grande atualizado se aplicar, ajudando as pessoas a usar o fundo de previdência de Pequim para comprar casas em Hebei, fazer anúncios e vídeos e criar romances online.

Robin Li comparou diretamente o Wenxin Model 4.0 com GPT-4 na reunião|Baidu

Na reunião, **Robin Li afirmou com confiança que as capacidades da versão 4.0 do modelo Wen Xin são "nada menos que GPT-4".

Ao mesmo tempo, a afirmação de que "vale a pena reconstruir todas as aplicações com modelos grandes", anunciada há meio ano, também teve resultados na reunião do mesmo dia. Desde a pesquisa de negócios principal, até a biblioteca Baidu, disco de rede, mapa e outros aplicativos de bucket da família Baidu, eles foram conectados ao grande modelo Wenxin, mostrando melhores capacidades de interação e lógica.

No lado B, Robin Li também expôs ferramentas GBI (generative business analysis), bem como assistentes de escritório com grandes capacidades de modelo "Ruliu".

Se a IA generativa ativa todo o mundo da tecnologia, então o Baidu pode ser o gigante que mais se beneficia.

01 Wen Xin 4.0 Benchmark Direto GPT-4

Assim que a conferência de imprensa começou, Robin Li anunciou pela primeira vez o lançamento da versão 4.0 do modelo Wenxin.

O Baidu divide quatro critérios que definem as capacidades dos grandes modelos: compreensão, geração, lógica e memória. Desta vez a atualização do modelo Wen Xin 4.0, a infraestrutura ainda é a mesma das versões 3.0 e 3.5, mas afirma ser muito melhorada em termos de lógica e memória.

Robin Li anuncia Wenxin Grand Model 4.0|Baidu

De acordo com o CTO da Baidu, Wang Haifeng, a melhoria da compreensão e capacidade de geração do Wenxin Big Model 4.0 é semelhante, enquanto a melhoria da lógica é 3 vezes maior que a da compreensão, e a melhoria da memória é 2 vezes maior que a da compreensão**.

Quatro recursos diferentes podem melhorar a eficiência de diferentes cenários de aplicativos. Para essas habilidades, Li Yanhong mostrou isso no local.

A compreensão é a base para a IA conversacional ajudar os usuários, e é muito importante em assuntos governamentais, marketing, atendimento ao cliente e outros campos.

Em termos de capacidade de compreensão, a cena usou uma inversão de ordem de palavras e uma expressão vaga (prompt) para testar a capacidade do modelo: "Quero voltar a Chengde para comprar uma casa, posso usar o empréstimo do fundo de previdência?" E os procedimentos? Trabalho em Pequim."

Para entender esta frase, a IA deve entender que "trabalhar em Pequim" e "voltar a Chengde para comprar uma casa" na verdade têm "pagar fundo de previdência em Pequim, e o hukou está em Chengde". Este tipo de subtexto com características chinesas pode dar respostas precisas que os usuários precisam. E, com certeza, Wen Xin rapidamente entendeu a chave da pergunta e fez uma resposta correta.

Robin Li explica as quatro principais capacidades do AI|Baidu

A capacidade de geração pode melhorar principalmente a eficiência do marketing da marca, copywriting e trabalho criativo.

No local, Li Yanhong mostrou que, de acordo com uma imagem, com instruções de linguagem natural, você pode realizar transformação de fundo, desfocagem de assunto e gerar cartazes e copywriting de acordo com informações do site oficial.

Além desses tradicionais processamentos de imagem, o Baidu também demonstrou sua capacidade de gerar vídeo. Através da linguagem natural, na demonstração ao vivo, Wen Xin gerou um anúncio de vídeo oral humano digital sem quase nenhum atraso. O vídeo incorpora imagens do produto, adiciona muito fundo de transição, e uma pessoa digital em um terno aparece de vez em quando para apresentar os recursos do produto coletados do site oficial.

Exibição ao vivo dos recursos de geração de publicidade do Wenxin Model 4.0|Baidu

O efeito que só poderia ser alcançado pela cooperação de vários produtos AIGC foi perfeitamente integrado neste display. Um filme publicitário, 5 cópias de anúncios e um cartaz levaram menos de 3 minutos para serem gerados.

Raciocínio lógico, geralmente manifestado como um teste de lógica matemática. Nesta vitrine, o Baidu destacou seu potencial na educação.

Li Yanhong deu um problema de aplicação envolvendo a transformação do volume cônico em volume de cubo, e Wen Xin não só deu a solução, mas também resolveu o problema passo a passo, e analisou os pontos de conhecimento envolvidos em cada etapa.

Usar inteligência artificial generativa para ensinar crianças com trabalhos de casa é mais simples|Baidu

Para a exibição da capacidade de memória, a escolha do Baidu é mais especial.

Baidu escolheu deixar Wen Xin escrever o cenário de um romance de artes marciais. Depois que a escrita for concluída, no esboço original, deixe o grande modelo aumentar a relação entre os personagens e aumentar o conflito dramático, para mostrar que o grande modelo pode se lembrar do cenário original e da habilidade do personagem depois de adicionar informações complexas, sem usar a imaginação sem objetivo.

A Baidu também compartilhou o suporte técnico para a melhoria das capacidades de grandes modelos da Wenxin.

Baidu anunciou anteriormente que o modelo Wenxin é o primeiro grande modelo treinado usando o cluster Wanka na China, e muitas pessoas especulam que a escala de parâmetros do modelo Wenxin 4.0 deve exceder o nível trilionário. No entanto, nesta conferência, Baidu não enfatizou o nível de parâmetros do modelo grande.

Além do treinamento do Wanka, o CTO do Baidu também mencionou que a média semanal da estabilidade do treinamento do algoritmo do Baidu excedeu 98%, e a tecnologia de aprimoramento do ponto de conhecimento foi realizada em termos de entrada e saída.

02 "Refatoração" Balde da Família Baidu

Embora sejam mostrados separadamente, na verdade, na maioria das vezes, as quatro capacidades básicas de modelos grandes são aplicadas em combinação.

Em maio, a Baidu anunciou o uso de modelos grandes para reconstruir as aplicações da Baidu. Nesta conferência, a Baidu também demonstrou as últimas conquistas da aplicação da reconstrução de modelos grandes da Wenxin.

Entre eles, o mais surpreendente é a refatoração da pesquisa.

Em fevereiro, a Microsoft lançou o Novo Bing baseado na tecnologia do GPT para refatorar sua pesquisa. Em seu último depoimento, Nadella, da Microsoft, disse que a participação da Microsoft no mercado de pesquisa quase não mudou desde que adicionou recursos de IA ao Bing.

O Novo Bing, da Microsoft, lançou principalmente um sistema de bots conversacionais que podem conversar com o Novo Bing para fazer perguntas para obter informações integradas com links. O Bard do Google é semelhante.

Baidu usa IA para reconstruir sua principal busca de negócios|Baidu

No entanto, a reconstrução de busca do Baidu desta vez vai mais fundo em todo o sistema de busca. Baidu descreve como "satisfação final, estimulação de recomendação e várias rodadas de interação".

A satisfação final é refletida em inserir uma pergunta na caixa de pesquisa, A pesquisa não pode mais dar um link, mas gerar diretamente a melhor resposta.

Na apresentação, Robin Li levantou a questão de qual é o ranking de valor acrescentado industrial de vários países nos últimos 20 anos.

Ao contrário do Novo Bing e Bard, que podem dar uma resposta de dados vinculados, o novo Baidu pode dar diretamente um gráfico de tabela dinâmico, na forma de um gráfico de barras, mostrando os valores de crescimento industrial de diferentes países. Este gráfico é mesmo dinâmico, crescendo e mudando ao longo do tempo.

A função de excitação de recomendação é um pouco equivalente às perguntas relevantes do motor de busca atual, o que pode levar o usuário a continuar a entender algumas perguntas relacionadas de acordo com o prompt, como "Qual é a relação entre o valor agregado industrial e o PIB?" "Qual o impacto da indústria no desenvolvimento da economia nacional?".

Robin Li compartilha IA reconstrói experiência de aplicação de bucket da família Baidu|Baidu

E as múltiplas rodadas de interação também são muito interessantes.

Na atual onda de empreendedorismo de modelos de grandes idiomas, um dos muitos empreendedores está trabalhando duro para usar, ou seja, usar grandes modelos de linguagem com mecanismos de recomendação para realizar várias rodadas de diálogo para fornecer aos usuários a melhor escolha.

Em setembro, a Baidu realizou o projeto de competição de empreendedorismo Wenxin Cup, e o vencedor do primeiro prêmio Buysmart.AI foi o líder nessa direção. Os usuários usam linguagem natural e cliques para esclarecer constantemente suas necessidades, e Buysmart.AI usa o mecanismo de recomendação para recomendar os produtos que os usuários mais precisam.

A pesquisa do Baidu reconstruída adiciona diretamente uma função de direção semelhante à pesquisa.

Na demonstração, o prompt de busca do Baidu está perguntando "Onde fazer caminhadas por Pequim?" Depois de dar várias respostas, como Baihuashan, Haituo Mountain, etc., o motor de busca permite que os usuários cliquem mais para complementar e escolher sua própria situação. Por exemplo, se você optar por adicionar novatos de caminhada entre pais e filhos, o mecanismo de busca mudará para recomendar lugares como Xishan e Baiwangshan, que são relativamente fáceis de escalar e mais amigáveis para atividades entre pais e filhos.

Além da reconstrução da pesquisa, Baidu também mostrou a reconstrução do disco de rede Baidu, mapa Baidu, biblioteca Baidu e outras aplicações.

A nuvem do Baidu Network Disk, um assistente pessoal na nuvem, já foi lançada antes. Como o primeiro assistente pessoal de nuvem do mundo, tem atualmente 20 milhões de usuários. Você pode usar linguagem natural para se comunicar com o assistente, encontrar um vídeo na nuvem pessoal em uma frase, entender o conteúdo do vídeo, encontrar um determinado conteúdo no vídeo, resumir a frase de ouro do vídeo e assim por diante.

O Baidu Map, de acordo com a promoção do Baidu, é o primeiro produto de mapa nativo de IA do mundo. Falar com o assistente do mapa torna possível aceder a milhares de serviços num menu de vários níveis num só passo. Você também pode recomendar restaurantes com locais adequados, escolher entre o ambiente do restaurante e, finalmente, reservar um táxi diretamente.

Contando com bilhões de recursos manuscritos passados, o Baidu Wenku pode selecionar diretamente o tipo de artigo necessário, literatura acadêmica séria ou materiais públicos em geral depois que os usuários pesquisam informações sobre tópicos específicos e geram artigos com um clique.

A biblioteca Baidu reconstruída também adiciona a função de geração PPT, que pode entender se as visualizações são justapostas ou progressivas, e mudar o estilo de estilo PPT com um clique, Baidu afirma que "muito além de outras ferramentas de geração PPT no mercado".

03 Poder lado B

Nesta demonstração, o Baidu também mostrou algumas novas aplicações do lado B.

Entre elas, a Baidu focou no lançamento de um produto de business intelligence. Baidu GBI, Business Intelligence Generativo.

Este é um novo produto lançado pela Baidu, que é o primeiro produto de inteligência de negócios generativo na China, com a capacidade de suportar interação em linguagem natural, análise entre bancos de dados e aprendizado de conhecimento profissional, encurtando o trabalho de análise de dados que os analistas de negócios podem concluir em poucos dias a minutos.

Produtos Baidu GBI direcionados para o lado B|Baidu

No comercial, a pergunta "Qual é o custo estimado?" Qual é o piso de preço sem perder dinheiro? O cliente pediu-nos para concluir a entrega no prazo de 3 meses, podemos fazê-lo? Quanto tempo é o mais rápido? Se a concorrência estiver certa, como o nosso preço baixo, o que pode ser feito?" Para esta série de análises financeiras relacionadas, interação com projetos e perguntas de análise de usuários, o Baidu GBI pode dar respostas diretamente por meio de diálogos em linguagem natural e gerar respostas ilustradas.

Nenhum especialista é necessário e nenhuma operação adicional é necessária para acessar dados em bancos de dados e tabelas. Além disso, as empresas também podem treiná-los para aprender conhecimentos profissionais e se tornarem especialistas do setor.

Outro produto do lado B é o Ruliu. Depois de usar IA generativa para refatoração, como o Flow pode gerar atas de reunião com um clique, resumindo o conteúdo de milhares de grupos de trabalho. Combinado com o sistema de CRM da empresa, proponha o histórico do projeto e a discussão do projeto para os gerentes. De acordo com o itinerário pessoal, planeie planos de trabalho, envie convites para reuniões, etc.

Além de habilitar o escritório, o Baidu também demonstrou o empoderamento de grandes modelos para direção autônoma, cockpit inteligente e projetos de monitoramento inteligente do governo.

Desde o seu lançamento por mais de meio ano, Wenxin tem iterado rapidamente para reconstruir aplicações Baidu, e ao mesmo tempo está gradualmente estabelecendo o ecossistema Wenxin.

A Baidu também apresentou a recém-lançada plataforma Lingjing na conferência de imprensa. Quer se trate de dados ou aplicações pessoais ou empresariais, pode ser rapidamente transformado num plug-in na plataforma Lingjing, e a API pode ser usada para aceder à capacidade do modelo grande Wenxin.

Robin Li prevê a próxima era ecológica da IA|Baidu

A Baidu apresentou que, no mês atual, desde o lançamento da plataforma Lingjing, 27.000 desenvolvedores se inscreveram para se instalar, cobrindo mais de 20 campos, incluindo consultoria jurídica, geração de currículos, produção de mapas cerebrais, prática de fala e outras aplicações nativas em vários cenários. Os dados privados corporativos podem ser acessados de forma fácil e rápida aos recursos deste modelo grande de última geração sem o risco de vazamento.

"A China tem uma riqueza de cenários de aplicação, e os usuários chineses estão naturalmente dispostos a abraçar novas tecnologias, e com grandes modelos básicos avançados, podemos construir um ecossistema de IA próspero e, em conjunto, criar uma nova rodada de crescimento econômico." Li Yanhong disse.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)