A IA generativa pode gerar o futuro do Baidu?

Fonte original: Light Cone Intelligence

Autor: Liu Yuqi

Fonte da imagem: Gerado por Unbounded AI

O vento começa no final de Qingping, e os acidentes e inevitabilidades do destino estão muitas vezes interligados.

2019 é o ano mais sombrio de toda a história da inteligência artificial. Após a derrota da AlphaGo para Lee Sedol em 2016, o surgimento da arquitetura Tansformer em 2017, que levou a uma explosão de tecnologia em grande escala, e o boom empresarial em 2018. Em 2019, o refluxo do capital, o período de gargalos técnicos e a dificuldade de pousar em cenas abriram uma "era caótica" na história da inteligência artificial.

Ninguém sabe quando a IA geral chegará, assim como um trisolarano não sabe quando o sol nascerá. **

Naquele ano, um grande número de empresas de IA caiu em demissões, cadeias de capital quebradas e produção difícil de produtos, e havia poucas para persistir.

Mas foi também em 2019 que uma nova esperança para a IA começou a ser concebida: a OpenAI aceitou o investimento da Microsoft e a cooperação profunda com ela em julho, e foi a partir desse ano que o GPT-3, que agora é chocante para o mundo, começou a ser desenvolvido; Baidu, o primeiro a estabelecer uma estratégia de IA na China, realizou um ajuste de pessoal de meio ano desde o início do ano, e agora parece que o rearranjo das tropas parece ter aberto um período de quatro anos de perseverança.

Em 2019, Wang Haifeng foi promovido a CTO do Grupo e continuou a atuar como chefe geral do AI Technology Platform System (AIG) e do Basic Technology System (TG), que são as bases técnicas mais importantes do Baidu; Shen foi promovido a Vice-Presidente Sênior, responsável pelo grupo de negócios do ecossistema móvel, e depois transferido para o Baidu Intelligent Cloud em 2022, tornando-se o pioneiro da segunda curva de crescimento do Baidu. Entre as novas forças introduzidas em 2019, He Junjie é o único vice-presidente do Baidu pós-anos 80, primeiro responsável por fusões e aquisições de investimentos e investimento estratégico, e depois reutilizado, responsável pelo grupo de negócios ecológico móvel vago de Shen Jing, com mais poder real.

Chegou a hora de 2023, e a capacidade do Transformer finalmente quebrou o teto pela OpenAI neste ano, avançando para um novo nível, e o avanço da tecnologia fez da OpenAI a empresa mais assistida do mundo. A Microsoft ofuscou o brilhantismo tecnológico do Google.

**Nos últimos quatro anos, o negócio principal do Baidu formou uma estrutura triangular liderada pela nuvem inteligente Shen Tian, He Junjie é responsável pela ecologia móvel, Wang Haifeng pressionando a tecnologia de matriz, e Baidu finalmente terminou o período de silêncio e começou a transformar defesa em ataque, e a ação é contínua. **

"Faça todas as aplicações novamente" é a primeira espada brilhante após meio ano de acumulação de poder, e agora Baidu é como um planeta, prestes a encontrar um enorme "campo gravitacional tecnológico" e mudar completamente sua órbita.

Véspera do surgimento de grandes modelos

Em 2017, o Google propôs a arquitetura do Transformer em um artigo chamado "Attention Is All You Need" para substituir os modelos tradicionais de loop RNN e CNN, que mostrou que a precisão de treinamento do Transformer é maior do que todos os modelos anteriores, o tempo de treinamento é significativamente menor do que o modelo anterior e o efeito de treinamento também é bom quando o conteúdo do conjunto de treinamento é pequeno.

Desde então, a arquitetura Transformer tem sido rapidamente aceita e aplicada no campo da PNL e CV, especialmente no campo da PNL, onde o mecanismo de atenção permite que as máquinas compreendam a semântica com mais precisão e as gerem, além de reduzir a duplicação de informações.

Como uma das primeiras empresas a descobrir e acompanhar a rota da tecnologia Transformer, a Baidu tem pesquisado no campo da PNL por mais de dez anos, e formou uma equipe enxuta de PNL formada por especialistas de alto nível, como Wang Haifeng, Wu Tian, Wu Hua e assim por diante.

Wang Haifeng

Naquela época, a primeira tarefa importante da equipe de PNL era construir a tradução do Baidu. Wang Haifeng aplica corajosamente a aprendizagem profunda e as redes neurais à tradução para melhorar a compreensão da máquina do contexto e formar uma tradução mais suave. Esta tentativa ousada também fez do Baidu Translate o primeiro sistema de tradução a suportar mais de 200 idiomas, mesmo um ano e 3 meses antes do Google.

**Este é também o protótipo da capacidade de compreensão nas quatro capacidades centrais do grande modelo "compreensão, geração, lógica e memória". **

Mas Wang Haifeng sente que a PNL não é suficiente. Ele foi especialmente ao escritório de Li Yanhong para relatar e propôs a próxima "Normandia desembarcada" - reconhecimento de fala. Seu raciocínio é que a tecnologia de reconhecimento de fala está prestes a atingir o ponto crítico da industrialização e, uma vez rompida, em breve será comercializada em larga escala.

Com seu próprio julgamento sobre tecnologia, Li Yanhong decidiu apoiar Wang Haifeng novamente, e estabeleceu sucessivamente o "departamento de reconhecimento de fala", "departamento de reconhecimento de imagem" e "departamento de gráfico de conhecimento" paralelo ao departamento de PNL.

A operação de Wang Haifeng deixou muitos alunos do Baidu intrigados: "Essas tecnologias não têm nada a ver com os produtos atuais do Baidu, é para economizar para o Ano Novo criar tantos departamentos em um cérebro?" "

Naquela época, Wang Haifeng viu que os dados de pesquisa têm um suporte muito forte para a lógica da formação de grandes modelos. "O Baidu tem o maior mecanismo de busca do mundo, que não só tem uma forte pontualidade de informações, mas também tem uma alta taxa de precisão, o que pode construir o gráfico de conhecimento mais completo", explicou Wang em uma entrevista pública. **

Antes de criar o Wenxin, Baidu precipitou um gráfico de conhecimento multi-heterogêneo em super-grande escala com mais de 5 bilhões de entidades e 55 bilhões de fatos, e foi capaz de obter uma compreensão unificada do mundo através da linguagem, audição, visão, etc. Seu modelo de aprimoramento de conhecimento lançado em 2021, ERNIE (Wenxin) 3.0, é o antecessor de Wenxin Yiyan, e o projeto é o principal responsável por Wu Tian.

Wu Tian

Em 2019 novamente, Baidu Wenxin 1.0 foi lançado, e 3 versões foram iteradas em 4 anos. Em novembro de 2022, Wu Tian anunciou simultaneamente 11 modelos de indústria que Wenxin acumulou na cimeira pública, abrangendo eletricidade, gás, finanças, aeroespacial e outros campos, e a ecologia industrial formou-se inicialmente.

** Tudo isso prenunciou e abriu caminho para o Baidu liberar preventivamente as palavras de Wen Xin. Em 16 de março, depois que as palavras de Wen Xin foram divulgadas, Baidu voltou aos holofotes novamente, mas mais do que afirmado, era duvidoso. **

"No caso de uma demanda de mercado tão forte, ainda é muito significativo quem faz isso primeiro", disse Li Yanhong certa vez em uma entrevista, mesmo que o produto não esteja totalmente maduro, mas ainda tenha que ser lançado: "Após o lançamento das palavras de Wenxin, inúmeras pessoas, pessoas que não estiveram em contato comigo no passado ou que estão longe de mim na indústria estão perguntando, como podemos cooperar com Baidu, como experimentá-lo o mais rápido possível."

**Do ponto de vista técnico, os modelos grandes são iterações de alta velocidade de "cada vez mais usados". ** "Durante o teste interno, o funcionário perguntou, como pode Wen Xin esconder a cabeça e escrever um poema mal? Eu disse espere, acho que posso aprender depois de amanhã, e será capaz de ser usado no dia seguinte, e o progresso do grande modelo também é um processo de aprendizado contínuo", disse Wang Haifeng com um sorriso.

Em meio ano, Wenxin Yiyan realizou três iterações de 3.0 para 3.5 e depois para a versão 4.0, de acordo com Wang Haifeng na reunião, a escala de usuários Wenxin Yiyan atingiu 45 milhões, 54.000 desenvolvedores, 4.300 cenários, 825 aplicativos e mais de 500 plug-ins.

A água regada na PNL, o fertilizante aplicado, finalmente inaugurou uma colheita em 2023 e, como disse Li Yanhong, o caminho do desenvolvimento tecnológico é o processo de "duas vidas, duas vidas três, três vidas e todas as coisas".

Força interna por trás de grandes modelos

Após a eclosão da inteligência artificial geral, a atenção da computação em nuvem e a atenção das empresas atingiram o pico, e também chegou ao "momento iPhone".

O surgimento de grandes modelos, resultando em uma enorme lacuna de poder de computação, computação em nuvem não só para o modelo grande para fornecer suporte de poder de computação em nuvem, mas também o melhor ponto de aterrissagem para grandes empresas de aterrissagem de modelos, seja Baidu ou qualquer empresa com um modelo grande, quando o modelo grande sai, o próximo foco é promover para o mercado, deixar as empresas usarem.

**Para Baidu, tal fardo recai sobre os ombros de Shen Shu. **

Shen tremeu

Entre os seis líderes de grupos empresariais da Baidu, com exceção do CTO Wang Haifeng, Shen é o único vice-presidente sênior. Embora ambos venham de uma formação técnica, ao contrário do papel de "engenheiro" de Wang Haifeng, Shen tem sido responsável pelo crescimento de negócios-chave desde que se juntou à Baidu.

Nos 10 anos desde que se juntou ao Baidu, Shen integrou sucessivamente o sistema de publicidade e melhorou a capacidade de monetização do sistema; Combine fluxos de pesquisa e feed; Ele integra o grupo de negócios do ecossistema móvel atualizado pela pesquisa para completar o território do ecossistema móvel do Baidu.

** Se Wang Haifeng criou uma faca afiada, então Shen Shu é um oficial pioneiro que pode usar essa faca afiada para abrir território, nas palavras de Li Yanhong, "ouse lutar uma batalha difícil e pode vencer uma batalha". **

Em maio de 2022, Shen Jixing foi nomeado presidente do Baidu Intelligent Cloud (ACG) Business Group. Para a Baidu, não apostou totalmente na computação em nuvem no início, mas foi justamente com o desenvolvimento contínuo da tecnologia de inteligência artificial que a Baidu percebeu as deficiências da computação em nuvem e começou a cultivar secretamente a segunda curva de crescimento.

**Devido à falta de vantagem de pioneiro, o objetivo do Baidu Cloud nos últimos 10 anos é muito claro, não competir com as "velhas armas" na escala da camada IaaS, mas através da combinação de PaaS + SaaS e recursos inteligentes, jogar diferenciação e cortar na digitalização empresarial em pequenas batalhas. **

Na Conferência Mundial Baidu 2023, Shen mais uma vez propôs a estratégia de "integração nuvem-inteligência": "A combinação profunda de inteligência artificial e computação em nuvem é a chave para as empresas implementarem rapidamente aplicativos nativos de IA. Atualmente, todos os aplicativos e serviços do Grupo Baidu estão sendo executados no Baidu Intelligent Cloud com base na arquitetura de tecnologia 'Cloud-Intelligence Integration'."

**De acordo com a observação do cone ótico, o núcleo da estratégia de integração de inteligência em nuvem é que, por um lado, confiando no Baidu Intelligent Cloud, ele pode fornecer rapidamente às empresas um conjunto completo de serviços de grande modelo; Por outro lado, os modelos de grande porte também empurram o limiar para que a digitalização empresarial se torne mais baixa. **

Nos cinco meses após assumir a ACG, Shen rapidamente integrou a "super fábrica de serviços de modelo grande" - Wen Xin Qianfan em resposta às principais necessidades das empresas na era dos grandes modelos, e dividiu os usuários em cinco categorias de usuários de acordo com suas necessidades.

Em primeiro lugar, tendo em vista a lacuna de demanda causada por recursos de poder de computação, a plataforma Qianfan fornece vários tipos de poder de computação heterogêneo. Por exemplo, no link de treinamento mais caro, através de treinamento paralelo distribuído e recursos de interconexão de nível de microssegundo, a plataforma Qianfan pode alcançar uma taxa de aceleração de treinamento de 95% e uma relação de tempo de treinamento eficaz de 96%, reduzindo consideravelmente o poder de computação do cliente e os custos de tempo.

Em segundo lugar, no nível do modelo, para clientes que desejam ligar diretamente para modelos grandes existentes, as empresas podem chamar rapidamente vários modelos grandes, incluindo Wen Xin Yiyan, enquanto a plataforma Qianfan fornece ferramentas como aprimoramento chinês, aprimoramento de desempenho e aprimoramento de contexto. De acordo com Shen Ji, a plataforma Qianfan já atendeu mais de 17.000 clientes.

**Para clientes com necessidades de desenvolvimento secundário, a plataforma Qianfan fornece uma cadeia de ferramentas de ciclo de vida completo, como reciclagem, ajuste fino, avaliação e implantação para modelos grandes, com o maior número de 41 conjuntos de dados de alta qualidade do setor, e os otimiza rapidamente para seus próprios cenários de negócios.

A conferência também realizou uma demonstração prática de como desenvolver rapidamente aplicações de P&&R de conhecimento para a Sany Heavy Industry com base na estrutura de geração de aprimoramento de recuperação (RAG, Retri Augmented Generation): basta selecionar a estrutura RAG predefinida na bancada de trabalho de aplicativos nativos de IA Qianfan e configurar os parâmetros correspondentes para realizar rapidamente o desenvolvimento e o lançamento do aplicativo inteligente de atendimento ao cliente no site oficial da Sany Heavy Industry.

**Shen disse que construir um "pequeno assistente", mesmo que precise processar milhares de milhares de documentos longos, o custo é de apenas algumas centenas de yuans; Depois disso, cada consulta do utilizador custa apenas alguns cêntimos. **

Por muito tempo, a indústria, a manufatura e a agricultura em grande escala têm sido áreas profundas de digitalização, e a principal razão é que a complexidade da indústria levou a um alto limiar para a digitalização e é difícil de pousar.

No entanto, através do modelo grande, não só o limiar de uso é reduzido, mas também o custo de uso é reduzido. Não há necessidade de construir nenhum novo sistema, nem requer participação manual, é um método de aplicação mais avançado de componentes técnicos, ** a combinação dos dois, mas também virar o volante de inteligência em nuvem, acumulando-se gradualmente. **

Desafios de Inovação para Grandes Modelos

O passado é um dado adquirido, mas o futuro pode mudar.

Todos os fornecedores com modelos grandes encontraram oportunidades na camada de aplicação. A Microsoft começou a trabalhar na linha completa de produtos, incluindo sistemas Bing, Office e Windows em março, e Ali Daniel Zhang disse: "Devemos usar o grande modelo para refazer todos os produtos", mas esta frase, simples de dizer, é o maior desafio de inovação na era dos grandes modelos.

Como a IA refatora as aplicações? Isso requer não apenas capacidade de negócios, mas também imaginação, e diante de uma nova era de IA, o Baidu também colocou o bastão nas mãos dos jovens. **

Depois de maio de 2022, Shen Jie foi sucedido como chefe do grupo de negócios MEG por He Junjie, o vice-presidente da geração pós-anos 80 introduzida no plano de construção do escalão de talentos da Baidu. Se Shen Zhan é uma "fação de guerra dura", então He Junjie é uma verdadeira "jovem fação forte". Como disse Ren Zhengfei, é necessário "deixar que aqueles que ouvem o canhão comandem a batalha".

** A refatoração do aplicativo não está quebrada ou em pé, em contraste, o Baidu é realmente "particularmente implacável" consigo mesmo. **

Na Conferência Mundial Baidu, com foco em "ecologia", He Junjie entregou as respostas de "ecologia móvel", "ecologia de conteúdo" e "ecologia de negócios".

Entre eles, o ecossistema móvel abrange aplicações nativas de IA como "New Search", "New Wenku", Wenxin Yiyan APP e Baidu e-commerce "Huibexing"; A nível ecológico de conteúdos, uma série de aplicações como a Baidu APP "AI Editor" capacitam o ecossistema criador; Ao nível da ecologia empresarial, foi lançada a plataforma de marketing AI Native "Light". Além disso, He Junjie também anunciou o plug-in ecológico Wen Xin Yiyan - "Spirit Matrix", que agora está totalmente aberto.

**A nova pesquisa definida pelo Baidu é exatamente a lógica de cálculo de caixa proposta por Robin Li em 2010. **Tem três características: satisfação final, estimulação de recomendação e interação multi-round. Ou seja, quando os utilizadores pesquisam perguntas, "já não lhe dão um monte de links", mas através da compreensão do conteúdo, geram respostas multimodais como texto, imagens e gráficos dinâmicos; A estimulação por recomendação pode recomendar os problemas com os quais os usuários se preocupam em tempo real; Em resposta a necessidades complexas, a interação multi-round pode atender às necessidades de pesquisa personalizada dos usuários por meio de prompts, ajustes, etc.

O processo de demanda para correspondência, também conhecido como busca "de ponta a ponta", mas isso quebrará o modelo de classificação de lances em que o Baidu confiava, e a receita de publicidade sempre foi a maior vaca de dinheiro do Baidu.

Os recursos do AIGC deram nova vitalidade a alguns dos aplicativos antigos do Baidu, como documentos Baidu atualizados de ferramentas de recuperação de conteúdo para ferramentas de produção de conteúdo, e o Baidu Editor se tornou uma ferramenta de geração de conteúdo; A outra parte também explora novos cenários, como a geração única de conteúdo de marketing do Baidu Diager por meio do AIGC e a entrega inteligente, combinada com a plataforma de geração humana digital "Huaicast Star" para ajudar os comerciantes a expandir seu escopo e cenários de marketing.

**Ao mesmo tempo, com o pouso gradual de grandes aplicações de modelos, o Baidu também percebeu que confiar em sua própria força é, em última análise, limitado, e o infinito é vertical e horizontal. **

Este é o valor da Spirit Matrix, uma plataforma que reduz muito o custo de desenvolvimento de plug-in de grandes modelos, permitindo que pessoas comuns com criatividade e ideias se tornem desenvolvedores de plug-in. Li Yanhong disse que o plug-in é um aplicativo nativo de IA especial, e também é o aplicativo nativo de IA com o limite mais baixo e o mais fácil de começar.

A característica do plug-in é a "interface universal", que pode conectar pesquisa, miniprogramas, plataformas de conteúdo ou qualquer entrada, de modo que o uso de "plug and play" permite que desenvolvedores e criadores se juntem rapidamente ao ecossistema.

He Junjie revelou que, um mês após seu lançamento, Lingjing Matrix recebeu 27.000 pedidos de registro de desenvolvedores, cobrindo mais de 20 campos verticais, incluindo empresas, instituições e desenvolvedores individuais.

Um insider do Baidu disse à Light Cone Intelligence: "O grande plug-in de modelo da camada de aplicativo tem o Lingjing como a plataforma principal e será colocado no Wenxin Yiyan e Baidu App. Qianfan está mais no nível inferior, e o reino espiritual é mais superior, e é até possível substituir Qianfan no nível de plug-ins de aplicativos no futuro."

Conclusão

Em 2016, Li disse que o Baidu estava a apenas 30 dias da falência. "O dinossauro pisou numa colher no pé e demorou horas a reagir. Então, não importa quão grandes dinossauros cresçam, eles serão extintos."

Baidu não quer ser um dinossauro e, ao nível da consciência, pensa sempre a dez passos de distância.

Felizmente, Baidu esperou pela nova era e passou pelos momentos mais difíceis; Infelizmente, no início desta nova era, qualquer arrebatamento meticuloso parecerá insignificante sob a longa competição.

Mas conseguir um novo bilhete é, pelo menos, um novo começo.

Referência:

Peritos transfronteiriços em vários domínios da inteligência artificial - Transformer"

A viagem é longe: esculpem almas para a inteligência artificial

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)