O texto integral do discurso é de 11500 palavras | Baidu Robin Li: Estamos prestes a entrar em uma era de IA nativa!

Fonte do artigo: AI Dark Horse

Compartilhando convidado: Baidu Robin Li

Registro de campo: Dark Horse of Entrepreneurship

O mundo voltou à sua aparência anterior, e há quem diga que Robin tem uma publicidade séria em palco, revelando o sentido futurista e a curiosidade dos produtos tecnológicos. Essa é a esperança e ressonância do futuro da tecnologia dentro e fora do palco, da empresa e dos usuários.

O Baidu World Congress 2023 é a conferência de estratégia, tecnologia e lançamento de produtos mais importante da Baidu, que é realizada há 17 anos, desde 2006.

**No dia 17 de outubro, o cavalo negro do empreendedorismo foi convidado a participar da Conferência Mundial Baidu, gravou 10 conteúdos importantes no local, e organizou o texto completo do discurso de Robin Li e o compartilhou com todos. **

  1. Bem-vindo à era da inteligência artificial generativa! A maior inovação em tecnologia no ano passado foi o surgimento da inteligência a partir de grandes modelos, que é a base para o desenvolvimento de aplicações nativas de IA. O Wenxin Model 4.0 foi lançado oficialmente, realizando uma atualização abrangente do modelo básico, e melhorou significativamente sua compreensão, geração, lógica e recursos de memória, e o nível abrangente não é inferior ao do GPT-4.

2.AI As aplicações nativas são aplicações desenvolvidas com base na compreensão, geração, lógica e capacidades de memória de grandes modelos. Estas capacidades não estão disponíveis em épocas passadas, abrindo assim um espaço ilimitado para a inovação.

  1. IA generativa e pesquisa são uma combinação feita no céu. A busca do Baidu foi reconstruída com base no modelo de IA grande, e a nova busca tem três características: satisfação extrema, estimulação de recomendação e interação multi-round. Ele não só melhora a qualidade da pesquisa, mas também rompe o escopo de aplicação da pesquisa e expande os limites do produto.

  2. Baidu GBI é o primeiro produto de inteligência de negócios generativo na China, que pode encurtar o trabalho de análise de dados e redação de relatórios que os analistas de negócios podem concluir em mais de dez dias para o nível minuto, e é uma ferramenta de tomada de decisão baseada em grandes capacidades de modelo.

  3. A Biblioteca Baidu é o produto mais completo da reconstrução de IA. Baidu Wenku, que é baseado na reconstrução de grandes modelos, foi revelado, transformando-se de "ferramentas de conteúdo" para "ferramentas de produtividade". Ele evolui rapidamente em funções como compreensão de materiais, escrita de artigos, geração inteligente PPT e mudança de estilo.

  4. O disco de rede Baidu concluiu a reconstrução da IA. O assistente pessoal inteligente na nuvem "Cloud One" realiza a transformação da interação da interface gráfica para a interação em linguagem natural, melhora a compreensão de informações multimodais e pode localizar vídeos com precisão, resumir o conteúdo de vídeo com um clique e refinar frases douradas, liderando o mundo.

  5. Plug-in é uma aplicação nativa de IA especial, com o limiar mais baixo e o mais fácil de usar. O plug-in melhora as capacidades de modelos grandes, tornando-os mais práticos e fáceis de usar, e também faz com que muitos dados privados corporativos possam ser usados de forma fácil e rápida sem o risco de vazamento.

  6. As futuras aplicações nativas de IA devem ser multimodais, e a condução autónoma é uma aplicação típica de grandes modelos visuais para reconstruir o mundo físico.

  7. A Baidu está promovendo vigorosamente a integração profunda da tecnologia digital e da economia real, e a tecnologia de grandes modelos tem sido aplicada na fabricação, energia, energia elétrica, indústria química, transporte e outras indústrias reais, usando inspeção inteligente para reduzir potenciais riscos de segurança, usando programação inteligente para encurtar o ciclo de entrega, usando tomada de decisão inteligente para melhorar a eficiência empresarial, controle inteligente de informações para resolver congestionamentos de tráfego, e o modelo grande está se tornando uma força motriz importante para a nova industrialização.

  8. Estamos prestes a entrar em uma era de IA nativa, uma era de interação humano-computador!

A seguir está o texto completo do discurso do fundador e CEO da Baidu, Robin Li, editado pela Dark Horse of Entrepreneurship:

Olá convidados! Bem-vindo ao Baidu World Congress 2023!

Bem-vindo à era da IA generativa! **

**O tema desta conferência são aplicações nativas de IA. Vou compartilhar com vocês em detalhes a experiência da Baidu no processo de reconstrução nativa de IA de suas várias linhas de produtos nos últimos meses, e espero que seja útil para você. **

Como todos sabemos, as aplicações nativas de IA são desenvolvidas com base em grandes modelos. A maior inovação no setor de tecnologia no último ano foi, sem dúvida, o surgimento da inteligência trazida por grandes modelos, que é a base para o desenvolvimento de aplicações nativas de IA.

Portanto, as aplicações nativas de IA do Baidu também são desenvolvidas com base em nossas palavras Wen Xin. As palavras de Wen Xin foram lançadas pela primeira vez em 16 de março deste ano e, desde então, temos iterado rapidamente e sido aprovados para abrir ao mundo em 31 de agosto, obtendo muito feedback dos usuários, e a velocidade da inovação está acelerando.

Hoje, tenho o prazer de anunciar o lançamento oficial do Wenxin Grand Model 4.0.

Também começámos a convidar testes ao mesmo tempo. Amigos no local, você só precisa digitalizar o código QR no cartão de convidado, receber o cupom de experiência, e você pode entrar no site oficial da Wenxin Yiyan ou no aplicativo Wenxin Yiyan para experimentar o Wenxin Model 4.0.

Este é o modelo grande Wenxin mais poderoso até agora, ele conseguiu uma atualização abrangente do modelo básico, compreensão, geração, lógica e memória quatro capacidades principais, em comparação com a versão atual do Wenxin Yiyan foram significativamente melhoradas, o nível abrangente é nada menos do que GPT4!

**A chamada aplicação nativa de IA, tal como a entendo, é uma aplicação desenvolvida com base na compreensão, geração, lógica e capacidades de memória de grandes modelos. Estas capacidades não estão disponíveis em épocas passadas, pelo que podem abrir um espaço ilimitado para a inovação. **

Abaixo, combinarei os cenários de aplicação para apresentá-lo aos quatro recursos das palavras de Wen Xin. O aplicativo com esses quatro recursos é o aplicativo nativo da era da IA.

** A primeira é a capacidade de compreender. Esta é a coisa mais incrível que senti depois que entrei em contato com a grande modelo. **

No passado, dissemos que a IA é "deficiência intelectual artificial", ou seja, a IA muitas vezes não consegue entender as palavras das pessoas e, com o tempo, você não se atreve a falar muito com ela.

Hoje, cada palavra que você diz, ele provavelmente pode entender, muitas vezes melhor do que seus amigos e colegas entendem o que você está dizendo.

Por exemplo, é um jovem que trabalha em Pequim e quer comprar uma casa em Hebei e quer saber se pode candidatar-se a um empréstimo para um fundo de previdência em Pequim.

Vamos entrar em uma linha.

[Quero voltar a Chengde para comprar casa, posso usar o empréstimo do fundo de previdência, o que devo fazer com os procedimentos?] Trabalho em Pequim. 】

Vamos dar uma olhada nos resultados. Wen Xin respondeu que poderia usar o empréstimo do fundo de previdência. Por que essas perguntas e respostas refletem a capacidade de entender o grande modelo? Na verdade, o que eu dei agora, aparentemente simples, tem várias pequenas armadilhas para entender:

Em primeiro lugar, é uma expressão de vaivém. Quando a maioria das pessoas liga para fazer perguntas, elas pensam em onde dizer, não tão rigorosas, como esta, eu disse primeiro sobre comprar uma casa e lidar com o fundo de previdência, e finalmente disse "Eu trabalho em Pequim", o que apresenta requisitos mais altos para a compreensão.

Em segundo lugar, utilizo deliberadamente duas expressões vagas aqui. Um é "trabalhar em Pequim", o subtexto é "depositar o fundo de previdência em Pequim", o outro é "voltar a Chengde para comprar uma casa", apenas uma palavra "retorno", na verdade, implicando que eu sou provavelmente um Chengde hukou.

Em terceiro lugar, Wen Xin combinou o contexto e combinou todos os pontos de informação para compreender com precisão a verdadeira questão, ou seja, "pode um utilizador com registo familiar em Chengde, província de Hebei, usar o fundo de previdência de Pequim para comprar uma casa em Chengde com um empréstimo", e depois deu uma resposta e passos de tratamento para esta pergunta.

Pode-se ver que as palavras de Wen Xin já podem ter uma compreensão bastante precisa de "expressões fora de ordem, intenções de expressão relativamente vagas e subtexto em palavras". Esta capacidade tem uma gama muito ampla de perspetivas de aplicação em assuntos governamentais, marketing, atendimento ao cliente e outros campos.

**A segunda capacidade importante dos modelos grandes é a "geração", que pode gerar conteúdo multimodal, como texto, imagens e vídeos. **

Então, como usar a energia de geração? Eu pedi a Wen Xin para gerar um conjunto de criativos em uma palavra.

Introduza primeiro uma imagem e, em seguida, introduza um parágrafo.

[Este é o novo veículo de energia de Changan.] Por favor, ajude-me a gerar duas imagens com uma primavera, cenário vibrante ao fundo, e a sensação do carro acelerando. 】

Vemos que esta geração usa o vibrante cenário ao ar livre da primavera, acompanhado pelo borrão do excesso de velocidade.

Pedi que gerasse um cartaz vertical diretamente para mim.

[Combinado com as informações de Changan Qiyuan no site oficial de Changan, faça um cartaz de publicidade vertical e escreva uma cópia de marketing simples e elegante, ecoando o estilo do corpo. ] 】

Como você pode ver, geramos um cartaz publicitário vertical com imagens e texto.

Agora temos um cartaz publicitário, e precisamos de uma cópia de publicidade mais rica, você pode pedir a Wen Xin para escrever mais algumas palavras:

[Este carro enfatiza cockpit de inteligência digital, design Fuguang e condução de qualidade. Por favor, escreva mais 5 peças de cópia do anúncio, cada uma com um título curto e uma descrição]

O copywriting escrito pela IA, que tem a beleza da ciência e da tecnologia, a tendência dos tempos, também enfatiza a interação humano-computador, o copywriting é mais profissional e suave, atingiu o padrão de marketing da marca.

E se eu ainda quiser um vídeo?

[Por favor, combine as informações do site oficial e o conteúdo de vídeo existente para gerar um vídeo oral humano digital, quero veicular anúncios in-feed.] 】

Ele foi gerado, então abrimos o vídeo para ver o efeito.

Este é, de facto, um vídeo de transmissão digital mais distinto da população, e também reflete as características deste carro.

Agora, temos 1 filme comercial, 5 cópias de anúncios e 1 cartaz, e eu só dei a Wen Xin uma palavra de um material de imagem e algumas palavras como "carro inteligente digital" e "condução de qualidade", e todo o processo levou menos de 3 minutos.

Não muito tempo atrás, também usamos esse recurso para lançar a plataforma criativa de marketing AIGC Steering Engine, permitindo que uma pessoa se torne uma equipe de marketing de IA. Pode haver alguns amigos copywriting em cena hoje, vendo isso, você acha que modelos grandes podem trazer mais inspiração criativa e ajudá-lo a melhorar a eficiência?

A seguir, vamos falar sobre a terceira capacidade dos grandes modelos: a lógica. **

Muitas pessoas têm muitas vezes de ajudar os filhos com os trabalhos de casa. Algumas pessoas brincam que "se você não escreve lição de casa, a mãe é piedade filial, e quando você escreve lição de casa, a galinha voa e o cachorro pula". Então, vamos ver, as palavras de Wen Xin podem ajudar os pais a resolver o problema da tutoria dos trabalhos de casa?

Deixe-me inventar um problema de matemática e ver como ele funciona:

[A pilha de areia em forma de cone, a área inferior é de 8 metros quadrados, a altura é de 12 decímetros, espalhe essa pilha de areia em uma estrada de 2 metros de largura, 5 cm de espessura, quantos metros podem ser pavimentados? ] 】

Este é um tipo de problema de matemática que podemos ter feito quando éramos crianças, e a julgar pela resposta de Wen Xin, sua lógica de resposta é bastante clara. Cada passo é escrito. Os pais podem ver se é mais detalhado do que o que é dado em alguns materiais de tutoria.

Inclusive, a IA pode apontar os pontos de conhecimento utilizados na resolução de problemas para ajudar as crianças a consolidar a aprendizagem, voltemos a perguntar:

[Que pontos de conhecimento estão envolvidos no processo de resolução de problemas acima?] 】

Wen Xin deu claramente os pontos de conhecimento envolvidos nesta questão, tais como a fórmula do volume do cone, unidade de medida unificada, volume permanecendo inalterado e resolvendo equações. Isto é prático para alunos, professores e pais. Depois que esses pontos de conhecimento forem claramente dominados, as crianças terão a capacidade de tirar inferências umas das outras.

A capacidade super lógica do modelo grande certamente não pode ser usada apenas para a resolução de problemas. Planejamento de rotas para mapas inteligentes, assistentes inteligentes para tarefas complexas, controle de semáforos em sistemas de transporte inteligentes e assim por diante exigem o uso de recursos lógicos.

Em seguida, vamos olhar para o quarto ponto, que é a capacidade de memória do modelo grande. **

A memória aqui se refere principalmente ao que você disse anteriormente, se a IA se lembra dele, o conteúdo gerado pela IA, será contraditório. Este é um indicador importante para distinguir a inteligência de grandes modelos, e o diálogo multi-round é a personificação da capacidade de memória.

Eu sei que muitos criadores estão usando Wen Xin para escrever romances. E se o conteúdo do romance é inconsistente, então não é legível. Hoje, vou pedir-lhe para escrever um romance na hora, intercalar algumas distrações com perguntas, e ver se consegue lembrar-se do que escreveu.

Vou inserir um primeiro:

[Por favor, me ajude a escrever um romance de artes marciais, a protagonista é uma mulher, e a trama tem altos e baixos. ] 】

Bem, vejamos, o esboço do romance saiu:

O primeiro é o pano de fundo da história, no antigo mundo das artes marciais, forças obscuras estão subindo; O nome da heroína é Ling'er, e ela tem o poder de manipular forças internas e fugir.

Vou inserir um primeiro:

[Por favor, me ajude a escrever um romance de artes marciais, a protagonista é uma mulher, e a trama tem altos e baixos. ] 】

Bem, vejamos, o esboço do romance saiu:

O primeiro é o pano de fundo da história, no antigo mundo das artes marciais, forças obscuras estão subindo; O nome da heroína é Ling'er, e ela tem o poder de manipular forças internas e fugir.

Em seguida, há o início da história. Ling'er quer derrotar as forças das trevas e salvar as artes marciais. No clímax do romance, ela trava uma batalha de vida ou morte com o vilão, derrota o vilão e salva as artes marciais e todas as seitas.

No final, Ling'er e seus aliados também estabeleceram o Instituto de Cultivo de Poder Interno juntos.

Agora que a história está basicamente formada, mas é um pouco simples, quero adicionar mais alguns requisitos de personagem:

[Agora a relação de personagens é muito simples, há apenas dois caracteres, e mais 4 caracteres são adicionados]

Wen Xin deu mais quatro papéis em uma palavra, cada um com uma identidade e personalidade diferentes, com uma personalidade diferente, este Murong Gucheng é uma geração de grandes mestres, e há um profeta Xiao Hanyan que pode prever o futuro.

Mas agora ainda há um elemento necessário no romance, o conflito dramático. Uma história sem conflito não é uma boa história, e o processo da heroína derrotar as forças das trevas agora é muito simples, vamos ver se podemos torná-lo mais difícil.

Insira outro

[Também é necessário adicionar o conflito dramático da linha principal à história para tornar a história mais visível]

Vejamos, já está escrito para um conflito dramático. Aqui está uma inversão, por trás das forças das trevas, o verdadeiro líder é uma figura de nível de grão-mestre altamente respeitada, o que colocou a heroína em perigo várias vezes. Até a batalha decisiva, a heroína teve a chance de revidar.

Como você pode ver, ele lembra que a linha principal da história é o confronto entre Ling'er e as forças das trevas, e o conflito também gira em torno dessa linha principal.

Então, será que Wen Xin ainda se lembra da história que acabou de escrever e correlaciona esses personagens com a história?

Vamos fazer mais um pedido:

[Traga esses personagens para o esboço da história que você projetou para mim e crie um título.] 】

Os resultados foram mostrados nas telonas, e o romance é chamado de "A Justa Batalha dos Rios e Lagos", que adiciona personagens adicionais e conflitos dramáticos ao esboço da história. O quarto e quinto capítulos aqui também nos dizem que o grande mestre deste vilão é Murong Gucheng que acaba de ser apresentado.

Durante todo o processo, fui aumentando a dificuldade e apresentando novos requisitos para interferir na sua memória, e Wen Xin ainda se lembrava de todas as necessidades e respostas anteriores, e conseguia corresponder com precisão o enredo e os personagens, e sua memória era muito incrível.

Então todos na cena de teste agora, você se lembra, qual é a habilidade especial do protagonista Linger?

Talvez a maioria das pessoas não se lembre, então vamos ver se Wen Xin se lembra?

[Qual é a habilidade que a heroína tem?] 】

Bem, a resposta está fora, é o poder de manipular as forças internas e fugir. Este é o texto de exemplo escrito por Wen Xin na primeira rodada de diálogo. Agora, depois de cinco rodadas de diálogo e alguns milhares de palavras de ficção, ele ainda pode se lembrar do que escreveu antes, que é a capacidade de memória do grande modelo.

Acabamos de experimentar as quatro capacidades do grande modelo, é claro, na maioria das vezes, essas quatro habilidades não aparecem sozinhas, elas se complementam. **

Por exemplo, para criar uma cópia publicitária, ela precisa entender o tema da criação, esclarecer a lógica da criação e manter a consistência através da memória.

Na resolução de problemas, também é necessário aplicar de forma abrangente a capacidade de compreender, gerar, lógica e lembrar.

Vejamos um exemplo de aplicação abrangente:

Em primeiro lugar, abrimos o Baidu App reconstruído, digitalizamos a caixa de medicamentos retirada pelo paciente com a câmera, e não há necessidade de olhar através das instruções em letras pequenas, e o médico humano digital irá ajudá-lo a explicar.

As perguntas que apareceram na tela há pouco, como "se comer antes ou depois das refeições", "se beber álcool pode comer", "que outras precauções", são muitos pacientes em medicação diária vai encontrar problemas.

Vemos que o modelo grande pode não só ajudar os pacientes a interpretar as instruções do medicamento, mas também combinar necessidades personalizadas para melhorar a eficiência da medicação e garantir a precisão e pontualidade da medicação dos pacientes.

Não muito tempo atrás, combinamos o modelo Wen Xin com conhecimento médico profissional e lançamos o Spirit Medicine Big Model, que pode ajudar pacientes e médicos a conversar e gerar registros médicos aplicando o Spirit Medicine Bot. Este exemplo usa não só a capacidade de compreender e gerar memória lógica, mas também a capacidade de fala multimodal, visão e assim por diante.

A demonstração anterior reflete principalmente o progresso do modelo Wenxin nas quatro capacidades de compreensão, geração, lógica e memória, que são a base para a sobrevivência de todas as aplicações nativas de IA. Da mesma forma, sem uma rica ecologia de aplicativos nativos de IA construída sobre o modelo básico, um modelo grande não vale nada.

Eu disse publicamente em maio que a Baidu será a primeira empresa a reestruturar todos os produtos, e usaremos o pensamento de IA para fazer aplicações nativas de IA.

**Nos últimos meses, as nossas pesquisas, tais como streams, mapas, discos online, bibliotecas, etc., irão encontrá-lo com um novo visual. Durante o período, pisei em muitos poços, e estou disposto a compartilhar com vocês, espero que vocês possam tomar estradas menos tortas no processo de desenvolvimento. **

A seguir, vou te mostrar como são esses produtos reconstruídos com modelos grandes? Isso também é para expandir a imaginação de todos e inspirar todos a fazer mais incríveis aplicações nativas de IA.

A primeira coisa que mostro é a pesquisa, que foi onde o Baidu começou. A impressão de muitas pessoas sobre a pesquisa é que você insere uma palavra-chave, e o Baidu lhe dá um link da web. Já não!

Baidu nova pesquisa, ao abrir a interface, além de ver uma caixa de pesquisa, os resultados da pesquisa será completamente diferente do passado.

**A nova pesquisa reconstruída tem três características: satisfação extrema, estimulação de recomendação e múltiplas rodadas de interação. **

O que é a satisfação final? Quando você digita uma pergunta na caixa de pesquisa, como "O que é MBTI?" "Como estacionar ao lado", a nova busca não é mais para lhe dar um monte de links, mas para entender através do grande modelo e gerar uma melhor resposta

Por exemplo, se perguntar "a classificação do valor acrescentado industrial por país nos últimos 20 anos", a nova pesquisa não só lhe dirá a resposta diretamente, mas também mostrará a resposta com gráficos dinâmicos.

Da tela grande atrás de mim, posso ver que, nas últimas duas décadas, nossa indústria de manufatura industrial experimentou um rápido desenvolvimento e está se transformando de um país manufatureiro para uma potência manufatureira.

Esta é a satisfação final: um passo para lhe dar a resposta final.

Então, o segundo passo, depois de ver a resposta, o que mais você quer ver?

É aqui que a estimulação de recomendação é usada. Por exemplo, após o gráfico dinâmico, a função de excitação de recomendação também dá "qual é a relação entre o valor acrescentado industrial e o PIB" e "qual é o impacto da indústria no desenvolvimento da economia nacional" estas questões que também lhe podem preocupar. Clique para obter a resposta.

É claro que nem todas as necessidades têm uma única resposta correta. As necessidades dos utilizadores podem, por vezes, ser complexas e não são claras numa ou duas frases. Também é difícil para os utilizadores expressarem plenamente um requisito muito complexo através de uma grande descrição de uma só vez.

Neste momento, precisamos usar um modelo de busca mais novo e personalizado para atender os usuários, ou seja: interação multiround.

Vamos dar uma olhada neste exemplo:

Por exemplo, se você perguntar "onde é o lugar recomendado para fazer montanhismo em torno de Pequim", ele dá várias respostas, como a Montanha Baihua e a Montanha Haituo, tendenciosas para rotas de caminhada;

Então, ele dá várias dicas para complementar sua escolha de situação, você pode escolher entre iniciantes, pais-filhos e ver folhas caídas. Agora, mudou para recomendar West Mountain e Baiwang Mountain, que são relativamente fáceis de escalar e mais amigáveis para atividades entre pais e filhos.

Então continue a perguntar, que equipamento precisa para montanhismo e caminhadas? A resposta foi bastões de trekking, sapatos de caminhada, etc., e também lembrou que escolheu um passeio entre pais e filhos mais cedo, e especialmente deu dicas sobre como cuidar das crianças.

Pode-se dizer que a IA generativa e a busca são uma combinação feita no céu.

A pesquisa, embora ainda comece a partir dessa caixa simples, mas o próximo passo a passo, superou e reconstruiu o modo de pesquisa original, não só melhorou a qualidade da pesquisa, mas também rompeu o escopo da aplicação de pesquisa e expandiu o limite do produto. tais

A pesquisa interativa de IA liderará a transformação geracional da indústria de pesquisa.

Num futuro próximo, a busca se tornará um assistente íntimo, capaz de evocar, resolver problemas e até mesmo quebrar as limitações do "fim" a qualquer momento, de modo a responder a qualquer hora, em qualquer lugar, atender necessidades e acompanhar todo o processo.

Em seguida, vamos dar uma olhada no segundo produto de pensamento nativo de IA, Baidu GBI, Generative Business Intelligence, ou seja, inteligência de negócios generativa. **

Este é um produto de raiz, não uma refatoração de um produto existente. **

No nosso mundo empresarial, o mais inseparável é a análise de negócios, ou seja, BI, como tomar as decisões de negócio mais rápidas? Vamos primeiro sentir através de um vídeo:

Como você pode ver, no vídeo, o presidente fez uma variedade de perguntas profissionais. Há análise financeira, entrega de projetos e análise de usuários, e o assistente do presidente do GBI pode rapidamente dar resultados e deixar o presidente tomar decisões no local.

Esta é uma ferramenta de tomada de decisão baseada em grandes capacidades de modelo, o primeiro produto de inteligência de negócios generativo na China, Baidu GBI. Com o GBI, faça tudo rápido!

Não só as pessoas com ferramentas avançadas não serão substituídas pela IA, como "promoções e aumentos não são um sonho". As pessoas que não utilizam ferramentas avançadas correm o risco de perder o emprego. **

Então, como o Baidu GBI ficou um passo à frente? Ele subverte a análise de dados tradicional de três maneiras:

Em primeiro lugar, o BI tradicional só pode ser operado por profissionais, enquanto o GBI pode entender diretamente as perguntas do presidente e executá-las em tempo real;

Em segundo lugar, o GBI fornece um método de acesso conveniente, as empresas podem acessar dados, fazer perguntas e analisar quaisquer dados em linguagem natural, e não precisam mais fazer manualmente várias operações profissionais em bancos de dados e tabelas;

Em terceiro lugar, o GBI também tem a capacidade de aprender, e as empresas podem injetar sua própria experiência no setor para se tornarem especialistas do setor.

Este é o Baidu GBI, que pode encurtar o trabalho de análise de dados e redação de relatórios que os analistas de negócios podem concluir em uma dúzia de dias para o nível de minuto. As chamadas artes marciais do mundo só podem ser quebradas rapidamente;

** Competição empresarial, não peixes grandes comem peixes pequenos, mas peixes rápidos comem peixes lentos, tomada de decisão mais rápida do que os concorrentes, é provável que você ganhe! **

Falando em tomada de decisão rápida, na Baidu, contamos com uma plataforma de escritório inteligente chamada Ruliu, e também reimaginamos esse aplicativo com IA.

Hoje, tornou-se um super assistente do qual as pessoas do Baidu não podem prescindir.

Agora todo mundo por favor veja, isso é como um fluxo fazendo gravação em tempo real. Vamos ver se ele consegue se lembrar de todos os pontos que acabamos de mencionar:

Esta é a função de geração de um clique das atas de reunião. Dizemos que como conduzir reuniões de forma eficiente é um trabalho técnico. Esse recurso reduz muito a carga de trabalho da reunião e reduz o tempo de reunião em 40%.

Outro cenário comum são os grupos de trabalho. A maioria das pessoas no local de trabalho é frequentemente bombardeada com várias mensagens de chat em grupo. Em seguida, resumir rapidamente os pontos-chave do bate-papo em grupo torna-se um recurso extremamente útil.

Vamos dar uma olhada em como nossos gerentes de produto o usam.

Ele tem 9 grupos de trabalho, atraso por um período de tempo, pode haver mais de mil informações não lidas, e Ruliu pode não só "1000 mensagens, obter o foco em um segundo", mas também inteligentemente dividir o conteúdo que precisa ser lido em várias categorias: "esperando que eu confirme", "foco em", "discussão de tópico", o que melhora muito a eficiência do trabalho.

Então, é refinado com precisão, será mal interpretado ou perderá informações essenciais? Isso testa a capacidade de entender e gerar grandes modelos. Quanto mais profundo for o entendimento, mais preciso será o resumo. Não diga 1.000, 10.000 informações, como o super assistente de fluxo também pode dar classificação inteligente e resumo inteligente em poucos segundos.

Vejamos outro cenário no trabalho: as viagens.

Passagens aéreas, hotéis, negociações, etc., essas tarefas transacionais são tediosas e demoradas! Se você tivesse um assistente de IA para ajudá-lo a resolver tarefas triviais, adoraria trabalhar mais?

Por exemplo, recentemente, o gerente de produto de Ruliu planejou viajar a Xangai para se encontrar com o Sr. Wang do PICC. Sabemos que o PICC está promovendo a inovação em produtos e serviços, modelos de negócios, tecnologia digital e outros aspetos, e nossa tecnologia de inteligência artificial na Baidu pode desempenhar um papel.

Este itinerário de viagem de negócios pode ser entregue a Ruliu, o super assistente, e vamos dar uma olhada em seu desempenho.

O super assistente pode organizar a viagem com base em suas informações de agenda.

Como a última reunião termina às 4 horas, então reserve um voo depois das 7:30; E, de acordo com os seus padrões de viagem, ajudá-lo a encontrar hotéis onde possa ficar. Por fim, foi feito um convite ao cliente.

Ele pode precisar de algum conhecimento antes de se encontrar com um cliente, e um superassistente também pode ajudá-lo com isso. Através da conexão com o CRM e outros dados do sistema da empresa, como fluxo, fornece dados detalhados, como projetos de cooperação e registros de visitas.

Ao entender a situação de cooperação comercial e informações externas, como o fluxo, também pode ajudá-lo a gerar uma referência de discussão, predefinir as perguntas que o cliente pode fazer e dar algumas sugestões de cooperação. Deste ponto de vista, Ruliu é mais como um verdadeiro assistente?

Acabamos de ver que, com apenas três palavras, Ruliu completou a reserva de boletins de viagem, vinho de máquina e horários, e até preparou materiais de referência para negociação, que é a "viagem de um clique" de Ruliu. Como o faz?

Esta é uma aplicação abrangente da capacidade de compreensão, geração, lógica e memória de um modelo grande, que desmonta automaticamente tarefas complexas em várias tarefas simples para executar separadamente e, em seguida, se funde para gerar o resultado final. Dizemos que melhorar a eficiência significa aumentar a competitividade, como deixar que o "trabalho inteligente" substitua o "trabalho árduo".

Agora, vamos dar uma olhada na nova biblioteca do Baidu. Este também é o produto que eu acho que foi completamente refatorado até agora. **

A Biblioteca Baidu mudará completamente nossos hábitos de trabalho, aprendizagem e criação.

Como criamos no passado? Por exemplo, digamos que você esteja fazendo uma apresentação sobre a aplicação da IA na psicologia. Leva vários dias para verificar informações, organizar materiais, escrever manuscritos, escrever PPT e embelezar PPT.

Hoje, no Baidu Wenko, você pode começar a trabalhar com uma frase, olhe para a tela grande: Primeiro, você quer que ele escreva um discurso, e ele encontra dezenas de materiais sobre o tema da inteligência artificial e psicologia.

Ele também pode identificar quais são revistas acadêmicas, relatórios oficiais e quais são apenas materiais de massa. Se você quiser escrever um artigo animado, escolha alguns materiais populares, como ensaios e ciência popular.

Então, se você quiser um discurso acadêmico rigoroso, você só pode verificar o conteúdo autorizado para garantir a precisão do conteúdo. Então, ao entender esses manuscritos, a biblioteca produz um artigo bem estruturado e bem definido, ao mesmo tempo em que poli e formata o conteúdo.

Isso pode ser feito porque Baidu Wenku já tem 1 bilhão de documentos de alta qualidade, com base na compreensão desses conteúdos, escrever documentos verdadeiramente práticos e claros, em vez de bobagens sérias como muitos grandes modelos, nem será conversa vazia geral.

Em seguida, a apresentação também precisa de PPT. A biblioteca pode combinar o manuscrito agora mesmo com alguns dos materiais que você coletou para gerar automaticamente a estrutura do PPT e, em seguida, embelezar o desenho para fazer um PPT de dezenas de páginas.

Há também alguma jogabilidade com recursos de geração multimodal, como seleção de estilo e troca de estilo com um clique. Mas há alguns lugares que testam mais a capacidade da biblioteca e exigem que ela tenha uma compreensão precisa do conteúdo. Por exemplo, ele precisa saber a relação entre as ideias, se elas são justapostas ou subordinadas, a fim de projetar o gráfico correto.

Devido a essa capacidade de compreensão, a biblioteca também pode escrever o script de fala correspondente para este PPT com base na geração de PPT. Não só isso, mas também pode usar esses conteúdos para deduzir perguntas que o público pode fazer e prepará-lo para respostas.

Avaliamos que a capacidade de gerar bibliotecas, especialmente PPT, excede em muito qualquer outra ferramenta no mercado, seja estrangeira ou nacional. No passado, as pessoas vinham à biblioteca para encontrar conteúdo pronto. No futuro, as pessoas poderão produzir conteúdo como quiserem, de forma mais eficiente do que qualquer outra ferramenta de produtividade.

Com base nas quatro capacidades do modelo Wenxin, não é exagero dizer que Baidu Wenku revolucionou fundamentalmente sua própria vida e completou a evolução de "ferramentas de conteúdo" para "ferramentas de produtividade"**.

Não muito tempo atrás, no primeiro dia da nova versão do Baidu Wenku, a nova função de IA inaugurou mais de 2 milhões de experiências. Agora, estamos mais confiantes para dizer que, na era dos grandes modelos, Baidu Wenku é o melhor ponto de partida para produzir conteúdo.

Como Wenku, Baidu disco de rede também é um velho amigo familiar. Nos últimos 11 anos, o disco de rede Baidu serviu 800 milhões de usuários, o volume de arquivos atingiu 4 trilhões e os usuários carregam mais de 1 bilhão de imagens todos os dias.

Na direção da reconstrução de IA, o disco de rede Baidu se concentra em fazer um bom trabalho em serviços inteligentes para arquivos pessoais.

O que você vê agora é a nova página inicial do disco de rede Baidu.

**O disco de rede reconstruído não só realiza a transformação da interação da interface gráfica para a interação em linguagem natural, mas também melhora a compreensão da informação multimodal. **

Agora, com apenas uma frase, você pode operar nos arquivos, fotos, vídeos, etc. em sua unidade on-line.

Este é o disco de rede Baidu "Cloud One", que é o primeiro assistente inteligente de nuvem pessoal da indústria e até mesmo do mundo. Vamos sentir quais pontos problemáticos o "Cloud One" pode resolver e trazer novas experiências?

O primeiro ponto é encontrar fotos ou vídeos. Às vezes, pensamos em uma imagem e queremos encontrá-la no disco de rede, muitas vezes depois de muitos passos, jogando por meio dia não pode ser encontrado. Agora, você diz uma palavra para "Cloud One", e isso pode ajudá-lo a identificá-la:

Bem, isso me ajudou a encontrar rapidamente o que o cientista-chefe da OpenAI, LLYA, entrevistou sobre transformadores.

Por trás dessa busca aparentemente simples está o papel de vários recursos de IA, que devem ser capazes de entender o conteúdo do vídeo, identificar personagens e formar memórias contextuais para localizar com precisão um determinado quadro do vídeo, que é uma tecnologia muito líder no campo global da nuvem pessoal.

O segundo recurso do Yunyi é ajudar os usuários a entender rapidamente o conteúdo do vídeo, vamos dar uma olhada:

Você pode ver que duas habilidades são demonstradas, uma é a capacidade de resumir e resumir conteúdo, e a capacidade de extrair frases de ouro. Esta é uma entrevista de 43 minutos, através da compreensão e capacidade lógica da IA, Yun Yiduo resumiu e refinou o vídeo, apresentando Llya e suas principais ideias.

Mas muitas vezes, vamos sentir que o texto original é muito emocionante, depois de destilar a ideia principal ou resumo, não é tão atraente, então a segunda função agora, eu acho que é realmente mais útil para mim, ou seja, temos que encontrar a parte mais emocionante do vídeo original, que são aquelas frases de ouro. Por exemplo, LLYA diz que "aprender leis estatísticas é muito mais importante do que ver aparências". O principal avanço na extração desta frase de ouro é a extração eficiente de informação multimodal, que é a tecnologia líder mundial. Ele pode encontrar as melhores partes do conteúdo da entrevista longa, o que melhora muito nosso aprendizado e eficiência de trabalho.

Este é o novo disco de rede após a reconstrução da IA. Até ontem, Yunyi atingiu 20 milhões de usuários.

É um assistente inteligente de IA baseado em uma nuvem pessoal. Na última década, o Baidu definiu o que é chamado de disco de rede; Na próxima década, o Baidu usará IA para redefinir novos discos de rede.

A seguir, vejamos um produto mais histórico, o Mapa Baidu. **

Reconstruímos este produto de 18 anos com pensamento nativo de IA, que também é o primeiro produto de mapa nativo de IA do mundo.

Ao longo dos últimos 18 anos, o Baidu Maps acumulou uma riqueza de funções, pode navegar, chamar um táxi, encontrar um motorista substituto, reservar um hotel, comprar um bilhete e até mesmo atender às necessidades de pesquisa de POI em condições mais complexas. No passado, essas operações eram complexas e muitas vezes exigiam seis ou sete etapas ou mais para serem concluídas;

Agora, desde que o usuário diga a demanda, o mapa pode mobilizar milhares de interfaces de API de serviço, e o menu de vários níveis se torna uma resposta direta e rápida em uma etapa.

Vamos dar uma olhada a seguir, como o Baidu Map é implementado?

No vídeo, os usuários testam a compreensão do Baidu Map sobre a pan-demanda, a seleção de pontos de encontro intermediários, a comparação de informações de vários locais e a recomendação e reserva de viagens futuras, e dá soluções razoáveis.

Isso ocorre porque a capacidade de Wen Xin de falar foi fundida com o conhecimento exclusivo de bilhões de POI do mapa e dados de perceção de tráfego de trilhões de níveis, e pode ser chamada a qualquer momento para dar recomendações. O mapa Baidu reconstruído não é apenas navegação, mas também o nosso guia de viagem. Quanto mais inteligente você é, quanto mais inteligente você é, mais você entende você.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)