Robin Li revelou que a versão Wenxin Large Model 3.5 aumentou a velocidade de treinamento em 2 vezes e a velocidade de raciocínio em 17 vezes

Em 26 de junho, Robin Li, fundador, presidente e CEO da Baidu, participou do "Nishan Dialogue on Digital Civilization na World Internet Conference" e fez um discurso intitulado "Grandes modelos remodelam o mundo digital".

Modelos em grande escala são o foco da inovação tecnológica global e o principal campo de batalha da competição global de inteligência artificial. Li Yanhong acredita que "o ponto-chave da nova estratégia de competição internacional não é quantos modelos grandes um país possui, mas quantos aplicativos de IA nativos em seus modelos grandes e até que ponto esses aplicativos melhoraram a eficiência da produção. Se pudermos squeeze Vá para a mesa de pôquer e compre ingressos para a competição, a China terá uma indústria digital mais forte e a escala da economia digital crescerá tremendamente."

Li Yanhong também revelou em seu discurso que o modelo Baidu Wenxin foi iterado para a versão 3.5. Em comparação com a versão 3.0, a velocidade de treinamento foi aumentada em 2 vezes, a velocidade de inferência foi aumentada em 17 vezes e o efeito do modelo foi melhorado em mais de 50%. "A versão 3.5 do Wenxin Large Model não é apenas uma atualização técnica, mas também uma atualização de segurança." Li Yanhong enfatizou: "A qualidade dos dados, o efeito de geração e a segurança do conteúdo foram significativamente melhorados."

Li Yanhong acredita que a profunda integração da economia digital impulsionada por grandes modelos e a economia real tornará a economia real mais forte, melhor e maior. Em setores como fabricação de automóveis, energia e transporte, grandes modelos podem aprofundar os principais cenários de negócios e inovar em áreas como atendimento inteligente ao cliente, cadeia de suprimentos e programação de sistemas, além de promover a transformação digital e a melhoria inteligente do setor. .

Os desafios de governança impostos por grandes modelos de IA não podem ser ignorados. Li Yanhong disse a esse respeito: "Somente insistindo no desenvolvimento tecnológico e na tração nas duas rodas segura e controlável podemos fazer um progresso constante. Se seguirmos o caminho do desenvolvimento da IA com segurança e responsabilidade, os grandes modelos remodelarão o mundo digital e os a inteligência pode fornecer economia da China, e até mesmo a economia global, criar prosperidade incomparável e melhorar o bem-estar de toda a humanidade."

A seguir, a transcrição do discurso:

Ilustres dirigentes e ilustres convidados, bom dia!

É um grande prazer participar do Nishan Dialogue on Digital Civilization na World Internet Conference, cujo tema da minha palestra é "Grandes modelos remodelam o mundo digital".

No ano passado, a inteligência artificial avançou a uma velocidade iterativa de "semanas" em todos os níveis de tecnologia, produtos e aplicativos. O modelo grande comprimiu com sucesso a cognição humana do mundo, permitindo-nos ver o caminho para a inteligência artificial geral. A próxima fronteira do desenvolvimento de modelos em grande escala não é apenas imitar os seres humanos e completar as "ações prescritas" dos seres humanos, mas também ajudar os seres humanos a pesquisar e descobrir áreas desconhecidas e romper os limites que os seres humanos não ultrapassaram. no passado. Se você puder dar esse passo, será ainda mais significativo.

Como grandes modelos podem remodelar o mundo digital? Quero falar sobre isso a partir de dois níveis de tecnologia e aplicação:

No nível técnico, na era da inteligência artificial, a pilha de tecnologia de TI passou por mudanças fundamentais, da arquitetura original de três camadas de chips, sistemas operacionais e aplicativos para uma arquitetura de quatro camadas de chips, estruturas, modelos, e aplicações:

A camada inferior é a camada de chip, e o chip principal mudou de CPU para GPU. No topo do chip está a camada de estrutura.As principais estruturas incluem Baidu Fei Paddle, Meta's PyTorch e Google's TensorFlow. Acima da estrutura está a camada de modelo, e o modelo grande ChatGPT e Wenxin estão na camada de modelo. O modelo grande tornou-se o sistema operacional na era da inteligência artificial e todos os aplicativos serão desenvolvidos com base no modelo grande. Acima do modelo está a camada de aplicativos, incluindo vários aplicativos nativos de IA.

As mudanças estruturais na pilha de tecnologia de TI significam que a inteligência artificial, especialmente a tecnologia de modelos em larga escala, reestruturará a indústria digital global. O ponto-chave da nova estratégia de competição internacional não é quantos modelos grandes um país possui, mas quantos aplicativos de IA nativos estão em seus modelos grandes e até que ponto esses aplicativos melhoraram a eficiência da produção. Se conseguirmos nos espremer na mesa de pôquer e conseguir ingressos para a competição, a China terá uma indústria digital mais forte e a escala da economia digital crescerá tremendamente.

A Baidu investe em inteligência artificial há mais de 10 anos. Possui um layout de pilha completa nas quatro camadas de chips, estruturas, modelos e aplicativos. Em termos de tecnologias essenciais, a Baidu desenvolveu produtos líderes e tecnologias na arquitetura de quatro camadas, para que ele possa executar otimização de ponta a ponta para melhorar rapidamente a eficiência do treinamento e inferência de modelos grandes. O grande modelo Wenxin é completamente autônomo e controlável. Conseguimos dados controláveis, estrutura controlável e modelos controláveis.

Obviamente, os desafios de governança trazidos pelos grandes modelos de IA não podem ser ignorados. A aplicação de novas tecnologias muitas vezes precede as normas, e apenas estabelecendo e melhorando leis e regulamentos, sistemas institucionais e ética para garantir o desenvolvimento saudável da inteligência artificial, uma boa ecologia da inovação pode ser criada. Com foco no futuro, sem deixar de prestar atenção à prevenção de riscos, devemos também estabelecer mecanismos de tolerância e correção de erros ao mesmo tempo, e nos esforçar para alcançar um equilíbrio dinâmico entre regulação e desenvolvimento.

Modelos grandes estão na moda agora. Mas há 4 anos, quando o modelo grande não recebia atenção generalizada, o Baidu lançou o Wenxin Large Model 1.0. Em seguida, continue a evoluir para as versões 2.0 e 3.0.

Hoje, o modelo grande Wenxin foi iterado para a versão 3.5. Em comparação com a versão 3.0 em março, a velocidade de treinamento aumentou 2 vezes, a velocidade de inferência aumentou 17 vezes e o efeito cumulativo do modelo aumentou mais de 50%.

Wenxin Large Model Versão 3.5 não é apenas uma atualização técnica, mas também uma atualização de segurança. Usamos o método de avaliação de capacidade básica do modelo de grande escala convencional do setor para realizar a avaliação. Os resultados mostram que o modelo de grande escala Wenxin versão 3.5 foi significativamente melhorado em termos de qualidade de dados, efeito de geração e segurança de conteúdo.

o modelo de inteligência artificial do meu país tem uma certa base e precisamos alcançá-lo. Ao mesmo tempo, devemos aproveitar ao máximo as vantagens dos cenários de aplicação, desenvolver campos verticais, criar modelos profissionais de grande escala nas áreas de finanças, assistência médica e energia elétrica, realizar otimização técnica com aplicações de alta qualidade e feedback de dados, ajude atualizações iterativas de modelos grandes e construa um ecossistema de IA.

Prevê-se que os modelos de grande escala irão penetrar em mais e mais campos. A economia digital impulsionada por modelos de grande escala estará profundamente integrada com a economia real, tornando a economia real mais forte, melhor e maior, criando um valor incremental considerável, trazendo o próximo desenvolvimento econômico e social e profundas mudanças na indústria.

Por exemplo, na indústria automobilística, o processo de projeto mais complexo exige que engenheiros experientes encontrem várias combinações que atendam às necessidades entre mais de 20.000 peças e centenas de milhares de parâmetros e, em seguida, escrevam documentos e desenhem desenhos. Na Changan Automobile, o modelo grande pode encontrar informações de combinação com eficiência, gerar automaticamente documentos de projeto e reduzir bastante o ciclo e o custo de desenvolvimento. Na Sinopec e na China Southern Power Grid, grandes modelos podem se aprofundar nos principais cenários de negócios e inovar em áreas como atendimento inteligente ao cliente, cadeia de suprimentos e programação do sistema, além de promover a transformação digital e a melhoria inteligente do setor.

No campo do transporte, o esquema de transporte inteligente apoiado pela tecnologia de modelos em larga escala pode melhorar a eficiência da operação do tráfego.

Por exemplo, no último dia útil antes do feriado de primeiro de maio deste ano, o índice de congestionamento urbano em Pequim aumentou 2,5 vezes. Do segundo anel viário ao sexto anel viário, é vermelho, e o único verde é Yizhuang. O fluxo de tráfego em Yizhuang também aumentou significativamente, mas devido à implantação da solução de controle de informações globais AI, mais de 300 cruzamentos inteligentes podem ajustar automaticamente os semáforos de acordo com o fluxo de tráfego e Yizhuang se tornou um "oásis" sem engarrafamentos. No dia anterior ao Festival do Barco do Dragão, o tráfego na área urbana de Pequim e Yizhuang é surpreendentemente semelhante: a área urbana está muito congestionada, mas Yizhuang é tranquilo.

No ponto cênico do Monte Tai em Tai'an, Shandong, a fim de atender ao desenvolvimento da economia do turismo, promover o congestionamento urbano e o tráfego suave e resolver o problema de "estacionamento difícil" para turistas de outros lugares, o Baidu usa métodos de controle inteligentes, como telas de orientação de tráfego e cinturões de ondas verdes para proteger efetivamente cidadãos e turistas em viagens seguras.

As soluções de transporte inteligentes da Baidu foram adotadas por 69 cidades. Ao ajustar de forma inteligente o tempo dos semáforos, a eficiência do tráfego pode ser aumentada em 15% a 30%, o que impulsionará o crescimento do PIB em 2,4% a 4,8%.

Em Jinan, Shandong, também desembarcamos na Base da Indústria de Dados Básicos de Inteligência Artificial da Baidu Smart Cloud (Shandong), que não apenas cultivou novas profissões, como instrutores de IA, mas também incubou 22 empresas de tecnologia de rotulagem de dados, gerando empregos regionais e estimulando o crescimento econômico.

Não importa do ponto de vista das tendências tecnológicas ou das aplicações industriais, os modelos em grande escala não são de forma alguma um flash na panela, mas uma grande mudança tecnológica que afeta o desenvolvimento humano, um motor que impulsiona o crescimento econômico global e uma grande oportunidade estratégica isso não deve ser esquecido.

Aderir ao desenvolvimento tecnológico e tração em duas rodas segura e controlável, a fim de alcançar um progresso constante e de longo prazo. Se seguirmos o caminho do desenvolvimento da IA com segurança e responsabilidade, o grande modelo remodelará o mundo digital, e a inteligência artificial poderá criar uma prosperidade inigualável para a economia chinesa e até mesmo para a economia global e melhorar o bem-estar de toda a humanidade.

Isso é tudo pelo meu discurso, obrigado!

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)