360 Group Peng Hui: A tendência de desenvolvimento de grandes modelos é a verticalização! O ChatGPT de nível empresarial só precisa destas 4 etapas...

2023-08-25 03:37:44

Fonte: azarão AI

Autor: Vice-presidente do Grupo Peng Hui 360

01. A tendência de desenvolvimento de grandes modelos é a "verticalização"

Com as suas características inclusivas, omnipresentes e universais, o modelo de grande escala entrará em milhares de lares e capacitará milhares de indústrias no futuro.

Então, temos esta visão:

Cada família, cada governo e cada empresa terão um ou mais grandes modelos.

Acreditamos também que o desenvolvimento da China e dos Estados Unidos no mercado To B é muito diferente. Não haverá monopólio na China e definitivamente não haverá apenas 3 a 5 modelos grandes.

No futuro, os grandes modelos deverão estar omnipresentes e as futuras oportunidades de desenvolvimento deverão estar no mercado empresarial.

Todos sabem que a digitalização se tornou uma estratégia central do nosso país e que a digitalização industrial será um enorme mercado incremental descentralizado no futuro.

Portanto, ao fabricar modelos de grande escala na China, acreditamos firmemente que devemos aproveitar esta oportunidade estratégica para capacitar a indústria, ancorar o mercado a nível industrial e retirar modelos de grande escala do chamado mercado centralizado. a produtividade e a eficiência da produção do governo e das empresas.

É claro que, neste processo, os grandes modelos encontrarão enormes desafios no processo de chegada ao mercado empresarial.

Eu resumo em quatro aspectos:

Falta de conhecimento profissional.

Todo mundo sabe que usaremos uma grande quantidade de corpus da Internet para alimentar o grande modelo, é como um estudante do ensino médio, no máximo um graduado. No entanto, é extremamente deficiente em alguns conhecimentos de domínio profissional, conhecimento da indústria e conhecimento interno da empresa. Nem mesmo atualizado a tempo. Então, isso é um grande problema, falta de expertise.

Bobagens alucinatórias ocasionais.

Todo mundo costuma dizer uma palavra, e a grande modelo falará bobagens de maneira séria. Terá ambiguidade de conhecimento e ilusão de conhecimento. Como os dados e o conhecimento são como bancos de dados estruturados, eles são codificados nos parâmetros e pesos da nossa rede neural profunda em outra forma matricial e vetorial. No entanto, quero chamá-lo, usá-lo e realmente preciso fazer um trabalho melhor de inicialização. Neste processo, o seu mecanismo algorítmico produzirá uma ilusão de conteúdo, que não pode garantir autenticidade e credibilidade.

Questões de segurança.

As empresas não estão dispostas a contribuir com as suas competências únicas para o modelo público de grande dimensão, nem a treiná-las para um modelo público de grande dimensão.

Questões de custo.

Agora o fornecimento da Nvidia H100 está esgotado e o ChatGPT afirma treinar dezenas de milhares de placas ao mesmo tempo. Portanto, este tipo de investimento é muito difícil para uma empresa comum. Podemos ter reduzido mão de obra, mas não reduzimos custos.

Então, como resolver esses problemas?

Acreditamos que uma tendência de desenvolvimento no futuro deve ser a verticalização e a criação de grandes modelos verticais pequenos, mas especializados.

É impossível confiar em um grande modelo único e multifuncional para resolver todos os problemas de decomposição de tarefas, interação humano-computador e resposta a perguntas de conhecimento. Devemos contar com um corpus de dados de nível empresarial e dados de alta qualidade para treinar grandes modelos verticais proprietários de pequena escala.

Os modelos grandes tornar-se-ão uma configuração padrão e um componente de todos os sistemas digitais no futuro.

02 Como a GPT de nível empresarial pode ser implementada rapidamente?

Entrevistamos mais de 100 clientes corporativos e parceiros e todos basicamente chegaram a um consenso:

Grandes modelos não são tudo no momento.

Então, a questão é: como aplicá-lo melhor em cenários empresariais?

Precisamos profissionalizar os chamados generalistas e tornar-nos verdadeiros especialistas governamentais e empresariais.

Neste momento, precisamos encontrar uma pequena incisão e aproveitar ao máximo seus pontos fortes.

Acreditamos que as capacidades atuais do grande modelo se refletem principalmente nas duas capacidades de geração de texto, ou criação de conteúdo e resposta a perguntas de conhecimento. Podemos começar com essas duas habilidades.

Cada vez mais profissionais da indústria de modelos em grande escala acreditam que, em cenários de aplicação relativamente focados e estreitos, modelos grandes menores e ajustados atenderão aos requisitos de precisão da extremidade To B com mais rapidez.

Portanto, devemos proceder passo a passo, deixar o modelo grande ser primeiro um bom assistente e deixar o modelo grande ser primeiro uma boa navegação.

Focando nesse cenário, encontramos cenários de aplicação correspondentes que se adaptam a esses quatro produtos para exercer rapidamente sua produtividade e eficácia nas quatro dimensões superior, inferior, interna e externa.

Na cena interna achamos que é mais uma questão de escrever e resumir o escritório.
No cenário externo, um grande número de pessoas digitais começou a aparecer no cenário de atendimento ao cliente.
No cenário acima, enfatizamos a síntese e análise de informações e inteligência.
No próximo cenário, podemos deixar o grande modelo fazer uma série de treinamentos sobre conhecimento corporativo e até mesmo habilidades profissionais.

Portanto, durante todo o processo de implementação, percebemos um ponto muito importante. No futuro, mais de 80% dos nossos cenários de negócios estarão intimamente relacionados com a base de conhecimento da empresa.

No passado, quando trabalhávamos com big data, todos ficávamos na aplicação de dados estruturados. Você deve saber que 80% do conhecimento e dos dados não estruturados são abandonados ou deixados de lado. Essa parte do big data se tornará o corpus para o treinamento de grandes modelos.

Portanto, como extrair conhecimento valioso e dados precisos de alta qualidade de um grande banco de dados da empresa, transformá-los em uma base de conhecimento de domínio privado da empresa e capacitar o grande modelo por meio de correção e aprimoramento de recuperação, pode realmente produzir conteúdo confiável e atualizações oportunas de conteúdo no cenário de negócios To B, bem como a segurança de conteúdo, como descentralização e divisão de domínios.

Os dados são divididos em três portas:

A primeira porta pode ser dados abertos da Internet, a segunda porta são dados semipúblicos da indústria ou dados corporativos, e parte deles são dados confidenciais dentro da empresa.

Para dados confidenciais e dados autorizados deste tipo de empresa, devemos colocá-los na base de conhecimento de uma empresa, ou colocá-los em um banco de dados vetorial, para que possam gerar uma espécie de gestão com autoridade e auditoria, através de Uma espécie de gestão de autoridade de conhecimento empresarial classificado e hierárquico, aprimorado pela recuperação de grandes modelos, de modo a fornecer conhecimento e capacitação mais precisos.

Outro aspecto é a aplicação. No nível da aplicação, todos já foram expostos ao ChatGPT. Você acha que é fácil de usar?

Por que há algum tempo todos os cérebros mencionavam que no futuro haveria muitos cargos e funções que sugeriam engenheiros, na verdade é muito complicado.

Queremos que ele escreva um bom artigo e temos que dar muitas dicas, ideias centrais, resumos e esboços antes que ele possa escrever um bom artigo. Deixamos que ele faça uma imagem, use Midjourney, eu Você ainda precisa diga quantos milímetros de lente, distância focal, abertura e profundidade de campo você precisa usar, que tipo de ambiente pode criar uma imagem gerada realmente bonita como esta, mas esse projeto de dica só pode ser usado, mas é muito estranho e difícil de usar.

Portanto, no processo de desenvolvimento futuro, não seja supersticioso com a chamada linguagem UI, e as interfaces mais tradicionais não serão eliminadas.

Além disso, será gerado em grande número em cenários futuros, como redação de escritório, criação de imagens, criatividade de marketing, etc., e até mesmo em cenários de perguntas e respostas sobre conhecimento governamental, porque fornece mais intuição e aplicabilidade.

Por exemplo, Lao Zhou costumava dizer que queria comer um prato de batatas raladas. Eu queria batatas fritas em vez de vinagre. O clique pode ser de um segundo, e terminei este assunto.

A 360 lançará toda a estrutura do sistema de produtos de seu próprio GPT de nível empresarial. Na camada inferior, ainda acreditamos que os dados e o conhecimento se tornarão uma base para grandes modelos de nível empresarial no futuro, que não podem ser separados da acumulação de todos os dados do passado. necessidades de grandes modelos e desestruturar os dados acumulados por todas as empresas no passado. Conteúdo e documentos, incluindo gráficos multimídia de áudio e vídeo, dados de imagem, por meio de vários conectores de dados e robôs de rastreamento de conhecimento, um mecanismo de processamento que promove dados de múltiplas fontes incorpora-os em nossa base de conhecimento empresarial, por meio de índices vetoriais, índices abstratos no sentido tradicional, índices de texto e índices multimodais, construir uma base de conhecimento de um grande modelo de nível empresarial e, em seguida, por meio de nossa pesquisa e aprimoramento de conhecimento, capacitar nossos profissionais empresa vertical em grande escala O modelo fornece serviços para cima.

03, 3 práticas e o melhor processo para pousar modelos grandes

Redação de escritório.

Esconderemos os projetos complexos por trás dos diferentes modelos grandes de 15 categorias e modelos de documentos subdivididos em quase 80 categorias. Use essa ferramenta para concluir com eficiência a redação de documentos oficiais e resolver com eficácia os problemas de redação demorada e de baixa qualidade de documentos oficiais.

Serviços governamentais.

Através do grande modelo e da base de conhecimento dos assuntos governamentais, podemos fazer com que o grande modelo compreenda a semântica como um ser humano através de múltiplas rodadas de diálogo, complemente informações relevantes por meio de perguntas de acompanhamento e acompanhamento e, finalmente, forme uma pergunta e resposta. Ele pode responder de forma objetiva e precisa a todas as perguntas que as pessoas comuns têm no processo de fazer negócios.

Pessoas digitais de turismo cultural.

Lao Zhou também mencionou Wenlv Digital People em muitas ocasiões. Todo mundo já planejou viagens. Um chamado plano de itinerário de viagem pode resolver seus problemas de viagem?

O que nos importa é que após pousar em um destino, tenhamos um amigo local e um guia turístico local. As paisagens, a comida, as anedotas e as piadas que me interessam, como essas coisas se tornam uma companheira digital centrada no destino? Queremos criar esse companheiro digital.No futuro, sob a liderança do governo, abriremos gradualmente as capacidades da China e de Taiwan e, depois de conectarmos nossa OTA, hotéis e restaurantes locais.

Combinado com o próprio Grupo 360 e mais de 100 clientes corporativos e parceiros, formamos o processo de implementação das melhores práticas até agora.

O primeiro passo é a análise do negócio e a seleção do cenário.

A segunda etapa é a coleta de dados e preparação da limpeza.

A terceira etapa é treinar o grande modelo proprietário da empresa.

A quarta etapa é desenvolver aplicativos de cenário empresarial.

Acreditamos que quando todos os modelos de grande escala são implementados em cenários de nível empresarial, uma das principais prioridades ainda é a análise de negócios. Não é diferente da digitalização.

Ainda precisamos encontrar os pontos problemáticos do negócio no processo de análise de negócio, para encontrar um cenário adequado e, após selecionar esse cenário, definir nossa solução.

Em seguida, colete e limpe dados e conhecimento em torno deste cenário para formar nossos dados rotulados de alta qualidade. Depois de entrar no banco de dados, parte dele é alimentado em nosso grande modelo vertical como corpus para treinamento, e parte dele entra em nossa base de conhecimento empresarial para fazer uma busca de aprimoramento de conhecimento. Em seguida vem o desenvolvimento de assistentes inteligentes, funcionários digitais e humanos digitais, por meio do arranjo de modelos de aplicativos e da abertura de APIs para integração com sistemas de negócios existentes.

Durante o processo de implementação do grande modelo de nível empresarial, enfatizamos que ele é inseparável da estreita colaboração dos especialistas comerciais e técnicos de ambas as partes.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.