Sugiro que Alibaba, Baidu e Huawei não se apressem em agarrar os "empregos" de grandes modelos da indústria!

2023-09-27 02:57:19

Original: Yibi Yanyu

Fonte: Data Ape

Mídia de serviço de inovação da indústria de big data

——Foco em dados·Mudança de negócios

Nos últimos meses, uma tendência de desenvolvimento muito óbvia no campo dos grandes modelos nacionais é que todos estão se reunindo para construir grandes modelos na indústria. Não apenas empresas em vários campos verticais lançaram vários modelos de grande indústria, mas também gigantes líderes como Baidu, Alibaba, Huawei, Tencent e JD.com também consideram grandes modelos da indústria como um foco principal.

Especificamente, estes fabricantes podem ser divididos em duas categorias com base na proporção de modelos grandes nas suas estratégias:

Baidu, Alibaba, Tencent e iFlytek prestam igual atenção aos grandes modelos gerais e aos grandes modelos da indústria.

Por um lado, eles prestam mais atenção aos grandes modelos gerais e abrem os grandes modelos gerais aos usuários finais C. Baidu Wenxinyiyan e iFlytek Spark da iFlytek até criaram aplicativos móveis para promover a aplicação de modelos grandes em geral.

Por outro lado, também prestam muita atenção aos grandes modelos da indústria. Geralmente, é exportado externamente na forma de soluções industriais. Ainda em 19 de setembro, o Baidu lançou diretamente um grande modelo da indústria médica - o Modelo de Medicina Espiritual, que atende diretamente hospitais, pacientes e empresas de dispositivos médicos.

A outra categoria é representada pela Huawei e JD.com, que desde o início se concentraram em modelos industriais de grande escala e estão diretamente orientadas para aplicações industriais.

O slogan do modelo Pangu da Huawei desde o início foi "Não escreva poesia, apenas faça coisas." Não estava entusiasmado com as aplicações C-end e quase todo o seu foco estratégico estava na indústria.

O grande modelo Yanxi da JD.com é semelhante, aderindo ao conceito de "nuvem que entende melhor a indústria" da JD Cloud, JD.com também se concentra em aplicações industriais na área de grandes modelos. Além disso, a JD Health também lançou um grande modelo de Jingyi Qianxun como pioneira na entrada na indústria.

Pode-se descobrir que seja Baidu, Alibaba, Tencent e iFlytek que “prestam igual atenção às duas frentes”, ou Huawei e JD.com, que estão quase “lutando em uma frente”, todos consideram o grande modelo da indústria como campo de batalha para estrategistas militares.

O autor acredita que isso é problemático. Esses gigantes da tecnologia devem se concentrar em grandes modelos gerais, e as aplicações industriais devem ser deixadas para parceiros em vários campos da indústria. Eles devem construir apenas a "infraestrutura" de grandes modelos e não tocar em aplicações de camada superior.

Por que dizemos isso? A seguir, vamos analisar detalhadamente os prós e os contras.

Os gigantes devem se concentrar na pesquisa e desenvolvimento de grandes modelos gerais

Os grandes modelos gerais são como a base de toda a indústria de modelos de grande porte. Se a base é sólida ou não, determinará a altura do edifício que pode ser construído. Então, a base atual é sólida?

Infelizmente, embora os grandes modelos tenham inicialmente alcançado a "emergência" da inteligência e tenham feito grandes progressos na compreensão da linguagem natural, na geração de conteúdo e no raciocínio lógico, eles não são bons o suficiente. Especialmente se quisermos implementar comercialmente grandes modelos em vários setores, as capacidades do modelo atual não são suficientes.

A capacidade mencionada aqui não é forte o suficiente e não se refere especificamente a um determinado modelo grande.

Mesmo o GPT-4 ainda apresenta deficiências significativas em termos de capacidade se quiser ser implementado no campo comercial. Vejamos alguns exemplos.

Os motores de busca são um importante cenário de aplicação para modelos grandes. O Bing da Microsoft fez uma grande reviravolta ao alterar o método original de busca por palavra-chave devido ao seu acesso ao ChatGPT. Então, qual é o real desempenho do Bing com atendimento ChatGPT?

Nós tentamos e foi bastante decepcionante, para ser honesto.

A seguir está um exemplo. Deixe o Bing pesquisar notícias sobre modelos grandes hoje (26 de setembro). As quatro notícias fornecidas são: Depois de clicar, o conteúdo dos itens 1 e 3 vem, na verdade, de um artigo de notícias, e estes são os primeiros a notícia foi publicada em 21 de fevereiro; o segundo e o quarto conteúdo também são da mesma notícia, publicada em 27 de julho.

Ou seja, a notícia dada está errada, procuramos as notícias de hoje, mas o resultado é um conteúdo de alguns meses atrás. Além disso, procuramos eventos importantes na área de grandes modelos.Entre as quatro respostas dadas, estão duas reportagens, um artigo de análise de notícias e uma atividade de fórum. A rigor, relatórios e artigos de análise não são notícias importantes. Nessa perspectiva, os resultados fornecidos pelo Bing não atendem completamente aos requisitos.

O autor então perguntou mais e pediu-lhe que usasse uma tabela para classificar o conteúdo das notícias fornecidas. Como resultado, na tabela que ele forneceu, o horário das notícias mudou para 26 de setembro, e quando se trata do horário específico, isso é obviamente um absurdo.

O autor já teve grandes expectativas em relação a novos mecanismos de busca como o Bing e os experimentou várias vezes. Mas a sensação geral é: basicamente inutilizável. Este é o desempenho real do ChatGPT no campo de pesquisa e, até certo ponto, representa o nível mais alto que grandes modelos podem alcançar.

O Baidu também lançou uma função semelhante. Além da pesquisa usual na web, você também pode consultar por meio de conversas. Mal podíamos esperar para experimentá-la.

Comparado ao Bing, o Baidu tem uma melhor compreensão dos eventos noticiosos. O Bing fornece vários relatórios, enquanto o Baidu fornece resultados com base em grandes lançamentos de modelos. O valor noticioso desses eventos é obviamente maior.

No entanto, esses resultados fornecidos pelo Baidu são confiáveis? Da mesma forma, permitimos que seja compilado em forma tabular e fornecemos horários e links de notícias. Verifica-se que os horários são todos de 11 de maio, o que é obviamente problemático, o que queremos é a notícia de 26 de setembro, não de 11 de maio.

Além disso, há também um problema com o link de notícias indicado na tabela: ao abrir a página correspondente, retorna diretamente "404". É claro que o Bing da Microsoft também tem esse problema: os links de notícias que ele fornece não podem ser abertos ou não existem.

Voltando ao ChatGPT, uma de suas limitações importantes é que ele não pode ser conectado à Internet e seus dados não podem ser atualizados em tempo real.O conjunto de dados de treinamento do GPT-3 é de setembro de 2021, e o conjunto de dados de treinamento do GPT -4 é em janeiro de 2022. lua.

Além disso, o ChatGPT frequentemente comete erros no cálculo e processamento de dados complexos. Seus alegados recursos de upload e compreensão de texto também não são ideais.

Vamos experimentar os recursos de compreensão de documentos do GPT-4. Carregamos o relatório semestral de 2023 de Loongson Zhongke e tentamos deixá-lo fazer uma análise SWOT simples. Após fazer o upload do documento, o ChatGPT começa a escrever o código para analisar o documento, o que parece ser muito poderoso.

Qual foi o resultado?

No final, o ChatGPT não conseguiu analisar o documento PDF. Tentamos várias vezes, mas não conseguimos analisá-lo.

Imagine só, contando com esses grandes modelos, se você quiser implementá-los em cenários industriais complexos, o efeito definitivamente não será o ideal, e eles já são os melhores modelos gerais de grande porte do mercado.

É verdade que houve algum “surgimento de inteligência” em modelos grandes, e suas capacidades foram melhoradas qualitativamente, mas eles estão atualmente no estágio inicial de “o pequeno lótus está apenas mostrando suas arestas vivas”. Como a descoberta de grandes modelos é uma direção promissora, o mais importante a fazer agora é acelerar e cultivar essa “criança” potencial, em vez de deixá-la sustentar a família prematuramente.

A julgar pela experiência histórica, cada mania da inteligência artificial será seguida por um longo período de silêncio. A principal razão é que as expectativas das pessoas foram elevadas demasiado na fase inicial e ficarão desapontadas quando descobrirem que as suas expectativas não foram satisfeitas.

Da mesma forma, se nos apressarmos a implementar grandes modelos em várias indústrias agora, em breve teremos um período de problemas, e as pessoas passarão rapidamente de grandes expectativas a queixas malucas.Tais altos e baixos não conduzem ao desenvolvimento saudável da indústria. .

Portanto, a principal tarefa dos gigantes da tecnologia como Alibaba, Huawei, Baidu e Tencent é cultivar o “filho” do Modelo Geral. Desde que as capacidades sejam verdadeiramente melhoradas, a implementação em larga escala será realmente muito rápida, por isso não há pressa em esperar até agora.

Existe uma curva de emergência de inteligência bem conhecida no campo de grandes modelos, ou seja, o desempenho do modelo não está linearmente relacionado à escala de parâmetros.Um modelo com 20 bilhões de parâmetros não é duas vezes melhor que um modelo com 10 bilhões parâmetros.

Existe um limite nesta curva de emergência de inteligência, que atualmente é de cerca de 100 bilhões de parâmetros. Antes deste limiar, o nível de inteligência apresentado pelo modelo não muda significativamente à medida que a escala dos parâmetros aumenta.Um modelo com 20 mil milhões de parâmetros tem um desempenho quase igual ao de um modelo com 2 mil milhões de parâmetros. No entanto, quando a escala de parâmetros ultrapassou o limite de 100 mil milhões, o desempenho do modelo melhorou exponencialmente.

Embora o tamanho do modelo não possa representar tudo, a julgar pela experiência de desenvolvimento da inteligência artificial nos últimos dez anos, a "violência quantitativa" é muitas vezes uma direção-chave. Modelos maiores, redes neurais mais profundas e mais dados trarão melhor desempenho.

A julgar pela atual curva de emergência da inteligência, após a escala de centenas de bilhões de parâmetros, ela entrará em um período de gargalo de inteligência.Pode não haver diferença significativa em "inteligência" entre um modelo com 500 bilhões de parâmetros e um modelo com 100 bilhões de parâmetros . No entanto, se quisermos atingir o próximo “limiar de emergência”, a melhor maneira presentemente é continuar a expandir o tamanho do parâmetro. Talvez, depois que a escala de parâmetros se expanda para dezenas de trilhões, o próximo limiar de emergência seja introduzido e as capacidades dos grandes modelos atinjam um novo nível.

Mapeamento de macacos de dados de previsão de emergência inteligente de modelo grande

É claro que, à medida que a escala do modelo for ampliada, o custo também aumentará significativamente, então este só pode ser um jogo para os gigantes. Além disso, a simples expansão do tamanho do modelo também causará problemas de ajuste excessivo. Portanto, a expansão da escala do modelo também precisa ser acompanhada pela otimização e ajuste da arquitetura do modelo, onde as capacidades técnicas são verdadeiramente testadas.

Para dar um passo atrás, os grandes modelos atuais são todos baseados na arquitetura Transformer, e essa arquitetura foi proposta em um artigo por vários pesquisadores do Google há cinco anos. Então a arquitetura do Transformer é realmente a melhor? Existe uma arquitetura de modelo melhor? Estas questões precisam de ser respondidas por gigantes da tecnologia como Huawei, Baidu, Alibaba e Tencent.

Além da escala de parâmetros e da arquitetura do modelo, os grandes modelos também precisam resolver problemas de "ilusão", problemas de interpretabilidade e problemas multimodais. Esses problemas ainda não foram bem resolvidos, o que é um problema comum enfrentado por toda a indústria. A chave para resolver estes problemas reside nos avanços tecnológicos subjacentes nos grandes modelos em geral, e não nos grandes modelos da indústria.

É claro que quem conseguir realmente resolver estes problemas-chave será recompensado em conformidade pelo mercado.

Não seja árbitro e jogador ao mesmo tempo

A razão pela qual se recomenda que os gigantes da tecnologia não toquem nos grandes modelos da indústria é que, além do problema não resolvido dos grandes modelos em geral, outra razão muito importante é evitar conflitos de interesses com os parceiros.

Para os gigantes da tecnologia, eles jogam um jogo ecológico e partilham os benefícios da infraestrutura.

No domínio dos grandes modelos, a rota de transmissão de valor deve ser grandes modelos gerais - grandes modelos da indústria - clientes da indústria. No estágio de grandes modelos da indústria, os grandes fabricantes de modelos em geral, como Huawei, Baidu e Alibaba, podem desenvolver eles próprios grandes modelos da indústria ou permitir que parceiros terceirizados conduzam pesquisa e desenvolvimento com base em seus próprios grandes modelos gerais.

Mapeamento de macacos de dados do mecanismo de transmissão de valor de aplicativos da indústria de grandes modelos

Os grandes modelos gerais testam as capacidades técnicas, enquanto o limiar técnico para os grandes modelos da indústria não é muito elevado.Os seus elementos principais são os dados e a experiência da indústria, e estes dois pontos são as deficiências dos gigantes tecnológicos. Reunir conjuntos de dados de alta qualidade de vários setores, como finanças, assistência médica, manufatura e varejo, e compreender os cenários de negócios de vários setores, definitivamente não é algo que uma empresa possa fazer. Ela deve confiar no poder de o ecossistema e usam milhares de dados de todo o ecossistema. Os parceiros fazem isso.

É claro que fabricantes gerais de grandes modelos, como Baidu, Huawei e Tencent, também podem ocupar ambas as rotas de transmissão de valor. Por exemplo, na área médica, o Baidu pode não apenas usar seu próprio modelo de medicina espiritual em grande escala para atender diretamente hospitais, pacientes e empresas de equipamentos médicos, mas também promover a construção de um sistema de parceiros modelo médico vertical em grande escala.

No entanto, esta situação enfrentará o problema de “competir com o povo pelo lucro”, o que é um tabu nos negócios.

Imagine que uma determinada empresa A de modelo médico em grande escala se baseie no modelo geral de grande escala da empresa B, abra seus principais dados médicos para B e treine um modelo médico em grande escala. Poucos meses depois, A descobriu que a empresa B também havia lançado um grande modelo médico e suas funções eram semelhantes às suas. Quando um cliente do setor fez um pedido, descobriu que a Empresa B também estava licitando e seu parceiro repentinamente se tornou um concorrente. Se for esse o caso, a Empresa A ainda está disposta a cooperar com a Empresa B?

Num ecossistema, a confiança dos parceiros no proprietário do ecossistema é tão valiosa como o ouro. Somente quando os parceiros de aplicação de nível superior acreditarem firmemente que o eco-proprietário não terá um conflito de interesses com ele ou roubará seu negócio, ele se sentirá confiante em colocar seu negócio na plataforma construída pelo eco-proprietário.

Isso é um pouco semelhante ao relacionamento entre fornecedores de IaaS e fornecedores de SaaS na área de computação em nuvem. A razão mais crítica pela qual muitas empresas de SaaS na China estão preocupadas com fornecedores de nuvem como Alibaba Cloud, Tencent Cloud, Baidu Cloud e Huawei Cloud é que elas têm medo de conflitos de interesse. Atualmente, os limites de negócios dos fornecedores de nuvem IaaS não são suficientemente claros, eles não apenas fornecem produtos IaaS e PaaS, mas também entram em muitos campos de SaaS, que são o maior tabu para seus parceiros SaaS.

Nas fases iniciais da Internet na China, os investidores tinham uma famosa questão de reflexão para as empresas iniciantes: o que fariam se a Tencent fizesse o mesmo produto?

Da mesma forma, se os grandes fabricantes de modelos em geral quiserem construir um ecossistema de aplicativos, os grandes fabricantes de modelos da indústria nas áreas de assistência médica, finanças, assuntos governamentais, manufatura e outras áreas também perguntarão - se você fizer algo como eu no futuro, o que devo fazer?

Então, que tipo de ecossistema de modelo grande é mais razoável? Podemos aprender com o ecossistema de computação em nuvem: o grande modelo geral é equivalente ao IaaS, e o grande modelo da indústria é equivalente ao SaaS.

Baidu, Huawei, Alibaba, Tencent, JD.com, ByteDance, iFlytek e outros fabricantes líderes de modelos gerais concentram-se em grandes modelos gerais (IaaS + PaaS) e tentam não tocar nos grandes modelos da indústria (SaaS).Demarcar limites de negócios.

Deve-se salientar que, mesmo que não produzam grandes modelos industriais, os grandes fabricantes gerais de modelos subjacentes ainda podem partilhar os dividendos da aplicação industrial dos grandes modelos. Assim como os aplicativos SaaS consomem recursos de IaaS e pagam por IaaS, o modelo da indústria da camada superior chamará os recursos do modelo geral da camada inferior, e um modelo de negócios razoável pode ser construído com base no número de chamadas e no uso.

Por exemplo, o Baidu não fabrica modelos médicos em grande escala, mas tem 10 parceiros de modelos médicos em grande escala baseados em Wen Xinyiyan, e cada parceiro atende 1.000 hospitais. Suponha que cada hospital pague 1 milhão de yuans por ano e que o Baidu compartilhe 20% desse 1 milhão de yuans. Então, cada empresa modelo médica de grande escala pode ganhar 1 bilhão de yuans por ano, e a receita do Baidu é de 1 bilhão*20%*10=2 bilhões de yuans. Dessa forma, o Baidu precisa atender apenas 10 parceiros, em vez de atender 10 mil hospitais.

Por analogia, se um ecossistema próspero de grandes modelos industriais puder ser construído, a aplicação industrial de grandes modelos também poderá trazer dezenas de bilhões de receitas para os grandes fabricantes gerais de modelos subjacentes.

Para grandes fabricantes de modelos em geral, como Baidu, Huawei, Tencent e Alibaba, não há necessidade de se preocupar em perder os dividendos das aplicações de grandes modelos da indústria. Assim como no campo da computação em nuvem, a receita de qual fornecedor de SaaS pode corresponder à da Alibaba Cloud, Tencent Cloud e Huawei Cloud que fornecem IaaS?

Contanto que você se concentre em lançar as bases do grande modelo geral, você poderá vender o “terreno” sem ter que mover tijolos laboriosamente para construir uma casa. Vamos pensar no campo imobiliário: os promotores imobiliários como Vanke e Evergrande são os mais lucrativos? É obviamente mais lucrativo e mais fácil vender terrenos.

Para grandes fabricantes de modelos em indústrias verticais, seu estado mais ideal é aprender com estratégias de implantação de SaaS entre nuvens para alcançar a implantação de modelos gerais de grandes modelos do setor e migrar suavemente os negócios de uma plataforma de modelo geral para outra. Isso evita ficar vinculado a uma única plataforma. É claro que os grandes modelos da indústria estão atualmente numa fase muito inicial e ainda é muito cedo para falar sobre a implantação de modelos gerais.

Mapeamento de dados do modo de implantação de modelos cruzados de grandes modelos da indústria

Em resumo, recomenda-se que gigantes da tecnologia como Baidu, Huawei, Alibaba e Tencent se concentrem na investigação e desenvolvimento de grandes modelos gerais, em vez de na aplicação de grandes modelos da indústria.

Por um lado, grandes modelos de uso geral ainda não são bons o suficiente.Problemas como nível de inteligência insuficiente do modelo, problemas de alucinação, má interpretabilidade, fraca capacidade de fusão multimodal e alto custo de treinamento e inferência de modelos ainda são proeminentes Os gigantes da tecnologia deveriam resolver esses problemas. Quebra-cabeças de nível mais baixo e mais desafiadores. Somente quando esses problemas forem resolvidos a base da aplicação da grande indústria modelo poderá ser sólida.

No nível de aplicação de grandes indústrias modelo, a conclusão pode ser completamente deixada para as empresas de campo vertical de nível superior. É previsível que haverá centenas ou milhares de empresas modelo de indústria de grande escala competindo em cada área. No final, dezenas de empresas sobreviverão e as mais aptas sobreviverão. Essas empresas sobreviventes são parceiros qualificados. Os grandes fabricantes de modelos gerais subjacentes devem construir um ecossistema com os seus parceiros para servir conjuntamente os clientes da indústria.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Partilhar

Comentar

0/400

Nenhum comentário

Tópico
1/3
1Simple Earn Annual Rate 24.4%
39k Popularidade
2Gate Launchpad List IKA
41k Popularidade
3ETH Trading Volume Surges
42k Popularidade
4Gate ETH 10th Anniversary Celebration
22k Popularidade
5Trump’s AI Strategy
18k Popularidade

Pino