Desencantamento AI: modelo de meio ano, ainda voando no céu

2023-08-04 06:52:59

Fonte: "Photon Planet" (ID: TMTweb), autor: Wu Kunyan, editor: Wu Xianzhi

Fonte da imagem: Gerada por Unbounded AI

O fogo do grande modelo está queimando nesta terra há meio ano. À medida que as coletivas de imprensa da Huawei, JD.com e Ctrip acompanham os episódios noturnos, de acordo com o paradigma consistente da Internet, a "novidade" dos modelos domésticos de grande escala também deu início ao seu próprio teste semestral.

É apenas diferente dos exames semestrais de outras empresas. Os exames semestrais de formas de negócios, como novos veículos de energia, telefones celulares e plataformas de comércio eletrônico, são apoiados por informações de dados públicos suficientes para facilitar a análise textual. Em um " caixa preta", não há um modelo de negócios claro, então as chamadas informações de dados e outros argumentos estão fora de questão.

É bastante irônico que, mesmo do ponto de vista da função do produto, o grande modelo ainda não tenha produzido um método de avaliação geral. De frente para o objetivo final da AGI, existem naturalmente vários métodos de avaliação, como o clássico "método de peixe mandarim esquilo" que os usuários domésticos C-end confiam para "avaliar" modelos grandes.

Ou por causa disso, a maioria dos fabricantes nacionais falha em abrir seus próprios modelos grandes para uso como OpenAI, mas implementam mecanismos de teste internos.

A exploração de modelos de grande escala é mais focada no lado B e no lado G, como os modelos de grande escala líderes da indústria da Tencent, Pangu 3.0 da Huawei, Jingdong Lingxi, etc. Como a faixa atual em que os principais jogadores se concentram, seu grande modelo se concentra em mostrar formas de produtos maduros o máximo possível, com a comercialização como objetivo básico. Por exemplo, a fim de popularizar e promover rapidamente a comercialização desse tipo de modelo grande, além da orientação comercial, os recursos de implantação localizada também se tornaram importantes indicadores de referência.

Mesmo assim, aos olhos de quem está por dentro do setor, o modelo industrial de larga escala que "entrega a tigela na frente" ainda carece de empresas que o comprem. O vento do modelo industrial sopra há um mês desde junho, e há não houve cooperação comercial em grande escala até agora.

Portanto, não é difícil perceber que no mercado de investimentos atual, os investimentos relacionados a grandes modelos estão concentrados no mercado secundário e não no mercado primário. Mesmo que o nível de vaca grande de Wang Huiwen entre no mercado, fontes públicas dizem que seu financiamento A-round é muito superior a 230 milhões de dólares americanos, e sua capacidade de financiamento não é a mesma da OpenAI, que recebe dezenas de bilhões de dólares da Microsoft de vez em quando.

O mercado de investimentos é um barômetro qualificado. Obviamente, as folhas de respostas apresentadas pelas maquetes nacionais de grande escala no nó do exame semestral não são satisfatórias, e será necessário um período de dormência e polimento para que a "história" se torne realidade.

Modelo grande sem modelo de negócio?

Quando os modelos domésticos de grande escala precisam responder às dúvidas do mercado, os modelos de negócios devem ser colocados em primeiro lugar.

O ChatGPT, que já ocupou o primeiro lugar na mente dos usuários, teve uma queda significativa na popularidade. Baidu e Ali, os primeiros modelos grandes de uso geral lançados no mercado interno, também caíram no "silêncio" depois que um grande número de jogadores o seguiu acima. A razão é que o modelo de negócios do grande modelo geral não funcionou. Mesmo tendo conquistado a aprovação dos usuários no campo da opinião pública, o circuito fechado comercial nunca apareceu.

Tomando como exemplo o modelo de grande escala do Baidu com uma ampla gama de testes, o modelo de pagamento de seu aplicativo comercial Wenxin Qianfan é baseado no número de tokens gerados por chamada, o padrão é 0,012 yuan por mil tokens e custa 0,12 yuan para produzir um manuscrito de mil caracteres.

Independentemente da velocidade de seu custo de recuperação, a taxa de 0,012 yuan/mil tokens parece barata, mas a geração de texto geralmente requer múltiplas interações para obter os resultados desejados. Múltiplas interações aumentarão infinitamente o custo oculto. Afinal, Wenxin Qianfan não é o tipo de pessoal que vem e vai.

Um cenário semelhante é a comunidade de perguntas e respostas. Sun Quan (pseudônimo), um acadêmico, disse ao Photon Planet que a experiência de usar aplicativos de modelo é semelhante à busca de respostas de alta qualidade na comunidade de perguntas e respostas. o pensamento do usuário é a granularidade da questão, e a vontade de pagar muitas vezes só é encontrada em respostas de alta qualidade.RESPOSTAS DE QUALIDADE serão produzidas depois. Portanto, o Baidu escolheu o número de textos de inferência como padrão de pagamento, mas ainda não consegue cobrir os custos ocultos do uso comercial.

Se você adotar o pagamento mensal que o lado B adora ver, isso apenas transferirá as despesas de custo dos usuários para você, o que obviamente não é uma solução de longo prazo. A melhor prova é que o ChatGPT ainda é suspeito de cortar custos abaixo do preço de $ 20 por mês para usuários C-end.

Atualmente, a comercialização de grandes modelos de uso geral é difícil de alcançar um equilíbrio de equilíbrio, seja no lado B ou no lado C. Ao mesmo tempo, é provável que encontre riscos de conformidade, como a ética da IA e supervisão. Portanto, a industrialização e a verticalização de grandes modelos tornaram-se uma mudança de paradigma sob a demanda de pouso.

Em contraste com o modelo industrial de grande escala, embora a forma do produto comece com a demanda de desembarque, os problemas que surgem no desembarque real ainda precisam ser resolvidos.

Um tipo de caso digno de referência é o modelo vertical para C construído com base em sua própria ecologia de produto, como Zhihaitu AI, que Zhihu anunciou anteriormente para realizar testes internos no produto, e Ctrip.com, que foi lançado há pouco tempo atrás.

As vantagens de ambos entrarem na trilha do modelo em grande escala são as mesmas, que residem em sua própria ecologia comunitária e no conteúdo comunitário de alta qualidade derivado disso. O conteúdo, como dados da indústria, pode se tornar o corpus de treinamento de grandes modelos após uma simples limpeza. A sutil diferença entre os dois é que Zhihu é uma comunidade de conteúdo desde o início, enquanto a Ctrip só começou a se concentrar em conteúdo nos últimos anos.

Mas, do ponto de vista atual, seja Zhihu ou Ctrip, a forma de produto de seu modelo grande não parece ser capaz de atender aos pontos problemáticos dos usuários, nem pode melhorar suficientemente as funções existentes.

O produto atualmente anunciado da Zhihaitu AI, “Hot List Summary”, usa AI para capturar perguntas e respostas de alta qualidade e polir e reescrever o resumo para apresentar aos usuários, enquanto outro aplicativo “Search Aggregation” agrega opiniões de auto-respostas para melhorar as informações de aquisição do usuário e eficiência na tomada de decisões.

Funções de agregação, como auto-recomendação e lista quente, são as “habilidades artísticas tradicionais” de Zhihu, e o desempenho do grande modelo de capacitação não causou impacto no nível do usuário. Além disso, o processo de reescrita e polimento da IA também abrange os recursos personalizados das respostas populares.Para os usuários, a função desse aplicativo é apenas entender rapidamente as informações, o que contraria a comunicação diferenciada e personalizada preconizada pela comunidade de conteúdo.

Com base na OTA, a Ctrip perguntou, na opinião de Liang Jianzhang, presidente do conselho de administração da Ctrip, que é uma "biblioteca de respostas confiável" para a indústria do turismo. Levará tempo para testar a eficácia de seus produtos, mas do ponto de vista do posicionamento, também é suspeito de "sacrificar o básico e perseguir o último".

Aos olhos dos jovens utilizadores, não existe uma resposta padrão para o turismo, o que é provado pela emergência de formas diversificadas de turismo como as “forças especiais”, o “soco” e a “imersão”. Por exemplo, supondo que um grande número de usuários use IA para formular o planejamento de rotas de viagem, o mesmo planejamento de rotas afetará a comunicação e a atmosfera da comunidade e até causará uma diminuição no tempo de permanência do usuário.

De um modo geral, a tentativa de pouso do modelo vertical na extremidade C não é suave, podendo até se tornar um "custo irrecuperável". Talvez afetado pelo mito de "melhorar a eficiência" do próprio modelo grande, o posicionamento do produto é principalmente limitado à palavra "eficiência", mas a eficiência é apenas uma dimensão não essencial na experiência do usuário.

O mesmo paradigma também foi demonstrado no campo to B, e no lado B que busca a eficiência, o modelo de negócios e as questões de implementação do grande modelo da indústria foram demonstrados mais profundamente.

Caixa preta não clara

"IA não é física. Existem poucos grandes avanços tecnológicos na teoria, mas mais ajustes finos e pequenas otimizações nas dimensões da estrutura do modelo e qualidade dos dados. Em muitos casos, o resultado do modelo é ainda melhor, mas a equipe não pode encontre o motivo."

Na opinião de um especialista da indústria, há um enorme viés cognitivo em grandes modelos fora da indústria, e a razão é que o treinamento de grandes modelos e a indústria de IA são uma "caixa preta" para o mundo exterior, e é difícil para examinar grandes modelos O processo de raciocínio que produz a saída é invisível e intangível.

Isso levou o mundo exterior a tomar uma atitude cautelosa em relação à "caixa preta" do grande modelo, uma vez que eles se acalmaram após o período de frenesi trazido pelo ChatGPT. Isso levará ao dilema do grande modelo no terreno, sendo esse fenômeno mais evidente no processo de mudança para a rota B.

Tomemos como exemplos os produtos produzidos pelos principais fabricantes que agora definiram claramente a rota para B, incluindo a solução de tecnologia MaaS lançada pela Tencent Cloud e o modelo Pangu large lançado pela Huawei Cloud. Implantação de nuvem, implantação rápida localizada etc. Também há conquistas na interação, operação e adição subsequente de otimização iterativa de novos dados do setor.Pode-se dizer que, para fins de aterrissagem, o limite para modelos grandes foi reduzido a um nível extremamente baixo.

No entanto, a barreira cognitiva provocada pela "prudência" não foi quebrada.Embora o ChatGPT esteja explodindo há meio ano, muitas empresas não têm motivação e interesse em pesquisar como importar modelos grandes.

Uma lógica semelhante pode ser vista na indústria de computação em nuvem há alguns anos. A computação em nuvem é um serviço e derivado baseado no reconhecimento do valor dos dados.Quanto ao valor dos grandes modelos para as empresas, é relativamente falando que o valor dos dados saltou. São também as capacidades técnicas que faltam aos clientes corporativos.Mesmo a popularização da computação em nuvem nas empresas nacionais ainda está longe do fim, sem falar no modelo grande.

Se o modelo da indústria é útil ou não, na verdade não é mais importante, afinal, o valor de uso do produto precisa ser descoberto pelo usuário no final. Além disso, o mundo exterior medirá aproximadamente o nível do modelo através de certos testes e performances, como o "método do peixe mandarim esquilo" ou Huawei Pangu, que recentemente foi questionado devido a erros na previsão do local de pouso e intensidade do supertufão "Dusuri" Modelo meteorológico.

Talvez por causa disso, o modelo de grande escala Jingdong Lingxi lançado recentemente optou por dar prioridade à execução de seus próprios cenários de negócios e espera-se que esteja aberto a "cenários de negócios sérios externos" no início do próximo ano.

O que vale a pena mencionar é que sob a "tendência da indústria", o chamado modelo de indústria orientado para a comercialização substituiu a narrativa original "universal" do grande modelo e, ao mesmo tempo, também fez com que muitas pessoas "perdessem ".

A definição do chamado modelo de indústria é vaga. A conotação do modelo grande (Modelo de Fundação) não reside no número de parâmetros, mas nas capacidades gerais que emergem do treinamento geral de dados. Se a mesma arquitetura de modelo for adotada, mas um único domínio de dados for usado nos dados, não apenas a capacidade geral será perdida, mas até mesmo os problemas de domínio não poderão ser resolvidos devido a descontos emergentes.

Se os dados da indústria forem usados para pré-treinamento secundário com base no modelo grande original, é equivalente a ajustar o modelo original, então o produto em si ainda está na camada do modelo, que pode ser chamado de modelo grande da indústria ; se o conhecimento do domínio for adicionado por meio de um banco de dados externo, isso é apenas para estimular as capacidades do modelo original, e o produto também deve pertencer à camada de aplicativo acima do modelo. É um exagero chamá-lo de modelo de indústria.

Atualmente, a maioria dos modelos industriais de grande escala nas grandes fábricas são os primeiros, como Tencent, Jingdong, Huawei e assim por diante. Este último aparecerá mais na comunidade de código aberto devido ao investimento mais leve e à rápida melhoria do desempenho do modelo, como o ChatLaw, um grande modelo jurídico que gerou discussões acaloradas há algum tempo.

"Comparado com o primeiro, o último é mais maduro em termos de forma de produto, o que facilita a construção rápida de capacidades de modelo, mas o último geralmente tem um limite superior superior após concluir o processo de incutir conhecimento de domínio", disse um especialista da indústria.

Ameaças de código aberto

Recentemente, a Meta forneceu seu último modelo grande de código aberto Llama2 gratuitamente sob uma licença comercial aberta e o introduziu na plataforma Azure da Microsoft. Essa mudança foi saudada como um marco importante para o LLM de código aberto e até começou a ameaçar o status de código fechado fabricante líder OpenAI.

Através da Microsoft, o grande patrocinador do modelo, a Meta desafia a OpenAI com uma atitude mais aberta.

Na verdade, a "facção do código aberto" surgiu silenciosamente como um terceiro partido muito antes disso. “Não temos um fosso, nem a OpenAI”, disse um documento interno do Google que vazou acidentalmente em maio. A ideia geral é que, na superfície, OpenAI e Google estão alcançando um ao outro no modelo grande, mas o verdadeiro vencedor pode não vir desses dois. A razão para esse julgamento está na ecologia de código aberto cada vez mais rica.

A ecologia de código aberto está se tornando cada vez mais ativa, e até Llama2, que representa a capacidade do modelo, e LORA, a tecnologia representativa do paradigma Finetune (ajuste fino do modelo), surgiram. Tudo isso tornou os fabricantes gigantes que estão se esforçando para "lutar por milagres" sentem um calafrio claro.

Fatores como compartilhamento de tecnologia de código aberto e transferência de talentos também estão tornando a caixa preta do grande modelo mais "vitrificada". O resultado inevitável da falta de barreiras é que o Konw How, que é investido por grandes empresas com enormes quantias de tempo, é facilmente derrubado pela comunidade de código aberto.

A maioria dos principais fabricantes nacionais responde a isso "agarrando com as duas mãos". A mão esquerda "fecha a porta para construir um carro", aprimora continuamente a forma e os recursos do produto na forma de testes internos em pequena escala, e a mão direita "brainstorms" constrói uma comunidade de código aberto dentro da ecologia baseada na nuvem ecologia do desenvolvedor, mas isso requer apenas a própria camada de poder de computação do fabricante e a camada de modelo Layout de pilha completa para a camada de aplicativo. Alibaba Cloud lançou a comunidade de código aberto em larga escala GPT, e Huawei Cloud, Baidu Cloud e Tencent Cloud também fizeram planos.

De um modo geral, seja indústria ou GM, C ou B, o teste semestral do modelo grande nos dá a sensação direta de que é difícil de implementar e a expectativa de lucro está constantemente retrocedendo; o risco está ficando mais forte, e é difícil dizer a barreira técnica. Então, onde está o caminho para quebrar a situação atual?

Por enquanto, existem duas direções interessantes. Um é o banco de dados vetorial conhecido como "Memory in the AI era" e o outro é o hardware inteligente dotado de inteligência de modelo.

O chamado vetor refere-se a dados multidimensionais que podem representar qualquer coisa, incluindo texto, imagens, vídeos e sons que são mais importantes no treinamento LLM hoje. Essas formas de conteúdo são claramente representadas no banco de dados e suportam a recuperação semântica, ou seja, recuperação por similaridade, por exemplo, homem vs menino. Em outras palavras, para modelos grandes, a recuperação de vetores é o SEO de modelos grandes.

Conforme mencionado acima, o conhecimento do domínio pode melhorar a construção e o uso de modelos da indústria por meio de recursos de banco de dados vetoriais, ou ajustes finos ou plug-ins.Para grandes fabricantes, é naturalmente o foco da próxima etapa. Desde maio, o capital tem sido despejado em trilhas relacionadas a dados vetoriais.Como um produto de camada de aplicativo com uma perspectiva mais certa, os dados vetoriais também receberam muita atenção de muitos VCs.

Quanto ao modelo integrado de hardware inteligente, é um salto nas capacidades em comparação com os assistentes inteligentes anteriores, como "siri" e "Xiaoai", e também é uma extensão de dispositivos inteligentes reais (telefones celulares, computadores). Na comunidade de código aberto, houve tentativas de construir modelos de grandes parâmetros em MACs, enquanto os grandes fabricantes acumularam uma certa quantidade de capacidade de produção de hardware na era da Internet móvel anterior e, relativamente falando, sua vantagem pioneira é mais óbvia .

Sem o estilo de escrita de primavera e outono no estilo PR, os modelos em grande escala que se tornaram os principais requisitos não são mais misteriosos e as histórias estão se tornando cada vez menos. Os jogadores de pista que começaram a "mergulhar fundo" ainda são trabalhando duro. A indústria precisa do próximo momento "ChatGPT" antes de vermos mergulhadores emergindo e confrontando-os de frente.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

1 Curtidas