A guerra de modelos domésticos em grande escala já foi envolta em muitas dúvidas. Com JD.com e Tencent ocupando seus lugares um após o outro, esse jogo complicado está ficando mais claro.
Baidu e Ali, como o primeiro lote de players de modelos em grande escala na China, ganharam o tráfego inicial enquanto "obtinham a vantagem". Por outro lado, embora a Tencent e a JD.com tenham começado um pouco mais tarde, eles são mais capazes de examinar a trilha do modelo em grande escala em profundidade para aprofundar sua compreensão da indústria.
Por causa disso, alguns grandes fabricantes que lançaram modelos em grande escala relativamente tarde não seguiram cegamente o público e investiram na maré de modelos em grande escala de uso geral. Por exemplo, o grande modelo da Huawei mencionou praticidade antes, e JD.com escolheu um caminho mais perspicaz e mais direcionado em virtude de sua profunda acumulação na indústria e na cadeia de suprimentos. Ao mesmo tempo que o JD Cloud Summit (JDD Conference), um modelo JD Yanxi orientado para a indústria foi lançado.
Na era atual de modelos de grande escala de uso geral, o modelo de grande escala Yanxi e seu caminho de criação de valor industrial lançado pela JD.com não são apenas uma excelente tentativa de estabelecer uma ordem comercial de modelo em grande escala, mas também trazem uma novo pensamento e direção para toda a indústria. Nas águas estagnadas da comercialização de grandes modelos, os grandes modelos industriais que estão mais próximos do desembarque provavelmente liderarão o caminho na futura competição por grandes modelos e se tornarão uma nova força que não pode ser ignorada.
Modelo grande, nem "história" nem "brinquedo"
Cada onda de sucessão tecnológica geralmente carrega muitos sedimentos.
De chips, robôs a IA nos primeiros anos, em todas as ondas, sempre há alguns jogadores com segundas intenções misturadas, misturando tecnologia e marketing, tornando a pista originalmente clara ainda mais turva. O mesmo é verdade para as pistas de maquetes domésticas em grande escala nesta fase.
De um lado da pista, os jogadores lutam para descobrir o contexto técnico do grande modelo, e tentam encontrar a direção do pouso; do outro lado, até mesmo empresas que nada têm a ver com a área de tecnologia estão saindo de campo um após o outro, treinando os chamados produtos "big model" - devo admitir que a situação atual de "tudo pode ser um grande modelo" tem o significado de "tudo pode ser um metaverso" há dois anos.
Obviamente, quando o chamado "grande modelo" se torna sinônimo, servindo ao seu próprio apelo de "narrativa" em vez de criar valor real, há uma grande probabilidade de que ele só possa ir para o destino do metaverso. E isso também é verdade para os jogadores que estudam tecnologia honestamente. Afinal, é difícil para a própria tecnologia criar valor diretamente - o objetivo do grande modelo não é treinar o grande modelo geral em si, mas deixar a tecnologia gerar valor e, então, realizar uma comercialização madura.
Portanto, as operações aparentemente engraçadas dos fãs em perseguição realmente soaram como um alerta para a grande pista do modelo. Afinal, o ChatGPT que iniciou o AIGC afetou sutilmente a visão dos jogadores do modelo grande, fazendo com que muitos jogadores corressem para o modelo grande geral e lançassem uma variedade de "variantes" do ChatGPT.
Objetivamente falando, o grande modelo de uso geral tem seu valor, mas no momento em que a dimensão da competição está se tornando cada vez mais acirrada, o modelo de grande escala de uso geral não é suave:
Por um lado, os jogadores se aglomeram em um único campo um após o outro e é muito provável que caiam na situação de "fabricação repetitiva de rodas". É concebível que seja difícil sair do campo de batalha cheio de jogadores nacionais e estrangeiros gigantes da tecnologia.
Por outro lado, um modelo grande de uso geral é um produto típico da separação de consumo e pagamento e se tornará um "brinquedo" se você não tomar cuidado.
Para dar um exemplo simples, uma ampla gama de usuários C-end pode fazer perguntas ou até mesmo discutir o universo e o céu, mas a grande maioria dos usuários comuns não tem demandas de produtividade. Após uma experiência intensiva de curto prazo, eles sinta rapidamente o frescor das tecnologias emergentes. Perdido, pode não ter o poder de usar por muito tempo.
Com base nisso, mesmo que o atual modelo de larga escala de uso geral possa melhorar a eficiência da criação de conteúdo até certo ponto, exceto pela redução de custos e aumento da eficiência em algumas indústrias e organizações de conteúdo, ele ainda não desenvolveu um modelo maduro e modelo de negócio replicável. É previsível que, à medida que a pista geral de modelos em grande escala se torne cada vez mais lotada, os jogadores enfrentarão muitos desafios em termos de extensão comercial.
Em última análise, agora que a "singularidade" chegou, os grandes modelos não são apenas um marco na sucessão da tecnologia, mas também uma força motriz fundamental para moldar o futuro. De acordo com essa lógica, a guerra de modelos em grande escala neste estágio não é de forma alguma uma corrida de curta distância, mas um projeto sistemático. Se os jogadores quiserem passar pelo ciclo e chegar ao fim, eles não podem confiar apenas em um único ponto de avanço no nível técnico, mas precisam pensar simultaneamente em muitas dimensões, como direção técnica, aplicação de cena e modelo de negócios. .
Modelos industriais em grande escala, uma nova frente na "Guerra dos Cem Modelos"
Desde 1997, quando "Deep Blue" derrotou o mestre de xadrez Garry Kasparov, para "AlphaGo" entrou no círculo Go e, em seguida, para o sistema visual AI e direção automática, AI experimentou muitas rodadas de evolução emocionante no passado. A roda parece estar à beira da explosão do aplicativo, mas os botões de flores que estão cheios de galhos não conseguem florescer há muito tempo.
A principal razão por trás disso é que a tecnologia ainda não formou uma aplicação profunda na indústria, afinal, o fim do progresso tecnológico não está preso no laboratório, mas sim em um mergulho no "mundo real".
Seguindo essa lógica, olhando para as trilhas de modelo de larga escala de uso geral de hoje, ainda há um longo caminho a percorrer antes de se enraizar em cenários de negócios reais e criar valor real.
Xu Ran, CEO do Jingdong Group, disse na conferência JDD que o modelo grande em si é uma ferramenta para obter valor industrial, não um fim. O valor real dos modelos grandes deve ser percebido em aplicações industriais.
Em outras palavras, o grande modelo não é o objetivo, mas a aplicação é o objetivo.
Os atuais fabricantes de modelos grandes geralmente consideram os parâmetros do modelo como o padrão de teste para a qualidade de modelos grandes. Como todos sabem, ao nível da implementação comercial, parâmetros enormes também correspondem a custos elevados, existindo também problemas como tempo de correspondência longo e concorrência fraca.
Um exemplo simples, alguns "monstros de parâmetros" custam dois ou três centavos para responder a uma pergunta e precisam esperar de 5 a 10 segundos. Por mais precisa que seja a resposta, é difícil conseguir uma comercialização em larga escala. Além disso, o atual modelo grande de propósito geral tem uma taxa de precisão de cerca de 85%, o que pode ser suficiente para usuários comuns, mas em cenários de negócios sérios, esse erro provavelmente terá um impacto que não pode ser ignorado nos negócios.
Em relação ao problema do aplicativo, os líderes técnicos de várias linhas de negócios do JD.com mencionaram que as pessoas ririam de uma resposta fabricada da GPT, mas uma vez implementada no processo real do aplicativo, qualquer desvio resultará em enormes perdas.
Dr. He Xiaodong, Reitor do JD Exploration Research Institute e Presidente do Departamento de Produtos e Serviços Inteligentes da JD Technology, uma vez experimentou algo pessoalmente, o que é bastante representativo. "Um modelo grande responde à raiz quadrada de 143, e a resposta dada é 11,5 (na verdade, aproximadamente igual a 11,96). Se for usado em um cenário de aplicação real, essa resposta trará grandes perdas."
No campo técnico, os parâmetros e a precisão do modelo são importantes, mas no mundo dos negócios, a chave é que o modelo grande em si é fácil de usar e estável. A esse respeito, o modelo industrial intimamente relacionado com as indústrias subdivididas, sem dúvida, tem vantagens naturais.
No entanto, não é fácil desenvolver um modelo industrial em larga escala. Como todos sabemos, os dados de treinamento são a base do aprendizado de modelos grandes e também determinam a capacidade de generalização e os cenários de aplicação de modelos grandes. Portanto, além de avanços em nível técnico, cenários de primeira mão e dados da indústria são igualmente importantes para o desenvolvimento de grandes modelos industriais.
Tomando como exemplo a JD.com, a razão pela qual lançou um modelo em grande escala para a indústria deve-se, em grande parte, aos seus fortes genes industriais. Afinal, entre os grandes fabricantes nacionais, o JD.com, que liga o mercado consumidor e as duas pontas da cadeia de suprimentos, tem forte ligação com o mesmo setor e possui grande quantidade de dados de alta qualidade.
É relatado que, quando o grande modelo Yanxi é treinado, 70% dos dados gerais e 30% dos dados originais da cadeia de suprimentos de inteligência digital são integrados. Percebe-se que o JD.com não enfatiza apenas os parâmetros, nem conta "história" deliberadamente, mas se concentra no nível do "tuning", visando criar um grande modelo altamente integrado à indústria.
O modelo industrial em grande escala pode se tornar um passo importante para a comercialização em larga escala da pista de modelo em grande escala, e os jogadores que gradualmente entendem a lógica estão gradualmente entrando no carro.
Recentemente, a Tencent, que está se segurando há muito tempo, lançou seu próprio modelo de indústria em grande escala; Baidu, que mantém a bandeira de modelos de grande escala de uso geral, também lançou modelos de indústria em grande escala que cobrem o transporte , energia e outros campos. Não é difícil perceber que, à medida que as gigantes aumentaram de tamanho, os modelos industriais de grande porte e mais próximos da comercialização se tornaram uma nova frente na "Guerra dos Cem Modelos".
Encontre-se em uma estrada estreita, quem conseguir a "cena" ganha
Seja um modelo de uso geral ou um modelo industrial, a construção de uma nova ordem de negócios não pode evitar "cenas".
Em outras palavras, para implementação, termos técnicos obscuros e PPTs comerciais deslumbrantes são castelos no ar. Somente aplicando verdadeiramente a capacidade de grandes modelos à cena e gerando valor real, um círculo virtuoso pode ser aberto.
No momento em que a demanda por AIGC em todas as esferas da vida está explodindo, não é difícil encontrar os chamados cenários de aplicação para grandes modelos. Mas se você quiser encontrar uma cena adequada para o pouso em grande escala de modelos grandes e percorrer o caminho da comercialização, pode ter que passar por muitos desvios.
Seguindo essa lógica, os jogadores que já apresentaram o grande modelo estão constantemente tentando em várias subdivisões, tentando encontrar seu próprio ponto de apoio:
A Baidu aproveitou os pontos quentes do exame anual de admissão à faculdade e lançou assistentes voluntários de IA. Ao fazer pleno uso dos recursos de modelos grandes, também tentou usar isso para entrar no mercado C-end; Ali usou o Tmall Genie como uma âncora para explorar a aplicação de grandes modelos na área de eletrônicos de consumo Capacidade de expansão.
JD.com, que desenvolve grandes modelos industriais, apresenta a fórmula de "valor de grandes modelos = algoritmo × poder de computação × dados × quadrado de espessura industrial", e a chamada "espessura industrial" é apenas empilhada por cenas específicas .
Independentemente do caminho, os jogadores de modelos em grande escala são obrigados a continuar tentando e cometendo erros antes de chegar à "Terra Prometida" e até cruzar o "Mar Vermelho".
Diante da dificuldade de conseguir modelos grandes, alguns jogadores optam por fazer o papel de "vendedores de água" para ajudar as empresas a construir seus próprios modelos grandes. No entanto, o JD.com, que sempre foi pragmático em seu estilo de jogo, propôs uma estratégia de "três etapas", ou seja, primeiro construa um grande modelo de uso geral, depois explore cenários e aplicativos internamente e depois abra gradualmente Aumente suas capacidades para o mundo exterior - ao mesmo tempo em que se usa como um campo de teste, também é autodesenvolvido. Digerir o custo de tentativa e erro para garantir que produtos de modelo em grande escala possam criar valor real.
É relatado que no JD.com, o modelo grande não foi apenas incorporado em cenários de aplicativos comuns, como marketing digital, otimização de processos operacionais e atendimento ao cliente, mas também foi estendido a muitos cenários verticais, como varejo, logística, finanças , e saúde.
Tomando como exemplo o campo da logística, diante dessa complicada engenharia de sistemas, a JD.com explorou vários caminhos de exploração: o produto da cadeia de suprimentos Jinghui, que vem sendo construído há 5 anos, além de algoritmos nativos ricos, como previsão de IA e otimização da operação, por meio da tecnologia ecológica aberta, pode não apenas se comunicar bem com os algoritmos e dados de sistemas heterogêneos, mas também ser mais expressivo em termos de previsão de vendas, estoque, abastecimento e planejamento de reabastecimento com o suporte de grandes modelos. , devido à ampla aplicação do AIGC , sua torre interativa de controle da cadeia de suprimentos pode ajudar os usuários a localizar e resolver rapidamente os problemas da cadeia de suprimentos.
No cenário de gestão de fundos, foi lançado o produto “smart base selection” da JD Finance. A triagem tradicional de fundos é cara de entender e complicada de operar, o que afeta diretamente a taxa de sucesso das transações. Com a ajuda de grandes modelos, o JD.com otimizou os links de correspondência de intenção, geração de algoritmo, reconhecimento de intenção e várias rodadas de diálogo, fazendo com que a taxa de precisão de perguntas comuns de triagem chegue a 90%, melhorando efetivamente a experiência do cliente e a eficiência da transação. Este produto também atenderá plenamente as instituições financeiras no futuro.
Pode-se ver que a estratégia de "três etapas" da JD.com alcançou resultados iniciais e gradualmente penetrou na textura de setores verticais, como logística e finanças. É previsível que, à medida que a estratégia for gradualmente implementada, o JD.com também continuará a acumular cenários de pouso e dados de alta qualidade, girando assim o volante para o pouso comercial de modelos industriais de grande escala.
Na análise final, a aparentemente complicada guerra de modelos em larga escala deve retornar a uma questão central, ou seja, como a tecnologia pode trazer valor real para a indústria física. Nesta fase, os jogadores com caminhos diferentes só podem explorar e praticar gradualmente as respostas às perguntas nesta longa maratona.
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Grandes Modelos Precisam de Realizadores
Original: Wu Xianzhi Wen Yehao
Editor: Wang Pan
Fonte: Planeta Fóton
A guerra de modelos domésticos em grande escala já foi envolta em muitas dúvidas. Com JD.com e Tencent ocupando seus lugares um após o outro, esse jogo complicado está ficando mais claro.
Baidu e Ali, como o primeiro lote de players de modelos em grande escala na China, ganharam o tráfego inicial enquanto "obtinham a vantagem". Por outro lado, embora a Tencent e a JD.com tenham começado um pouco mais tarde, eles são mais capazes de examinar a trilha do modelo em grande escala em profundidade para aprofundar sua compreensão da indústria.
Por causa disso, alguns grandes fabricantes que lançaram modelos em grande escala relativamente tarde não seguiram cegamente o público e investiram na maré de modelos em grande escala de uso geral. Por exemplo, o grande modelo da Huawei mencionou praticidade antes, e JD.com escolheu um caminho mais perspicaz e mais direcionado em virtude de sua profunda acumulação na indústria e na cadeia de suprimentos. Ao mesmo tempo que o JD Cloud Summit (JDD Conference), um modelo JD Yanxi orientado para a indústria foi lançado.
Na era atual de modelos de grande escala de uso geral, o modelo de grande escala Yanxi e seu caminho de criação de valor industrial lançado pela JD.com não são apenas uma excelente tentativa de estabelecer uma ordem comercial de modelo em grande escala, mas também trazem uma novo pensamento e direção para toda a indústria. Nas águas estagnadas da comercialização de grandes modelos, os grandes modelos industriais que estão mais próximos do desembarque provavelmente liderarão o caminho na futura competição por grandes modelos e se tornarão uma nova força que não pode ser ignorada.
Modelo grande, nem "história" nem "brinquedo"
Cada onda de sucessão tecnológica geralmente carrega muitos sedimentos.
De chips, robôs a IA nos primeiros anos, em todas as ondas, sempre há alguns jogadores com segundas intenções misturadas, misturando tecnologia e marketing, tornando a pista originalmente clara ainda mais turva. O mesmo é verdade para as pistas de maquetes domésticas em grande escala nesta fase.
De um lado da pista, os jogadores lutam para descobrir o contexto técnico do grande modelo, e tentam encontrar a direção do pouso; do outro lado, até mesmo empresas que nada têm a ver com a área de tecnologia estão saindo de campo um após o outro, treinando os chamados produtos "big model" - devo admitir que a situação atual de "tudo pode ser um grande modelo" tem o significado de "tudo pode ser um metaverso" há dois anos.
Obviamente, quando o chamado "grande modelo" se torna sinônimo, servindo ao seu próprio apelo de "narrativa" em vez de criar valor real, há uma grande probabilidade de que ele só possa ir para o destino do metaverso. E isso também é verdade para os jogadores que estudam tecnologia honestamente. Afinal, é difícil para a própria tecnologia criar valor diretamente - o objetivo do grande modelo não é treinar o grande modelo geral em si, mas deixar a tecnologia gerar valor e, então, realizar uma comercialização madura.
Portanto, as operações aparentemente engraçadas dos fãs em perseguição realmente soaram como um alerta para a grande pista do modelo. Afinal, o ChatGPT que iniciou o AIGC afetou sutilmente a visão dos jogadores do modelo grande, fazendo com que muitos jogadores corressem para o modelo grande geral e lançassem uma variedade de "variantes" do ChatGPT.
Objetivamente falando, o grande modelo de uso geral tem seu valor, mas no momento em que a dimensão da competição está se tornando cada vez mais acirrada, o modelo de grande escala de uso geral não é suave:
Por um lado, os jogadores se aglomeram em um único campo um após o outro e é muito provável que caiam na situação de "fabricação repetitiva de rodas". É concebível que seja difícil sair do campo de batalha cheio de jogadores nacionais e estrangeiros gigantes da tecnologia.
Por outro lado, um modelo grande de uso geral é um produto típico da separação de consumo e pagamento e se tornará um "brinquedo" se você não tomar cuidado.
Para dar um exemplo simples, uma ampla gama de usuários C-end pode fazer perguntas ou até mesmo discutir o universo e o céu, mas a grande maioria dos usuários comuns não tem demandas de produtividade. Após uma experiência intensiva de curto prazo, eles sinta rapidamente o frescor das tecnologias emergentes. Perdido, pode não ter o poder de usar por muito tempo.
Com base nisso, mesmo que o atual modelo de larga escala de uso geral possa melhorar a eficiência da criação de conteúdo até certo ponto, exceto pela redução de custos e aumento da eficiência em algumas indústrias e organizações de conteúdo, ele ainda não desenvolveu um modelo maduro e modelo de negócio replicável. É previsível que, à medida que a pista geral de modelos em grande escala se torne cada vez mais lotada, os jogadores enfrentarão muitos desafios em termos de extensão comercial.
Em última análise, agora que a "singularidade" chegou, os grandes modelos não são apenas um marco na sucessão da tecnologia, mas também uma força motriz fundamental para moldar o futuro. De acordo com essa lógica, a guerra de modelos em grande escala neste estágio não é de forma alguma uma corrida de curta distância, mas um projeto sistemático. Se os jogadores quiserem passar pelo ciclo e chegar ao fim, eles não podem confiar apenas em um único ponto de avanço no nível técnico, mas precisam pensar simultaneamente em muitas dimensões, como direção técnica, aplicação de cena e modelo de negócios. .
Modelos industriais em grande escala, uma nova frente na "Guerra dos Cem Modelos"
Desde 1997, quando "Deep Blue" derrotou o mestre de xadrez Garry Kasparov, para "AlphaGo" entrou no círculo Go e, em seguida, para o sistema visual AI e direção automática, AI experimentou muitas rodadas de evolução emocionante no passado. A roda parece estar à beira da explosão do aplicativo, mas os botões de flores que estão cheios de galhos não conseguem florescer há muito tempo.
A principal razão por trás disso é que a tecnologia ainda não formou uma aplicação profunda na indústria, afinal, o fim do progresso tecnológico não está preso no laboratório, mas sim em um mergulho no "mundo real".
Seguindo essa lógica, olhando para as trilhas de modelo de larga escala de uso geral de hoje, ainda há um longo caminho a percorrer antes de se enraizar em cenários de negócios reais e criar valor real.
Xu Ran, CEO do Jingdong Group, disse na conferência JDD que o modelo grande em si é uma ferramenta para obter valor industrial, não um fim. O valor real dos modelos grandes deve ser percebido em aplicações industriais.
Em outras palavras, o grande modelo não é o objetivo, mas a aplicação é o objetivo.
Os atuais fabricantes de modelos grandes geralmente consideram os parâmetros do modelo como o padrão de teste para a qualidade de modelos grandes. Como todos sabem, ao nível da implementação comercial, parâmetros enormes também correspondem a custos elevados, existindo também problemas como tempo de correspondência longo e concorrência fraca.
Um exemplo simples, alguns "monstros de parâmetros" custam dois ou três centavos para responder a uma pergunta e precisam esperar de 5 a 10 segundos. Por mais precisa que seja a resposta, é difícil conseguir uma comercialização em larga escala. Além disso, o atual modelo grande de propósito geral tem uma taxa de precisão de cerca de 85%, o que pode ser suficiente para usuários comuns, mas em cenários de negócios sérios, esse erro provavelmente terá um impacto que não pode ser ignorado nos negócios.
Em relação ao problema do aplicativo, os líderes técnicos de várias linhas de negócios do JD.com mencionaram que as pessoas ririam de uma resposta fabricada da GPT, mas uma vez implementada no processo real do aplicativo, qualquer desvio resultará em enormes perdas.
Dr. He Xiaodong, Reitor do JD Exploration Research Institute e Presidente do Departamento de Produtos e Serviços Inteligentes da JD Technology, uma vez experimentou algo pessoalmente, o que é bastante representativo. "Um modelo grande responde à raiz quadrada de 143, e a resposta dada é 11,5 (na verdade, aproximadamente igual a 11,96). Se for usado em um cenário de aplicação real, essa resposta trará grandes perdas."
No campo técnico, os parâmetros e a precisão do modelo são importantes, mas no mundo dos negócios, a chave é que o modelo grande em si é fácil de usar e estável. A esse respeito, o modelo industrial intimamente relacionado com as indústrias subdivididas, sem dúvida, tem vantagens naturais.
No entanto, não é fácil desenvolver um modelo industrial em larga escala. Como todos sabemos, os dados de treinamento são a base do aprendizado de modelos grandes e também determinam a capacidade de generalização e os cenários de aplicação de modelos grandes. Portanto, além de avanços em nível técnico, cenários de primeira mão e dados da indústria são igualmente importantes para o desenvolvimento de grandes modelos industriais.
Tomando como exemplo a JD.com, a razão pela qual lançou um modelo em grande escala para a indústria deve-se, em grande parte, aos seus fortes genes industriais. Afinal, entre os grandes fabricantes nacionais, o JD.com, que liga o mercado consumidor e as duas pontas da cadeia de suprimentos, tem forte ligação com o mesmo setor e possui grande quantidade de dados de alta qualidade.
É relatado que, quando o grande modelo Yanxi é treinado, 70% dos dados gerais e 30% dos dados originais da cadeia de suprimentos de inteligência digital são integrados. Percebe-se que o JD.com não enfatiza apenas os parâmetros, nem conta "história" deliberadamente, mas se concentra no nível do "tuning", visando criar um grande modelo altamente integrado à indústria.
O modelo industrial em grande escala pode se tornar um passo importante para a comercialização em larga escala da pista de modelo em grande escala, e os jogadores que gradualmente entendem a lógica estão gradualmente entrando no carro.
Recentemente, a Tencent, que está se segurando há muito tempo, lançou seu próprio modelo de indústria em grande escala; Baidu, que mantém a bandeira de modelos de grande escala de uso geral, também lançou modelos de indústria em grande escala que cobrem o transporte , energia e outros campos. Não é difícil perceber que, à medida que as gigantes aumentaram de tamanho, os modelos industriais de grande porte e mais próximos da comercialização se tornaram uma nova frente na "Guerra dos Cem Modelos".
Encontre-se em uma estrada estreita, quem conseguir a "cena" ganha
Seja um modelo de uso geral ou um modelo industrial, a construção de uma nova ordem de negócios não pode evitar "cenas".
Em outras palavras, para implementação, termos técnicos obscuros e PPTs comerciais deslumbrantes são castelos no ar. Somente aplicando verdadeiramente a capacidade de grandes modelos à cena e gerando valor real, um círculo virtuoso pode ser aberto.
No momento em que a demanda por AIGC em todas as esferas da vida está explodindo, não é difícil encontrar os chamados cenários de aplicação para grandes modelos. Mas se você quiser encontrar uma cena adequada para o pouso em grande escala de modelos grandes e percorrer o caminho da comercialização, pode ter que passar por muitos desvios.
Seguindo essa lógica, os jogadores que já apresentaram o grande modelo estão constantemente tentando em várias subdivisões, tentando encontrar seu próprio ponto de apoio:
A Baidu aproveitou os pontos quentes do exame anual de admissão à faculdade e lançou assistentes voluntários de IA. Ao fazer pleno uso dos recursos de modelos grandes, também tentou usar isso para entrar no mercado C-end; Ali usou o Tmall Genie como uma âncora para explorar a aplicação de grandes modelos na área de eletrônicos de consumo Capacidade de expansão.
JD.com, que desenvolve grandes modelos industriais, apresenta a fórmula de "valor de grandes modelos = algoritmo × poder de computação × dados × quadrado de espessura industrial", e a chamada "espessura industrial" é apenas empilhada por cenas específicas .
Independentemente do caminho, os jogadores de modelos em grande escala são obrigados a continuar tentando e cometendo erros antes de chegar à "Terra Prometida" e até cruzar o "Mar Vermelho".
Diante da dificuldade de conseguir modelos grandes, alguns jogadores optam por fazer o papel de "vendedores de água" para ajudar as empresas a construir seus próprios modelos grandes. No entanto, o JD.com, que sempre foi pragmático em seu estilo de jogo, propôs uma estratégia de "três etapas", ou seja, primeiro construa um grande modelo de uso geral, depois explore cenários e aplicativos internamente e depois abra gradualmente Aumente suas capacidades para o mundo exterior - ao mesmo tempo em que se usa como um campo de teste, também é autodesenvolvido. Digerir o custo de tentativa e erro para garantir que produtos de modelo em grande escala possam criar valor real.
É relatado que no JD.com, o modelo grande não foi apenas incorporado em cenários de aplicativos comuns, como marketing digital, otimização de processos operacionais e atendimento ao cliente, mas também foi estendido a muitos cenários verticais, como varejo, logística, finanças , e saúde.
Tomando como exemplo o campo da logística, diante dessa complicada engenharia de sistemas, a JD.com explorou vários caminhos de exploração: o produto da cadeia de suprimentos Jinghui, que vem sendo construído há 5 anos, além de algoritmos nativos ricos, como previsão de IA e otimização da operação, por meio da tecnologia ecológica aberta, pode não apenas se comunicar bem com os algoritmos e dados de sistemas heterogêneos, mas também ser mais expressivo em termos de previsão de vendas, estoque, abastecimento e planejamento de reabastecimento com o suporte de grandes modelos. , devido à ampla aplicação do AIGC , sua torre interativa de controle da cadeia de suprimentos pode ajudar os usuários a localizar e resolver rapidamente os problemas da cadeia de suprimentos.
No cenário de gestão de fundos, foi lançado o produto “smart base selection” da JD Finance. A triagem tradicional de fundos é cara de entender e complicada de operar, o que afeta diretamente a taxa de sucesso das transações. Com a ajuda de grandes modelos, o JD.com otimizou os links de correspondência de intenção, geração de algoritmo, reconhecimento de intenção e várias rodadas de diálogo, fazendo com que a taxa de precisão de perguntas comuns de triagem chegue a 90%, melhorando efetivamente a experiência do cliente e a eficiência da transação. Este produto também atenderá plenamente as instituições financeiras no futuro.
Pode-se ver que a estratégia de "três etapas" da JD.com alcançou resultados iniciais e gradualmente penetrou na textura de setores verticais, como logística e finanças. É previsível que, à medida que a estratégia for gradualmente implementada, o JD.com também continuará a acumular cenários de pouso e dados de alta qualidade, girando assim o volante para o pouso comercial de modelos industriais de grande escala.
Na análise final, a aparentemente complicada guerra de modelos em larga escala deve retornar a uma questão central, ou seja, como a tecnologia pode trazer valor real para a indústria física. Nesta fase, os jogadores com caminhos diferentes só podem explorar e praticar gradualmente as respostas às perguntas nesta longa maratona.