modelo, legal

Fonte da imagem: Gerada por Unbounded AI

Depois de mais de 200 dias de empreendedorismo em larga escala, a mentalidade dos exploradores chineses mudou do entusiasmo ideal para a realidade.

Antes disso, além da própria empresa, o empreendedorismo do modelo de IA era dotado de mais significados como o sentimento nacional e a tendência dos tempos. Diante do surgimento do modelo de propósito geral ChatGPT, os empresários chineses rapidamente chegaram a um consenso sobre como construir uma versão chinesa do OpenAI e do ChatGPT.

Não há dúvida de que o ChatGPT é o melhor jogador do mundo este ano. Por conta disso, o tráfego do site da OpenAI ultrapassou 1,8 bilhão em abril, ficando entre os 20 primeiros no ranking de tráfego global. No entanto, de acordo com os dados divulgados pela empresa de análise web Similarweb, após seis meses de rápido crescimento, as visitas do ChatGPT registaram pela primeira vez um crescimento negativo, tendo as visitas em junho diminuído 9,7% face ao mês anterior.

A queda repentina no tráfego do ChatGPT gerou preocupações e discussões na comunidade global de tecnologia sobre o risco de uma bolha na indústria de IA. A revista The Economist chegou à conclusão de que "o caminho para uma IA maior e melhor não é mais viável". A ideia de se tornar uma "versão chinesa do ChatGPT" também está se afastando do círculo empresarial chinês.

Zhu Xiaohu, sócio fundador da GSR, escreveu em Moments: "Não seja supersticioso com o modelo geral, porque no próximo ano o GPT-3.5 se tornará commodity (infraestrutura geral) e, três anos depois, o GPT-4 também será. Para a maioria dos empreendedores, a cena é a prioridade e os dados são rei!"

Ao mesmo tempo em que a mentalidade dos praticantes mudou, o mercado empresarial de grande escala começou a se dividir.

As empresas de modelos de grande escala da China não estão mais obcecadas com o objetivo idealizado de "tornar-se a OpenAI da China", nem com a busca de modelos paramétricos e poder de computação. Elas têm respostas mais pragmáticas e prestam mais atenção à resolução de problemas em cenários industriais reais.

A competição de grandes modelos de IA deu início a um novo nó de trilha.

Pragmatismo Coletivo

No início deste ano, Liang Jianzhang, fundador e presidente do conselho de administração da Ctrip, começou a entrar em contato com o ChatGPT. Nos últimos anos, ele tem atuado nos círculos acadêmicos e empresariais como demógrafo, mas também foi o primeiro e mais jovem programador da China e quase se tornou um Ph.D. em inteligência artificial.

Aos 13 anos, Liang Jianzhang projetou um programa para escrever poemas métricos e ganhou um prêmio nacional. Aos 15 anos, ele foi admitido na classe júnior da Universidade de Fudan. Após a formatura, ele foi para os Estados Unidos para estudar e obteve um mestrado em ciência da computação pelo Georgia Institute of Technology aos 21 anos. Aos 22 anos, Liang Jianzhang, que estava estudando para um Ph.D., de repente percebeu as limitações do conhecimento teórico e optou por desistir de seu Ph.D. para ingressar na Oracle nos Estados Unidos.

O surgimento do ChatGPT deixou Liang Jianzhang feliz por não ter continuado a estudar para um doutorado em inteligência artificial, porque "Todos esses algoritmos de processamento de linguagem natural foram completamente derrotados por ele (ChatGPT)". Ele lembrou que quando entrou em contato com o ChatGPT pela primeira vez, ficou "muito, muito chocado" e o segundo sentimento foi de humildade: "O algoritmo mais inteligente que finalmente fizemos estava tão próximo da estrutura biológica do cérebro humano".

Liang Jianzhang começou a pensar na combinação de modelo grande de IA e negócios Ctrip.

Na visão de Liang Jianzhang, sob o pano de fundo da sociedade inteligente, o turismo, como uma "indústria de demanda espiritual difícil de automatizar", sua demanda aumentará com a melhoria da riqueza social geral e sua proporção na economia também se expandirá. Ele fixou os olhos no modelo vertical da indústria do turismo.

Nos últimos seis meses, membros de vários negócios da Ctrip formaram a equipe técnica de modelos em grande escala da Ctrip. No estágio inicial do desenvolvimento do modelo grande, a Ctrip ajustou sua estrutura organizacional de acordo com os requisitos estratégicos do modelo grande e formou diferentes departamentos, incluindo equipe técnica geral, equipe de estratégia de conteúdo, equipe de lista, etc., e adaptou a equipe técnica de acordo com a atualização contínua e iteração de produtos de modelo grande.

Liang Jianzhang disse que a Ctrip não poupará esforços para investir no modelo grande: "Devemos investir com muita firmeza no longo prazo se for valioso para nossos clientes ou comerciantes. Este (modelo grande) é muito novo e a equipe técnica está constantemente otimizando o valor do investimento, mas não temos limite."

Em meados de julho, a Ctrip lançou oficialmente um grande modelo vertical da indústria do turismo. A Asked examinou 20 bilhões de dados de turismo não estruturados, combinados com os dados estruturados em tempo real existentes da Ctrip, e os robôs e algoritmos de pesquisa treinados historicamente da Ctrip, e realizou treinamento de modelo vertical autodesenvolvido. "Ao mesmo tempo, investimos muita mão de obra na geração e verificação do conteúdo geral da resposta de viagem." Liang Jianzhang enfatizou.

Antes do lançamento da pergunta, Ctrip realizou um teste interno, e a equipe de atendimento ao cliente Wang Yun obviamente sentiu que seu trabalho havia passado por grandes mudanças. No passado, ela precisava atender mais de 150 ligações por dia para responder às perguntas dos clientes sobre cancelamentos de pedidos pós-venda e extravio de bagagem; agora, Wang Yun se transformou em recomendação de atendimento ao cliente antes da viagem e entra na sala de transmissão ao vivo nos bastidores para fornecer aos internautas serviços e sugestões que precisam ser preparados antes da viagem.

Na visão de Liang Jianzhang, com base em um modelo de grande escala de uso geral, resolver o problema de precisão na indústria do turismo ainda é a chave: "As viagens são uma indústria de alto consumo. Mesmo que o planejamento economize meia hora, pode haver 5% de chance de que o hotel recomendado ou o resultado do itinerário esteja errado".

Embora não seja tão bom quanto o modelo grande geral em termos de parâmetros, nem tenha os requisitos rígidos de poder de computação e outras condições do modelo grande geral, mas o modelo grande vertical apresenta requisitos mais altos para dados e cenários.

O maior desafio no treinamento do modelo em grande escala do Ask é que, na cena real, no processo de obtenção de informações de viagem pelos usuários, várias rodadas de coleta e limpeza interativa de dados, o volume de dados e a precisão dos dados precisam ser constantemente corrigidos, especialmente a indústria do turismo passou por mudanças tremendas e as informações do destino três anos atrás podem estar completamente desatualizadas, especialmente o impacto da epidemia na indústria global do turismo exacerbou a pontualidade dos dados.

Assim como a Ctrip, cada vez mais empresas colocam a trilha de grandes modelos no campo vertical.

A folha de respostas do modelo em grande escala da Yanxi entregue pela JD.com também considera o modelo industrial em grande escala como uma característica importante. De acordo com Xu Ran, o novo CEO do Jingdong Group, o desenvolvimento da tecnologia de inteligência artificial no passado esteve à beira da explosão de aplicativos várias vezes, mas muitas vezes durou pouco no final, e uma das razões importantes é que a tecnologia não formou uma aplicação sólida na indústria**.

Na coletiva de imprensa do Huawei Pangu Large Model 3.0 em 7 de julho, Zhang Pingan, CEO da Huawei Cloud, disse sem rodeios: "O Pangu Large Model não tem tempo para escrever poemas e conversar. Não importa quantos parâmetros e quão boa seja a capacidade de diálogo, se não puder resolver problemas práticos, não será de muita utilidade."

A Tencent ainda não anunciou o progresso do modelo geral em grande escala Hunyuan, mas anunciou a rota do modelo em grande escala da indústria de maneira destacada, lançando mais de 50 soluções para 10 grandes indústrias de uma só vez. Li Qiang, vice-presidente da Tencent e presidente do governo e negócios corporativos da Tencent, também disse: "Os modelos grandes gerais não são a única direção para a aplicação do modelo, e os modelos para indústrias verticais se tornarão o ponto de inflexão do valor dos modelos grandes".

Mudança de mentalidade

Um ponto óbvio na mudança de mentalidade dos grandes empreendedores começou quando Wang Huiwen foi diagnosticado com depressão e foi adquirido pela Meituan anos-luz de sua fundação. De repente, todos perceberam que até mesmo a empresa estrela que era esperada por todos e tinha grandes esperanças poderia ter que parar de funcionar por causa de vários acidentes.

Há apenas meio ano, outras saídas pareciam se dissipar da noite para o dia, e apenas o modelo grande estava na posição C. Empresários e investidores nos círculos de tecnologia da China voaram para o Vale do Silício para aprender com a OpenAI. Zhang Yiming, Ma Huateng e Wang Xing, o número 1 ou figuras centrais de tomada de decisão desses gigantes, voltaram da noite para o dia ao estado de empolgação e curiosidade quando iniciaram seus negócios, lendo artigos e trocando tecnologias tarde da noite.

Naquela época, parecia que todo explorador de maquetes chinesas em grande escala pensava em problemas com os sentimentos de família e país. Diante da rápida iteração do ChatGPT, os objetivos traçados pelos empresários chineses são como conseguir a ultrapassagem em quanto tempo.

Li Yanhong disse: "Baidu Wenxinyiyan estava no estágio de pesquisa e desenvolvimento, e a equipe técnica do Baidu realizou um teste comparativo com o ChatGPT. Naquela época, a diferença era de 40 pontos e poderia ser recuperada em um mês." Wang Xiaochuan também disse que fará o melhor modelo de linguagem grande na China até o final do ano.

Zhou Hongyi, o fundador do 360, disse em entrevista ao "Chinese Entrepreneur" que os grandes modelos não são mais a dimensão da competição comercial. Se o fechamento da Internet chinesa e o problema da ilha de dados entre os APPs causado pela Internet móvel não forem resolvidos, é provável que isso leve às limitações do treinamento do mecanismo de inteligência artificial, o que pode levar a uma nova rodada de revolução da IA entre a China e os Estados Unidos. Lacuna intergeracional.

Quanto ao motivo pelo qual nenhuma empresa como a OpenAI nasceu na China, os empresários chineses até começaram a refletir naquela época. No passado, a exploração doméstica de inteligência artificial era muito pragmática e tudo era orientado a KPI, de modo que todos não tinham determinação e paciência para investir nisso, então eles perderam um nó tão importante.

Com paixão, depois que Baidu Wenxin deu o primeiro tiro, mais de 80 modelos grandes de IA surgiram em meio ano e mais de 30 modelos grandes apareceram na Conferência Mundial de Inteligência Artificial de 2023, realizada apenas em Xangai. Não é exagero descrever a popularidade de modelos grandes como "guerra de cem modelos".

Mas nós realmente precisamos de tantos modelos grandes? Que tipo de grande modelo precisamos?

Na verdade, Robin Li propôs desde o início: "Não faz muito sentido para as startups recriar o ChatGPT. Acho que há uma grande oportunidade de desenvolver aplicativos com base nesse grande modelo de linguagem. Não há necessidade de reinventar a roda. Depois que a roda estiver disponível, o valor de fabricar carros e aviões pode ser maior do que o da roda".

He Xiaodong, vice-presidente de tecnologia do JD Group, também percebeu desde o início: "Se o grande modelo deve ser valioso, deve ser colocado na indústria, e é melhor estar em um campo com alto valor industrial. Só assim ele pode se tornar verdadeiramente sustentável a longo prazo, caso contrário, pode se tornar uma coisa de curta duração."

NOVA VARIÁVEL

Justamente quando os empreendedores domésticos lutavam para explorar o modelo de IA, a grande jogada de Zuckerberg trouxe novas variáveis para esse campo em constante mudança.

Na madrugada de 19 de julho, horário de Pequim, a Meta lançou o grande modelo de código aberto Llama 2, que mais uma vez detonou o círculo da IA: o Llama 2 não apenas tem o mesmo desempenho do GPT-3, mas também é gratuito, de código aberto e disponível comercialmente. Llama 2 é a continuação do modelo Llama lançado pela Meta no início de março.

Na subsequente conferência de parceiros Microsoft Inspire, o CEO da Microsoft, Satya Nadella, anunciou a notícia da cooperação entre a Meta e a Microsoft, que permite que o Llama 2 seja executado no serviço de nuvem da Microsoft, o Microsoft Azure. Ao mesmo tempo, a nuvem Amazon AWS também se juntou à cooperação com a Meta.

A importância do Llama 2 para os empreendedores de modelos de grande escala é que, assim como o sistema Android é para o desenvolvimento de APP, os desenvolvedores não precisam reinventar a roda e obter diretamente a infraestrutura de modelos de grande escala com o menor custo, para que possam se concentrar mais em seus próprios cenários industriais.

Até certo ponto, isso também significa que, para a maioria dos empreendedores, optar por focar em aplicações verticais da indústria provou ser um caminho mais prático.

No entanto, diferente dos grandes modelos gerais, Os grandes modelos industriais também apresentam diferentes limites e requisitos para os participantes da indústria: Por um lado, os grandes modelos industriais exigem que os desenvolvedores tenham certa acumulação e força técnica; por outro lado, os grandes modelos industriais também exigem que os operadores tenham ricos cenários de prática de aplicação industrial.

Liang Jianzhang disse ao "Chinese Entrepreneur": "O indicador mais importante de um grande modelo geral pode ser quantos parâmetros ou quantas GPUs são usadas, etc., mas o grande modelo vertical e o grande modelo de linguagem são apenas uma parte dele. Ele também tem uma combinação com outros dados, incluindo verificação manual, etc.

"O maior problema no turismo é a confiabilidade. Isso é realmente mais complicado do que escrever poemas, artigos e romances com IA. Também é um trabalho de longo prazo. Qualquer coisa que possa melhorar isso para 80%, 90%, 95% ou até 99% vale a pena fazer." Liang Jianzhang finalmente disse.

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)