Os modelos em grande escala estão em alta há meio ano e existem apenas alguns investidores que pagaram com dinheiro real

Autor|Liu Yangnan

Fonte|Jiazi Light Year

No 136º dia depois de gritar "para ser uma versão chinesa do OpenAI", Wang Huiwen vendeu Light Years Away para Meituan.

Em 29 de junho de 2023, a Meituan anunciou na Bolsa de Valores de Hong Kong que adquirirá 100% do capital da "Light Years Beyond" em 29 de junho de 2023. O preço total da compra inclui: US$ 233,673 milhões em dinheiro + compromisso de Dívida de US$ 366,924 milhões em Renminbi + 1 yuan, totalizando cerca de 2,065 bilhões de yuans.

É difícil imaginar que a primeira start-up de modelos em grande escala fundada por um chefão na China terminará dessa forma, o que deixou inúmeras dúvidas e especulações no mercado.

Do ponto de vista geral dos negócios, a aquisição da Meituan a anos-luz de distância é apenas uma aquisição comum entre as empresas. Mas para a indústria doméstica de IA, essa aquisição parece indicar que a onda de empreendedorismo em larga escala da IA, que está quente há apenas meio ano, está esfriando.

O mercado de capitais tem uma percepção mais intuitiva da temperatura da água do setor. Desde 26 de junho, as ações de conceito de IA, como HKUST Xunfei, Kunlun Wanwei e 360, despencaram coletivamente.

Não apenas na China, as pessoas nem mesmo buscam mais o ChatGPT, que antes era frequentado.

De acordo com os dados da ferramenta de análise de dados do site SimilarWeb, a taxa de crescimento das visitas do ChatGPT na fase inicial foi surpreendente, com uma taxa de crescimento mensal de 131,6% em janeiro, 62,5% em fevereiro e 55,8% em março. desacelerou significativamente em abril, com uma taxa de crescimento mensal de 12,6%, e em maio esse valor foi de apenas 2,8%.

Quando a popularidade dos modelos grandes acabou, é fácil para as pessoas pensarem em uma pergunta: o modelo grande é uma boa oportunidade para iniciar um negócio?

Obviamente, não há uma resposta padrão para essa pergunta, e mesmo as opiniões dos grandes são bem diferentes. Apenas alguns dias atrás, Fu Sheng, presidente e CEO da Cheetah Mobile, e Zhu Xiaohu, diretor administrativo do GSR Venture Capital Fund, "discutiram" no círculo de amigos sobre isso.

As inconsistências cognitivas do grande modelo não se concentram apenas no indivíduo. Quando empreendedores, investidores e demandantes têm vieses cognitivos, ser "cauteloso e conservador" com grandes modelos tornou-se um estado comum para a maioria dos jogadores.

Na Conferência Anual de 2023 da China Film Capital realizada em 16 de junho, houve uma discussão acalorada entre os investidores da China Film Capital e as empresas investidas de tecnologia de ponta e tecnologia de consumo sobre como a indústria adota modelos de grande escala e AIGC.

Da perspectiva de "Jiazi Guangnian", o mercado de modelos em grande escala precisa urgentemente de vozes racionais, o ritmo da inovação não pode ser interrompido e muitas questões ainda precisam ser esclarecidas - se modelos em grande escala podem ser lançados? Como lançar? Quais são os problemas de entrar no modelo grande? A futura comercialização de grandes modelos repetirá os erros da indústria de IA anterior?

Não importa o quanto as pessoas estejam preocupadas, é quase certo que a indústria adota o modelo grande - a questão é, de que maneira.

1. Investidores prudentes

Baichuan Intelligent, Lianyuan Technology, Lingxin Intelligent, Xihu Xinchen, MiniMax... Desde o início de 2023 até o presente, empresas start-up domésticas de grande escala surgiram uma após a outra. A força de cada empresa é altamente capitalizada.

Naquela época, não era incomum um certo empresário estrela deixar o emprego para abrir um negócio e entrar em um grande modelo para obter financiamentos vultosos.

Por exemplo, em 1º de junho, foi relatado que a MiniMax, uma empresa start-up de modelos domésticos em grande escala, estava prestes a concluir uma rodada de financiamento de mais de 250 milhões de dólares americanos, e a avaliação da empresa ultrapassou 1,2 bilhão de dólares americanos;

Na época, as notícias de financiamento da Light Years Away, que acabara de ser adquirida pela Meituan, eram ainda mais confusas. Wang Huiwen uma vez negou que a empresa tivesse recebido US$ 230 milhões em financiamento da Source Code, Tencent, Wuyuan e Suhua, mas este financiamento acabou por ser rejeitado, tendo sido confirmado devido ao anúncio de aquisição emitido pela Meituan.

Essa onda de investidores em busca de empreendedores fez as pessoas pensarem que o grande modelo ativaria todo o círculo doméstico de capital de risco da IA, mas não é o caso. Na verdade, exceto para equipes de estrelas com suas próprias auréolas, os investidores são mais propensos a esperar para ver e examinar o empreendedorismo em larga escala, e apenas um pequeno número de pessoas realmente gasta dinheiro real.

Já no início deste ano, quando a onda do ChatGPT varreu o mundo, "Jiazi Guangnian" trocou opiniões com alguns investidores pela primeira vez. Durante esse tempo, quase todo mundo estava aprendendo rapidamente e convidava especialistas para conduzir a ciência popular dentro da empresa.

Naquela época, havia uma discussão acalorada no campo da IA: o ChatGPT é o momento do iPhone no mundo da inteligência artificial? A este respeito, a resposta dada por Xianfeng não é apressada para uma conclusão. "Ainda não temos certeza de quão grande é esse impacto, mas achamos que (grande modelo) definitivamente mudará alguma coisa", disse Li Kang, vice-presidente da Xianfeng.

No entanto, algumas instituições de investimento expressaram preocupação com o modelo grande. Um investidor do mercado primário disse a "Jiazi Guangnian" que estava muito preocupado com a reação exagerada da China. Após a eclosão do ChatGPT, os estoques domésticos de conceitos de IA foram detonados. "Nossos mercados primário e secundário devem considerar se o investimento relevante injetado pode gerar retornos correspondentes. Se for para interesses de curto prazo, esse tipo de investimento será facilmente desperdiçado no final, porque você realmente não promoveu o desenvolvimento da tecnologia , mas é um investimento conceitual."

Na sua opinião, os investidores devem apostar na exploração de ciências mais básicas e com impacto no futuro da humanidade, que é o verdadeiro poder tecnológico com profundo potencial de valor de mercado. "É preciso integrar a dinâmica do mercado, assim como o valor de mercado e o progresso social futuro real. Não devemos seguir cegamente. Devemos entender claramente o que pode mudar o futuro. Não deve ser uma bolha em uma onda."

No entanto, um praticante da FA disse a "Jiazi Guangnian": "Recentemente, os investidores começaram gradualmente a investir em projetos modelo de grande escala, mas o valor não é grande."

“O problema essencial ainda é a cognição insuficiente.” Em relação à atitude cautelosa dos investidores, Zhang Gaonan, sócio-gerente da Huaying Capital, deu seu próprio entendimento. Ele afirmou ainda: "Quase ninguém pode definir claramente o modelo grande. Precisamos definir os limites do modelo grande antes de discuti-lo. O modelo grande que você mencionou e o modelo grande que mencionei provavelmente não são a mesma coisa."

Na opinião de algumas pessoas, a cautela dos investidores pode ser um sinal negativo para o empreendedorismo em grande escala e está jogando água fria nos modelos de grande escala. Mas do ponto de vista objetivo, a prudência não significa rejeição, e um abraço racional após uma reflexão profunda é mais precioso.

Sejam investidores, empreendedores ou empresas tradicionais que esperam transformar e atualizar seus próprios negócios com a ajuda de grandes modelos, eles precisam esclarecer duas questões antes de realmente entrarem no mercado de modelos grandes - qual é o limite de capacidade do modelo grande e se eles precisam introduzir um modelo grande?

2. Antes de abraçar o modelo grande, esclareça duas questões

Quando surge uma nova tecnologia, a questão central no mundo dos negócios é: onde e como essa tecnologia pode ser utilizada?

Isso é especialmente importante para modelos grandes e também é uma questão que as empresas que ainda não entraram no modelo grande devem considerar com cuidado.

Para responder a essa pergunta, primeiro é necessário delinear o limite de capacidade do modelo grande.

A característica especial do modelo grande é que seu algoritmo de modelo interno é uma enorme caixa preta. O processo de geração do modelo grande é inexplicável e imprevisível, por isso é difícil definir seu limite de capacidade. Mas o que é certo é que o grande modelo de uso geral não é uma panaceia.

Lin Yonghua, vice-presidente e engenheiro-chefe do Zhiyuan Research Institute, mencionou certa vez em um compartilhamento que, do ponto de vista da implementação industrial, "grande modelo + aprendizado imediato" não pode substituir tudo.

Ela mencionou ainda que, para muitas tarefas específicas ou novas tarefas, o aprendizado de dicas pode permitir que o modelo grande forneça os resultados necessários por meio de várias rodadas de dicas, mas o modelo grande "não consegue se lembrar" desse processo e, se o desenvolvedor adicionar toda a dica em cada chamada, por um lado, pode torná-la cada vez mais longa e exceder a capacidade de contexto do modelo grande. Por outro lado, inevitavelmente levará a um aumento no custo de cada raciocínio, e o efeito será difícil controlar. Essa instabilidade é ainda mais fatal no estágio de desembarque de produtos que investiram dinheiro real.

Zhang Yitian, especialista-chefe do National Speech Innovation Center, também disse na reunião anual da Huaying Capital em 2023: "O grande modelo é uma lógica generativa, e o que ele oferece é apenas um agrupamento de vocabulário ideal, e não há causa e efeito entre a resposta e a pergunta. O que obtemos é apenas um 'resultado', que precisa ser identificado, não uma 'resposta'. Portanto, se o modelo grande pode ser aplicado diretamente em campos sérios, como educação, assistência médica, e a justiça pode ser um problema. Mas é para auxiliar na tomada de decisão. É significativo. Em termos de geração direta de resultados, se for para ser comercializado e produtizado, achamos que ainda há um longo caminho a percorrer.”

Portanto, há um consenso na indústria de que no futuro cada indústria terá seu próprio modelo vertical, e o ponto chave é como integrar as capacidades do modelo geral com os dados da própria indústria da empresa.

Mas antes de realmente considerar a implementação do projeto de modelo em grande escala, os empreendedores precisam considerar uma questão mais importante, mas facilmente negligenciada - o modelo em grande escala é uma "necessidade justa" para a empresa?

A esse respeito, uma equipe doméstica multimodal de modelos em grande escala disse uma vez a "Jiazi Guangnian" que se os modelos em grande escala são "apenas necessários" para as empresas precisam ser entendidos de várias perspectivas. Para algumas empresas, não introduzir um modelo em grande escala equivale a perder uma vantagem competitiva no mercado, e elas precisam usar um modelo em grande escala para ganhar o favor dos clientes - isso também é uma "necessidade justa".

Mas, até certo ponto, esse é mais um sentimento de mercado nos primeiros dias das tecnologias emergentes. A longo prazo, a industrialização das tecnologias emergentes será essencialmente impulsionada pelas necessidades dos negócios. Neste momento, se uma empresa precisa de um modelo grande, precisa considerar vários fatores.

Além de questões específicas de implementação de projetos, as empresas também precisam considerar questões de segurança de dados e o impacto de grandes modelos na estrutura original do mercado.

Esses dois problemas têm aparecido com frequência na era da informação e digital e não podem ser erradicados, mas na era inteligente podem aparecer de forma mais sutil.

"Muitas empresas de consumo ou baseadas em plataforma, se adotarem o grande modelo sem reservas, o grande modelo tem uma forte capacidade de retroceder na indústria, porque significa que a indústria é facilmente transferida da indústria. O limite de entrada e a chave cognitiva ”, disse Zhang Yitian.

No contexto da transformação digital, a maioria das indústrias alcançou a transformação digital e a atualização por meio de tecnologias como big data e computação em nuvem. Mas, ao mesmo tempo, as empresas tradicionais também entregaram uma grande quantidade de dados da indústria aos fabricantes de tecnologia digital. Os provedores de tecnologia digital se tornaram um corpo principal que não pode ser ignorado na indústria, e a estrutura original do mercado foi alterada.

No entanto, devido à pequena quantidade de dados em setores como indústria e construção, e a dificuldade de conectar dados entre linhas de negócios, as empresas tradicionais ainda mantêm altas barreiras de concorrência.

Zhang Yitian disse: "Atualmente, a indústria da construção é a indústria que está mais bem protegida no contexto da digitalização. Agora, a informatização da indústria da construção, exceto para um Glodon que pode fazer um orçamento, nenhum gigante pode cortar. Por quê? Porque a arquitetura tem desenhos de projeto, desenhos de construção, desenhos de manutenção, desenhos de planejamento, desenhos de arquivamento e outros oito desenhos, todos os desenhos não estão conectados entre si e os departamentos governamentais não se reconhecem. O custo de abertura desses oito desenhos do todo o edifício é alto o suficiente, então a indústria da construção manteve a diversificação desse tipo de competição. Costumamos pensar que a diversificação da competição é a fonte de vitalidade e força para o desenvolvimento industrial.”

Portanto, sob a onda de modelos de grande escala, para empresas cujos padrões da indústria e vantagens competitivas não são perfeitos, adotar modelos de grande escala incondicionalmente é uma questão que toda empresa precisa considerar cuidadosamente.

3. Não há uma resposta padrão para a implementação de engenharia de grandes modelos

Para os participantes que investiram dinheiro real no mercado de modelos grandes, a próxima coisa a fazer é resolver o problema real de implementação do projeto.

Nesse sentido, a indústria formou gradualmente um consenso de que, no futuro, modelos grandes e pequenos se complementarão no processo de implementação industrial.

Lin Yonghua disse uma vez que os cenários de área estreita que exigem alta precisão e capacidades de baixa generalização são mais adequados para o paradigma "pequeno modelo + aprendizagem por transferência". Tais como inspeção industrial, inspeção de qualidade industrial, análise de imagens médicas, etc.

Além disso, Xuan Xiaohua, fundador da Huayuan Computing, também disse que o modelo de negócios das empresas de IA no futuro é integrar o grande modelo geral impulsionado por big data e o pequeno modelo de dados impulsionado pelo conhecimento para indústrias verticais para alcançar dois Wheel Drive.

Zhang Gaonan também disse a "Jiazi Guangnian": "Quando as empresas otimizam seus próprios modelos ou treinam modelos verticais, elas podem combinar com modelos grandes. Elas não precisam de dados de alta dimensão como modelos grandes e não precisam aplicar totalmente modelos grandes. No entanto, a tecnologia de modelos grandes pode ser acoplada a outras tecnologias para formar um modelo vertical da indústria com requisitos de baixa potência de computação, o que é esclarecedor, e não é de forma alguma uma simples aplicação de modelos grandes.”

Por exemplo, para o problema de "ilusão" de grandes modelos que tem sido repetidamente criticado, pode ser necessário combinar a geração anterior de tecnologia de IA para resolvê-lo no curto prazo.

"Existem muitas razões para alucinações, e pode ser porque os dados são relativamente escassos e insuficientes em um determinado domínio. Nesse caso, precisamos fornecer mais dados ao modelo para treinamento. Além disso, quando os usuários fizerem perguntas, forneça claramente Mais a informação de fundo também é uma forma de reduzir as alucinações, ou para diminuir a 'temperatura'. Às vezes, as alucinações ocorrem porque as perguntas não são completas o suficiente, faltando fundo e premissa. Portanto, a questão também é muito importante e a engenharia é a chave. Em Além disso, se os usuários realmente quiserem resolver problemas 100% precisos, eles ainda podem precisar usar gráficos de conhecimento. Os gráficos de conhecimento podem garantir a precisão do raciocínio lógico e incluir tecnologias mais recentes, como o 'modelo de mundo' proposto por Yann Lecun, o chefe da Meta AI”, disse Wu Xuening, CTO da Jinyou.com.

Além de combinar com a geração anterior de tecnologia AI, também é uma parte importante combinar o processo de treinamento de grandes modelos com dados da indústria de alta qualidade.

Por exemplo, como um banco de dados híbrido que atende à plataforma AI PaaS, o Tianyun Data passou por mais de dez anos e agora atingiu o estágio de combinação com grandes modelos.

Li Congwu, vice-presidente da Tianyun Data, disse que a combinação entre si e o modelo grande será considerada sob dois aspectos - primeiro, como combinar dados de domínio privado com o modelo grande. Por exemplo, a Tianyun Data concluiu um projeto de interpretação de política semelhante para a China Securities Regulatory Commission. Ao combinar vários dados, como regulamentos, precedentes e interpretações, a Tianyun Data gerou interpretações de violações, semelhantes ao processo de penalidades judiciais. dados para decifrar as causas das violações.

Em segundo lugar, a Tianyun Data vem desenvolvendo um banco de dados híbrido e é uma das primeiras empresas na China. Já por volta de 2018, a Tianyun Data propôs o conceito de banco de dados nativo de IA, que na verdade é semelhante ao banco de dados vetorial que suporta grandes modelos hoje. A Tianyun Data lançou um banco de dados vetorial autodesenvolvido e o aplicou a seus próprios modelos.

Em geral, não há uma resposta padrão para a implementação de engenharia de grandes modelos.

No caminho da inteligência artificial, a China certamente abrirá um caminho diferente de outros países. É difícil distinguir as vantagens e desvantagens dos dois caminhos, e eles são mais baseados em escolhas realistas em diferentes condições nacionais.

Li Kang, vice-presidente da Xianfeng, certa vez fez uma analogia com "Jiazi Guangnian" em uma entrevista, e ainda parece ser aplicável hoje: "É injusto usar o sucesso da OpenAI para descrever os muitos problemas dos empreendedores domésticos. é como duas pessoas jogando cartas. É diferente, a outra parte de repente jogou uma grande mão e conseguiu um straight flush, você apenas diz que ele jogou bem, eu fui muito cauteloso, mas por que você não disse quando eu ganhei?"

Zhang Yitian compartilhou que, do ponto de vista do governo central, grandes modelos, incluindo questões de inteligência artificial, são uma importante ferramenta estratégica para ganhar a iniciativa na competição global e uma estratégia importante para promover o desenvolvimento da ciência e tecnologia do meu país, o otimização e modernização da industrialização, e o salto geral em recursos de produtividade.

"Quando o relatório do 20º Congresso Nacional do Partido Comunista da China falou sobre questões industriais, propôs a inteligência artificial separadamente da nova geração de tecnologia da informação. Portanto, do ponto de vista político, o desenvolvimento da inteligência artificial e de grandes os modelos em escala não são apenas uma questão técnica e industrial, mas também a principal competição de uma economia nacional. A questão do poder, de uma perspectiva mais profunda, é uma questão política, e todos devem entender essa questão de uma perspectiva mais elevada."

Se sairmos da China e estendermos a linha do tempo do desenvolvimento tecnológico, o alvoroço causado pelo ChatGPT pode ser apenas um ponto na história do desenvolvimento da tecnologia de inteligência artificial, e todos os julgamentos podem ser prematuros.

Afinal, mesmo os técnicos que estão imersos na linha de frente da pesquisa de inteligência artificial há muito tempo ainda não chegaram a um consenso sobre o futuro da inteligência artificial e estão profundamente ansiosos.

No livro recentemente popular "Por que a grandeza não pode ser planejada", os autores Kenneth Stanley e Joel Lehman escrevem: "Temos que enfrentar o fato desconfortável de que não podemos determinar se alguma regra prática pode ser um guia confiável na busca dos objetivos da IA. ."

Na Conferência Zhiyuan de Pequim de 2023, que terminou não muito tempo atrás, Huang Tiejun, diretor do Instituto de Pesquisa Zhiyuan, também teve uma ansiedade muito semelhante. Ele usou diretamente as quatro palavras "incapaz de fechar" como título do discurso para a cerimônia de encerramento. Ele disse: "Estamos em um estado incerto. Este AGI próximo é mais forte do que nós? É mais inteligente do que nós? Ou quando nos superará? Não sei. Estamos em um estado completamente fora de controle."

Ao final do discurso de encerramento, concluiu com esta frase: "Se podemos enfrentar os riscos com o mesmo entusiasmo de investir em grandes modelos, pelo menos é possível antever o futuro. Mas, você acredita que os humanos podem fazer isso? Eu não sei."

Olhando para todas as tecnologias e indústrias, essa "sensação de perda de controle" dos técnicos centrais da linha de frente não é comum em outros campos. Agora, quase todo mundo está atravessando o rio sentindo as pedras. Cada empresa que entra no mercado hoje tem potencial para se tornar pioneira em uma terra virgem tecnológica.

E o tempo é a melhor prova para provar tudo.

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)