A "verdade" do corpo a corpo de modelos de IA em larga escala: os investidores veem mais e investem menos, 20 empresas receberam apenas 6 bilhões de yuans em financiamento

Fonte: Tecnologia Sohu See More

Autor: Liang Changjun

Editor: Yang Jin

Figura: Na Conferência Mundial de Inteligência Artificial de 2023, muitas empresas exibiram produtos e aplicativos de modelo de IA em larga escala

“Olhe mais, vote menos”, “o clima de espera e observação é relativamente forte”. Falando sobre a atitude das instituições de investimento em relação ao empreendedorismo de modelos de IA em larga escala este ano, esse é o sentimento de alguns investidores e empreendedores domésticos.

Mas na indústria, modelos grandes de IA ainda são populares. Na recém-concluída Conferência Mundial de Inteligência Artificial, mais de 30 modelos em grande escala mostraram coletivamente seus músculos. Empresas domésticas de Internet e muitas empresas de IA entraram na trilha quente de modelos em grande escala, e a batalha de 100 modelos já começou .

No mercado de capital de risco, grandes nomes como Wang Huiwen, Wang Xiaochuan e Li Kaifu entraram no mercado um após o outro, proclamando ser a OpenAI da China, ser o melhor modelo em grande escala na China, etc., tornando-se um importante força nesta onda de modelos de IA em grande escala.

De acordo com estatísticas incompletas da Sohu Technology, no primeiro semestre deste ano, pelo menos 20 empresas modelo em grande escala receberam mais de 6 bilhões de yuans em financiamento. De uma perspectiva global, o número de financiamentos relacionados supera 50, e China e Estados Unidos assumem a liderança, com mais de 20 cada um, envolvendo um total de 100 bilhões de yuans.

Embora o número de transações domésticas seja relativamente grande, o valor representa apenas 6% do mundo. Os investidores domésticos não são generosos e o mercado de investimentos em grandes modelos de IA está um pouco deserto.

Ao mesmo tempo, todas as partes não chegaram a um consenso sobre o valor empresarial do grande modelo. Zhu Xiaohu, sócio-gerente da GSR Ventures, e Fu Sheng, presidente da Cheetah Mobile, discutiram entre si sobre isso anteriormente .

Cheng Hao, fundador da Yuanwang Capital e Xunlei, julgou que não haverá mais de 10 modelos de uso geral no mundo e há poucas oportunidades para o empreendedorismo. Isso basicamente se tornou um consenso no círculo de investimentos.O CEO da Baidu, Robin Li, também disse antes que não há necessidade de reinventar a roda.

Mas muitos empresários acham difícil concordar. Wang Xiaochuan acredita que as empresas iniciantes devem ter oportunidades e, sem ônus e maior pressão comercial, elas funcionarão mais rápido do que as grandes empresas.

Li Wei, vice-presidente de engenharia e cientista-chefe da Going out to ask, disse à Sohu Technology que é improvável que os principais fabricantes monopolizem modelos grandes de uso geral. "Muitas startups lançaram modelos grandes, provando que esse assunto não é mais um grande problema."

Apesar das diferenças, há consenso de que a aplicação será fundamental. Desde a espera para ver se deve fazê-lo, até a entrada de jogadores de todas as esferas da vida, o grande modelo chegou ao estágio de responder como implementá-lo. Quer se trate de uma grande fábrica ou de uma empresa iniciante, esta é uma folha de respostas obrigatórias.

O chefe tem sua própria auréola quando entra no jogo, quem está investindo no grande modelo?

Nasceu o ChatGPT, dando início ao auge do grande modelo da terceira onda da IA, e um grupo de figurões iniciou seus próprios negócios. De acordo com as estatísticas incompletas da Sohu Technology, no primeiro semestre deste ano, pelo menos 20 empresas de grande porte obtiveram financiamento, e a maioria delas estava na rodada inicial ou na rodada A.

Esses empreendedores basicamente têm sua própria auréola, incluindo Kai-Fu Lee, Wang Huiwen, Wang Xiaochuan, Li Zhifei, Zhou Bowen, etc. Congress, e West Lake University, entre os quais a Tsinghua University é particularmente típica.Os professores Tsinghua estão por trás da Shengshu Technology, Shenyan Technology, Dark Side of the Moon, Qingmao Intelligence, Face Wall Intelligence e Lingxin Intelligence.

Figura: Empresas modelo de IA de larga escala que obtiveram publicamente financiamento no primeiro semestre deste ano Fonte: informações públicas, Tianyancha

Do ponto de vista dos investidores, não existem apenas capitais industriais como Tencent, Baidu Ventures, Ant Group e TAL, mas também capitais de risco como Sequoia, IDG, ZhenFund, Sinovation Ventures, Qiming Ventures, Matrix Partners e Qiji Ventures. elenco. Sequoia é o mais ativo, com pelo menos 5 fotos, incluindo Light Years Beyond, Shenyan Technology, The Dark Side of the Moon e Project AI 2.0, enquanto a Tencent investiu em Light Years Beyond, MiniMax e Shenyan Technology.

Em termos de escala de financiamento, o financiamento total divulgado pelos projetos nessas estatísticas excede 6 bilhões de yuans. Segundo dados públicos, no primeiro semestre deste ano, houve 51 financiamentos corporativos envolvendo grandes modelos de IA no mundo, com um valor de investimento e financiamento superior a 100 bilhões de yuans, ou seja, o número de transações domésticas representou quase 40% , mas o valor do financiamento foi de apenas cerca de 6%.

Várias transações de grande escala no mercado dos EUA representaram a maioria, incluindo o investimento de US$ 10 bilhões da Microsoft em OpenAI, Bill Gates, Microsoft, Nvidia etc. US$ 1,3 bilhão. Essas três transações sozinhas representaram cerca de 90% do total global.

Isso também mostra, de certa forma, que, embora os modelos domésticos de grande escala estejam fortemente envolvidos e as ações-conceito no mercado de capitais tenham dobrado e disparado, os investidores no mercado primário ainda são relativamente cautelosos, especialmente em transações de grande valor.

Qu Kai, o fundador do Capítulo 42, que está envolvido em negócios de capital de risco FA, revelou que quase todos os fundos em dólares americanos estão atualmente olhando para IA, e alguns fundos em RMB também estão interessados. "Muitas instituições são muito positivas, mas no final não são muitas as que farão uma mudança. Provavelmente serão cinquenta ou sessenta."

Li Wei, vice-presidente de engenharia e cientista-chefe, também pode sentir que a comunidade de investimentos está realmente muito preocupada e gosta de grandes modelos, mas também é muito cautelosa. "Afinal, esta é uma nova direção tecnológica com um grande investimento, mas o modelo de negócios ainda não está claro."

Guo Tao, um investidor anjo e especialista sênior em inteligência artificial, analisou a Sohu Technology e disse que mais e mais instituições de investimento perceberam que grandes modelos de IA enfrentam grandes quantias de investimento, longos períodos de retorno, baixas taxas de sucesso, concorrência acirrada no setor, e regulamentos cada vez mais rigorosos. E outras questões, então o tiro tende a ser cauteloso, e a atual atmosfera de esperar para ver é relativamente forte.

Ao mesmo tempo, Guo Tao acredita que não há muitas empresas de IA de grande porte nas quais vale a pena investir no momento. A maioria das empresas iniciantes quase não tem vantagens significativas em tecnologia, dados e ecologia.

Além disso, as avaliações de muitas empresas estrela promissoras são muito caras, normalmente a anos-luz de distância.Em apenas três meses, a avaliação saltou de 200 milhões de dólares americanos para 1 bilhão de dólares americanos, e muitas instituições estão desanimadas. O fim desta empresa também é bastante embaraçoso: o Meituan de Wang Xing “salvou” seus irmãos e investidores com mais de 2 bilhões de yuans, e Wang Huiwen saiu mais cedo devido a uma doença.

Continuando a preferência de investimento na Internet e começando a lutar depois que a febre passar

Em termos da direção específica de investimento dos grandes modelos de IA, as instituições de investimento quase continuaram as preferências da era do investimento na Internet, e a camada de aplicativo é a mais popular. Cheng Hao disse que a Yuanwang Capital investe principalmente em empresas de middleware e camada de aplicativos.

De acordo com os dados divulgados por Qu Kai, entre os projetos de IA que receberam dinheiro este ano, 10%-20% são para modelos, 20%-30% são para camadas infra/intermediárias e 60%-70% são para camadas de aplicação. Se não contarmos os projetos que recebem dinheiro, os projetos que fazem candidaturas podem chegar a 95%.

Da infra subjacente (como chips, estruturas e outras infraestruturas) à camada de modelo, middleware e vários aplicativos, a indústria de modelos de IA em grande escala também formou uma estrutura de pirâmide invertida semelhante à indústria de chips. No caso de a camada inferior depender de tecnologia de código aberto estrangeira e ser difícil de romper, a maioria das startups domésticas aposta na camada de aplicativo, e a camada de modelo de alto custo é apenas um jogo para algumas empresas.

Li Wei acredita que as empresas iniciantes fazem principalmente modelos básicos de grande escala e aplicações posteriores de modelos de grande escala, e não é realista nem necessário fazer modelos básicos de grande escala. "Portanto, muitas start-ups tendem a se inscrever em cenários verticais. Por meio de chamadas de API ou implantação de privatização OEM, elas aproveitarão os serviços de grande modelo de grandes fornecedores de modelo para se concentrar em pesquisa e desenvolvimento inovadores de dados e aplicativos. Isso ajudará ser uma direção relativamente clara."

No entanto, essa onda de mania de modelos grandes parece ter começado a esfriar.O exemplo mais citado é o pico de tráfego do ChatGPT. De acordo com os dados do site de terceiros SimilarWeb, o tráfego global do site e cliente móvel do ChatGPT diminuiu 9,7% mês a mês em junho deste ano, a primeira queda desde o final do ano passado, e o tempo gasto por visitantes no site também diminuíram 8,5%. Além disso, o tráfego de sites como Microsoft Bing e Character.AI também diminuiu em vários graus em junho.

“O mercado tem esfriado nos últimos um ou dois meses, porque as mudanças qualitativas nos grandes modelos têm diminuído recentemente, e há menos novos empreendedores e novas histórias para contar do que no início do ano. hotspot tem suas próprias vantagens e desvantagens. Fu, isso é normal." Qu Kai disse.

Ele acredita que na próxima etapa do grande modelo de IA, devemos trabalhar duro para implementá-lo. A próxima onda de pontos quentes provavelmente ocorrerá dois ou três meses depois. Para um grande número de projetos que receberam dinheiro no primeiro semestre do ano, levará alguns meses para concluir o lançamento do produto. Veja se há mais e melhores aplicativos matadores e veja quem será o líder da camada de aplicativos.

De fato, os principais fabricantes estão atualmente se esforçando para o desembarque e aplicação comercial de modelos grandes. Quando a Huawei lançou o Pangu 3.0 recentemente, expressou que espera usá-lo para ajudar todas as esferas da vida, em vez de se concentrar no nível do modelo de voz. "Estamos tão ocupados fazendo coisas que não temos tempo para poesia."

Guo Tao acredita que, embora o modelo de IA tenha esfriado, ele durará cerca de um ano como um todo, e o foco mudará gradualmente do nível de tecnologia subjacente para o nível de aplicativo vertical.

Li Di, CEO da Xiaoice, julgou que a homogeneização de modelos grandes agora é coisa séria, e não há necessidade de tantos modelos grandes no mercado. A febre deve baixar em 2024, e constata-se que quem está na praia e que está nadando nu.

Sem chance para o modelo geral? A homogeneização da via vertical é coisa séria

Para os empreendedores, pensar no rumo antes de entrar no mercado é extremamente crítico. Zhu Xiaohu disse que o ChatGPT é muito hostil para empresas iniciantes e desistirá de fantasias de financiamento nos próximos dois a três anos. Fu Sheng reclamou disso, dizendo "Nossos investidores são ignorantes e aqueles que são destemidos."

Mais tarde, Zhu Xiaohu explicou que não negava oportunidades empreendedoras no campo de modelos de grande escala, mas lembrou aos empreendedores que não fossem supersticiosos em relação a modelos de grande escala de uso geral. "Para a maioria dos empreendedores, os cenários são a prioridade e os dados são os reis."

Essa visão tornou-se basicamente o consenso do atual círculo de investimentos domésticos. Guo Tao acredita que modelos de larga escala de uso geral formarão uma certa situação de monopólio, e empreendedores e "pequenas fábricas" estarão em desvantagem em termos de capital, tecnologia, dados e ecologia quando implantarem modelos de larga escala de uso geral .

"O fosso do modelo de grande escala de uso geral é muito alto e seu efeito de rede também é forte. O feedback do usuário o tornará cada vez mais inteligente, e a empresa que o fabricar primeiro terá uma vantagem pioneira." Hao também acredita que não há chance para as empresas iniciantes fazerem um modelo de uso geral em grande escala. Grande, apenas as grandes fábricas podem pagar.

Ao mesmo tempo, ele acredita que o modelo de base geral não exigirá tantas empresas no futuro. "Talvez não haja mais de 10 modelos de uso geral de código fechado e código aberto que possam ser usados no mundo no futuro, o que é demais."

Mas muitos empresários discordam. "Muitas empresas iniciantes lançaram modelos em grande escala, provando que isso não é um grande problema. Se você deseja atingir o nível de GPT-4, também é muito difícil para os principais fabricantes e parece impossível monopolizá-lo agora." Li Wei disse.

Ele acredita que, embora as empresas iniciantes não possam competir com fabricantes de grande escala em termos de recursos de hardware e força de engenharia, suas vantagens são que elas são mais práticas, têm um caminho de aterrissagem geral ou demanda de produto e não fazem grandes modelos por causa de grandes modelos.

"O grande modelo básico não é monolítico e há espaço para expansão. As startups podem começar com um modelo de um bilhão ou dez bilhões e depois decidir se continuam a desenvolver um modelo de 100 bilhões de acordo com suas próprias necessidades e seguir recursos." Li Wei disse.

Muitas empresas iniciantes seguem esse caminho ao fazer modelos em grande escala. Por exemplo, a Baichuan Intelligence lançou pela primeira vez um modelo de parâmetro de 7 bilhões e ainda está treinando um modelo de parâmetro de 50 bilhões. Basicamente, nenhuma empresa iniciante escolhe fazer um modelo grande com 100 bilhões de parâmetros.

Na visão de Li Wei, o tamanho do modelo não é o único indicador, e o cenário de aplicação também é uma importante dimensão de referência. "Para a maioria das aplicações, um modelo em supergrande escala é como um canhão acertando um mosquito. Além de levar muito tempo para inferir, custa muito e é difícil de aplicar e implantar, além de não fazer muito sentido em termos de efeito real."

Portanto, Li Wei acredita que competir cegamente pela perfeição não deve ser o mainstream de P&D e inovação de modelos em grande escala. É uma competição mais significativa e saudável promover modelos em grande escala para serem leves e verticalizados. importante.

Cheng Hao acredita que, no futuro, muitas pequenas e médias empresas terão seus próprios modelos verticais e as startups terão mais oportunidades de desenvolver aplicativos ou cadeias de ferramentas na trilha vertical. "A maioria das instituições de investimento ainda está olhando para o caminho das indústrias verticais, como Wang Xiaochuan e Wang Huiwen, em grande medida, elas estão apostando nas pessoas, não em fazer modelos de larga escala de uso geral."

No entanto, a escolha do percurso técnico da via vertical também enfrenta muitos desafios. Li Wei disse francamente que a implementação em larga escala de modelos de grande escala no campo vertical será mais difícil do que se imaginava.

Ele acredita que um dos desafios atuais é que as mudanças são muito rápidas e deslumbrantes. É difícil para empresas iniciantes se conectar e selecionar fornecedores de modelos em grande escala. A maioria dos modelos em grande escala ainda não produziu serviços maduros que possam ser aplicado, e o upstream e o downstream não podem ser contínuos. O problema de encaixar e combinar.

Ao mesmo tempo, persistem problemas como a homogeneidade técnica e o entrelaçamento comercial. “Incentivar a competição tecnológica e o desenvolvimento diferenciado de modelos, coordenar a cooperação empresarial e reduzir o interenvolvimento empresarial são as direções pelas quais as empresas e comunidades de tecnologia devem trabalhar juntas.” Li Wei apelou.

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)