Em 2023, a notícia de que a conhecida instituição de investimentos Tiger Fund não conseguiu captar recursos se espalhou silenciosamente pela Internet.
Nos últimos 10 anos, quando me acostumei a abrir um negócio ao vento, parece que o “inverno do investidor” apareceu pela primeira vez. Isso está intimamente relacionado a vários fatores desfavoráveis, como novos consumos, transmissão ao vivo e Metaverso. Os canais de saída, como fusões e aquisições e ações de conceito chinesas, estão meio fechados. O mercado de capital de risco parece realmente deserto.
É difícil para as empresas iniciantes levantar fundos e é difícil para o chefe encontrar uma direção para seu segundo empreendimento. Wang Huiwen, que se aposentou da Meituan, estudou Web3 e Metaverse por muito tempo. Wang Xiaochuan, que deixou a empresa após ser adquirido pela Tencent, testou as águas dos cuidados médicos da IA. Mas tudo mudou no final de 2022, quando foi lançado o ChatGPT 3.5, que rapidamente formou um consenso no mercado, chegou a era da AGI (inteligência artificial geral) e toda a indústria começou a se deparar com modelos em grande escala.
Entende-se que Wang Xiaochuan, que estava iniciando um negócio discreto na época, já havia estabelecido uma empresa para fabricar hardware inteligente. Destina-se a ajudar centenas de milhões de pessoas com distúrbios do sono, para criar um travesseiro inteligente para tratar o ronco. Quando o surgimento de modelos em grande escala surgiu em março, Wang Xiaochuan passou duas semanas tomando a decisão de encerrar esse projeto empresarial e projetar modelos em grande escala.
Wang Xiaochuan recrutou o ex-Sogou CTO Yang Hongtao para ajudar a assumir o projeto médico.As ações do ex-Sogou COO Ru Liyun nesta empresa também foram trocadas por Yang Hongtao, seguindo o modelo de negócios em larga escala de Wang Xiaochuan. Wang Xiaochuan gastou um total de 50 milhões de dólares americanos para estabelecer o "Baichuan Smart" e convidou os talentos técnicos da Soul para serem os responsáveis pelo algoritmo para acelerar a produção de modelos grandes. E a história de Wang Huiwen, todos estão muito familiarizados com ela.Postagens de recrutamento de heróis foram colocadas na mesa de vinho e uma empresa anos-luz de distância foi estabelecida para fazer um grande modelo.
Nas grandes empresas de Internet, o grande modelo também trouxe uma influência de abalar a terra. O responsável pelo projeto com uma grande modelo propôs demissão há alguns anos por causa do problema de não ser promovido. Três meses depois, o CEO do grupo tornou-se o gerente geral do modelo grande, usando a força da empresa para All no modelo grande.
Ninguém quer perder esta onda da era AGI, todos acreditam que depois de três altos e baixos no desenvolvimento da IA, a singularidade da inteligência artificial geral está chegando. Afinal, sob o boom da IA, empresas com dezenas de funcionários como ChatGPT e Midjourney criaram uma avaliação de cerca de US$ 4 bilhões. O valor total de mercado das "Big Seven" no mercado de ações dos EUA disparou para US$ 11 trilhões ao ano, um aumento de 60%. Essas histórias emocionantes de crescimento explosivo mais uma vez agitaram o mercado doméstico de negócios de tecnologia.
Entre as principais empresas de Internet da China, Li Yanhong, Zhang Yong, Zhang Yiming, Wang Xing e outros grandes nomes já assumiram pessoalmente o comando.Pode-se dizer que, exceto Pinduoduo, todos eles entraram no grande modelo. Assim como em 19 de julho, o valor de mercado da Microsoft e da Nvidia aumentou US$ 175 bilhões, exclamou Musk ao comentar tweets relacionados: "Tempos loucos".
O mercado de tecnologia e negócios que está prestes a silenciar de repente inaugurou o estimulante da IA, que também trouxe a Internet para seu último carnaval.
1. Um novo amanhecer no vale
Li Ming é o CEO de uma empresa iniciante com uma equipe de mais de 100 pessoas. 2023 é o ano em que ele mais se preocupa com o financiamento.
O processo de iniciar um negócio foi muito tranquilo no início e obteve financiamento angel e A-round de instituições de investimento angel bem conhecidas no estágio inicial. "Naquela época, a Internet Industrial ainda era uma faixa popular e não era tão exagerada quanto muitos projetos de IA." Li Ming disse a AI Jingxuan, mas em meados de 2023, na nova rodada de financiamento que lançou, ele lentamente descobriu que o mercado não estava certo.
**Instituições de investimento não apenas analisam dados e histórias, mas também analisam receitas. ** Li Ming, que antes era obcecado pela produção, não percebeu a mudança na direção do vento do investimento. Nas palavras de Wu Shichun, sócio fundador da Plum Blossom Venture Capital, os atuais projetos de investimento “exigem não apenas (tecnologia), mas também (dados) e (receita)”. De jeito nenhum, ele começou a procurar instituições da FA para ajudar no financiamento, e as rodadas de financiamento também regrediram, pedindo um A++.
“A FA ajudou a encontrar mais de 30 instituições de investimento, mas nada aconteceu.” O fracasso do financiamento deixou Li Ming um pouco desanimado. Mas em junho, ele sentiu o poder do grande modelo, então lançou um negócio industrializado baseado no ChatGPT internamente. "Ainda não levantamos fundos, mas os investidores tomarão a iniciativa de se comunicar com eles, e a outra parte está obviamente interessada."
Para a tecnologia de primeira classe de Yuan Jinhui, o modelo grande também é um canudo que salva vidas. Em 2022, esta empresa, que fabrica a estrutura de aprendizado profundo da IA, atingiu o ponto em que o financiamento não é tranquilo e precisa demitir funcionários para sobreviver. A empresa esteve prestes a quebrar sua cadeia de capital três vezes antes, e todos eles pediram dinheiro emprestado a Su Hua, um investidor anjo que também era o CEO da Kuaishou na época.
"O que fazemos é semelhante ao Flying Paddle da Baidu e ao Shengsi da Huawei. O mais importante é que o negócio de treinamento de modelos em grande escala no mercado ainda não começou." empresa pertence ao tempo em que é rico (2021) ) não tem negócios, e quando há negócios (2023), não haverá dinheiro.
Justamente quando Yuan Jinhui sentiu que o futuro era desesperador, a empresa inaugurou uma oportunidade de aquisição em 2023. Em abril de 2023, na empresa de tecnologia de primeira classe do Tsinghua Science and Technology Park, um ilustre convidado foi recebido: Wang Huiwen, cofundador da Meituan, que acabava de anunciar sua entrada no modelo em grande escala.
O preço de compra final não foi ruim. Um funcionário de tecnologia de primeira classe demitido nos disse: "É comparável à avaliação da última rodada de investimento da Hillhouse Capital, e minhas próprias opções também foram liquidadas."
E Yuan Jinhui, que se tornou o cofundador da Light Years Away, finalmente não precisa mais se preocupar com financiamento. A capacidade de financiamento de Wang Huiwen é inigualável no atual círculo de capital de risco. De acordo com o contrato de aquisição subsequente da Meituan, a Light Years Away levantou 2 bilhões de yuans sem produtos modelo em grande escala.
É claro que os investidores que se posicionaram no início dessa onda de ação caçaram unicórnios com sucesso. **
A Minimax foi fundada em novembro de 2021, recebeu um investimento angel round em janeiro de 2022 e a avaliação da empresa atingiu o nível de unicórnio no início de 2023. Entre as primeiras quatro instituições de investimento, há também a empresa de jogos de Xangai Mihayou.É relatado que os dois executivos fundadores têm laços familiares. De acordo com o Jingxuan News, Zhipu também levantou recentemente fundos avaliados em 10 bilhões de yuans.
Essas duas empresas foram estabelecidas há menos de 2 anos, mas ambas se tornaram unicórnios, e a velocidade de desenvolvimento da pista de modelo grande é incrível.
E o boom da AGI também é uma salvação para aquelas antigas empresas de IA. Anteriormente, a história de sair para perguntar sobre a listagem de IoT passou várias vezes sem sucesso. Com o lançamento da história do modelo em grande escala "Serial Monkey" e quatro produtos AIGC, embora o modelo em grande escala ainda seja cuidadoso para não ser avaliado publicamente, também permite que Momenwen finalmente tenha uma nova história para contar, e o pedido de listagem na bolsa de valores de Hong Kong foi submetido.
Mais modelos de grande escala e empreendedores de AIGC estão na estrada. Mesmo em um acampamento de startups, 60% dos projetos estão relacionados à IA. Com as vantagens de ativos leves, altas barreiras e tetos altos, AGI se tornou completamente o jogo mais quente no momento. estrada.
2. Faça do sonho da AGI o pico
Se 2023 é o "primeiro ano" do empreendedorismo modelo em grande escala. Então, o "ano da fonte", quando os gigantes da Internet entraram pela primeira vez no grande modelo, pode ser rastreado até 2019.
Ali começou a projetar o modelo grande em setembro de 2019 e lançou o modelo grande PLUG em abril de 2021. Antes do lançamento do ChatGPT 3.0, já havia muitos modelos grandes com trilhões de parâmetros na China, como o M6 da Bodhidharma Academy, o modelo grande Pangu da Huawei Cloud e o Enlightenment 2.0 da Zhiyuan. Comparado com o ChatGPT, embora os parâmetros do modelo sejam superados, a abundância de dados não é a mesma e o efeito não pode ser comparado. De acordo com Zhang Cong, do Dharma Institute, o mais importante é que os grandes modelos domésticos comecem de manhã cedo e recuperar o atraso à noite, duas coisas.
A primeira coisa é que o alinhamento não é feito. ** Naquela época, Ali tinha muitos modelos grandes e pequenos e, principalmente, não alinhava os resultados do treinamento. "Você pode ver que o ChatGPT pode compor poemas e conversar, o que é muito semelhante à inteligência humana. Na verdade, está alinhado com os valores humanos." Disse Zhang Cong, tudo isso requer ajustes artificiais nos resultados do raciocínio, em vez da lógica da máquina .
Em segundo lugar, ** não produziu conjuntos de dados de alta qualidade**. O ChatGPT usou professores universitários nas Filipinas para rotular dados nos primeiros dias, enquanto alunos de escolas secundárias técnicas nacionais foram usados para rotulagem. O problema do corpus também afetou muito os resultados . Na visão de Zhang Cong, o modelo de bate-papo ajustado do Llama 2 lançado em 19 de julho foi treinado em 1 milhão de dados rotulados por humanos, e o número total de tokens de treinamento aumentou em 40%. Comparado com o Llama, a melhoria é geral . "Portanto, o modelo grande não é uma invenção que trabalha duro para criar milagres, mas uma criação de engenharia bem projetada."
E, olhando para trás, para a indústria doméstica de IA, ela também enfrentará a interferência de muitos outros fatores. Naquela época, a Bodhidharma Academy tinha duas equipes principais trabalhando em grandes modelos, uma era a equipe de inteligência de máquina liderada por Jin Rong e Si Luo estava a cargo de AliciMind; a outra era o laboratório de linguagem natural liderado por Zhou Jingren, do qual Yang Hongxia estava a cargo do grande modelo M6.
Na avaliação no final de 2022, os resultados do modelo grande M6 têm uma ligeira vantagem e os dois são finalmente integrados ao modelo grande Tongyi atual. "Na verdade, há apenas 20 ou 30 pessoas na grande equipe modelo do Dharma Institute, e o pré-treinamento é principalmente colocado no Alibaba Cloud." Zhang Cong disse à AI Whale Selection Agency, mas agora Tongyi é um projeto importante do grupo , e envolve Existem mais de 600 pessoas e muitos recursos agora são dedicados a modelos grandes. O CEO do grupo pergunta sobre o progresso técnico a cada 2 semanas.
Para o Baidu, essa onda de boom da AGI, mas a era da IA que ele previu desde 2016, naturalmente não perderá.
Foi oficialmente aprovado internamente em 7 de fevereiro deste ano e lançado oficialmente em 16 de março. Durante este período, foi promovido diretamente ao projeto de maior prioridade do Grupo Baidu. Li Yanhong supervisionou pessoalmente a batalha, e o CTO Dr. Wang Haifeng assumiu diretamente o comando. Naquela época, o Centro de Supercomputação Baidu Yangquan era dedicado ao treinamento de modelos em grande escala .
O engenheiro de algoritmo do Baidu, Zhao Hui, disse à AI Whale que o departamento de processamento de linguagem natural do Baidu tem pesquisado NLP e outras tecnologias, e o cientista-chefe Wu Hua sempre foi o líder. Existem centenas de pessoas neste departamento. O ERNIE2.0 do Baidu foi transformado em um modelo grande de Wenxin: "Eu costumava fazer cérebros de Baidu, mas agora dizem que é um modelo grande de Wenxin."
Existem semelhanças no que eles fazem, mas é claro que existem diferenças. Zhao Hui mencionou que, no passado, o Baidu faria muita pesquisa vertical Rank, apenas para reordenar os resultados da pesquisa com base em cliques humanos. Após o surgimento do modelo grande, essas capacidades serão depositadas no algoritmo do modelo grande, o que também ajudará a dar respostas mais precisas.
Para o Baidu, o modelo grande promove mudanças qualitativas na próxima geração de busca, que foi escrita no OKR de Robin Li. No entanto, em termos de ecologia, o modelo Wenxin do Baidu é baseado no modelo Bert. "O GLM, incluindo o de Zhiyuan, é uma rota técnica independente, diferente do GPT internacional". não precisa se preocupar com isso Wenxin Qianfan tem todos os tipos de modelos, e GPT2, 3 e 4 também são muito diferentes.
Quanto a Yang Hongxia, que se demitiu de Ali, ela também foi contratada pela ByteDance para ser a chefe de pesquisa e desenvolvimento de grandes modelos norte-americanas depois que ela foi para o exterior. Zhang Yiming tem pesquisado se o modelo grande será de código aberto ou fechado, então ele não pediu para se concentrar no trabalho. “Haverá um avanço real antes do final do ano”, disse Yang Hongxia à AI Whale Selection Agency.
No geral, a ByteDance deve ser uma empresa que melhor corresponda ao grande modelo de negócios depois do Baidu. Alguns headhunters nos disseram que, embora o modelo grande não tenha pressa, ainda é bastante agressivo no campo do AIGC. Por exemplo, TikTok está fazendo negócios criativos de publicidade AIGC, a posição de diretor dá um orçamento de 100 a 150 W e o requisito é liderar a equipe após 1988.
**Até agora, exceto Pinduoduo, todas as grandes empresas de Internet entraram no modelo grande. **O entusiasmo dos grandes fabricantes em entrar no mercado é ainda maior do que o da O2O e da transmissão ao vivo da época.
3. A noite em que o divisor de águas apareceu de repente
Em junho, no Edifício Sohu em Pequim, esta empresa modelo em grande escala com mais financiamento está em pleno andamento.
A estrutura de aprendizado profundo Oneflow da tecnologia original de primeira classe ainda está pensando em continuar a fazê-lo, mas muitas pessoas foram transferidas pelo grande modelo de negócios. Mas em 23 de junho, alguém revelou repentinamente nas redes sociais que Wang Huiwen estava doente.Na época, alguém da empresa foi verificar, mas não recebeu essa notícia. No entanto, na noite do dia 25, a Meituan anunciou repentinamente que o co-fundador Wang Huiwen foi hospitalizado devido à depressão e renunciou ao cargo de diretor da empresa.
Por um tempo, a notícia de que Wang Huiwen fugiu cedo se tornou a adivinhação de algumas pessoas. A AI Whale Selection recebeu notícias do círculo de investidores de que a condição de Wang Huiwen era realmente grave. No final, o irmão de Wang Huiwen que dormia no beliche superior, Wang Xing, o fundador da Meituan, ajudou a assumir o negócio anos-luz de distância.
O grande modelo está realmente morto? Todo mundo tem essa pergunta. Durante esse período, Zhu Xiaohu, um conhecido investidor, e Fu Sheng, o fundador da Cheetah, também discutiam no círculo de amigos se havia uma bolha na indústria de modelos em grande escala. Zhu Xiaohu é extremamente pessimista sobre a situação atual do mercado reunindo-se para fazer modelos de grande escala de uso geral e acredita que a maioria deles morrerá até o final do ano.
A mudança ativa que está a anos-luz de distância também confirma as observações de Zhu Xiaohu?
De acordo com as informações obtidas da AI Whale Selection Agency, ** adquiriu a Meituan, que está a anos-luz de distância, e não parou o ritmo dos grandes modelos. ** Ele não apenas investiu exclusivamente várias centenas de milhões de yuans em Zhipu AI, mas também está recrutando um diretor de projeto para grandes modelos, com um salário anual de até 3 milhões de yuans, e até estabeleceu um instituto de pesquisa de tecnologia nos Estados Unidos. Estados. A Meituan, que ganha dinheiro suado, não quer ficar para trás nessa onda de tecnologia, principalmente depois que a Ele.me claramente quer se conectar ao modelo grande Tongyi, e a Ctrip, que tem concorrência comercial, também lançou um modelo grande .
Mas, para o mercado doméstico, existem muitos modelos grandes de uso geral. De acordo com estatísticas incompletas, em menos de 8 meses, mais de 85 grandes modelos foram lançados, muitos dos quais se tornaram conceitos de saque de empresas listadas.
De acordo com dados da Wind, em 2023, 24 "ações do conceito AIGC" sofreram um total de 67 reduções de participações, e a onda de divórcios dos principais acionistas também é incrível. **Desde o início de 2023, as famílias dos principais acionistas de quase dez empresas do setor de IA estão expostas ao divórcio. O que atraiu muita atenção é que a empresa de IA de ações A Kunlun Wanwei informou recentemente que a Sra. Li Qiong (ex-esposa do fundador Zhou Yahui), que responde por 11% das ações, planeja reduzir suas participações em 3 % das ações (cerca de 1,3 bilhão de yuans) e depois pagar os juros emprestados à empresa. De acordo com pessoas com conhecimento interno, Kunlun Wanwei, que sentiu os benefícios da AGI, não apenas fez modelos em grande escala, mas também formou uma equipe intensiva recentemente e fez de tudo para fazer o Copilot, que é uma referência contra a Microsoft.
As empresas listadas usam AGI para aproveitar o conceito de especulação e sacar. Startups de grandes modelos são introvertidas até a morte.
Zhang Yang, um investidor que estabeleceu recentemente o Fundo AIGC, disse-nos que com o advento do Llama 2 de código aberto, gratuito e poderoso, muitas empresas de grande porte inevitavelmente enfrentarão dificuldades de financiamento na segunda metade do ano. **
Agora tudo já está no horizonte. Em 11 de julho, a Baichuan Intelligent lançou o Baichuan-13B, um grande modelo com dezenas de bilhões de parâmetros. Ele não apenas anunciou que era de código aberto, mas também gratuito para uso comercial. Embora a escala de parâmetros do Baichuan-13B não seja grande, com base no treinamento preciso do corpus chinês, o Baichuan geralmente ocupa o primeiro lugar entre os grandes modelos com dezenas de bilhões de parâmetros.
A estratégia gratuita do Baichuan-13B teve um grande impacto no mercado pago de modelos de grande escala na China. Atualmente, Zhiyuan AI anunciou no dia 14 que o registro da empresa foi autorizado para permitir o uso comercial gratuito do ChatGLM-6B e ChatGLM2-6B.
Depois que mais e mais modelos grandes são de código aberto e gratuitos, a competição de nocaute mortal para modelos grandes começa oficialmente. Um CTO de uma empresa iniciante baseada em modelos de grande escala disse à AI Whale Selection Agency que os modelos de grande escala de Zhiyuan custaram 20 milhões de yuans desde a implantação inicial de domínio privado, e o preço de chamada no início do ano foi de 1,8 milhão para 300.000 embalagens A indústria está mudando muito rapidamente. Fu Sheng acredita que esta é a transição do mercado da competição de grandes parâmetros de modelo para a competição de escala ecológica.
As grandes empresas de Internet não estão preocupadas com a construção ecológica. Como existem muitos modelos internos, também existem modelos gratuitos e pagos. Os modelos grandes mais importantes ainda são de código fechado e pagos. É mais difícil para as empresas iniciantes estabelecer uma ecologia. Muitas empresas iniciantes esgotaram seus esforços para construir um modelo em grande escala e é inevitável que não consigam fazer a ecologia. Entende-se que a MiniMax é atualmente uma das poucas empresas start-up que adere à nuvem pública e é uma empresa de grande porte no modelo MaaS.
Fan Kai, CTO da Lilac Garden, descreveu essa onda de código aberto e gratuito, como trazer plantas aquáticas (modelos grandes) para as casas dos usuários de graça, para que todos tenham uma torneira. Para aquelas plantas aquáticas de fonte fechada, é melhor que sua água é invencível e deliciosa, todos estão dispostos a pagar para ir até você.
4. O desenvolvimento de AGI entra em uma bifurcação na estrada
Após o surgimento do divisor de águas, a atual competição empresarial desenvolveu três facções.
** Um grupo insiste em modelos grandes totalmente autodesenvolvidos e todos são jogadores capazes. **Esta facção é composta principalmente por grandes empresas de Internet como Baidu, Ali e Byte, bem como start-ups como Zhipu, MiniMAX e Lianyuan. Mas esses jogadores poderosos também estão divididos em dois tipos de empresas.
A primeira categoria é insistir em fazer modelos grandes de uso geral autodesenvolvidos, comparando com o ChatGPT e alcançando constantemente a velocidade de iteração do ChatGPT.
Na visão de Chen Yu, sócio-gerente da Yunqi Capital, os modelos de grande escala de propósito geral são o único caminho a percorrer, e o desenvolvimento de modelos verticais de grande escala é limitado. "Porque para o modelo grande geral, o campo vertical não precisa ser retreinado. O modelo grande geral pode ser aprofundado por meio do banco de dados de vetores, mas o modelo grande vertical é difícil de emergir de forma inteligente."
A julgar pela situação atual, quem tem um sonho deve fazer uma maquete de uso geral em grande escala, afinal ela pode se tornar a próxima grande empresa da Internet. O ChatGPT demonstrou esse potencial disruptivo nas áreas de escritório colaborativo, comércio eletrônico, geração de código e design auxiliar.
A segunda categoria é reconhecer a realidade, focar no pouso e insistir em fazer modelos verticais em grande escala. Este grupo inclui Zhu Xiaohu e Fu Sheng, que finalmente chegaram a um consenso. Ambos acreditam que os modelos verticais em grande escala terão mais aplicabilidade industrial.
Grandes modelos de propósito geral geralmente têm mais de 100 bilhões de parâmetros, enquanto grandes modelos verticais têm uma escala de cerca de 10 bilhões ou 7 bilhões. Os parâmetros do produto modelo em grande escala da Daguan Data, Cao Zhi, estão todos na faixa de 50 bilhões.
De acordo com Chen Yunwen, CEO da Daguan Data, disse à AI Jingxuan que o grande modelo "Cao Zhi" adota um esquema de dados de treinamento misto, que é 50% de corpo misto geral + 50% de corpo profissional vertical. "Fazemos inteligência de texto nas áreas de finanças e assuntos governamentais há muitos anos. Muitos dados são únicos e os clientes também nos pedem para fazer treinamento de privatização." Chen Yunwen disse à AI Whale Selection Agency: "No passado, quatro ou cinco pessoas usavam uma semana para fazer um relatório. , e agora a IA foi feita em meio dia."
Só desistindo do sonho de ser o próximo ChatGPT é que poderá aterrar o mais rapidamente possível na cena comercial, que é a sóbria cognição de muitos modelos verticais.
Do ponto de vista da indústria, a segunda rota para o templo da AGI é baseada em modelos de outras pessoas (como GPT)** e, em seguida, combinada com o know-how da própria indústria para treinamento. ** "Acho que levará tempo para verificar se a segunda categoria pode ter sucesso. Ainda não está claro. A razão é que todos ainda não sabem como integrar o know-how da indústria com o grande modelo. Ao mesmo tempo tempo, existe um modelo de negócio sustentável, que ainda é desconhecido.”
"Em particular, muitos modelos grandes são suspeitos de terem sido bombardeados", disse Zhang Yang, um investidor, à AI Whale Selection Agency. Ao combinar indústrias para comercialização, eles enfrentarão muitos problemas. É relatado que os grandes modelos de dois empresários conhecidos com o mesmo sobrenome são baseados no Llama de código aberto do Facebook; uma empresa de jogos e proteção usa a estrutura básica do grande modelo de Zhiyuan.
Um modelo de código aberto mais forte está chegando. A Meta lançou recentemente uma versão comercial gratuita Llama 2. Fu Sheng disse no círculo de amigos: "Não sei quantas empresas acordaram rindo no meio da noite, quantas empresas desmaiaram no banheiro.... "Zhu Xiaohu também comentou sobre isso: Muitas pessoas estão prestes a acordar, todos podem pegar uma carona."
O "acordar com um sorriso" de Fu Sheng é um pouco diferente do de Zhu Xiaohu. Fu Shengxiaoxing refere-se a empresas que usam grandes modelos de código aberto para desenvolver aplicativos AIGC e também podem produzir produtos melhores. Zhu Xiaohu Xiaoxing refere-se a empresas modelo de grande escala que afirmam ser autodesenvolvidas, mas na verdade cobrem suas conchas. Recentemente , eles anunciarão uma atualização. O que todos se referem é o mesmo. São todas empresas de modelos em grande escala que afirmam ser autodesenvolvidas. Llama 2, um dos mais poderosos modelos estrangeiros em grande escala, anunciou que é de código aberto e gratuito. Todos são baseados no mesmo modelo grande de código aberto. Como criar capacidades únicas na indústria?
**A terceira via do AGI é a aplicação pura, que é usar o modelo diretamente, que terá barreiras menores. **Zhu Xiaohu também não está otimista com esse tipo de modelo, pensando que se 90% dos recursos forem fornecidos pelo ChatGPT, os aplicativos AIGC não terão valor de investimento.
No ecossistema OpenAI, Sam Altman prometeu evitar ao máximo fazer a camada de aplicativos e competir com os desenvolvedores do ecossistema, então ele imitou o Google e criou o plug-in ChatGPT. Do ponto de vista atual, ninguém na China assumiu esse compromisso .
Houve centenas de atualizações de funções para Wenxinyiyan e Tongyiqianwen, e essas funções também cobriram o trabalho de alguns desenvolvedores. Embora o Wenxin Yiyan também tenha plug-ins, atualmente existem apenas dois, um é o Baidu Search e o outro é o ChatFile (a capacidade de analisar e processar documentos longos). Como coordenar o desenvolvimento ecológico de Baidu Qianfan e Alimodao ainda é uma proposta desafiadora.
Zhu Xiaohu, que está firmemente otimista sobre o AGI, acredita que a janela de empreendedorismo e investimento para modelos de grande escala de uso geral já passou, e o AIGC, que não depende absolutamente das capacidades de um determinado modelo de grande escala, é o baixo -fruto pendurado da era AGI. Por exemplo, a "Câmera Miaoya", que de repente se tornou popular no círculo de amigos recentemente, é o primeiro produto AIGC a se popularizar na China, e um produto similar "lensa" também se tornou popular no exterior, com uma renda mensal de US$ 8 milhões.
Quando a onda dos tempos chegou, o investidor Wu Shichun uma vez perguntou brincando a Zhu Xiaohu: "O dinheiro ganho com o investimento em IA compensou o dinheiro perdido com o investimento em SaaS?" Zhu Xiaohu respondeu, ainda não, mas a IA tem perspectivas ilimitadas .
Atualmente, o círculo de capital de risco também reconhece a verdade expressa por Zhu Xiaohu, mas muitas pessoas não esperam que Zhu Xiaohu diga a verdade, como "ChatGPT é muito hostil para empresas iniciantes, desista de ilusões de financiamento nos próximos dois a três anos" Essas palavras arrepiantes.
**"O grande modelo é a propriedade real da Internet, mesmo que haja uma bolha, é uma bela bolha", ** disse um empresário que acabou de terminar a educação e treinamento vocacional em IA. Lei Jun uma vez gritou quando o O dividendo da Internet desapareceu em 2013, devemos acreditar no poder da Internet, hoje também temos que acreditar na AGI, não importa se tem bolha ou não.
Nota: Li Ming, Zhang Cong, Zhao Hui, etc. são pseudônimos neste artigo.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
300 dias de empreendedorismo em grande escala: o vencedor é avaliado em 10 bilhões e 80% dos perdedores estão fora
Fonte: AI Whale Selection Agency
Autor: Yang Xiaohe
Em 2023, a notícia de que a conhecida instituição de investimentos Tiger Fund não conseguiu captar recursos se espalhou silenciosamente pela Internet.
Nos últimos 10 anos, quando me acostumei a abrir um negócio ao vento, parece que o “inverno do investidor” apareceu pela primeira vez. Isso está intimamente relacionado a vários fatores desfavoráveis, como novos consumos, transmissão ao vivo e Metaverso. Os canais de saída, como fusões e aquisições e ações de conceito chinesas, estão meio fechados. O mercado de capital de risco parece realmente deserto.
É difícil para as empresas iniciantes levantar fundos e é difícil para o chefe encontrar uma direção para seu segundo empreendimento. Wang Huiwen, que se aposentou da Meituan, estudou Web3 e Metaverse por muito tempo. Wang Xiaochuan, que deixou a empresa após ser adquirido pela Tencent, testou as águas dos cuidados médicos da IA. Mas tudo mudou no final de 2022, quando foi lançado o ChatGPT 3.5, que rapidamente formou um consenso no mercado, chegou a era da AGI (inteligência artificial geral) e toda a indústria começou a se deparar com modelos em grande escala.
Entende-se que Wang Xiaochuan, que estava iniciando um negócio discreto na época, já havia estabelecido uma empresa para fabricar hardware inteligente. Destina-se a ajudar centenas de milhões de pessoas com distúrbios do sono, para criar um travesseiro inteligente para tratar o ronco. Quando o surgimento de modelos em grande escala surgiu em março, Wang Xiaochuan passou duas semanas tomando a decisão de encerrar esse projeto empresarial e projetar modelos em grande escala.
Wang Xiaochuan recrutou o ex-Sogou CTO Yang Hongtao para ajudar a assumir o projeto médico.As ações do ex-Sogou COO Ru Liyun nesta empresa também foram trocadas por Yang Hongtao, seguindo o modelo de negócios em larga escala de Wang Xiaochuan. Wang Xiaochuan gastou um total de 50 milhões de dólares americanos para estabelecer o "Baichuan Smart" e convidou os talentos técnicos da Soul para serem os responsáveis pelo algoritmo para acelerar a produção de modelos grandes. E a história de Wang Huiwen, todos estão muito familiarizados com ela.Postagens de recrutamento de heróis foram colocadas na mesa de vinho e uma empresa anos-luz de distância foi estabelecida para fazer um grande modelo.
Nas grandes empresas de Internet, o grande modelo também trouxe uma influência de abalar a terra. O responsável pelo projeto com uma grande modelo propôs demissão há alguns anos por causa do problema de não ser promovido. Três meses depois, o CEO do grupo tornou-se o gerente geral do modelo grande, usando a força da empresa para All no modelo grande.
Ninguém quer perder esta onda da era AGI, todos acreditam que depois de três altos e baixos no desenvolvimento da IA, a singularidade da inteligência artificial geral está chegando. Afinal, sob o boom da IA, empresas com dezenas de funcionários como ChatGPT e Midjourney criaram uma avaliação de cerca de US$ 4 bilhões. O valor total de mercado das "Big Seven" no mercado de ações dos EUA disparou para US$ 11 trilhões ao ano, um aumento de 60%. Essas histórias emocionantes de crescimento explosivo mais uma vez agitaram o mercado doméstico de negócios de tecnologia.
Entre as principais empresas de Internet da China, Li Yanhong, Zhang Yong, Zhang Yiming, Wang Xing e outros grandes nomes já assumiram pessoalmente o comando.Pode-se dizer que, exceto Pinduoduo, todos eles entraram no grande modelo. Assim como em 19 de julho, o valor de mercado da Microsoft e da Nvidia aumentou US$ 175 bilhões, exclamou Musk ao comentar tweets relacionados: "Tempos loucos".
1. Um novo amanhecer no vale
Li Ming é o CEO de uma empresa iniciante com uma equipe de mais de 100 pessoas. 2023 é o ano em que ele mais se preocupa com o financiamento.
O processo de iniciar um negócio foi muito tranquilo no início e obteve financiamento angel e A-round de instituições de investimento angel bem conhecidas no estágio inicial. "Naquela época, a Internet Industrial ainda era uma faixa popular e não era tão exagerada quanto muitos projetos de IA." Li Ming disse a AI Jingxuan, mas em meados de 2023, na nova rodada de financiamento que lançou, ele lentamente descobriu que o mercado não estava certo.
**Instituições de investimento não apenas analisam dados e histórias, mas também analisam receitas. ** Li Ming, que antes era obcecado pela produção, não percebeu a mudança na direção do vento do investimento. Nas palavras de Wu Shichun, sócio fundador da Plum Blossom Venture Capital, os atuais projetos de investimento “exigem não apenas (tecnologia), mas também (dados) e (receita)”. De jeito nenhum, ele começou a procurar instituições da FA para ajudar no financiamento, e as rodadas de financiamento também regrediram, pedindo um A++.
“A FA ajudou a encontrar mais de 30 instituições de investimento, mas nada aconteceu.” O fracasso do financiamento deixou Li Ming um pouco desanimado. Mas em junho, ele sentiu o poder do grande modelo, então lançou um negócio industrializado baseado no ChatGPT internamente. "Ainda não levantamos fundos, mas os investidores tomarão a iniciativa de se comunicar com eles, e a outra parte está obviamente interessada."
Para a tecnologia de primeira classe de Yuan Jinhui, o modelo grande também é um canudo que salva vidas. Em 2022, esta empresa, que fabrica a estrutura de aprendizado profundo da IA, atingiu o ponto em que o financiamento não é tranquilo e precisa demitir funcionários para sobreviver. A empresa esteve prestes a quebrar sua cadeia de capital três vezes antes, e todos eles pediram dinheiro emprestado a Su Hua, um investidor anjo que também era o CEO da Kuaishou na época.
"O que fazemos é semelhante ao Flying Paddle da Baidu e ao Shengsi da Huawei. O mais importante é que o negócio de treinamento de modelos em grande escala no mercado ainda não começou." empresa pertence ao tempo em que é rico (2021) ) não tem negócios, e quando há negócios (2023), não haverá dinheiro.
Justamente quando Yuan Jinhui sentiu que o futuro era desesperador, a empresa inaugurou uma oportunidade de aquisição em 2023. Em abril de 2023, na empresa de tecnologia de primeira classe do Tsinghua Science and Technology Park, um ilustre convidado foi recebido: Wang Huiwen, cofundador da Meituan, que acabava de anunciar sua entrada no modelo em grande escala.
O preço de compra final não foi ruim. Um funcionário de tecnologia de primeira classe demitido nos disse: "É comparável à avaliação da última rodada de investimento da Hillhouse Capital, e minhas próprias opções também foram liquidadas."
E Yuan Jinhui, que se tornou o cofundador da Light Years Away, finalmente não precisa mais se preocupar com financiamento. A capacidade de financiamento de Wang Huiwen é inigualável no atual círculo de capital de risco. De acordo com o contrato de aquisição subsequente da Meituan, a Light Years Away levantou 2 bilhões de yuans sem produtos modelo em grande escala.
É claro que os investidores que se posicionaram no início dessa onda de ação caçaram unicórnios com sucesso. **
A Minimax foi fundada em novembro de 2021, recebeu um investimento angel round em janeiro de 2022 e a avaliação da empresa atingiu o nível de unicórnio no início de 2023. Entre as primeiras quatro instituições de investimento, há também a empresa de jogos de Xangai Mihayou.É relatado que os dois executivos fundadores têm laços familiares. De acordo com o Jingxuan News, Zhipu também levantou recentemente fundos avaliados em 10 bilhões de yuans.
Essas duas empresas foram estabelecidas há menos de 2 anos, mas ambas se tornaram unicórnios, e a velocidade de desenvolvimento da pista de modelo grande é incrível.
E o boom da AGI também é uma salvação para aquelas antigas empresas de IA. Anteriormente, a história de sair para perguntar sobre a listagem de IoT passou várias vezes sem sucesso. Com o lançamento da história do modelo em grande escala "Serial Monkey" e quatro produtos AIGC, embora o modelo em grande escala ainda seja cuidadoso para não ser avaliado publicamente, também permite que Momenwen finalmente tenha uma nova história para contar, e o pedido de listagem na bolsa de valores de Hong Kong foi submetido.
Mais modelos de grande escala e empreendedores de AIGC estão na estrada. Mesmo em um acampamento de startups, 60% dos projetos estão relacionados à IA. Com as vantagens de ativos leves, altas barreiras e tetos altos, AGI se tornou completamente o jogo mais quente no momento. estrada.
2. Faça do sonho da AGI o pico
Se 2023 é o "primeiro ano" do empreendedorismo modelo em grande escala. Então, o "ano da fonte", quando os gigantes da Internet entraram pela primeira vez no grande modelo, pode ser rastreado até 2019.
Ali começou a projetar o modelo grande em setembro de 2019 e lançou o modelo grande PLUG em abril de 2021. Antes do lançamento do ChatGPT 3.0, já havia muitos modelos grandes com trilhões de parâmetros na China, como o M6 da Bodhidharma Academy, o modelo grande Pangu da Huawei Cloud e o Enlightenment 2.0 da Zhiyuan. Comparado com o ChatGPT, embora os parâmetros do modelo sejam superados, a abundância de dados não é a mesma e o efeito não pode ser comparado. De acordo com Zhang Cong, do Dharma Institute, o mais importante é que os grandes modelos domésticos comecem de manhã cedo e recuperar o atraso à noite, duas coisas.
A primeira coisa é que o alinhamento não é feito. ** Naquela época, Ali tinha muitos modelos grandes e pequenos e, principalmente, não alinhava os resultados do treinamento. "Você pode ver que o ChatGPT pode compor poemas e conversar, o que é muito semelhante à inteligência humana. Na verdade, está alinhado com os valores humanos." Disse Zhang Cong, tudo isso requer ajustes artificiais nos resultados do raciocínio, em vez da lógica da máquina .
Em segundo lugar, ** não produziu conjuntos de dados de alta qualidade**. O ChatGPT usou professores universitários nas Filipinas para rotular dados nos primeiros dias, enquanto alunos de escolas secundárias técnicas nacionais foram usados para rotulagem. O problema do corpus também afetou muito os resultados . Na visão de Zhang Cong, o modelo de bate-papo ajustado do Llama 2 lançado em 19 de julho foi treinado em 1 milhão de dados rotulados por humanos, e o número total de tokens de treinamento aumentou em 40%. Comparado com o Llama, a melhoria é geral . "Portanto, o modelo grande não é uma invenção que trabalha duro para criar milagres, mas uma criação de engenharia bem projetada."
E, olhando para trás, para a indústria doméstica de IA, ela também enfrentará a interferência de muitos outros fatores. Naquela época, a Bodhidharma Academy tinha duas equipes principais trabalhando em grandes modelos, uma era a equipe de inteligência de máquina liderada por Jin Rong e Si Luo estava a cargo de AliciMind; a outra era o laboratório de linguagem natural liderado por Zhou Jingren, do qual Yang Hongxia estava a cargo do grande modelo M6.
Na avaliação no final de 2022, os resultados do modelo grande M6 têm uma ligeira vantagem e os dois são finalmente integrados ao modelo grande Tongyi atual. "Na verdade, há apenas 20 ou 30 pessoas na grande equipe modelo do Dharma Institute, e o pré-treinamento é principalmente colocado no Alibaba Cloud." Zhang Cong disse à AI Whale Selection Agency, mas agora Tongyi é um projeto importante do grupo , e envolve Existem mais de 600 pessoas e muitos recursos agora são dedicados a modelos grandes. O CEO do grupo pergunta sobre o progresso técnico a cada 2 semanas.
Para o Baidu, essa onda de boom da AGI, mas a era da IA que ele previu desde 2016, naturalmente não perderá.
Foi oficialmente aprovado internamente em 7 de fevereiro deste ano e lançado oficialmente em 16 de março. Durante este período, foi promovido diretamente ao projeto de maior prioridade do Grupo Baidu. Li Yanhong supervisionou pessoalmente a batalha, e o CTO Dr. Wang Haifeng assumiu diretamente o comando. Naquela época, o Centro de Supercomputação Baidu Yangquan era dedicado ao treinamento de modelos em grande escala .
O engenheiro de algoritmo do Baidu, Zhao Hui, disse à AI Whale que o departamento de processamento de linguagem natural do Baidu tem pesquisado NLP e outras tecnologias, e o cientista-chefe Wu Hua sempre foi o líder. Existem centenas de pessoas neste departamento. O ERNIE2.0 do Baidu foi transformado em um modelo grande de Wenxin: "Eu costumava fazer cérebros de Baidu, mas agora dizem que é um modelo grande de Wenxin."
Existem semelhanças no que eles fazem, mas é claro que existem diferenças. Zhao Hui mencionou que, no passado, o Baidu faria muita pesquisa vertical Rank, apenas para reordenar os resultados da pesquisa com base em cliques humanos. Após o surgimento do modelo grande, essas capacidades serão depositadas no algoritmo do modelo grande, o que também ajudará a dar respostas mais precisas.
Para o Baidu, o modelo grande promove mudanças qualitativas na próxima geração de busca, que foi escrita no OKR de Robin Li. No entanto, em termos de ecologia, o modelo Wenxin do Baidu é baseado no modelo Bert. "O GLM, incluindo o de Zhiyuan, é uma rota técnica independente, diferente do GPT internacional". não precisa se preocupar com isso Wenxin Qianfan tem todos os tipos de modelos, e GPT2, 3 e 4 também são muito diferentes.
Quanto a Yang Hongxia, que se demitiu de Ali, ela também foi contratada pela ByteDance para ser a chefe de pesquisa e desenvolvimento de grandes modelos norte-americanas depois que ela foi para o exterior. Zhang Yiming tem pesquisado se o modelo grande será de código aberto ou fechado, então ele não pediu para se concentrar no trabalho. “Haverá um avanço real antes do final do ano”, disse Yang Hongxia à AI Whale Selection Agency.
No geral, a ByteDance deve ser uma empresa que melhor corresponda ao grande modelo de negócios depois do Baidu. Alguns headhunters nos disseram que, embora o modelo grande não tenha pressa, ainda é bastante agressivo no campo do AIGC. Por exemplo, TikTok está fazendo negócios criativos de publicidade AIGC, a posição de diretor dá um orçamento de 100 a 150 W e o requisito é liderar a equipe após 1988.
**Até agora, exceto Pinduoduo, todas as grandes empresas de Internet entraram no modelo grande. **O entusiasmo dos grandes fabricantes em entrar no mercado é ainda maior do que o da O2O e da transmissão ao vivo da época.
3. A noite em que o divisor de águas apareceu de repente
Em junho, no Edifício Sohu em Pequim, esta empresa modelo em grande escala com mais financiamento está em pleno andamento.
A estrutura de aprendizado profundo Oneflow da tecnologia original de primeira classe ainda está pensando em continuar a fazê-lo, mas muitas pessoas foram transferidas pelo grande modelo de negócios. Mas em 23 de junho, alguém revelou repentinamente nas redes sociais que Wang Huiwen estava doente.Na época, alguém da empresa foi verificar, mas não recebeu essa notícia. No entanto, na noite do dia 25, a Meituan anunciou repentinamente que o co-fundador Wang Huiwen foi hospitalizado devido à depressão e renunciou ao cargo de diretor da empresa.
Por um tempo, a notícia de que Wang Huiwen fugiu cedo se tornou a adivinhação de algumas pessoas. A AI Whale Selection recebeu notícias do círculo de investidores de que a condição de Wang Huiwen era realmente grave. No final, o irmão de Wang Huiwen que dormia no beliche superior, Wang Xing, o fundador da Meituan, ajudou a assumir o negócio anos-luz de distância.
O grande modelo está realmente morto? Todo mundo tem essa pergunta. Durante esse período, Zhu Xiaohu, um conhecido investidor, e Fu Sheng, o fundador da Cheetah, também discutiam no círculo de amigos se havia uma bolha na indústria de modelos em grande escala. Zhu Xiaohu é extremamente pessimista sobre a situação atual do mercado reunindo-se para fazer modelos de grande escala de uso geral e acredita que a maioria deles morrerá até o final do ano.
A mudança ativa que está a anos-luz de distância também confirma as observações de Zhu Xiaohu?
De acordo com as informações obtidas da AI Whale Selection Agency, ** adquiriu a Meituan, que está a anos-luz de distância, e não parou o ritmo dos grandes modelos. ** Ele não apenas investiu exclusivamente várias centenas de milhões de yuans em Zhipu AI, mas também está recrutando um diretor de projeto para grandes modelos, com um salário anual de até 3 milhões de yuans, e até estabeleceu um instituto de pesquisa de tecnologia nos Estados Unidos. Estados. A Meituan, que ganha dinheiro suado, não quer ficar para trás nessa onda de tecnologia, principalmente depois que a Ele.me claramente quer se conectar ao modelo grande Tongyi, e a Ctrip, que tem concorrência comercial, também lançou um modelo grande .
Mas, para o mercado doméstico, existem muitos modelos grandes de uso geral. De acordo com estatísticas incompletas, em menos de 8 meses, mais de 85 grandes modelos foram lançados, muitos dos quais se tornaram conceitos de saque de empresas listadas.
De acordo com dados da Wind, em 2023, 24 "ações do conceito AIGC" sofreram um total de 67 reduções de participações, e a onda de divórcios dos principais acionistas também é incrível. **Desde o início de 2023, as famílias dos principais acionistas de quase dez empresas do setor de IA estão expostas ao divórcio. O que atraiu muita atenção é que a empresa de IA de ações A Kunlun Wanwei informou recentemente que a Sra. Li Qiong (ex-esposa do fundador Zhou Yahui), que responde por 11% das ações, planeja reduzir suas participações em 3 % das ações (cerca de 1,3 bilhão de yuans) e depois pagar os juros emprestados à empresa. De acordo com pessoas com conhecimento interno, Kunlun Wanwei, que sentiu os benefícios da AGI, não apenas fez modelos em grande escala, mas também formou uma equipe intensiva recentemente e fez de tudo para fazer o Copilot, que é uma referência contra a Microsoft.
As empresas listadas usam AGI para aproveitar o conceito de especulação e sacar. Startups de grandes modelos são introvertidas até a morte.
Zhang Yang, um investidor que estabeleceu recentemente o Fundo AIGC, disse-nos que com o advento do Llama 2 de código aberto, gratuito e poderoso, muitas empresas de grande porte inevitavelmente enfrentarão dificuldades de financiamento na segunda metade do ano. **
Agora tudo já está no horizonte. Em 11 de julho, a Baichuan Intelligent lançou o Baichuan-13B, um grande modelo com dezenas de bilhões de parâmetros. Ele não apenas anunciou que era de código aberto, mas também gratuito para uso comercial. Embora a escala de parâmetros do Baichuan-13B não seja grande, com base no treinamento preciso do corpus chinês, o Baichuan geralmente ocupa o primeiro lugar entre os grandes modelos com dezenas de bilhões de parâmetros.
A estratégia gratuita do Baichuan-13B teve um grande impacto no mercado pago de modelos de grande escala na China. Atualmente, Zhiyuan AI anunciou no dia 14 que o registro da empresa foi autorizado para permitir o uso comercial gratuito do ChatGLM-6B e ChatGLM2-6B.
Depois que mais e mais modelos grandes são de código aberto e gratuitos, a competição de nocaute mortal para modelos grandes começa oficialmente. Um CTO de uma empresa iniciante baseada em modelos de grande escala disse à AI Whale Selection Agency que os modelos de grande escala de Zhiyuan custaram 20 milhões de yuans desde a implantação inicial de domínio privado, e o preço de chamada no início do ano foi de 1,8 milhão para 300.000 embalagens A indústria está mudando muito rapidamente. Fu Sheng acredita que esta é a transição do mercado da competição de grandes parâmetros de modelo para a competição de escala ecológica.
As grandes empresas de Internet não estão preocupadas com a construção ecológica. Como existem muitos modelos internos, também existem modelos gratuitos e pagos. Os modelos grandes mais importantes ainda são de código fechado e pagos. É mais difícil para as empresas iniciantes estabelecer uma ecologia. Muitas empresas iniciantes esgotaram seus esforços para construir um modelo em grande escala e é inevitável que não consigam fazer a ecologia. Entende-se que a MiniMax é atualmente uma das poucas empresas start-up que adere à nuvem pública e é uma empresa de grande porte no modelo MaaS.
Fan Kai, CTO da Lilac Garden, descreveu essa onda de código aberto e gratuito, como trazer plantas aquáticas (modelos grandes) para as casas dos usuários de graça, para que todos tenham uma torneira. Para aquelas plantas aquáticas de fonte fechada, é melhor que sua água é invencível e deliciosa, todos estão dispostos a pagar para ir até você.
4. O desenvolvimento de AGI entra em uma bifurcação na estrada
Após o surgimento do divisor de águas, a atual competição empresarial desenvolveu três facções.
** Um grupo insiste em modelos grandes totalmente autodesenvolvidos e todos são jogadores capazes. **Esta facção é composta principalmente por grandes empresas de Internet como Baidu, Ali e Byte, bem como start-ups como Zhipu, MiniMAX e Lianyuan. Mas esses jogadores poderosos também estão divididos em dois tipos de empresas.
A primeira categoria é insistir em fazer modelos grandes de uso geral autodesenvolvidos, comparando com o ChatGPT e alcançando constantemente a velocidade de iteração do ChatGPT.
Na visão de Chen Yu, sócio-gerente da Yunqi Capital, os modelos de grande escala de propósito geral são o único caminho a percorrer, e o desenvolvimento de modelos verticais de grande escala é limitado. "Porque para o modelo grande geral, o campo vertical não precisa ser retreinado. O modelo grande geral pode ser aprofundado por meio do banco de dados de vetores, mas o modelo grande vertical é difícil de emergir de forma inteligente."
A julgar pela situação atual, quem tem um sonho deve fazer uma maquete de uso geral em grande escala, afinal ela pode se tornar a próxima grande empresa da Internet. O ChatGPT demonstrou esse potencial disruptivo nas áreas de escritório colaborativo, comércio eletrônico, geração de código e design auxiliar.
A segunda categoria é reconhecer a realidade, focar no pouso e insistir em fazer modelos verticais em grande escala. Este grupo inclui Zhu Xiaohu e Fu Sheng, que finalmente chegaram a um consenso. Ambos acreditam que os modelos verticais em grande escala terão mais aplicabilidade industrial.
Grandes modelos de propósito geral geralmente têm mais de 100 bilhões de parâmetros, enquanto grandes modelos verticais têm uma escala de cerca de 10 bilhões ou 7 bilhões. Os parâmetros do produto modelo em grande escala da Daguan Data, Cao Zhi, estão todos na faixa de 50 bilhões.
De acordo com Chen Yunwen, CEO da Daguan Data, disse à AI Jingxuan que o grande modelo "Cao Zhi" adota um esquema de dados de treinamento misto, que é 50% de corpo misto geral + 50% de corpo profissional vertical. "Fazemos inteligência de texto nas áreas de finanças e assuntos governamentais há muitos anos. Muitos dados são únicos e os clientes também nos pedem para fazer treinamento de privatização." Chen Yunwen disse à AI Whale Selection Agency: "No passado, quatro ou cinco pessoas usavam uma semana para fazer um relatório. , e agora a IA foi feita em meio dia."
Só desistindo do sonho de ser o próximo ChatGPT é que poderá aterrar o mais rapidamente possível na cena comercial, que é a sóbria cognição de muitos modelos verticais.
Do ponto de vista da indústria, a segunda rota para o templo da AGI é baseada em modelos de outras pessoas (como GPT)** e, em seguida, combinada com o know-how da própria indústria para treinamento. ** "Acho que levará tempo para verificar se a segunda categoria pode ter sucesso. Ainda não está claro. A razão é que todos ainda não sabem como integrar o know-how da indústria com o grande modelo. Ao mesmo tempo tempo, existe um modelo de negócio sustentável, que ainda é desconhecido.”
"Em particular, muitos modelos grandes são suspeitos de terem sido bombardeados", disse Zhang Yang, um investidor, à AI Whale Selection Agency. Ao combinar indústrias para comercialização, eles enfrentarão muitos problemas. É relatado que os grandes modelos de dois empresários conhecidos com o mesmo sobrenome são baseados no Llama de código aberto do Facebook; uma empresa de jogos e proteção usa a estrutura básica do grande modelo de Zhiyuan.
Um modelo de código aberto mais forte está chegando. A Meta lançou recentemente uma versão comercial gratuita Llama 2. Fu Sheng disse no círculo de amigos: "Não sei quantas empresas acordaram rindo no meio da noite, quantas empresas desmaiaram no banheiro.... "Zhu Xiaohu também comentou sobre isso: Muitas pessoas estão prestes a acordar, todos podem pegar uma carona."
O "acordar com um sorriso" de Fu Sheng é um pouco diferente do de Zhu Xiaohu. Fu Shengxiaoxing refere-se a empresas que usam grandes modelos de código aberto para desenvolver aplicativos AIGC e também podem produzir produtos melhores. Zhu Xiaohu Xiaoxing refere-se a empresas modelo de grande escala que afirmam ser autodesenvolvidas, mas na verdade cobrem suas conchas. Recentemente , eles anunciarão uma atualização. O que todos se referem é o mesmo. São todas empresas de modelos em grande escala que afirmam ser autodesenvolvidas. Llama 2, um dos mais poderosos modelos estrangeiros em grande escala, anunciou que é de código aberto e gratuito. Todos são baseados no mesmo modelo grande de código aberto. Como criar capacidades únicas na indústria?
**A terceira via do AGI é a aplicação pura, que é usar o modelo diretamente, que terá barreiras menores. **Zhu Xiaohu também não está otimista com esse tipo de modelo, pensando que se 90% dos recursos forem fornecidos pelo ChatGPT, os aplicativos AIGC não terão valor de investimento.
No ecossistema OpenAI, Sam Altman prometeu evitar ao máximo fazer a camada de aplicativos e competir com os desenvolvedores do ecossistema, então ele imitou o Google e criou o plug-in ChatGPT. Do ponto de vista atual, ninguém na China assumiu esse compromisso .
Houve centenas de atualizações de funções para Wenxinyiyan e Tongyiqianwen, e essas funções também cobriram o trabalho de alguns desenvolvedores. Embora o Wenxin Yiyan também tenha plug-ins, atualmente existem apenas dois, um é o Baidu Search e o outro é o ChatFile (a capacidade de analisar e processar documentos longos). Como coordenar o desenvolvimento ecológico de Baidu Qianfan e Alimodao ainda é uma proposta desafiadora.
Zhu Xiaohu, que está firmemente otimista sobre o AGI, acredita que a janela de empreendedorismo e investimento para modelos de grande escala de uso geral já passou, e o AIGC, que não depende absolutamente das capacidades de um determinado modelo de grande escala, é o baixo -fruto pendurado da era AGI. Por exemplo, a "Câmera Miaoya", que de repente se tornou popular no círculo de amigos recentemente, é o primeiro produto AIGC a se popularizar na China, e um produto similar "lensa" também se tornou popular no exterior, com uma renda mensal de US$ 8 milhões.
Quando a onda dos tempos chegou, o investidor Wu Shichun uma vez perguntou brincando a Zhu Xiaohu: "O dinheiro ganho com o investimento em IA compensou o dinheiro perdido com o investimento em SaaS?" Zhu Xiaohu respondeu, ainda não, mas a IA tem perspectivas ilimitadas .
Atualmente, o círculo de capital de risco também reconhece a verdade expressa por Zhu Xiaohu, mas muitas pessoas não esperam que Zhu Xiaohu diga a verdade, como "ChatGPT é muito hostil para empresas iniciantes, desista de ilusões de financiamento nos próximos dois a três anos" Essas palavras arrepiantes.
**"O grande modelo é a propriedade real da Internet, mesmo que haja uma bolha, é uma bela bolha", ** disse um empresário que acabou de terminar a educação e treinamento vocacional em IA. Lei Jun uma vez gritou quando o O dividendo da Internet desapareceu em 2013, devemos acreditar no poder da Internet, hoje também temos que acreditar na AGI, não importa se tem bolha ou não.
Nota: Li Ming, Zhang Cong, Zhao Hui, etc. são pseudônimos neste artigo.