Com 2,5 bilhões de yuans, Zhipu AI não pode mais manter um perfil discreto

Fonte do artigo: 36 Krypton

No contexto da narrativa atual de grandes modelos, Zhipu AI tem que aprender a se acostumar a ficar no centro das atenções.

Fonte da imagem: Gerada por Unbounded AI

01 IA do espectro da sabedoria, em destaque

Mais de 2,5 bilhões de yuans, que é a quota de financiamento acumulada obtida pela Beijing Zhipu Huazhang Technology Co., Ltd. (doravante referida como Zhipu AI) este ano, e também se tornou uma das maiores start-ups modelo com o maior financiamento público na China.

Após o lançamento do ChatGPT, o boom tecnológico desencadeado por grandes modelos rapidamente se transformou em um boom de investimentos. Mas, ao contrário do que acontecia no passado, é amplamente reconhecido que esta é uma trilha mais importante, tanto para investidores quanto para startups.

Por um lado, nesta fase, o empreendedorismo de grande modelo depende fortemente de recursos pesados e fundos fortes, e o número de empresas em fase de arranque que têm a capacidade de entrar no mercado é pequeno e os investidores podem licitar muito menos;

Por outro lado, a maioria das pessoas acredita que o grande modelo é uma oportunidade comparável ou mesmo superior à Internet, a valorização das empresas está a aumentar e investidores e instituições bem conhecidos têm de "comprar em grupos".

De acordo com a 36Kr, o valor de financiamento anunciado oficialmente pela Zhipu AI ainda é uma estimativa conservadora, e ainda há financiamento em discussão.

De 2019 a 2023, o montante total de financiamento em três rodadas de quatro anos de Zhipu AI ultrapassou 3 bilhões de RMB. Desde o início deste ano, tanto a frequência como o montante do financiamento já ultrapassaram largamente o número anterior.

Em 2019, a Zhipu AI foi oficialmente estabelecida, com investidores da rodada Pré-A, incluindo China Science and Technology Chuangxing e Tsinghua Holdings, investidores da Série A, incluindo Dachen Caizhi e China Holdings Fund, e investidores da Série B, incluindo Legend Capital, Qiming Venture Capital, etc.

De acordo com as informações divulgadas pela Zhipu AI, seus participantes de investimento incluem principalmente o fundo de segurança social Zhongguancun Independent Innovation Fund (Legend Capital é o gestor do fundo), Meituan, Ant, Ali, Tencent, Xiaomi, Kingsoft, Shunwei, Boss Zhipin, Good Future, Sequoia, Hillhouse e outras instituições e alguns acionistas antigos, incluindo a Legend Capital.

Fonte: IT Orange

Como uma grande startup modelo, Zhipu AI tem uma lista invejável de investidores, Zhipu AI não carece de fontes de financiamento, o capital tem um rosto, muitos investidores disseram, "Agora é definitivamente Zhipu que seleciona investidores, não o contrário." "

Atualmente, muitas grandes startups modelo do setor têm obtido alto financiamento, e não falta dinheiro no mercado para investir em grandes modelos, mas se tomar ou não, como tomar, é o que as grandes startups modelo devem considerar mais.

Analisando a lista de investidores da Zhipu AI, pode-se ver que os fundos não são a única consideração, o valor representado por trás dos fundos pode dar diferentes recursos para startups de grande porte.

Por exemplo, o fundo de segurança social Zhongguancun Independent Innovation Fund. Na conferência de imprensa das principais realizações científicas e tecnológicas do Fórum de Zhongguancun de 2023, realizada no final de maio deste ano, a Fundação da Segurança Social anunciou que vai criar o "Fundo de Segurança Social Zhongguancun Independent Innovation Special Fund", que tem o atributo de identidade de "equipa nacional", com uma escala inicial de 5 mil milhões de yuans e um período de fundo de mais de 10 anos, mostrando características de fundo de longo prazo.

Outro exemplo é Meituan, Ant, Ali e Tencent e outros gigantes da Internet, não só pode trazer fundos ricos, mas também significa potencial cooperação industrial, muitos negócios da Internet têm o potencial de se transformar com base em grandes modelos, o grande modelo básico de Zhipu AI pode acessar dados enormes, cenários de negócios, etc., que é a parte que falta de muitas start-ups.

No contexto da narrativa atual do grande modelo, Zhipu AI tem que aprender a se acostumar a ficar no centro das atenções, o que não é muito consistente com o estilo discreto de Zhipu AI o tempo todo.

02 A fumaça da grande modelo está queimando há muito tempo

ChatGPT fora do círculo é o momento de singularidade da AIGC, com isso como o ponto de divisão pode claramente dividir duas etapas, algumas grandes empresas ou startups já fizeram pré-pesquisa técnica ou estabeleceram novas empresas para se concentrar em grandes modelos quando o grande modelo mostra suas sementes, e uma proporção considerável de empresas são claramente vistas ChatGPT antes de tomar suas decisões para fazer um modelo grande.

Isso leva a diferenças cognitivas que podem levar a resultados diferentes.

A indústria geralmente acredita que 2023 é o primeiro ano do grande modelo, e aos olhos de Zhang Peng, CEO da Zhipu AI, o "primeiro ano do modelo de linguagem grande de IA" deve ser 2020, ou seja, o segundo ano do estabelecimento da Zhipu AI.

Zhang Peng, CEO da Zhipu AI

Em 2017, nasceu o Transformer, e uma série de modelos de Transformer de grande escala como GPT-1 e GPT-2 foram sucessivamente produzidos, que tinham parâmetros de larga escala e fortes capacidades de generalização, resolvendo muitos problemas que antes não conseguíamos resolver.

Até 2020, o advento do GPT-3 trouxe a IA generativa para uma nova era.

Em 2020, é também o nó onde a Zhipu AI decidiu desenvolver totalmente modelos grandes. Naquela época, devido ao alto custo de treinamento e ao complexo limiar de pesquisa e desenvolvimento, os grandes modelos não eram otimistas pela indústria, e o desenvolvimento do espectro da sabedoria não era tão importante quanto agora.

No entanto, após o lançamento do ChatGPT, Zhang Peng disse sem rodeios que seus sentimentos estavam "animados e com alguma pressão", animado que a direção era mais certa, e a pressão veio da urgência de alcançar as novas tecnologias.

Ao mesmo tempo, mais e mais investidores estão procurando por Zhipu AI, e a fumaça de grandes modelos há muito tempo foi acesa, e os investidores esperam encontrar pessoas que possam prestar atenção aos fogos de artifício primeiro.

Depois de algumas pesquisas, uma equipe fundadora estável, precipitação de tecnologia suficiente e exploração de comercialização e outros fatores fizeram Zhipu AI de emergente para famoso.

Em termos da equipe fundadora, a Zhipu AI foi incubada pelo Tsinghua KEG (Knowledge Engineering Lab), e essa equipe saiu do laboratório e entrou no mercado, e a Zhipu AI foi oficialmente estabelecida.

O CEO Zhang Peng formou-se no Departamento de Ciência da Computação da Universidade de Tsinghua com um diploma de bacharel, e sua direção de pesquisa de doutorado no Departamento de Ciência da Computação da Universidade de Tsinghua é gráfico de conhecimento.

O presidente Liu Debing estudou com o acadêmico Gao Wen, foi vice-diretor do Centro de Pesquisa de Big Data de Ciência e Tecnologia do Tsinghua Data Science Research Institute, e o presidente Wang Shaolan é um dos principais doutores em inovação da Tsinghua.

No Vale do Silício e até mesmo no círculo acadêmico global, Zhipu AI tem sido famoso, aos olhos dos investidores, Zhipu AI durante o período Tsinghua "tem pessoas, tecnologia, clientes", equivalente a uma pequena mas bela startup, e todos os principais funcionários têm um período de cooperação, relativamente estável, de acordo com a lógica de investir em pessoas, investir na pista, Zhipu AI é naturalmente favorecido.

O aspeto técnico também é a força da Zhapu AI, que pode ser rastreada até a pesquisa inicial de Zhippu, desde o AMiner em 2006, até a criação da empresa em 2019, e depois para se concentrar na pesquisa de algoritmos de grandes modelos em 2020, GLM-10B em 2021, GLM-130B em 2022, ChatGLM-6B e ChatGLM, um modelo de diálogo de 100 bilhões em março de 2023.

É relatado que a Zhipu AI também lançará uma nova geração de modelo grande de pedestal em 27 de outubro. Neste outubro dilacerado pela guerra da grande indústria de modelos, se Zhipu pode ocupar um lugar depende do desempenho da nova geração de modelos.

A pesquisa de Zhipu AI é mais cedo do que a grande maioria dos grandes participantes de modelos na China, e Zhipu transforma a vantagem de pioneiro em vitória.

Na principal avaliação de modelos de grande porte do mundo divulgada por Stanford, o GLM-130B é o único modelo selecionado na Ásia, com a mesma precisão e malícia do GPT-3, e a robustez e o erro de calibração são excelentes entre todos os modelos.

O ChatGLM-6B foi de código aberto em 14 de março de 2023 e recebeu 48.000+ estrelas e 6.800+ forks no GitHub em poucos meses, e 8.000.000+ downloads no Hugging Face, ficando em primeiro lugar na tendência de quatro semanas; Centenas de projetos baseados em ChatGLM-6B, como LoRA, P-Tuning, langchain, etc. Classificado em primeiro lugar em avaliações de terceiros para linguagem natural chinesa, conversas em chinês, perguntas e respostas em chinês e tarefas de raciocínio.

03 Uma longa corrida sem fim

Como uma tecnologia revolucionária geral, o grande modelo não só determina a competição entre indivíduos e empresas, mas também relacionado com a competição de grandes potências, e a origem de Zhipu determina que não é apenas uma empresa, mas também uma equipe de tipo acadêmico com ideais tecnocráticos.

Ao contrário da maioria das empresas e instituições, o Spectrum AI está seguindo seu próprio caminho.

36Kr aprendeu que a grande pesquisa de modelo de muitos grandes fabricantes nacionais é baseada em GPT, BERT e T5, como uma empresa comercial é compreensível, mas de uma perspetiva nacional, a China deve e deve ter sua própria estrutura de pré-treinamento, não para seguir, mas para sair de sua própria rota, GLM (General Language Model) é a resposta para Zhipu.

O auto-desenvolvimento de modelos grandes não é fácil e extremamente arriscado. "O impacto do GPT-3 em nós está determinado a desenvolver um modelo bilíngue denso de 100 bilhões. Porque depois que terminamos de pesquisar naquele ano, também sabíamos que o investimento em fazer tal coisa era muito grande, especialmente o poder de computação, talento, equipe e dados. Zhang Peng disse anteriormente a 36Krypton.

Fonte: Foto IC

"A China não tem sua própria estrutura para modelos pré-treinados. Seja GPT, BERT ou T5, é a tecnologia subjacente proposta pelos cientistas ocidentais, e o caminho é monopolizado pelo Ocidente. Queremos quebrar o monopólio, por isso não replicamos completamente o caminho da OpenAI. Ele disse.

É claro que a IA Zhipu corta ativamente do sistema técnico ocidental, o que também representa riscos potenciais, e se o desenvolvimento subsequente encontrar novos gargalos, pode haver dificuldades adicionais.

Atualmente, Zhipu é uma das poucas grandes empresas modelo com capital nacional/auto-pesquisa doméstica, e tem um plano claro de adaptação de chips domésticos, que é mais adequado para empresas chinesas e pode compensar a divergência de rotas em certa medida.

Nos resultados da licitação "2023 Industrial Technology Basic Public Service Platform - Industrial Public Service Platform Project for Artificial Intelligence Large Model Engineering Technology and Application" recentemente divulgados pelo Departamento de Ciência e Tecnologia do Ministério da Indústria e Tecnologia da Informação, o consórcio participado pela Zhipu AI venceu a licitação.

De acordo com relatórios, o projeto é o primeiro grande projeto especial de grande modelo do Ministério da Indústria e Tecnologia da Informação da República Popular da China e o único grande projeto de plataforma de serviço público de grande modelo este ano, que apoiará o licitante vencedor e promoverá a pesquisa de tecnologia chave e geração inteligente e aplicação de engenharia de modelo grande para aplicações chave da indústria.

O código aberto também é uma característica importante do Zhipu AI, muitas empresas escolheram a rota de código fechado, mas Zhipu espera criar uma comunidade próspera e ecologia, a fim de promover ainda mais o desenvolvimento da grande comunidade de código aberto modelo, Zhipu AI lançou ChatGLM2, centenas de bilhões de modelos de diálogo de pedestal são atualizados e código aberto, incluindo 6B, 12B, 32B, 66B, 130B tamanhos diferentes, para atender às necessidades dos clientes em diferentes níveis.

"Nossos intercâmbios acadêmicos e técnicos e cooperação de produtos são relativamente abertos, e grandes modelos não podem ser feitos confiando em uma empresa, mas ainda precisam de uma ecologia aberta." Eu acho que é de código aberto ou livre, essas coisas não são para ganho comercial. Zhang Peng disse.

Em termos de comercialização, Zhipu AI é mais sem pressa, tomando o modelo grande da indústria quente de hoje como exemplo, Zhipu AI não fez um modelo grande da indústria para atender aos clientes, Zhipu AI escolheu "colocar ovos ao longo do caminho" no caminho para AGI, em vez de tomar o modelo grande da indústria como um objetivo.

"O modelo da indústria é essencialmente uma casca de um modelo grande e uma reinvenção da roda do algoritmo tradicional." Zhang Peng apontou as limitações do grande modelo da indústria: "Acreditamos que apenas uma certa escala de grandes modelos (gerais) pode alcançar o surgimento de habilidades cognitivas semelhantes às humanas." "

A inteligência artificial é uma corrida de longa distância sem fim, o grande modelo é um dos monumentos, todos querem gravar o seu nome nele, o capital é o meio de Zhipu AI para o ideal da tecnologia, quando Zhipu está embrulhado e tem de estar em frente ao palco, vai testar a determinação, confiança e paciência de Zhipu.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)