4 anos de dezenas de bilhões de avaliação, grande modelo de empreendedorismo doméstico TOP 1, feito em Tsinghua

2023-10-23 07:06:15

Fonte: Qubits

A grande empresa de modelos Zhipu AI anunciou o valor de financiamento para o ano: 2,5 bilhões de yuans.

Qual é o conceito? Atualizou o montante acumulado de financiamento de startups nacionais de grande porte, com uma avaliação de mais de 10 bilhões.

Esta empresa de 4 anos tornou-se a empresa de reconhecimento mais valiosa e absorvente de ouro para modelos nacionais de grande porte.

Na "segunda fase da IA generativa" na guerra dos 100 modelos, o progresso do financiamento do líder Zhipu também é prova do efeito Matthew da indústria?

As empresas que estão otimistas terão mais recursos, enquanto as empresas que não provam sua autoestima enfrentam baralhar e perder a próxima etapa das corridas.

Do ponto de vista das startups, isso é mais como o fim da primeira metade do empreendedorismo de grandes modelos, o divisor de águas do padrão apareceu e a sede ecológica começou a ficar clara.

Porquê o Wisdom Spectrum?

Antes de descobrir por que o modelo doméstico de financiamento em larga escala é um espectro de sabedoria, devemos primeiro rastrear a fonte e conhecer sua origem.

Antes disso, provavelmente pertencia ao estado de ser bem conhecido no círculo e desconhecido fora do círculo.

Zhipu AI, fundada em junho de 2019, é transformada com sucesso a partir da tecnologia do Laboratório de Engenharia do Conhecimento (KEG) do Departamento de Ciência da Computação da Universidade de Tsinghua.

Os membros da equipe principal são quase todos linhagem Tsinghua, entre eles, CEO Zhang Peng graduado pelo Departamento de Ciência da Computação da Universidade de Tsinghua e é um líder de inovação de 2018 da Universidade de Tsinghua com um doutorado em engenharia.

No KEG Lab, a equipe pesquisou principalmente como aplicar aprendizado de máquina, mineração de dados, gráficos de conhecimento, etc. à prática de engenharia, e começou a treinar modelos de IA em 2017.

No primeiro aniversário do estabelecimento do Zhipu, a OpenAI lançou o GPT-3.

Desde então, toda a empresa tem estado totalmente envolvida no desenvolvimento de grandes modelos de pré-formação linguística. No caminho para modelos grandes, a OpenAI escolheu GPT, o Google escolheu BERT e Zhipu escolheu GLM (General Language Model).

Quase todas as histórias posteriores giraram em torno da arquitetura única de pré-treinamento GLM de Zhipu:

Em 2022, Zhipu e Tsinghua cooperaram para desenvolver o modelo bilíngue GLM-130B, de 100 bilhões de dólares, usando-o como base**, e começaram a construir a plataforma de modelo grande e a matriz de produtos.

Em 2023, Zhipu tomará ações muito frequentes, começando pelo lançamento do modelo de diálogo ChatGLM e do modelo de código aberto de cartão único ChatGLM-6B, seguido pelo modelo visual Visual-6B, o modelo de código de código CodeGeeX2, o modelo matemático MathGLM, o modelo multimodal CogVLM-17B e a série Agent model AgentLM, e todos eles são de código aberto.

Em 31 de agosto deste ano, Zhipu Qingyan, um assistente de IA generativa baseado no modelo de diálogo bilíngue chinês-inglês ChatGLM2, tornou-se um dos primeiros 11 produtos de modelo grande que voaram para as casas das pessoas comuns através de arquivamento.

Pode-se dizer que, nos últimos anos, a principal coisa de Zhipu no campo dos grandes modelos é muito clara, ou seja, abalroar a fundação (modelo base) com uma mão, e depois construir vários edifícios modais e funcionais sobre a fundação.

Vale a pena mencionar que a Zhipu pode sustentar-se com capacidades de serviço do lado B do período embrionário, que é a confiança da empresa face à realidade aceite de "grandes modelos gastando dinheiro como água corrente", mas também frequentemente desenvolvendo e lançando novos modelos e novos produtos.

Claro que esta não é a única razão.

Além das capacidades de serviço e das capacidades de receita que a acompanham, a Zhipu também tem uma forte equipe de talentos e força técnica.

Como mencionado acima, Zhipu nasceu de Tsinghua, e ** "Tsinghua Department" tornou-se uma marca de prestígio neste campo**.

A razão é que o Departamento de Computação de Tsinghua se dedicou à pesquisa de grandes modelos anteriormente, tem experiência de longo prazo e cultivou muitos talentos - os jogadores que podem ser chamados no mercado agora, representados por Zhipu, bem como o lado escuro da lua, Tecnologia Shenyan, tecnologia de primeira classe, Inteligência Baichuan, Inteligência de Parede Facial, Tecnologia Yuanyuan, Tecnologia Shengshu, etc., são todas linhagens Tsinghua.

O número de citações dos seus artigos publicados e a capacidade de verificação dos modelos publicados são uma prova forte deste "rótulo reconhecido".

Além disso, de acordo com informações públicas, Zhipu é a única empresa de grande modelo financiada e desenvolvida internamente.

Tal histórico da empresa faz com que Zhipu tenha sua própria preparação e estratégia na interminável discussão e controvérsia de "segurança de modelo, segurança de dados e segurança de conteúdo".

É relatado que, a fim de cooperar com o desenvolvimento de GPUs domésticas, Zhipu está agora pousando o plano de adaptação de chips domésticos do modelo de linguagem universal GLM.

Especificamente, é cooperar com os fabricantes nacionais de chips de poder de computação para adaptar algoritmos de modelo, e adaptar chips domésticos na extremidade de inferência do lado do algoritmo, e existem quase 10 tipos de chips domésticos que podem ser adaptados.

Depois de angariar tanto dinheiro, o que fazer a seguir?

O boletim acima e a singularidade podem ter se tornado a principal razão pela qual Zhipu tem sido altamente otimista e se destacado durante todo o caminho.

No entanto, por ser altamente favorável, o espectro de sabedoria que acumulou capital suficiente também mostra a determinação de construir competitividade a longo prazo.

Depois de levantar 2,5 bilhões de RMB em financiamento dentro de 10 meses, Zhipu AI declarou oficialmente:

O financiamento acima referido será utilizado para aprofundar a investigação e o desenvolvimento do modelo de base, apoiar melhor a ecologia da indústria e desenvolver-se rapidamente com os parceiros.

O núcleo resume-se a dois aspetos:

Primeiro, torná-lo maior, mais forte e mais sólido, e a base do modelo grande.
O segundo é expandir a ecologia e o círculo de amigos.

Tem de haver profundidade e amplitude.

**Em primeiro lugar, tornar a base do modelo maior e mais forte, e "desenvolver ainda mais" o modelo de base grande. **

Atualmente, o grande modelo que Zhipu considera como base é o modelo bilíngue bilíngue bidirecional denso GLM-130B lançado em 2021, com 130 bilhões de parâmetros.

Naquela época, devido a muitas limitações, como tecnologia, dados e poder de computação, treinar um modelo grande com essa quantidade de parâmetros era suficiente para ser careca, mas os resultados foram notáveis, e o GLM-130B teve um desempenho melhor do que GPT-3 e PaLM.

No entanto, hoje, a demanda provocada por dados e crescimento modal, o gigante de 130 bilhões de parâmetros no passado, parece ser um pouco inadequada.

A última notícia da Qubit é que nesta sexta-feira (27 de outubro), Zhipu terá uma nova ação - o lançamento de uma nova geração de grandes modelos de pedestais. **

**Em segundo lugar, expanda a ecologia e o círculo de amigos. **

Quando se trata de ações concretas, não devemos ser capazes de ignorar o princípio consistente do espectro da sabedoria: fonte aberta contínua.

Esta empresa sempre foi um dos players mais abertos no campo dos grandes modelos, já na era pré-ChatGPT, tem sido transparente e aberta juntamente com Baidu (ERNIE2.0), Ali (AliceMind), Zhiyuan (Qingyuan CPM), Lanzhou (Mencius Big Model) e outros.

Olhando para o relatório GLM inicial de Zhipu, há as palavras "Convidamos todos a se juntarem à sua comunidade aberta para promover o desenvolvimento de modelos pré-treinados em larga escala". Agora, a empresa ainda está usando código aberto para fazer amizade com desenvolvedores e usuários da indústria.

Este hábito mantém-se até aos dias de hoje.

Combinado com os dados atuais, podemos ver mais claramente a insistência de Zhipu em código aberto e quais resultados faseados foram obtidos:

Comunidade de desenvolvedores, o ChatGLM-6B conquistou o primeiro lugar na lista de tendências quatro semanas após seu lançamento, com um total acumulado de mais de 10 milhões de downloads, e o GitHub estrelou 5w+.

Por outro lado, o site oficial de Zhipu listou ** parceiros para construir um ambiente ecológico, "69 países, 1000+ instituições de pesquisa". Além disso, os qubits foram verificados, com mais de 1.000 clientes e 200-300 ecossistemas de código aberto.

Uma vez que a ecologia do grande modelo é estabelecida, ela pode integrar melhor os recursos da camada básica, camada intermediária e camada de aplicação do modelo grande, otimizar a alocação e alcançar o efeito de interação saudável e coevolução.

Entre eles, o modelo grande do pedestal está no centro da ecologia do grande modelo em virtude de sua fundação e versatilidade. Para entender isso, não é difícil entender as vantagens e a necessidade de Zhipu comprometido em expandir a ecologia e o círculo de amigos.

Big Model Entrepreneurship, entrando em um momento divisor de águas

No final de novembro passado, a OpenAI enviou o ChatGPT para o mundo. Imediatamente a seguir, a tendência da tecnologia de grandes modelos desencadeou onda após onda a uma velocidade sem precedentes.

Os dados intuitivos são surpreendentes, e a velocidade de apresentação é incrível.

Centenas de milhões de atividades de usuários, bilhões de receitas, dezenas de bilhões de avaliações... O grande modelo está varrendo o mundo sem falar sobre virtude marcial, e todo mundo está assistindo e explorando, pensando em quão amplos os limites dessa tecnologia de inteligência artificial podem explorar, e como os produtos que ela suporta podem exercer o poder da tecnologia?

Como resultado, há pioneiros como OpenAI e Anthropic no exterior, e há dezenas de bilhões de unicórnios como Zhipu AI e MiniMax na China.

Pearl jade está à frente, alguns dos problemas técnicos e de engenharia não podem ser acelerados e ignorados, e então a linha de estrelas, e depois o financiamento astronômico, desde que você pegue a estrada de grandes modelos, você deve experimentá-lo você mesmo.

O desafio é assustador, mas os desafiantes estão felizes em seguir o exemplo.

△Fonte: Sequoia

Hoje, quase um ano depois, assistimos ao desenvolvimento de grandes modelos tecnológicos e à forma como a inovação e a concorrência estão a moldar o campo.

O que pode ser visto mais claramente é que a gigante ** completou o slot de cartão inicial, a empresa startup começou a embaralhar e o padrão do primeiro estágio apareceu. **

Isso mesmo, uma empresa não pode fazer tudo dentro das capacidades do modelo grande, mas os ingressos para o modelo grande geral são tão limitados, e os jogadores que não têm a capacidade de obtê-lo começam a desviar: ou vão para o especial e fazem o modelo da indústria; Ou desiste da camada de modelo para começar um negócio, começa a ficar sobre os ombros de outros modelos e vai para a camada intermediária, a camada de aplicação...

O empreendedorismo de grandes modelos está entrando em um momento divisor de águas.

A partir de agora, o progresso do financiamento de startups de grande porte provavelmente se reunirá cada vez mais do que é agora. Centenas de milhões de dólares continuarão a reunir-se em empresas de "não menos dinheiro".

O efeito Matthew na indústria está se intensificando. O montante total de capital é limitado, quanto mais valiosa for a empresa, e os melhores e mais recursos serão enviados para o cavalo com maior potencial.

No mercado de capitais, a única desvantagem das empresas caras é que elas são caras, e a única vantagem das empresas baratas é que elas são baratas.

A primeira metade do grande modelo de empreendedorismo está chegando ao fim.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
1/3
1CandyDrop Airdrop Event 6.0
95k Popularidade
2White House Crypto Report
82k Popularidade
3Join Alpha RION Airdrop to Earn $40
67k Popularidade
4Fed Holds Rates Decision
11k Popularidade
5July Spark Program TOP 10 Creators Announced
4k Popularidade

Marcar

sitemap

4 anos de dezenas de bilhões de avaliação, grande modelo de empreendedorismo doméstico TOP 1, feito em Tsinghua

**Porquê o Wisdom Spectrum? **

** Depois de angariar tanto dinheiro, o que fazer a seguir? **

Big Model Entrepreneurship, entrando em um momento divisor de águas

Porquê o Wisdom Spectrum?

Depois de angariar tanto dinheiro, o que fazer a seguir?