A “Selecção Nacional” acaba, e o grande modelo “rola” para uma nova latitude

2023-07-12 03:07:50

Fonte original: One DU Finance

Fonte da imagem: Gerada por Unbounded AI‌

Depois de meio ano soprando o vento do modelo grande, ele finalmente tem uma nova direção.

Em 7 de julho, na Conferência Mundial de Inteligência Artificial de 2023 (WAIC 2023), o **Grupo Geral de Padronização de Inteligência Artificial, sob a orientação do Comitê Nacional de Padrões, anunciou que o líder da primeira força-tarefa de padronização de modelo em larga escala do meu país será liderado pelo Laboratório de Inteligência Artificial de Xangai e Baidu., Huawei, Ali e outras empresas são co-responsáveis. **

O mundo exterior não se surpreende com o primeiro lote de escalações selecionadas da "seleção nacional", afinal, o desenvolvimento de grandes modelos precisa ser liderado por jogadores com força técnica excepcionalmente forte. Depois que o estado esclareceu seu status e tarefas, a direção do vento do mercado doméstico de modelos em grande escala começou a sofrer novas mudanças.

01 Furacão por meio ano, a indústria inaugurou a "equipe nacional"

Desde o início deste ano, o modelo grande vem subindo cada vez mais, e a velocidade superou o processo de desenvolvimento de qualquer tecnologia anterior. Se no primeiro trimestre deste ano vários players acorreram à entrada do grande modelo, ainda discutindo a questão de "se faz ou não", no segundo trimestre cada player já evoluiu para a questão de "como fazer faça isso".

E uma cena tão animada marcou o clímax no WAIC 2023. **Mais de 400 empresas participaram desta conferência, e mais de 30 modelos em grande escala focaram os destaques.A área de exposição atingiu 50.000 metros quadrados, estabelecendo um novo recorde. **

Nesta conferência animada, muitas pessoas não conseguiram entrar no local da conferência porque não marcaram com antecedência. Na conferência, que é chamada de "alto padrão" por especialistas do setor, a celebridade da Internet Musk, Yang Likun, um dos gigantes do Prêmio Turing, Hu Houkun, presidente rotativo da Huawei, Tang Xiaoge, professor da Universidade Chinesa de Hong Kong, e meio acadêmico e empresarial Os figurões apareceram um após o outro.

No salão de exposições, a era do modelo em grande escala, IA generativa e inteligência artificial geral, essas palavras que não eram familiares há meio ano, agora se tornaram símbolos que podem ser vistos em todos os lugares do salão de exposições.

Claro, os jogadores de mais de 30 modelos em grande escala na conferência não decepcionaram o mundo exterior e deram suas próprias respostas aos modelos em grande escala. Especialmente as ações dos membros da "seleção nacional" atraíram a atenção do mundo exterior.

Por exemplo, Baidu, como o primeiro fabricante na China a anunciar All in artificial intelligence, seu salão de exposições no local da conferência é particularmente atraente. É claro que, nesta importante ocasião, o Baidu exibirá naturalmente o "tesouro da prefeitura" que mais pessoas podem experimentar. Este produto é chamado Wenxin Yige, que permite ao público que entra na sala de exposições perceber a liberdade das imagens P.

A Huawei transferiu seu "cluster de treinamento de IA mais rápido do mundo" Atlas 900 PoD A2 para o local. Hu Houkun, vice-presidente da Huawei, disse que usando o Atlas 900, as pessoas podem concluir o treinamento da rede neural típica ResNet-50 no conjunto de dados ImageNet em apenas 59,8 segundos, o que é 15% mais rápido que o segundo lugar com a mesma precisão. . "Isso é equivalente a atingir a linha no topo do campo de sprint e, em seguida, beber uma garrafa de água para ver o segundo colocado até a linha de chegada." público impressionado A atenção mudou da complexidade do modelo grande para a competição no lado do hardware.

No Fórum Alibaba Cloud, a "Família Tongyi" do Alibaba Cloud adicionou um modelo de pintura AI "Tongyi Wanxiang". Diz-se que este modelo pode ajudar os humanos na criação gráfica e pode ser aplicado ao design de arte, comércio eletrônico, jogos e criação cultural no futuro e outros cenários de aplicação. Zhou Jingren, CTO do Alibaba Cloud Intelligence Group, disse no local que este é um passo fundamental para o grande modelo do Alibaba Cloud compreender totalmente a capacidade multimodal, e essa capacidade será gradualmente aberta aos clientes do setor no futuro.

"Dinheiro, pessoas, tecnologia e cenas" são as vantagens inatas dos grandes fabricantes na fabricação de modelos em grande escala. Ao mesmo tempo, também é uma lacuna que muitas empresas iniciantes são difíceis de preencher. Algumas pessoas até apontaram diretamente no local em que os modelos de grande escala da China chegaram. , estará apenas entre os cinco principais fabricantes, ou seja, BAT+Huawei+Tencent.

Mas o que os gigantes devem fazer? Para onde vai a seguir é uma grande questão.

02 Abandonando conceitos e sentimentos, os gigantes se concentraram na cena do pouso

Conferência de inteligência artificial deste ano, o grande modelo tornou-se uma classe superior bem merecida.

Ali Tongyi, Baidu Wenxin, Huawei Pangu e outras equipes nacionais mostraram seu poder duro. Ao mesmo tempo, mais de 30 modelos verticais de grande escala, como Xunfei Xinghuo, Shangtang Rixin e Netease Fuxi, não perderam seu ímpeto. Trabalhe duro em seus respectivos campos.

Mas, a julgar pela situação no local, eles parecem ter abandonado as práticas grandes e vazias de contar histórias e falar emocionalmente e, em vez disso, começaram a se concentrar em falar sobre cenários e casos de aterrissagem. Essa é a única maneira de os grandes modelos seguirem em frente e também é muito provável que se torne o destaque da próxima etapa.

Na conferência, o Huawei Cloud Pangu Large Model 3.0 foi lançado oficialmente, atraindo muitas pessoas da indústria para assistir. O que impressionou ainda mais a indústria é o que disse Zhang Ping'an, diretor executivo da Huawei e CEO da Huawei Cloud - o modelo Pangu está muito ocupado, ocupado fazendo coisas e não tem tempo para escrever poemas. E escrever poemas é exatamente o que os jogadores que lançaram o grande modelo nos seis meses anteriores mais gostam de fazer.

Na visão de Zhang Ping'an, a Huawei espera que o modelo Pangu possa ajudar vários setores, como finanças, assuntos governamentais, mineração, meteorologia, etc., em vez de focar no nível do modelo de linguagem. De acordo com sua divulgação, a partir de agora, o grande modelo Pangu foi implementado nas áreas de meteorologia, pesquisa e desenvolvimento médico e energia elétrica, e entregou vários modelos grandes com centenas de bilhões de parâmetros.

Baidu também colocou a cena em prática. Como um dos primeiros players, o Baidu lançou o modelo grande Wenxin há quatro anos, mas a indústria não prestou atenção suficiente ao modelo grande na época, para que não causasse muito impacto. Mas para o Baidu, o modelo grande Wenxin é um layout avançado que está um passo à frente da indústria. Hoje, este produto voltado para o futuro também ganhou muito.

No site WAIC 2023, o diretor de tecnologia do Baidu, Wang Haifeng, disse que o Baidu agora atualizou para a versão 3.5 do modelo grande Wenxin. Em comparação com a versão anterior, o efeito foi aprimorado em 50%, a velocidade de treinamento foi dobrada e a velocidade de raciocínio foi aumentada em 30 vezes. Em termos de custo, caiu para 10% do passado.

"Tome a promoção da prosperidade da ecologia de modelo em grande escala da China como o objetivo principal e forneça serviços completos para empresas iniciantes de grande escala." Alibaba Cloud CTO Zhou Jingren disse isso. Obviamente, isso continua o conceito MaaS (Model as a Service) proposto pelo Alibaba Cloud.

A Tencent, que foi a última a entrar no ramo de modelos grandes, vem fazendo movimentos constantes nos últimos 20 dias. Em 19 de junho, a Tencent divulgou publicamente seu pensamento sobre modelos grandes pela primeira vez; em 26 de junho, divulgou sua rede de computação de alto desempenho Xingmai autodesenvolvida pela primeira vez; em 7 de julho, no WAIC 2023, o vice-presidente da Tencent Cloud e o responsável pela Tencent Cloud Intelligence, Wu Yunsheng, divulgaram as conquistas inovadoras da Tencent na aplicação de modelos grandes e disseram que os recursos de modelo grande da indústria da Tencent Cloud foram aplicados a cenários como controle de risco financeiro, tradução interativa e cliente digital inteligente serviço, que melhorou a eficiência de aplicativos inteligentes.

Claro, os grandes modelos em campos subdivididos também mostram forte vitalidade. Tang Wenbin, cofundador e CTO da Megvii Technology, disse em entrevista à mídia: "A implementação de aplicativos é o único critério para medir o valor de grandes modelos. A Megvii Technology passará de grandes modelos visuais para grandes modelos multimodais gerais ."

**Concentre-se na implementação de cenários e forneça efetivamente aos usuários corporativos soluções de redução de custos e aumento de eficiência, que se tornou o foco dos atuais players de modelos em grande escala. **No futuro, os modelos em grande escala já passaram de "fazer ou não fazer" para "como fazer". E esse é o próximo passo na guerra dos megamodelos.

03 Participe da batalha pelo futuro, responda primeiro a estas quatro perguntas

Embora os modelos grandes sejam muito populares, ainda há um longo caminho a percorrer desde o início até o mercado. No processo, muitas dificuldades foram expostas.

No entanto, na visão da 1DU Finance and Economics, a futura competição pelo maior modelo provavelmente será lançada em quatro latitudes. Ou seja: tecnologia, talento, capital e comercialização. **

**Olhe primeiro para o nível técnico. ** Não há dúvida de que a inteligência artificial é uma das tecnologias mais avançadas da atualidade.No nível técnico, é impossível compensar o acúmulo necessário em um curto período de tempo. Poder de computação "grande", dados "grandes" e modelos "grandes" são as características básicas dos modelos grandes atualmente, e também são desafios para a industrialização de modelos grandes. Atualmente, embora a escala de dados seja grande, o a qualidade dos dados é desigual. Em segundo lugar, o tamanho do modelo é grande e a dificuldade de treinamento é maior. O terceiro é que a escala do poder de computação é grande e os requisitos de desempenho do hardware serão maiores.

Isso também significa que ** não tem fundos suficientes para sustentá-lo, por isso é difícil formar uma equipe tão forte. ** Um fundador da nuvem de marketing mencionado em comunicação com 1DU Finance and Economics: "Desde o investimento no modelo de grande escala do setor em março, o investimento de capital geral foi muito grande, excedendo até mesmo a soma do estabelecimento da empresa para o grande modelo em escala." No entanto, ele também mencionou que, se for feito, será definitivamente uma garantia para o desenvolvimento da empresa nos próximos dez anos.

Antes disso, muitas pessoas na indústria propuseram que "grandes modelos são um jogo para grandes fabricantes queimarem dinheiro". Esta afirmação não é sem razão.

Embora os grandes modelos sejam muito populares, o capital não acompanhou o ritmo da recuperação tecnológica em escala global. O financiamento global de capital de risco caiu quase pela metade nos primeiros seis meses deste ano, caindo 48%, para US$ 173,9 bilhões, enquanto o número de negócios também caiu 19%, segundo a empresa de pesquisa PitchBook.

Na China, até o final de junho deste ano, mais de uma dezena de empresas start-up de grande porte obtiveram financiamento. Entre as empresas que anunciaram o valor do financiamento, a MiniMax tem a maior escala de financiamento. Em junho deste ano, recebeu mais de 250 milhões de dólares americanos em financiamento da Série A da Tencent; Anos atrás, antes de ser adquirida pela Meituan, também recebeu uma rodada de financiamento angel+ de US$ 230 milhões.

Vejamos o investimento dos principais fabricantes. Anteriormente, as estatísticas da Titanium Media podem explicar o problema. Em 2022, o investimento da Huawei em despesas de P&D será de 161,5 bilhões de yuans, tornando-se a empresa com o maior investimento em P&D na China; seguido pela Tencent, embora não é baixo. No entanto, manteve-se no nível de 61,4 bilhões de yuans. Ali ficou em terceiro lugar, com despesas de P&D de 55,5 bilhões de yuans. De acordo com informações públicas, o Baidu, como um dos primeiros players em inteligência artificial, investiu mais de 100 bilhões de yuans no campo de IA nos últimos dez anos. Tais padrões de investimento obviamente não são comparáveis a empresas comuns.

Com tecnologia e capital, as grandes fábricas são relativamente mais atraentes para os talentos. No início deste ano, cada empresa iniciou uma competição maluca de talentos. O Baidu recruta engenheiros de algoritmos de modelo em larga escala de IA com um salário mensal de 25-40 mil, e o mais generoso Ali recruta engenheiros de algoritmo e treinamento de modelos em grande escala com um salário mensal de 40-70 mil.

Depois de pesquisar a palavra-chave "grande modelo" em uma plataforma de recrutamento, você descobrirá que algumas empresas estão dispostas a pagar de 15 a 25 mil salários mensais aos graduados de 2023. Ao mesmo tempo, algumas empresas de trilhos verticais também participaram desta rodada de competição. Por exemplo, uma empresa comercial recrutou um gerente de produto de modelo médico em grande escala com uma faixa salarial de 25 a 50 mil, e uma empresa de jogos recrutou um engenheiro de algoritmo para um modelo de linguagem em grande escala e também deu um salário de até 50 mil. Mesmo o salário anual de um gerente de produto de plataforma modelo grande recrutado pela China Telecom pode chegar a 840.000.

Talentos, tecnologia e capital, que sobem com a maré, incitam os players dos grandes modelos a desembarcar e comercializar o mais rápido possível, afinal, de acordo com as leis dos negócios, no final das contas, esses insumos precisam ser devolvidos para ser valioso.

No entanto, o custo de aterrissagem de modelos grandes também é um obstáculo que os principais players precisam superar. Algumas pessoas na indústria estimaram que o custo de treinar um modelo grande é extremamente alto, chegando a 2-120 milhões de dólares americanos. Isso também significa que a comercialização de grandes modelos de IA pode ter que voltar à contabilidade de custos.

Conclusão

Olhando para o grande modelo do momento atual, a situação geral é muito semelhante à Internet em 1998. Estava apenas em sua infância, com muitas bolhas e grandes oportunidades. Nesse caso, uma boa empresa com força real terá melhor crescimento e maior valor no futuro. **

Ver original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Recompensa
curtir
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
GT 2025 Q2 Burn Completed
13k Popularidade
Michael Saylor Hints at Buying BTC
10k Popularidade
BTC
30453k Popularidade
4contentstar
10720k Popularidade
5NADA
11186k Popularidade
6BOME
11565k Popularidade
7BTC
30453k Popularidade
8SMILE
9062k Popularidade
9比特币
13441k Popularidade

Marcar

sitemap