ChatGPT explodiu nos últimos seis meses: hot money, gigantes e supervisão

Produzido | Tiger Sniff Technology Group Autor | Chen Yifan Qi Jian

Fonte da imagem: Gerada por Unbounded AI

Depois de meio ano do batismo da IA, pode ser difícil encontrar uma palavra mais apropriada do que "resposta ao estresse" para descrever o estado de todos na indústria de tecnologia hoje - tensão, estimulação e pressão.

"Resposta ao estresse" refere-se a uma série de respostas que os organismos produzem para manter a homeostase do corpo quando encontram pressões ou ameaças ambientais externas. É uma resposta natural dos organismos para se adaptar ao ambiente e garantir a sobrevivência. **Esta resposta pode ser de curta ou longa duração. **

Em 26 de julho, o Twitter oficial da OpenAI anunciou que a versão Android do ChatGPT estava disponível para download nos Estados Unidos, Índia, Bangladesh e Brasil, e planeja expandir para mais países em um futuro próximo. O ChatGPT está expandindo os canais, ganhando mais usuários e maior aderência ao uso, e a onda de IA generativa continua a aumentar.

No início de julho, na Conferência Mundial de Inteligência Artificial (WAIC) de 2023 em Xangai, uma técnica de uma empresa start-up de modelos em grande escala estava passando pelo salão de exposições. Ela planejava encontrar uma solução de chip doméstico econômica para a empresa para usar para treinamento de modelo em grande escala.

"**Temos 1.000 A100, mas não são suficientes." disse ela a Huxiu.

A100 é uma GPU de ponta da Nvidia e a base de hardware para o desenvolvimento do ChatGPT. Alguns dados públicos mostram que, no processo de treinamento dos modelos da série GPT, o número de GPUs Nvidia usadas pelo OpenAI é de cerca de 25.000. Portanto, para fazer um modelo grande, você deve primeiro avaliar quantas placas gráficas A100 você pode obter, o que quase se tornou uma prática neste setor.

Onde estão as GPUs? Onde posso encontrar poder de computação barato? Este é apenas um microcosmo das muitas perguntas na conferência 2023WAIC.

Quase todas as pessoas que estiveram "estressadas" nos últimos seis meses estão ansiosas para encontrar mais respostas sobre IA neste "evento".

Um técnico de um expositor de chips disse a Tiger Sniff que, durante os poucos dias da conferência WAIC, muitos gerentes de produto foram ao estande de "grandes modelos" na esperança de encontrar aqui as definições de produtos para os negócios de grandes modelos da empresa.

No Fórum Zhongguancun em 28 de maio, o "Relatório de Pesquisa de Mapas de Modelos em Grande Escala de Inteligência Artificial da China", divulgado pelo Instituto de Informações Científicas e Tecnológicas da China, mostrou que, até o final de maio, 79 modelos em grande escala com uma escala de parâmetros de mais de 1 bilhão na China foram liberados. Nos dois meses seguintes, uma série de grandes modelos de IA, como Tongyi Wanxiang da Alibaba Cloud, Pangu 3.0 da Huawei Cloud e Youdao "Ziyue" foram lançados. De acordo com estatísticas incompletas, os atuais modelos grandes de IA domésticos Existem mais de 100. **

A ação de empresas domésticas lutando para lançar grandes modelos de IA é a melhor personificação da "resposta ao estresse". A ansiedade provocada por essa "reação" está sendo transmitida a quase todo o pessoal relevante da indústria, do CEO de um gigante da Internet a um pesquisador de uma instituição de pesquisa de IA, de um sócio de um fundo de capital de risco ao fundador de uma Empresa de IA e até mesmo muitos profissionais jurídicos relacionados à IA, bem como reguladores de dados e segurança de rede.

**Para pessoas de fora da indústria, isso pode ser apenas um carnaval de curta duração, mas quantas pessoas se atrevem a dizer que estão fora da IA hoje em dia. **

A IA está inaugurando uma nova era e vale a pena reformular tudo com um grande modelo. Mais e mais pessoas estão começando a pensar sobre as consequências da difusão da tecnologia.

O dinheiro está entrando, o volante está aqui

Um mês após o nascimento do ChatGPT, Li Zhifei, o fundador do ChatGPT, foi ao Vale do Silício duas vezes e conversou sobre grandes modelos com todos. Ao conversar com Tiger Sniff, Li Zhifei disse sem rodeios que este era seu último "All in" . **

Em 2012, Li Zhifei fundou a Mobwenwen, uma empresa de inteligência artificial com interação por voz e a combinação de software e hardware como núcleo, que experimentou os altos e baixos das duas ondas de inteligência artificial da China. Durante o período mais quente da última onda de inteligência artificial, a avaliação de Momenwenbang já foi empurrada para o nível de unicórnio, mas também passou por um período de solidão desde então. Não foi até o surgimento do ChatGPT que a indústria de inteligência artificial que esteve em silêncio por muitos anos. Um buraco foi aberto.

No mercado primário, "o dinheiro quente está entrando".

Este é o consenso da indústria quando se trata de modelos grandes nos últimos seis meses. Lu Qi, fundador do Fórum Qiji, acredita que os modelos de IA em grande escala são um "volante", e o futuro será uma era em que os modelos são onipresentes. "Este volante já começou", e a maior força motriz é o capital.

No início de julho, dados divulgados pela plataforma de informações empresariais Crunchbase mostraram que empresas classificadas como IA levantaram US$ 25 bilhões no primeiro semestre de 2023, respondendo por 18% do financiamento global. Embora esse valor tenha diminuído em comparação com os US$ 29 bilhões no primeiro semestre de 2022, o valor total do financiamento de várias indústrias no mundo no primeiro semestre de 2023 diminuiu 51% em comparação com o mesmo período de 2022, o que mostra que o valor do financiamento na área de IA é o maior do mundo. A proporção do financiamento total quase dobrou. **Crunchbase escreveu no relatório: "Sem o boom da inteligência artificial desencadeado pelo ChatGPT, o valor do financiamento em 2023 será ainda menor."

Até agora, o maior financiamento da indústria de IA em 2023 é o investimento de US$ 10 bilhões da Microsoft na OpenAI em janeiro.

Tiger Sniff De acordo com estatísticas públicas, entre as startups de grande porte nos Estados Unidos, a Inflection AI pode se tornar a segunda maior startup no campo da inteligência artificial depois da Open AI, seguida pela Anthropic (US$ 1,5 bilhão), Cohere (US$ 445 milhões), Adept (US$ 415 milhões), Runway (US$ 195,5 milhões), Character.ai (US$ 150 milhões) e Stability AI (cerca de US$ 100 milhões).

Na China, no primeiro semestre de 2023, houve 456 incidentes de investimento e financiamento público na indústria doméstica de inteligência artificial. E essa estatística é 731, 526, 353, 631 e 648 nos cinco anos de 2018 a 2022.

Eventos de investimento e financiamento público na indústria nacional de inteligência artificial no primeiro semestre do ano

**Outro evento que acionou o volante foi o lançamento da interface da API pelo ChatGPT. **Quando a OpenAI abriu a interface API do ChatGPT pela primeira vez em março, havia quase um consenso dentro e fora da indústria de IA: a indústria está prestes a mudar. À medida que mais aplicativos são conectados a modelos grandes, uma floresta mais exuberante cresce em cima da IA.

"Fazer modelos e fazer aplicativos devem ser separados", os investidores sempre têm um olfato aguçado. De acordo com Chen Runze, diretor executivo da Source Code Capital, a IA segue a mesma lógica da divisão do trabalho em semicondutores. IA grandes modelos Após o boom, logo veremos um boom em aplicações de IA.

No início deste ano, quando Chen Runze e seus colegas foram para o Vale do Silício, descobriram que a Y Combinator, uma conhecida incubadora de startups no Vale do Silício (o CEO da OpenAI, Sam Altman, atuou como presidente desta incubadora por muitos anos), ** metade dos projetos foram transformados em IA generativa. . **O entusiasmo por modelos grandes não é menor que o da China do outro lado do oceano.

No entanto, ele também constatou que tanto o capital quanto os empreendedores nos Estados Unidos estão mais otimistas com as aplicações ecológicas baseadas em grandes modelos do que com o empreendedorismo em larga escala. Afinal, empresas como a OpenAI já surgiram nessa trilha. Ao mesmo tempo, o Os Estados Unidos têm um forte solo ecológico de aplicação ToB, então mais empresas americanas estão tentando fazer aplicações corporativas com base na ecologia de grandes modelos.

As observações de Chen Runze estão sendo confirmadas. Chen Ran, co-fundador da plataforma de serviço de modelo em grande escala OpenCSG, disse a Huxiu que hoje mais de 90% das empresas na Bay Area dos Estados Unidos usaram modelo em grande escala capacidades em todos os aspectos. Quanto à China, Chen Ran acredita que muitos clientes o utilizarão antes do final do ano.

Por volta de março deste ano, Chen Runze e sua equipe começaram a tentar encontrar empresas na China que fizessem aplicativos baseados em modelos grandes, mas ele descobriu que havia pouquíssimas empresas desse tipo. Uma grande quantidade de capital entrou na indústria de inteligência artificial, mas se você rastrear o fluxo desses fundos, verá que mais dinheiro ainda está concentrado nas principais empresas.

"Mesmo agora, não é fácil investir em 1-2 dos 10 projetos relacionados à IA generativa." Além do Source Code Capital, Huxiu também se comunicou com muitos investidores de tecnologia pesada. muitos projetos para ver, há muito poucos realmente confiáveis.

Essa atitude do lado da aplicação, aos olhos de muitas pessoas do setor, já é a norma.

Yu Kai, o co-fundador da Aspire, acredita que a pista aparentemente animada na superfície é, na verdade, mais uma competição nominal, e os resultados nada mais são do que duas situações: "** Uma é para financiamento, puramente voltada para o capital; a outra A outra é uma empresa que faz um modelo em grande escala para todo o domínio, e ela realmente precisa ser chamada. Se você não chamar, os outros não saberão.**”

Algumas estatísticas domésticas também ilustram esse problema. De acordo com estatísticas de uma organização terceirizada, Niu, em julho de 2023, havia 242 empresas AIGC na China e houve 71 incidentes de financiamento de trilha AIGC desde janeiro. Existem 67 empresas na trilha do modelo de grande escala da IA e houve apenas 21 eventos de financiamento desde o lançamento do ChatGPT.

Os eventos de financiamento da trilha AIGC e da trilha AI de modelo grande desde o lançamento do ChatGPT|Fonte de dados: Enniu Data

“No mercado doméstico de IA, existem poucos alvos bons.” Um investidor disse a Tiger Sniff que os melhores projetos são muito caros e os baratos não são confiáveis. **Embora o número de modelos de IA em grande escala lançados na China atualmente exceda cem, entre as empresas de modelos em grande escala na China, poucas obtiveram financiamento enorme, ou mesmo um punhado delas.

Muitos investimentos em IA se transformaram em investidores no final—ex-fundadores de empresas unicórnios, gigantes da Internet, pessoas com experiência empresarial relacionada a modelos de grande escala, etc.

Estatísticas parciais de empresas relacionadas a modelos domésticos de IA em larga escala

Entre os principais projetos de IA deste ano, Zhipu AI, Lingxin Intelligence, Shenyan Technology e Facewall Intelligence são empresas incubadas pelo Tsinghua Lab. Tanto a Shenyan Technology quanto a Facewall Smart foram estabelecidas em 2022 e têm endosso técnico de estudiosos conhecidos na indústria de IA.

O tempo de estabelecimento dessas empresas de IA baseadas em Tsinghua é mais curto do que o das empresas de IA fundadas por alguns líderes da indústria da Internet. Light Years Beyond, Baichuan Intelligent e Zero One Wanwu foram todas estabelecidas após o início dessa onda de modelos em grande escala.

Wang Huiwen, co-fundador da Meituan, certa vez levantou US$ 50 milhões anos-luz desde sua criação no início de 2023, que foi um dos poucos casos de financiamento na indústria de modelos em grande escala da China na época. Ao contrário de Zhipu AI e Xihu Xinchen, que já possuem empresas baseadas em modelos de grande escala, a anos-luz de distância começará em fevereiro de 2023. É difícil construir um modelo de grande escala do zero. Em 29 de junho, a Meituan anunciou a aquisição da todos os interesses além dos anos-luz, com uma consideração total de aproximadamente US$ 233 milhões (1,67 bilhão de yuans) em dinheiro, aproximadamente 367 milhões de yuans em dívidas e 1 yuan em dinheiro.

"** Pelo menos pessoas com experiência em processamento de linguagem natural, pessoas com experiência prática em treinamento de modelos em grande escala e profissionais em processamento de dados e clusters de poder de computação em grande escala. **Se você deseja fazer aplicativos ao mesmo tempo , você deve Deve haver também gerentes de produto e talentos operacionais nos campos correspondentes." Chen Runze descreveu a configuração padrão de uma equipe principal de modelo em grande escala.

Apostas de IA para grandes empresas

Nos últimos seis meses, as notícias de IA dos gigantes estabelecidos da Internet voaram por todo o céu. O investimento em grandes modelos de IA parece estar perseguindo pontos quentes, mas grandes empresas como Baidu, Ali e Huawei obviamente não estão seguindo a tendência quando apostam na IA. **

As apostas dos gigantes em IA já começaram há muito tempo, para essas empresas, IA não é um assunto novo. Tiger Sniff, de acordo com as estatísticas incompletas dos dados de pesquisa empresarial, as principais fábricas investiram em empresas relacionadas à inteligência artificial em graus variados desde 2018. Do ponto de vista das empresas de investimento, a maioria delas são empresas na aplicação de inteligência artificial, embora algumas delas estão envolvidas em empresas de chips de IA, mas o número não é grande, quase não há empresas envolvidas em modelos de grande escala, e a maioria das empresas relacionadas à inteligência artificial investidas por grandes fabricantes estão intimamente relacionadas aos seus negócios.

Dachang Investment Institucional Invested Companies Índice médio de participação acionária O maior índice de participação de 100% Número de empresas acionárias

O investimento de três grandes empresas de Internet em empresas relacionadas à IA|Fonte de dados: Qichacha

Em 2017, o Alibaba Dharma Institute foi estabelecido. Seus objetos de pesquisa abrangem vários campos industriais, como inteligência de máquina, rede inteligente e tecnologia financeira. Ele capacita as capacidades de inteligência artificial para várias linhas de negócios da Ali. Em 2018, o Baidu propôs a estratégia "All in AI".

A diferença é que o surgimento da IA generativa parece ser um ponto de virada. **Para gigantes da tecnologia com vantagens em dados, poder de computação e recursos de algoritmos, a inteligência artificial não é apenas um cenário facilitador para eles, mas também precisa assumir o papel de infraestrutura. Afinal, o surgimento da IA generativa significa que a inteligência artificial O a divisão do trabalho na indústria inteligente já começou.

Grandes empresas representadas por Baidu, Alibaba, Huawei e Tencent, os quatro provedores de nuvem, anunciaram suas próprias estratégias de IA, mas obviamente cada uma tem seu próprio foco.

Nos últimos seis meses, os gigantes lançaram seus próprios modelos de produtos em grande escala. Para grandes empresas como Baidu e Ali, não é tarde para entrar no modelo grande, basicamente em 2019.

A Baidu desenvolve modelos de pré-treinamento desde 2019 e lançou sucessivamente a série de modelos Knowledge Enhanced Wenxin (ERNIE). O modelo Tongyi Thousand Questions de Ali também começou em 2019. Além dos modelos grandes de propósito geral de Baidu e Ali, em 19 de junho, a Tencent Cloud divulgou o progresso de pesquisa e desenvolvimento de modelos grandes da indústria. Em 7 de julho, a HUAWEI CLOUD lançou o produto modelo industrial Pangu 3.0.

Esses focos também refletem os negócios gerais de cada empresa, a estratégia de nuvem e o layout de longo prazo no mercado de IA.

A lucratividade da principal linha de negócios do Baidu oscilou muito nos últimos cinco anos. **A Baidu há muito vê os problemas dos negócios de publicidade baseada em pesquisa no mercado doméstico. Nesse sentido, a Baidu optou por investir pesadamente em tecnologia de IA para encontrar novas oportunidades. **Nos últimos anos, a Baidu não apenas convidou Wu Enda, Lu Qi e outros líderes do setor para atuar como executivos, mas também tem muito mais entusiasmo pela direção autônoma do que outras grandes empresas. A Baidu, que está tão preocupada com a IA, deve fazer apostas pesadas nessa onda de competição de modelos em grande escala.

Ali também mostrou grande entusiasmo por modelos grandes em geral. Por muito tempo, o Alibaba Cloud depositou grandes esperanças, **O Alibaba espera seguir a rota técnica para criar a segunda curva de crescimento do grupo. **No contexto de uma concorrência cada vez mais acirrada no negócio de comércio eletrônico e desaceleração do crescimento do mercado, as novas oportunidades na indústria de IA criadas pela Evian são, sem dúvida, uma boa oportunidade para o Alibaba Cloud fazer mais esforços no mercado doméstico de nuvem.

Em comparação com Baidu e Ali, a Tencent Cloud optou por dar prioridade aos modelos da indústria de grande escala em termos de modelos de grande escala, enquanto a Huawei Cloud declarou publicamente que se concentraria apenas em modelos da indústria de grande escala.

Para a Tencent, o crescimento de seu principal negócio tem sido constante e positivo nos últimos anos. Em uma fase em que o futuro dos modelos de larga escala de uso geral ainda não está claro, a Tencent é relativamente cautelosa ao apostar em modelos de IA de larga escala. Quando Ma Huateng falou sobre o modelo em grande escala na teleconferência de resultados anterior, ele disse: "A Tencent não tem pressa em mostrar os produtos semi-acabados. A chave é fazer um bom trabalho nos algoritmos subjacentes, poder de computação e dados. A cena cai."

Por outro lado, da perspectiva do Tencent Group, a Tencent possui atualmente 4 AI Labs e, no ano passado, lançou um modelo de elementos mistos em larga escala com trilhões de parâmetros. **O movimento da Tencent Cloud para se dedicar a modelos de indústria em larga escala é mais como uma estratégia de apostas "Não coloque todos os ovos na mesma cesta". **

Para a Huawei, sempre foi uma aposta pesada em pesquisa e desenvolvimento.Nos últimos 10 anos, o investimento total da Huawei em pesquisa e desenvolvimento ultrapassou 900 bilhões de yuans. No entanto, devido aos obstáculos encontrados no desenvolvimento do negócio de telefonia móvel, a estratégia geral da Huawei em muitas pesquisas e desenvolvimento de tecnologia também pode estar enfrentando ajustes.

Por um lado, o negócio de telefonia móvel é a maior exportação da tecnologia C-end da Huawei. Se o negócio de telefonia móvel não pagar pelo modelo de larga escala de propósito geral, então a motivação da Huawei para desenvolver um grande modelo cairá significativamente. Para a Huawei, apostar em um grande modelo de indústria que pode ser realizado rapidamente parece ser a solução ideal neste jogo de IA. **Como disse o CEO da Huawei Cloud, Zhang Pingan, "a Huawei não tem tempo para escrever poesia".

No entanto, para os gigantes da tecnologia, por maior que seja a aposta, desde que façam a aposta certa, poderão apoderar-se do mercado de infraestrutura e ganhar o direito de falar na era da inteligência artificial.

Pegue um martelo e encontre um prego

Para empresas comerciais, **todas as decisões ainda recaem sobre os livros econômicos. **

Mesmo com um grande investimento, cada vez mais fundadores de empresas perspicazes percebem que isso é algo que deve ser feito no futuro, mesmo que o investimento inicial não tenha retorno algum.

A pesquisa e o desenvolvimento de grandes modelos de IA exigem muito investimento, mas cada vez mais fundadores de empresas e investidores acreditam que esse é um "investimento necessário", mesmo que não haja retorno algum.

Como resultado, muitas empresas de inteligência artificial que nasceram sob a última onda da IA viram um novo amanhecer após um longo período de silêncio.

"Três anos atrás, todos diziam que o GPT-3 é a possibilidade de levar à inteligência artificial geral." Li Zhifei liderou um grupo de pessoas para estudar o GPT-3 em 2020. Naquela época, ele estava em um ponto de virada em seu desenvolvimento . , eles esperavam explorar novos negócios, mas após um período de pesquisa, o projeto do modelo em grande escala de Li Zhifei foi suspenso. Um dos motivos era que o modelo não era grande o suficiente na época e o outro era que não havia cena de pouso comercial. **

No entanto, após o lançamento do ChatGPT no final de 2022, Li Zhifei parecia ter levado um tiro no braço, porque ele, como todo mundo, viu novas oportunidades para grandes modelos. Em abril deste ano, Going Out and Asking lançou um produto modelo em grande escala autodesenvolvido - Sequence Monkey. No momento, eles estão se preparando para correr para a Bolsa de Valores de Hong Kong com o recém-lançado modelo em grande escala "Serial Monkey", e já enviaram o prospecto no final de maio.

Outra empresa veterana de IA também está acompanhando. Em julho do ano passado, a Aspire apresentou um pedido de IPO ao Conselho de Inovação em Ciência e Tecnologia, que foi rejeitado pelo comitê de revisão de listagem em maio deste ano.

Yu Kai disse francamente que até o OpenAI treinou com o V100 da Microsoft por quase um ano no estágio GPT2, e seu poder de computação é várias ordens de magnitude pior do que o do A100. No estágio inicial de acúmulo de modelos grandes, o Aspire também utiliza cartões mais econômicos para treinamento. Claro, isso leva tempo como um preço.

Em comparação com modelos grandes autodesenvolvidos, algumas empresas orientadas a aplicativos têm suas próprias escolhas.

Zhang Wang (pseudônimo), presidente de uma empresa de educação online, disse a Huxiu que, nos últimos seis meses, eles não pouparam esforços para explorar cenários de aplicação de modelos em larga escala, mas logo descobriram que havia muitos problemas no processo de implementação , como custo e investimento. A equipe de P&D da empresa tem de 50 a 60 pessoas. Desde que começaram a fazer pesquisas de modelos em grande escala, eles expandiram a equipe de P&D e recrutaram alguns novos talentos em modelos de grande escala. Zhang Wang disse que talentos em modelos de baixo nível são muito caro. **

Zhang Wang nunca pensou em desenvolver um grande modelo do zero e, considerando questões como segurança de dados e estabilidade do modelo, ele não pretende acessar diretamente a API para aplicação. A abordagem deles é se referir ao modelo grande de código aberto e usar seus próprios dados para treinamento. Essa também é a prática atual de muitas empresas de aplicativos - além do modelo grande, use seus próprios dados para fazer um pequeno modelo de indústria. Olhando para o futuro, eles começaram com um modelo de 7 bilhões de parâmetros, chegaram a 10 bilhões e agora estão tentando um modelo de 30 bilhões. Mas eles também descobriram que À medida que a quantidade de dados aumenta, o que acontece no treinamento de modelos grandes é que a nova versão pode não ser tão boa quanto a versão anterior e os parâmetros devem ser ajustados um a um. desvio que deve ser feito." Esperando explicar.

Zhang Wang disse a Huxiu que sua exigência para a equipe de P&D é explorar cenários de modelo de IA em grande escala com base nos negócios da empresa.

Esta é uma forma de encontrar um "prego" com um "martelo", mas não é fácil.

"O maior problema no momento é encontrar uma cena adequada. Na verdade, existem muitas cenas, mesmo que a IA seja usada, o efeito não pode ser melhorado muito." Zhang Wang disse, por exemplo, na cena de classe, o modelo grande de IA pode ser usado para capacitar Alguns modos interativos incluem lembrar os alunos de assistir às aulas, responder a perguntas e rotular etc., mas depois de experimentar o modelo grande de IA, eles descobriram que a precisão não era boa e a capacidade de entender e produzir não era ideal. A equipe de Zhang Wang decidiu abandonar temporariamente a IA nesta cena depois de tentar por um tempo.

Outro provedor de serviços de Internet, Xiaogetong, também começou a explorar negócios relacionados imediatamente após a eclosão do modelo de IA. O principal negócio da Little Goose é fornecer ferramentas de operação digital para comerciantes online, incluindo marketing, gerenciamento de clientes e monetização comercial.

Fan Xiaoxing, cofundador e COO da Goose Communication, disse a Huxiu que em abril deste ano, quando mais e mais aplicativos nasceram baseados em IA generativa, a Goose Communication viu o potencial por trás dessa tecnologia. óbvio para todos.” Fan Xiaoxing e os outros organizaram especialmente a linha de negócios de pesquisa de IA internamente, procurando casos de desembarque relacionados ao seu próprio negócio.

Fan Xiaoxing disse que **no processo de integração do modelo grande ao negócio, ela considerou custo e eficiência. "O custo de entrada do modelo grande ainda é bastante alto. **", disse ela.

Os "pregos" da indústria da Internet são fáceis de encontrar. A dificuldade real na implementação da IA está nas indústrias físicas, como indústria e manufatura.

Yu Kai disse a Huxiu que esta onda de IA ainda está subindo em espiral e avançando em ondas, e a contradição entre ** e o pouso industrial não mudou em nada, apenas mudou a casca. ** Portanto, nesse sentido, as leis das duas ondas de IA são as mesmas, e a melhor maneira é aprender com a história—— "Lições da última onda de IA, não repita desta vez."

Embora muitos fabricantes tenham gritado o slogan "indústria em primeiro lugar" na implementação de grandes modelos de IA, é realmente difícil para muitos cenários físicos da indústria corresponder aos atuais grandes modelos de IA. Por exemplo, o sistema de inspeção visual de IA aplicado em alguns cenários de inspeção industrial, mesmo que a demanda pelo modelo de IA não seja tão alta quanto 1 bilhão de parâmetros, os dados de treinamento inicial ainda são estendidos.

Tomando como exemplo uma simples cena de inspeção de energia eólica, o número de inspeções em um parque eólico chega a 70.000 unidades, mas os mesmos dados de crack podem aparecer apenas uma vez, e a quantidade de dados que as máquinas podem aprender está longe de ser suficiente. Ke Liang, diretor de produto da Broadbo Intelligent Wind Power Hardware, disse a Huxiu que o atual robô de inspeção para pás de turbinas eólicas não pode analisar com precisão as rachaduras das pás, **porque a quantidade de dados disponíveis para treinamento e análise é muito pequena e é necessário formar uma inspeção e identificação totalmente automática confiável também requer uma grande quantidade de acúmulo de dados e análise manual. **

No entanto, em cenários com boa acumulação de dados industriais, modelos grandes de IA já podem auxiliar no gerenciamento de bibliotecas complexas de peças de modelos 3D. A biblioteca de peças de uma empresa fabricante de aeronaves doméstica implementou uma ferramenta auxiliar de biblioteca de peças baseada no modelo grande do quarto paradigma "Shishuo". Entre mais de 100.000 peças de modelagem 3D, a pesquisa de modelo 3D pode ser realizada por meio de linguagem natural, o modelo 3D pode ser pesquisado por modelo 3D e até mesmo a montagem automática do modelo 3D pode ser concluída. **Essas funções requerem operações em várias etapas em muitas ferramentas CAD e CAE que estão paradas na indústria de manufatura. **

Os modelos em grande escala de hoje enfrentam os mesmos problemas de pouso que a IA de alguns anos atrás e também precisam encontrar pregos com um martelo. ** Algumas pessoas acreditam com otimismo que o martelo de hoje é completamente diferente do passado, mas quando se trata de pagar pela IA com dinheiro real, o resultado é um pouco diferente. **

De acordo com a pesquisa Markets Live Pulse divulgada pela Bloomberg em 30 de julho, entre os 514 investidores pesquisados, cerca de 77% planejam aumentar ou manter o investimento em ações de tecnologia nos próximos seis meses, e apenas menos de 10% dos investidores acreditam que a tecnologia indústria enfrenta uma grave crise de bolhas. No entanto, apenas metade desses investidores que estão otimistas com o desenvolvimento da indústria de tecnologia estão abertos à tecnologia de IA.

50,2% dos entrevistados indicaram que não pretendem pagar pela compra de ferramentas de IA no momento, e a maioria das empresas de investimento não tem planos de aplicar IA a transações ou investimentos em larga escala.

O homem que vende pás

Se você fosse para a Califórnia para garimpar ouro durante a corrida do ouro em 1848, muitas pessoas morreriam, mas as pessoas que vendiam colheres e pás sempre ganhariam dinheiro.” Lu Qi disse em um discurso.

Gao Feng (pseudônimo) quer ser um "vendedor de pás", para ser mais preciso, uma pessoa que pode "vender boas pás na China".

Como pesquisador de chips, Gao Feng passa a maior parte de seu tempo de pesquisa científica em chips de IA. Nos últimos um ou dois meses, ele sentiu uma espécie de urgência - queria ser uma empresa de CPU baseada na arquitetura RISC-V. Em uma casa de chá, Gao Feng descreveu o futuro para Huxiu.

No entanto, é necessário fazer chips de IA do zero, seja na indústria de chips ou no círculo de tecnologia, é como uma "Arabian Nights". **

Quando o volante do modelo grande de IA começou rapidamente, o poder de computação por trás dele gradualmente começou a falhar em acompanhar o ritmo dos jogadores nesta pista. A crescente demanda por poder de computação fez da Nvidia a maior vencedora. Mas a GPU não é toda a solução para o poder de computação. CPU, GPU e vários chips inovadores de IA formam o principal centro de fornecimento de energia de computação do modelo grande.

"Você pode comparar a CPU com a área urbana, e a GPU é o desenvolvimento suburbano." Gao Feng disse que a CPU e o chip AI precisam ser conectados por meio de um canal chamado PCIE, e o os dados são transmitidos para o chip AI e, em seguida, o chip AI é conectado novamente. Passe os dados de volta para a CPU. Se o volume de dados do modelo grande aumentar, um canal ficará congestionado e a velocidade não aumentará. Portanto, essa estrada precisa ser alargada e somente a CPU pode determinar a largura desse canal e quantas faixas precisam ser definido.

Isso significa que, mesmo que a China rompa o chip AI no modelo grande, a CPU mais crítica ainda é difícil de romper. ** Mesmo no treinamento de IA, mais e mais tarefas podem ser atribuídas à GPU, mas a CPU ainda é a função de "gerente" mais crítica.

Alguns chips domésticos exibidos na área de exibição de grandes modelos 2023WAIC

Já se passaram mais de 50 anos desde que a Intel criou a primeira CPU do mundo em 1971. Nos mercados de servidores civis e PCs, a Intel e a AMD são há muito tempo o mundo. A Intel estabeleceu um sistema que cobre direitos de propriedade intelectual, acúmulo de tecnologia, custo de escala, e ecologia de software.Toda a barreira do modelo de negócios, e essa barreira nunca diminuiu.

Para abandonar completamente a arquitetura X86 e a arquitetura ARM e desenvolver um chip de CPU completamente independente baseado em uma nova arquitetura, pode-se dizer que "noventa e nove mortes e uma vida é uma vida inteira". Godson, que é baseado na instrução MIPS set, está nessa estrada há mais de 20 anos. Dizem que é uma arquitetura de código aberto que não foi totalmente desenvolvida e verificada como o RISC-V. **

O conjunto de instruções é como um pedaço de terra.Desenvolver chips com base no conjunto de instruções é equivalente a comprar um terreno e construir uma casa. A arquitetura do X86 é de código fechado, e apenas os chips ecológicos da Intel são permitidos.A arquitetura do ARM precisa pagar taxas de licenciamento IP, enquanto o RISC-V é uma arquitetura de código aberto gratuita.

A indústria e a academia já veem essas oportunidades.

Em 2010, a equipe de pesquisa de dois professores de Berkeley, Califórnia, desenvolveu um novo conjunto de instruções do zero, chamado RISC-V. Esse conjunto de instruções é totalmente de código aberto. Eles acreditam que o conjunto de instruções da CPU não deve pertencer a nenhum empresa.

"**RISC-V pode ser o alvorecer da CPU chinesa. **" disse Gao Feng. Em 2018, ele incubou uma empresa de chips de IA no instituto. Na época, ele disse que não queria perder a oportunidade de desenvolver a onda de IA. Desta vez, ele ainda queria aproveitá-la, e isso ponto de entrada foi RISC-V. Na era dos grandes modelos e da substituição doméstica, essa demanda é ainda mais urgente, afinal, se um dia as empresas chinesas não puderem mais usar o A100, o que farão?

"Se você deseja substituir o ARM e o X86, a CPU RISC-V precisa ser mais poderosa e você precisa participar do desenvolvimento do código com pessoas que usam sistemas operacionais comerciais no Linux", disse Gao Feng.

Gao Feng não é a primeira pessoa a perceber essa oportunidade.Um investidor na indústria de chips disse a Tiger Sniff que certa vez ele conversou com o fundador de uma empresa iniciante de chips sobre a oportunidade de usar a arquitetura RISC-V para fazer GPUs. Hoje, já existem algumas empresas na China que fabricam GPUs baseadas na arquitetura RISC-V, mas a ecologia ainda é o maior problema que enfrentam.

“O Linux demonstrou que esse caminho pode ser percorrido.” Gao Feng disse que no sistema operacional de código aberto Linux, empresas de código aberto como a Red Hat nasceram e muitos serviços em nuvem agora são construídos no sistema Linux. “São necessários desenvolvedores suficientes.” Gao Feng propôs um método. Esta estrada é difícil, mas será uma estrada brilhante se passar.

O volante gira muito rápido

Sob a "resposta ao estresse" do modelo grande, não é apenas o pico que sente a urgência.

A Lianchuang, uma empresa doméstica de modelos de IA em grande escala, disse a Tiger Sniff que eles também lançaram brevemente um modelo de diálogo em grande escala no início deste ano. Muitos pedidos de retificação.

"Até que não haja uma política regulatória específica, não abriremos facilmente o produto para usuários comuns. O principal motivo é a lógica do To B." Zhang Chao, CEO da Left Hand Doctor, acredita que antes das "Medidas Administrativas" serem emitidas , a IA generativa O produto é aberto a usuários C-end, o que é muito arriscado. “Nesta fase, por um lado, continuamos a otimizar de forma iterativa e, por outro lado, também continuamos prestando atenção às políticas e regulamentações para garantir a segurança da tecnologia”.

“A abordagem regulatória para IA generativa ainda não está clara, e os produtos e serviços de empresas modelo em grande escala são geralmente muito discretos.” Um provedor de tecnologia digital lançou um produto de aplicativo baseado em um modelo geral de grande escala desenvolvido por uma nuvem fabricante em junho. Na reunião, o responsável pela tecnologia da empresa disse a Huxiu que eles eram obrigados pelo fornecedor da nuvem a mantê-lo estritamente confidencial e, se revelassem de quem era o modelo grande usado, seriam considerados como tendo violado o contrato. Quanto ao motivo pelo qual o caso deve ser mantido em sigilo, o responsável analisou que grande parte do motivo pode ser para evitar riscos regulatórios. **

Em um momento em que o mundo está aumentando sua vigilância contra a IA, nenhum mercado pode aceitar um "período de vácuo" de regulamentação.

Em 13 de julho, sete departamentos, incluindo a Administração do Ciberespaço da China, divulgaram oficialmente as "Medidas Provisórias para a Administração de Serviços de Inteligência Artificial Generativa" (doravante denominadas "Medidas Administrativas"), que entrarão em vigor em 15 de agosto de 2023.

"Após o lançamento das "Medidas Administrativas", a política mudará do desenvolvimento orientado para o problema para o desenvolvimento orientado para o objetivo, que é o nosso objetivo.**" Wang Yuwei, sócio do escritório de advocacia Guantao, acredita que os novos regulamentos enfatizam " esparsidade" em vez de "bloqueio" não pesado. **

Navegar na biblioteca de gerenciamento de riscos nos Estados Unidos é uma lição de casa diária para Wang Yuwei, "Estamos fornecendo soluções de controle de risco e conformidade para aplicativos comerciais usando GPT e outros grandes modelos para segmentar indústrias e estabelecendo uma estrutura de governança de conformidade. "Wang Yuwei disse.

Os gigantes da IA da América estão fazendo fila para mostrar sua lealdade ao Congresso. Em 21 de julho, Google, OpenAI, Microsoft, Meta, Amazon, startups de IA Inflection, Anthropic, as sete empresas americanas de IA mais influentes, assinaram um compromisso voluntário na Casa Branca. Certifique-se de que especialistas em segurança independentes tenham permissão para testar seus sistemas antes de divulgá-los ao público. E compartilhar dados sobre a segurança de seus sistemas com governos e academia. Eles também desenvolverão sistemas para alertar o público quando imagens, vídeos ou textos forem gerados por IA, usando um método conhecido como "marca d'água".

Anteriormente, em uma audiência no Congresso dos EUA, o fundador da OpenAI, Sam Altman, disse que um conjunto de padrões de segurança para modelos de inteligência artificial precisa ser criado, incluindo a avaliação de suas capacidades perigosas. Por exemplo, os modelos devem passar por certos testes de segurança, como se podem "replicar-se" e "infiltrar-se na natureza".

Talvez o próprio Sam Altman não esperasse que o volante da IA girasse tão rápido que corresse o risco de perder o controle.

"No início, não percebíamos o quão urgente era esse assunto", disse Wang Yuwei, até que mais e mais fundadores da empresa vieram consultar. Ele sente que essa onda de inteligência artificial está passando por mudanças completamente diferentes do passado. **

No início deste ano, Wang Yuwei foi abordado por uma empresa Wenshengtu que foi a primeira a ter acesso a modelos de grande escala. A empresa queria introduzir seus negócios na China, então eles queriam saber sobre o negócio de compliance de dados nessa área. Imediatamente depois, Wang Yuwei descobriu que havia cada vez mais consultas desse tipo, e a mudança mais óbvia foi que não era mais o consultor jurídico da empresa, mas o fundador que vinha consultar. “Com o surgimento da IA generativa, a lógica regulatória original é difícil de aplicar”, disse Wang Yuwei.

Wang Yuwei, que está envolvido no trabalho jurídico de big data há muitos anos, descobriu que a IA generativa e a onda anterior de IA estão mostrando mudanças mais fundamentais. Por exemplo, da última vez, a IA foi mais baseada em recomendações baseadas em algoritmos, e algum reconhecimento facial foi direcionado a uma cena, e alguns pequenos modelos foram treinados em cenários de aplicativos específicos. As questões legais envolvidas nada mais eram do que direitos de propriedade intelectual. , Privacidade questões de proteção. Diferentes funções nesse ecossistema de IA generativa, como a empresa que fornece o grande modelo subjacente, a empresa que se conecta ao grande modelo para fazer aplicativos e o fornecedor de nuvem que armazena dados, etc., têm supervisão correspondente diferente. **

Atualmente, existe um consenso sobre os riscos associados a grandes modelos. A indústria entende que as aplicações comerciais inevitavelmente amplificam esses riscos. Para manter a continuidade dos negócios, é necessário estar atento à supervisão.

A dificuldade é "como encontrar um caminho que possa ser bem supervisionado sem afetar o desenvolvimento da indústria", disse Wang Yuwei.

Conclusão

Para toda a indústria, ao mesmo tempo em que aprofunda a discussão sobre tecnologia, também está provocando um pensamento mais abrangente.

Quando a IA está gradualmente ocupando uma posição dominante na indústria de tecnologia, como garantir a justiça, justiça e transparência da tecnologia? Como garantir que pequenas e médias empresas e start-ups não sejam marginalizadas quando empresas líderes controlam rigidamente a tecnologia e os fluxos de capital? O desenvolvimento e aplicação de modelos em grande escala tem um grande potencial, mas seguir cegamente a tendência nos fará ignorar outras tecnologias inovadoras?

"No curto prazo, o grande modelo de IA está sendo seriamente superestimado. Mas, no longo prazo, o grande modelo de IA está seriamente subestimado."

Em meio ano, a onda de calor da IA aumentou. No entanto, para empresas iniciantes e gigantes da tecnologia chinesas, como manter um julgamento claro e fazer planejamento e investimento de longo prazo na atmosfera aquecida do mercado será a chave para testar sua verdadeira força e visão.

(Pao Xiaoqian também contribuiu para este artigo)

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)