ChatGPT explodiu nos últimos seis meses: hot money, gigantes e supervisão

2023-08-04 09:56:54

Depois de meio ano do batismo da IA, pode ser difícil encontrar uma palavra mais apropriada do que "resposta ao estresse" para descrever o estado de todos na indústria de tecnologia hoje - tensão, estimulação e pressão.

"Resposta ao estresse" refere-se a uma série de respostas que os organismos produzem para manter a homeostase do corpo quando encontram pressões ou ameaças ambientais externas. É uma resposta natural dos organismos para se adaptar ao ambiente e garantir a sobrevivência. Esta resposta pode ser de curta duração ou de longa duração.

Em 26 de julho, o Twitter oficial da OpenAI anunciou que a versão Android do ChatGPT estava disponível para download nos Estados Unidos, Índia, Bangladesh e Brasil, e planeja expandir para mais países em um futuro próximo. O ChatGPT está expandindo os canais, ganhando mais usuários e maior aderência ao uso, e a onda de IA generativa continua a aumentar.

No início de julho, na Conferência Mundial de Inteligência Artificial (WAIC) de 2023 em Xangai, uma técnica de uma empresa start-up de modelos em grande escala estava passando pelo salão de exposições. Ela planejava encontrar uma solução de chip doméstico econômica para a empresa para usar para treinamento de modelo em grande escala.

“Temos 1.000 A100, mas não são suficientes”, disse ela a Huxiu.

A100 é uma GPU de ponta da Nvidia e a base de hardware para o desenvolvimento do ChatGPT. Alguns dados públicos mostram que, no processo de treinamento dos modelos da série GPT, o número de GPUs Nvidia usadas pelo OpenAI é de cerca de 25.000. Portanto, para fazer um modelo grande, você deve primeiro avaliar quantas placas gráficas A100 você pode obter, o que quase se tornou uma prática neste setor.

Onde estão as GPUs? Onde posso encontrar poder de computação barato? Este é apenas um microcosmo das muitas perguntas na conferência 2023WAIC.

Quase todas as pessoas que estiveram "estressadas" nos últimos seis meses estão ansiosas para encontrar mais respostas sobre IA neste "evento".

local 2023WAIC

Um técnico de um expositor de chips disse a Tiger Sniff que, durante os poucos dias da conferência WAIC, muitos gerentes de produto foram ao estande de "grandes modelos" na esperança de encontrar aqui as definições de produtos para os negócios de grandes modelos da empresa.

No Fórum Zhongguancun em 28 de maio, o "Relatório de Pesquisa de Mapas de Modelos em Grande Escala de Inteligência Artificial da China", divulgado pelo Instituto de Informações Científicas e Tecnológicas da China, mostrou que, até o final de maio, 79 modelos em grande escala com uma escala de parâmetros de mais de 1 bilhão na China foram liberados. Nos dois meses seguintes, uma série de grandes modelos de IA, como Tongyi Wanxiang da Alibaba Cloud, Pangu 3.0 da Huawei Cloud e Youdao "Ziyue" foram lançados. De acordo com estatísticas incompletas, os atuais modelos grandes de IA domésticos ultrapassaram 100.

A ação de empresas domésticas lutando para lançar grandes modelos de IA é a melhor personificação da "resposta ao estresse". A ansiedade provocada por essa "reação" está sendo transmitida a quase todo o pessoal relevante da indústria, do CEO de um gigante da Internet a um pesquisador de uma instituição de pesquisa de IA, de um sócio de um fundo de capital de risco ao fundador de uma Empresa de IA e até mesmo muitos profissionais jurídicos relacionados à IA, bem como reguladores de dados e segurança de rede.

Para pessoas de fora da indústria, isso pode ser apenas um carnaval de curta duração, mas quantas pessoas se atrevem a dizer que estão fora da IA hoje em dia.

A IA está inaugurando uma nova era e vale a pena remodelar tudo com um grande modelo. Mais e mais pessoas estão começando a pensar sobre as consequências da difusão da tecnologia.

Os fundos estão chegando, os volantes estão aqui

Um mês após o nascimento do ChatGPT, Li Zhifei, o fundador do ChatGPT, foi ao Vale do Silício duas vezes e conversou sobre grandes modelos com todos.Ao conversar com Huxiu, Li Zhifei disse sem rodeios que este era seu último "All in".

Em 2012, Li Zhifei fundou a Mobwenwen, uma empresa de inteligência artificial com interação por voz e a combinação de software e hardware como núcleo, que experimentou os altos e baixos das duas ondas de inteligência artificial da China. Durante o período mais quente da última onda de inteligência artificial, a avaliação de Momenwenbang já foi empurrada para o nível de unicórnio, mas também passou por um período de solidão desde então. Não foi até o surgimento do ChatGPT que a indústria de inteligência artificial que esteve em silêncio por muitos anos. Um buraco foi aberto.

No mercado primário, "o dinheiro quente está entrando".

Este é o consenso da indústria quando se trata de modelos grandes nos últimos seis meses. Lu Qi, fundador do Fórum Qiji, acredita que os modelos de IA em grande escala são um "volante", e o futuro será uma era em que os modelos são onipresentes. "Este volante já começou", e a maior força motriz é o capital.

No início de julho, dados divulgados pela plataforma de informações empresariais Crunchbase mostraram que empresas classificadas como IA levantaram US$ 25 bilhões no primeiro semestre de 2023, respondendo por 18% do financiamento global. Embora esse valor tenha diminuído em comparação com os US$ 29 bilhões do primeiro semestre de 2022, o valor total do financiamento de várias indústrias no mundo no primeiro semestre de 2023 diminuiu 51% em comparação com o mesmo período de 2022, o que mostra que o valor do financiamento na área de IA é o maior do mundo, a proporção do financiamento total quase dobrou. A Crunchbase escreveu no relatório: “Sem o boom da inteligência artificial desencadeado pelo ChatGPT, o valor do financiamento em 2023 será ainda menor”.

Até agora, o maior financiamento da indústria de IA em 2023 é o investimento de US$ 10 bilhões da Microsoft na OpenAI em janeiro.

Tiger Sniff De acordo com estatísticas públicas, entre as startups de grande porte nos Estados Unidos, a Inflection AI pode se tornar a segunda maior startup no campo da inteligência artificial depois da Open AI, seguida pela Anthropic (US$ 1,5 bilhão), Cohere (US$ 445 milhões), Adept (US$ 415 milhões), Runway (US$ 195,5 milhões), Character.ai (US$ 150 milhões) e Stability AI (cerca de US$ 100 milhões).

Na China, no primeiro semestre de 2023, houve 456 incidentes de investimento e financiamento público na indústria doméstica de inteligência artificial. E essa estatística é 731, 526, 353, 631 e 648 nos cinco anos de 2018 a 2022.

Eventos de investimento e financiamento público na indústria nacional de inteligência artificial no primeiro semestre do ano

Outro evento que acionou o volante foi o lançamento da interface da API pelo ChatGPT. Quando a OpenAI abriu a interface API do ChatGPT pela primeira vez em março, havia quase um consenso dentro e fora da indústria de IA: a indústria está prestes a mudar. À medida que mais aplicativos são conectados a modelos grandes, uma floresta mais exuberante cresce em cima da IA.

"A construção de modelos em grande escala e a criação de aplicativos devem ser separados." Os investidores sempre têm um olfato apurado. De acordo com Chen Runze, diretor executivo da Source Code Capital, a IA segue a mesma lógica da divisão do trabalho em semicondutores. prosperidade de modelos de IA em grande escala, em breve Em breve veremos um boom em aplicações de IA.

No início deste ano, quando Chen Runze e seus colegas foram para o Vale do Silício, descobriram que a Y Combinator, uma conhecida incubadora de startups no Vale do Silício (o CEO da OpenAI, Sam Altman, atuou como presidente desta incubadora por muitos anos), metade dos projetos foi transformada em IA generativa. O entusiasmo por grandes modelos não é menor que o da China do outro lado do oceano.

No entanto, ele também constatou que tanto o capital quanto os empreendedores nos Estados Unidos estão mais otimistas com as aplicações ecológicas baseadas em grandes modelos do que com o empreendedorismo em larga escala. Afinal, empresas como a OpenAI já surgiram nessa trilha. Ao mesmo tempo, o Os Estados Unidos têm um forte solo ecológico de aplicação ToB, então mais empresas americanas estão tentando fazer aplicações corporativas com base na ecologia de grandes modelos.

As observações de Chen Runze estão sendo confirmadas. Chen Ran, co-fundador da plataforma de serviço de modelo em grande escala OpenCSG, disse a Huxiu que hoje mais de 90% das empresas na área da baía dos Estados Unidos usaram modelo em grande escala capacidades em todos os aspectos. Quanto à China, Chen Ran acredita que muitos clientes o utilizarão antes do final do ano.

Por volta de março deste ano, Chen Runze e sua equipe começaram a tentar encontrar empresas na China que fizessem aplicativos baseados em modelos grandes, mas ele descobriu que havia pouquíssimas empresas desse tipo. Uma grande quantidade de capital entrou na indústria de inteligência artificial, mas se você rastrear o fluxo desses fundos, verá que mais dinheiro ainda está concentrado nas principais empresas.

"Mesmo agora, de 10 projetos relacionados à IA generativa, não é fácil investir em 1-2." projetos para ver, existem muito poucos realmente confiáveis.

Essa atitude do lado da aplicação, aos olhos de muitas pessoas do setor, já é a norma.

Yu Kai, o co-fundador da Aspire, acredita que a pista aparentemente animada na superfície é, na verdade, mais uma competição nominal, e os resultados são nada mais do que duas situações: "Uma é puramente voltada para o capital para arrecadar dinheiro; a outra é Uma empresa que faz um modelo universal em grande escala realmente precisa gritar, e outras não saberão se não gritarem.

Algumas estatísticas domésticas também ilustram esse problema. De acordo com estatísticas de uma organização terceirizada, Niu, em julho de 2023, havia 242 empresas AIGC na China e houve 71 incidentes de financiamento de trilha AIGC desde janeiro. Existem 67 empresas na trilha do modelo de grande escala da IA e houve apenas 21 eventos de financiamento desde o lançamento do ChatGPT.

Os eventos de financiamento da trilha AIGC e da trilha AI de modelo grande desde o lançamento do ChatGPT｜Fonte de dados: Enniu Data

“No mercado doméstico de IA, existem poucos alvos bons.” Um investidor disse a Tiger Sniff que bons projetos são muito caros e os baratos não são confiáveis. Embora o número de modelos de IA em grande escala lançados na China atualmente exceda cem, entre as empresas de modelos em grande escala na China, poucas, ou mesmo algumas delas, obtiveram financiamento enorme.

Muitos investimentos em IA se transformaram em investidores no final - ex-fundadores de empresas unicórnios, gigantes da Internet, pessoas com experiência empresarial relacionada a modelos de grande escala, etc.

| | | | | | | --- | --- | --- | --- | --- | | Tipo de empresa | Empresa | Data de estabelecimento | Grandes modelos e produtos relacionados | | Empresa de Internet | Baidu | 2012 | Wenxin Yiyan | Listado | | Aliyun | 2008 | Tongyi Qianwen | Listado | | | Tencent AI Lab| 1998 | Hunyuan| Listado| | | Huawei Cloud | 2019 | Pangu | Não listado | | | ByteDance| 2016 | Arca vulcânica| Não listado| | | JD Cloud | 2012 | Yanxi | Listado | | | Kunlun Wanwei | 2008 | Tiangong | Listado | | | 360 | 1992 | 360 Zhinao | Listado | |

| | | | | | | --- | --- | --- | --- | --- | | Tipo de empresa | Empresa | Data de estabelecimento | Grandes modelos e produtos relacionados | | AI Company | SenseTime | 2014 | Diário Novo | Listado | | HKUST Xunfei | 1999 | Xunfei Spark | Listado | | | Tecnologia Yuncong| 2015 | Calma| Listado| | | Daguan Data| 2015 | Cao Zhi| Rodada C| | | Saia e pergunte | 2014 | Macaco de Sequência | Rodada D | | | Zhipu Al | 2019 | ChatGLM | Rodada B | | | Tecnologia Lanzhou | 2021 | Mencius | Rodada pré-A | | | MiniMax | 2021 | Brilho | Investimento de capital | | | Tecnologia Facewall| 2022 | VisCPM | Roda de anjo| | | Shenyan Technology| 2022 | CPM | Investimento de capital | | | Mind Intelligence | 2021 | Al Utopia | Rodada Pré-A | | | Lianyuan Technology| 2021 | ProductGPT | Angel Wheel| | | Aspire | 2007 | DFM-2 | Término do IPO | |

| | | | | | | --- | --- | --- | --- | --- | | Tipo de empresa | Empresa | Data de estabelecimento | Grandes modelos e produtos relacionados | | Uma empresa start-up de IA será estabelecida em 2023 | A anos-luz de distância | 2023 | Não | Uma rodada | | Baichuan Intelligent | 2023 | baichuan | Investimento de capital | | | Zero One Tudo | 2023 | Nenhum | Investimento de capital | |

Estatísticas parciais de empresas relacionadas a modelos domésticos de IA em larga escala

Entre os principais projetos de IA deste ano, Zhipu AI, Lingxin Intelligence, Shenyan Technology e Facewall Intelligence são empresas incubadas pelo Tsinghua Lab. Tanto a Shenyan Technology quanto a Facewall Smart foram estabelecidas em 2022 e têm endosso técnico de estudiosos conhecidos na indústria de IA.

O tempo de estabelecimento dessas empresas de IA baseadas em Tsinghua é mais curto do que o das empresas de IA fundadas por alguns líderes da indústria da Internet. Light Years Beyond, Baichuan Intelligent e Zero One Wanwu foram todas estabelecidas após o início dessa onda de modelos em grande escala.

Wang Huiwen, co-fundador da Meituan, certa vez levantou US$ 50 milhões anos-luz desde sua criação no início de 2023, que foi um dos poucos casos de financiamento na indústria de modelos em grande escala da China na época. Ao contrário de Zhipu AI e Xihu Xinchen, que já possuem empresas baseadas em modelos de grande escala, a anos-luz de distância começará em fevereiro de 2023. É difícil construir um modelo de grande escala do zero. Em 29 de junho, a Meituan anunciou a aquisição da todos os interesses além dos anos-luz, com uma consideração total de aproximadamente US$ 233 milhões (1,67 bilhão de yuans) em dinheiro, aproximadamente 367 milhões de yuans em dívidas e 1 yuan em dinheiro.

"Pelo menos deve haver pessoas com experiência em processamento de linguagem natural, pessoas com certa experiência prática em treinamento de modelo em grande escala e profissionais em processamento de dados, clusters de poder de computação em grande escala, etc. Se você quiser fazer aplicativos ao mesmo tempo, você deve ter gerentes de produto correspondentes e talentos operacionais no campo.” Chen Runze descreveu a configuração padrão de uma equipe principal de modelo em grande escala.

A IA DA GRANDE EMPRESA É MELHOR

Nos últimos seis meses, as notícias de IA dos gigantes estabelecidos da Internet voaram por todo o céu. O investimento em grandes modelos de IA parece estar perseguindo pontos quentes, mas as apostas feitas por grandes empresas como Baidu, Ali e Huawei em IA obviamente não estão seguindo a tendência.

As apostas dos gigantes em IA já começaram há muito tempo, para essas empresas, IA não é um assunto novo. Tiger Sniff, de acordo com as estatísticas incompletas dos dados de pesquisa empresarial, as principais fábricas investiram em empresas relacionadas à inteligência artificial em graus variados desde 2018. Do ponto de vista das empresas de investimento, a maioria delas são empresas na aplicação de inteligência artificial, embora algumas delas estão envolvidas em empresas de chips de IA, mas o número não é grande, quase não há empresas envolvidas em modelos de grande escala, e a maioria das empresas relacionadas à inteligência artificial investidas por grandes fabricantes estão intimamente relacionadas aos seus negócios.

| | | | | | | --- | --- | --- | --- | --- | Instituições de investimento de Dachang| Número de empresas investidas| Índice médio de participação| Índice máximo de participação| Número de empresas com participação de 100%| | Alibaba | 23 | 36,25% | 100% | 5 | | Baidu Venture Capital | 25 | 5,50% | 15% | 0 | | Investimento Tencent | 54 | 17,54% | 100% | 2 |

O investimento de três grandes empresas de Internet em empresas relacionadas à IA｜Fonte de dados: Qichacha

Em 2017, o Alibaba Dharma Institute foi estabelecido. Seus objetos de pesquisa abrangem vários campos industriais, como inteligência de máquina, rede inteligente e tecnologia financeira. Ele capacita as capacidades de inteligência artificial para várias linhas de negócios da Ali. Em 2018, o Baidu propôs a estratégia "All in AI".

A diferença é que o surgimento da IA generativa parece ser um ponto de virada. Para gigantes da tecnologia com vantagens em dados, poder de computação e recursos de algoritmos, a inteligência artificial não é apenas um cenário facilitador para eles, mas também precisa assumir o papel de infraestrutura. Afinal, o surgimento da IA generativa significa que a indústria de inteligência artificial divisão do trabalho começou.

Grandes empresas representadas por Baidu, Alibaba, Huawei e Tencent, os quatro provedores de nuvem, anunciaram suas próprias estratégias de IA, mas obviamente cada uma tem seu próprio foco.

Nos últimos seis meses, os gigantes lançaram seus próprios modelos de produtos em grande escala. Para grandes empresas como Baidu e Ali, não é tarde para entrar no modelo grande, basicamente em 2019.

A Baidu desenvolve modelos de pré-treinamento desde 2019 e lançou sucessivamente a série de modelos Knowledge Enhanced Wenxin (ERNIE). O modelo Tongyi Thousand Questions de Ali também começou em 2019. Além dos modelos grandes de propósito geral de Baidu e Ali, em 19 de junho, a Tencent Cloud divulgou o progresso de pesquisa e desenvolvimento de modelos grandes da indústria. Em 7 de julho, a HUAWEI CLOUD lançou o produto modelo industrial Pangu 3.0.

Esses focos também refletem os negócios gerais de cada empresa, a estratégia de nuvem e o layout de longo prazo no mercado de IA.

A lucratividade da principal linha de negócios do Baidu oscilou muito nos últimos cinco anos. Há muito tempo, o Baidu vê os problemas do negócio de publicidade baseada em pesquisa no mercado doméstico. Nesse sentido, o Baidu optou por investir pesadamente em tecnologia de IA para encontrar novas oportunidades. Ao longo dos anos, a Baidu não apenas convidou Wu Enda, Lu Qi e outros líderes do setor para atuar como executivos, mas também tem muito mais entusiasmo pela direção autônoma do que outras grandes empresas. A Baidu, que está tão preocupada com a IA, deve fazer apostas pesadas nessa onda de competição de modelos em grande escala.

Ali também mostrou grande entusiasmo por modelos grandes em geral. Por muito tempo, Aliyun teve grandes esperanças, e Ali espera seguir o caminho técnico para criar a segunda curva de crescimento do grupo. No contexto de uma concorrência cada vez mais acirrada no negócio de comércio eletrônico e desaceleração do crescimento do mercado, as novas oportunidades na indústria de IA criadas pela Evian são, sem dúvida, uma boa oportunidade para o Alibaba Cloud fazer mais esforços no mercado doméstico de nuvem.

Em comparação com Baidu e Ali, a Tencent Cloud optou por dar prioridade aos modelos da indústria de grande escala em termos de modelos de grande escala, enquanto a Huawei Cloud declarou publicamente que se concentraria apenas em modelos da indústria de grande escala.

Para a Tencent, o crescimento de seu principal negócio tem sido constante e positivo nos últimos anos. Em uma fase em que o futuro dos modelos de larga escala de uso geral ainda não está claro, a Tencent é relativamente cautelosa ao apostar em modelos de IA de larga escala. Quando Ma Huateng falou sobre o grande modelo na teleconferência de resultados anterior, ele disse: "A Tencent não tem pressa em mostrar os produtos semi-acabados. A chave é fazer um bom trabalho nos algoritmos subjacentes, poder de computação e dados , e mais importante, a cena cai."

Por outro lado, da perspectiva do Tencent Group, a Tencent possui atualmente 4 AI Labs e, no ano passado, lançou um modelo de elementos mistos em larga escala com trilhões de parâmetros. Coloque todos os ovos na mesma cesta "estratégia de apostas.

Para a Huawei, sempre foi uma aposta pesada em pesquisa e desenvolvimento.Nos últimos 10 anos, o investimento total da Huawei em pesquisa e desenvolvimento ultrapassou 900 bilhões de yuans. No entanto, devido aos obstáculos encontrados no desenvolvimento do negócio de telefonia móvel, a estratégia geral da Huawei em muitas pesquisas e desenvolvimento de tecnologia também pode estar enfrentando ajustes.

Por um lado, o negócio de telefonia móvel é a maior exportação da tecnologia C-end da Huawei. Se o negócio de telefonia móvel não pagar pelo modelo de larga escala de propósito geral, então a motivação da Huawei para desenvolver um grande modelo cairá significativamente. Para a Huawei, apostar em um modelo de indústria em larga escala que possa ser realizado rapidamente parece ser a solução ideal neste jogo de IA. Como disse Zhang Pingan, CEO da Huawei Cloud, "a Huawei não tem tempo para escrever poesia".

No entanto, para os gigantes da tecnologia, por maior que seja a aposta, desde que façam a aposta certa, poderão apoderar-se do mercado de infraestrutura e ganhar o direito de falar na era da inteligência artificial.

Tome um martelo por um prego

Para empresas comerciais, todas as decisões ainda recaem sobre os livros econômicos.

Mesmo com um grande investimento, cada vez mais fundadores de empresas perspicazes percebem que isso é algo que deve ser feito no futuro, mesmo que o investimento inicial não tenha retorno algum.

A pesquisa e o desenvolvimento de grandes modelos de IA exigem muito investimento, mas cada vez mais fundadores de empresas e investidores acreditam que esse é um "investimento necessário", mesmo que não haja retorno algum.

Como resultado, muitas empresas de inteligência artificial que nasceram sob a última onda da IA viram um novo amanhecer após um longo período de silêncio.

"Três anos atrás, todos diziam que o GPT-3 é a possibilidade de levar à inteligência artificial geral." Li Zhifei liderou um grupo de pessoas para estudar o GPT-3 em 2020. Naquela época, ele estava em um ponto de virada em seu desenvolvimento . , eles queriam explorar novos negócios, mas após um período de pesquisa, o projeto do modelo em grande escala de Li Zhifei foi suspenso. Um dos motivos era que o modelo não era grande o suficiente na época e o outro era que não havia cena de pouso comercial.

No entanto, após o lançamento do ChatGPT no final de 2022, Li Zhifei parecia ter levado um tiro no braço, porque ele, como todo mundo, viu novas oportunidades para grandes modelos. Em abril deste ano, Going Out and Asking lançou um produto modelo em grande escala autodesenvolvido - Sequence Monkey. No momento, eles estão se preparando para correr para a Bolsa de Valores de Hong Kong com o recém-lançado modelo em grande escala "Serial Monkey", e já enviaram o prospecto no final de maio.

Outra empresa de IA estabelecida também está acompanhando. Em julho do ano passado, a Aspire apresentou um pedido de IPO ao Conselho de Inovação em Ciência e Tecnologia, que foi rejeitado pelo comitê de revisão de listagem em maio deste ano.

Yu Kai disse francamente que até o OpenAI treinou com o V100 da Microsoft por quase um ano no estágio GPT2, e seu poder de computação é várias ordens de magnitude pior do que o do A100. No estágio inicial de acúmulo de modelos grandes, o Aspire também utiliza cartões mais econômicos para treinamento. Claro, isso leva tempo como um preço.

Em comparação com modelos grandes autodesenvolvidos, algumas empresas orientadas a aplicativos têm suas próprias escolhas.

Zhang Wang (pseudônimo), presidente de uma empresa de educação online, disse a Huxiu que, nos últimos seis meses, eles não pouparam esforços para explorar cenários de aplicação de modelos em larga escala, mas logo descobriram que havia muitos problemas no processo de implementação , como custo e investimento. A equipe de P&D da empresa tem de 50 a 60 pessoas. Desde que começaram a fazer pesquisas de modelos em grande escala, eles expandiram a equipe de P&D e recrutaram alguns novos talentos em modelos de grande escala. Zhang Wang disse que talentos em modelos de baixo nível são muito caro.

Zhang Wang nunca pensou em desenvolver um grande modelo do zero e, considerando questões como segurança de dados e estabilidade do modelo, ele não pretende acessar diretamente a API para aplicação. A abordagem deles é se referir ao modelo grande de código aberto e usar seus próprios dados para treinamento. Essa também é a prática atual de muitas empresas de aplicativos - além do modelo grande, use seus próprios dados para fazer um pequeno modelo de indústria. Olhando para o futuro, eles começaram com um modelo de 7 bilhões de parâmetros, chegaram a 10 bilhões e agora estão tentando um modelo de 30 bilhões. Mas eles também descobriram que, à medida que a quantidade de dados aumenta, o treinamento de modelos grandes levará ao fato de que a nova versão pode não ser tão boa quanto a versão anterior e os parâmetros devem ser ajustados um a um. "Isso também é um desvio que deve ser feito", disse Zhang Wang.

Zhang Wang disse a Huxiu que o requisito para a equipe de P&D é explorar cenários de modelo de IA em grande escala com base nos negócios da empresa.

Esta é uma forma de encontrar um "prego" com um "martelo", mas não é fácil.

"O maior problema no momento é encontrar uma cena adequada. Na verdade, existem muitas cenas. Mesmo se a IA for usada, o efeito não pode ser melhorado muito." Zhang Wang disse, por exemplo, na cena da aula, IA grande modelos podem ser usados para capacitar alguns modos interativos. Incluindo lembrar os alunos de assistir às aulas, responder a perguntas e rotular, etc., mas depois de experimentar o modelo AI grande, eles descobriram que a precisão não era boa e capacidade de compreensão e produção não era ideal. A equipe de Zhang Wang decidiu abandonar temporariamente a IA nesta cena depois de tentar por um tempo.

Outro provedor de serviços de Internet, Xiaogetong, também começou a explorar negócios relacionados imediatamente após a eclosão do modelo de IA. O principal negócio da Little Goose é fornecer ferramentas de operação digital para comerciantes online, incluindo marketing, gerenciamento de clientes e monetização comercial.

Fan Xiaoxing, cofundador e COO da Goose Communication, disse a Huxiu que em abril deste ano, quando mais e mais aplicativos nasceram com base na IA generativa, a Goose Communication viu o potencial por trás dessa tecnologia: “Por exemplo, MidJourney, IA generativa é A melhoria da eficiência na geração de imagens de design é realmente óbvia para todos.” Fan Xiaoxing e os outros organizaram especialmente a linha de negócios de pesquisa de IA internamente, procurando casos de desembarque relacionados aos seus próprios negócios.

Fan Xiaoxing disse que, no processo de integração do modelo grande ao negócio, o que ela considerou foi custo e eficiência. "O custo de entrada do modelo grande ainda é bastante alto".

Os "pregos" da indústria da Internet são fáceis de encontrar. A dificuldade real na implementação da IA está nas indústrias físicas, como indústria e manufatura.

Yu Kai disse a Huxiu que essa onda de IA ainda está subindo em espiral e avançando em ondas, e as contradições na implementação da indústria não mudaram em nada, apenas mudaram a casca. Portanto, nesse sentido, as leis das duas ondas de IA são as mesmas, e a melhor maneira é aprender com a história: "Lições da última onda de IA, não repita desta vez".

Embora muitos fabricantes tenham gritado o slogan "indústria em primeiro lugar" na implementação de grandes modelos de IA, é realmente difícil para muitos cenários físicos da indústria corresponder aos atuais grandes modelos de IA. Por exemplo, o sistema de inspeção visual de IA aplicado em alguns cenários de inspeção industrial, mesmo que a demanda pelo modelo de IA não seja tão alta quanto 1 bilhão de parâmetros, os dados de treinamento inicial ainda são estendidos.

Tomando como exemplo uma simples cena de inspeção de energia eólica, o número de inspeções em um parque eólico chega a 70.000 unidades, mas os mesmos dados de crack podem aparecer apenas uma vez, e a quantidade de dados que as máquinas podem aprender está longe de ser suficiente. Ke Liang, diretor de produto da Broadbo Intelligent Wind Power Hardware, disse a Tiger Sniff que, atualmente, os robôs de inspeção para pás de turbinas eólicas não podem analisar com precisão 100% as rachaduras das pás, porque a quantidade de dados disponíveis para treinamento e análise é muito pequena. identificação também requer uma grande quantidade de acúmulo de dados e análise manual.

No entanto, em cenários com boa acumulação de dados industriais, modelos grandes de IA já podem auxiliar no gerenciamento de bibliotecas complexas de peças de modelos 3D. A biblioteca de peças de uma empresa fabricante de aeronaves doméstica implementou uma ferramenta auxiliar de biblioteca de peças baseada no modelo grande do quarto paradigma "Shishuo". Entre mais de 100.000 peças de modelagem 3D, a pesquisa de modelo 3D pode ser realizada por meio de linguagem natural, o modelo 3D pode ser pesquisado por modelo 3D e até mesmo a montagem automática do modelo 3D pode ser concluída. Essas funções requerem operações de várias etapas em muitas ferramentas CAD e CAE que estão paradas na indústria de manufatura.

Os modelos em grande escala de hoje enfrentam os mesmos problemas de pouso que a IA de alguns anos atrás e também precisam encontrar pregos com um martelo. Algumas pessoas acreditam com otimismo que o martelo de hoje é completamente diferente do passado, mas quando se trata de pagar pela IA com dinheiro real, o resultado é um pouco diferente.

De acordo com a pesquisa Markets Live Pulse divulgada pela Bloomberg em 30 de julho, entre os 514 investidores pesquisados, cerca de 77% planejam aumentar ou manter o investimento em ações de tecnologia nos próximos seis meses, e apenas menos de 10% dos investidores acreditam que a tecnologia indústria enfrenta uma grave crise de bolhas. No entanto, apenas metade desses investidores que estão otimistas com o desenvolvimento da indústria de tecnologia estão abertos à tecnologia de IA.

50,2% dos entrevistados indicaram que não pretendem pagar pela compra de ferramentas de IA no momento, e a maioria das empresas de investimento não tem planos de aplicar IA a transações ou investimentos em larga escala.

Pá Pá

"Se você fosse para a Califórnia garimpar ouro durante a corrida do ouro em 1848, muitas pessoas morreriam, mas as pessoas que vendiam colheres e pás sempre poderiam ganhar dinheiro", disse Lu Qi em um discurso.

Gao Feng (pseudônimo) quer ser um "vendedor de pás", para ser mais preciso, uma pessoa que pode "vender boas pás na China".

Como pesquisador de chips, Gao Feng passa a maior parte de seu tempo de pesquisa científica em chips de IA. Nos últimos um ou dois meses, ele sentiu uma espécie de urgência - queria ser uma empresa de CPU baseada na arquitetura RISC-V. Em uma casa de chá, Gao Feng descreveu o futuro para Huxiu.

No entanto, fazer um chip de IA do zero, seja na indústria de chips ou no círculo de tecnologia, é como uma "Arabian Nights".

Quando o volante do modelo grande de IA começou rapidamente, o poder de computação por trás dele gradualmente começou a falhar em acompanhar o ritmo dos jogadores nesta pista. A crescente demanda por poder de computação fez da Nvidia a maior vencedora. Mas a GPU não é toda a solução para o poder de computação. CPU, GPU e vários chips de IA inovadores formam o principal centro de fornecimento de energia de computação do modelo grande.

"Você pode comparar a CPU com a área urbana, e a GPU é o subúrbio do desenvolvimento." Gao Feng disse que a CPU e o chip AI precisam ser conectados por meio de um canal chamado PCIE, e os dados são transmitidos para o chip AI e, em seguida, o chip AI envia os dados de volta para a CPU. Se o volume de dados do modelo grande aumentar, um canal ficará congestionado e a velocidade não aumentará. Portanto, essa estrada precisa ser alargada e somente a CPU pode determinar a largura desse canal e quantas faixas precisam ser definido.

Isso significa que, mesmo que a China rompa o chip AI no modelo grande, ainda é difícil romper a CPU mais crítica. Mesmo no treinamento de IA, mais e mais tarefas podem ser atribuídas à GPU, mas a CPU ainda é a função de "gerente" mais crítica.

Alguns chips domésticos exibidos na área de exibição de grandes modelos 2023WAIC

Já se passaram mais de 50 anos desde que a Intel criou a primeira CPU do mundo em 1971. Nos mercados de servidores civis e PCs, a Intel e a AMD são há muito tempo o mundo. A Intel estabeleceu um sistema que cobre direitos de propriedade intelectual, acúmulo de tecnologia, custo de escala, e ecologia de software.Toda a barreira do modelo de negócios, e essa barreira nunca diminuiu.

É necessário abandonar completamente a arquitetura X86 e a arquitetura ARM e desenvolver um chip de CPU completamente independente baseado em uma nova arquitetura, uma arquitetura de código aberto como o RISC-V que não foi totalmente desenvolvida e verificada.

O conjunto de instruções é como um pedaço de terra.Desenvolver chips com base no conjunto de instruções é equivalente a comprar um terreno e construir uma casa. A arquitetura do X86 é de código fechado, e apenas os chips ecológicos da Intel são permitidos.A arquitetura do ARM precisa pagar taxas de licenciamento IP, enquanto o RISC-V é uma arquitetura de código aberto gratuita.

A indústria e a academia já veem essas oportunidades.

Em 2010, a equipe de pesquisa de dois professores de Berkeley, Califórnia, desenvolveu um novo conjunto de instruções do zero, chamado RISC-V. Esse conjunto de instruções é totalmente de código aberto. Eles acreditam que o conjunto de instruções da CPU não deve pertencer a nenhum empresa.

"RISC-V pode ser o alvorecer da CPU chinesa", disse Gao Feng. Em 2018, ele incubou uma empresa de chips de IA no instituto. Na época, ele disse que não queria perder a oportunidade de desenvolver a onda de IA. Desta vez, ele ainda queria aproveitá-la, e isso ponto de entrada foi RISC-V. Na era dos grandes modelos e da substituição doméstica, essa demanda é ainda mais urgente, afinal, se um dia as empresas chinesas não puderem mais usar o A100, o que farão?

"Se você deseja substituir o ARM e o X86, a CPU RISC-V precisa ser mais poderosa e você precisa participar do desenvolvimento do código com pessoas que usam sistemas operacionais comerciais no Linux", disse Gao Feng.

Gao Feng não é a primeira pessoa a perceber essa oportunidade.Um investidor na indústria de chips disse a Tiger Sniff que certa vez ele conversou com o fundador de uma empresa iniciante de chips sobre a oportunidade de usar a arquitetura RISC-V para fazer GPUs. Hoje, já existem algumas empresas na China que fabricam GPUs baseadas na arquitetura RISC-V, mas a ecologia ainda é o maior problema que enfrentam.

“O Linux demonstrou que esse caminho pode ser percorrido.” Gao Feng disse que no sistema operacional de código aberto Linux, empresas de código aberto como a Red Hat nasceram e muitos serviços em nuvem agora são construídos no sistema Linux. “São necessários desenvolvedores suficientes.” Gao Feng propôs um método. Esta estrada é difícil, mas será uma estrada brilhante se passar.

volante gira muito rápido

Sob a "resposta ao estresse" do modelo grande, não é apenas o pico que sente a urgência.

A Lianchuang, uma empresa doméstica de modelos de IA em grande escala, disse a Tiger Sniff que eles também lançaram brevemente um modelo de diálogo em grande escala no início deste ano. Muitos pedidos de retificação.

"Até que não haja uma política regulatória específica, não abriremos facilmente o produto para usuários comuns. O principal motivo é a lógica do To B." Zhang Chao, CEO da Left Hand Doctor, acredita que antes das "Medidas Administrativas" serem emitidas , a IA generativa O produto é aberto a usuários C-end, o que é muito arriscado. “Nesta fase, por um lado, continuamos a otimizar de forma iterativa e, por outro lado, também continuamos prestando atenção às políticas e regulamentações para garantir a segurança da tecnologia”.

“A abordagem regulatória para IA generativa ainda não está clara, e os produtos e serviços de empresas modelo em grande escala são geralmente muito discretos.” Um provedor de tecnologia digital lançou um produto de aplicativo baseado em um modelo geral de grande escala desenvolvido por uma nuvem fabricante em junho. Na reunião, o responsável pela tecnologia da empresa disse a Huxiu que eles eram obrigados pelo fornecedor da nuvem a mantê-lo estritamente confidencial e, se revelassem de quem era o modelo grande usado, seriam considerados como tendo violado o contrato. Quanto ao motivo pelo qual o caso deve ser mantido em sigilo, o responsável analisou que grande parte do motivo pode ser para evitar riscos regulatórios.

Em um momento em que o mundo está aumentando sua vigilância contra a IA, nenhum mercado pode aceitar um "período de vácuo" de regulamentação.

Em 13 de julho, sete departamentos, incluindo a Administração do Ciberespaço da China, divulgaram oficialmente as "Medidas Provisórias para a Administração de Serviços de Inteligência Artificial Generativa" (doravante denominadas "Medidas Administrativas"), que entrarão em vigor em 15 de agosto de 2023.

"Depois que as "Medidas Administrativas" forem emitidas, a política mudará do desenvolvimento orientado para o problema para o desenvolvimento orientado para o objetivo, que é o nosso objetivo." Wang Yuwei, sócio do escritório de advocacia Guantao, acredita que os novos regulamentos enfatizam a "drenagem" em vez do que "bloquear".

Navegar na biblioteca de gerenciamento de riscos nos Estados Unidos é uma lição de casa diária para Wang Yuwei. "Estamos fornecendo soluções de controle de risco e conformidade para aplicativos de negócios usando GPT e outros grandes modelos para segmentar setores e estabelecendo uma estrutura de governança de conformidade". .

Os gigantes da IA da América estão fazendo fila para mostrar sua lealdade ao Congresso. Em 21 de julho, Google, OpenAI, Microsoft, Meta, Amazon, startups de IA Inflection, Anthropic, as sete empresas americanas de IA mais influentes, assinaram um compromisso voluntário na Casa Branca. Certifique-se de que especialistas em segurança independentes tenham permissão para testar seus sistemas antes de divulgá-los ao público. E compartilhar dados sobre a segurança de seus sistemas com governos e academia. Eles também desenvolverão sistemas para alertar o público quando imagens, vídeos ou textos forem gerados por IA, usando um método conhecido como "marca d'água".

Representantes de 7 gigantes americanos de IA assinaram o compromisso de IA na Casa Branca

Anteriormente, em uma audiência no Congresso dos EUA, o fundador da OpenAI, Sam Altman, disse que um conjunto de padrões de segurança para modelos de inteligência artificial precisa ser criado, incluindo a avaliação de suas capacidades perigosas. Por exemplo, os modelos devem passar por certos testes de segurança, como se podem "replicar-se" e "infiltrar-se na natureza".

Talvez o próprio Sam Altman não esperasse que o volante da IA girasse tão rápido que corresse o risco de perder o controle.

"Não percebemos a urgência desse assunto no início", disse Wang Yuwei, até que mais e mais fundadores de empresas vieram consultar. Ele sente que essa onda de inteligência artificial está passando por mudanças completamente diferentes do passado.

No início deste ano, Wang Yuwei foi abordado por uma empresa Wenshengtu que foi a primeira a ter acesso a modelos de grande escala. A empresa queria introduzir seus negócios na China, então eles queriam saber sobre o negócio de compliance de dados nessa área. Imediatamente depois, Wang Yuwei descobriu que havia cada vez mais consultas desse tipo, e a mudança mais óbvia foi que não era mais o consultor jurídico da empresa, mas o fundador que vinha consultar. “Com o surgimento da IA generativa, a lógica regulatória original é difícil de aplicar”, disse Wang Yuwei.

Wang Yuwei, que está envolvido no trabalho jurídico de big data há muitos anos, descobriu que a IA generativa e a onda anterior de IA estão mostrando mudanças mais fundamentais. Por exemplo, da última vez, a IA foi mais baseada em recomendações baseadas em algoritmos, e algum reconhecimento facial foi direcionado a uma cena, e alguns pequenos modelos foram treinados em cenários de aplicativos específicos. As questões legais envolvidas nada mais eram do que direitos de propriedade intelectual. , Privacidade questões de proteção. Diferentes funções nesse ecossistema de IA generativa, como a empresa que fornece o grande modelo subjacente, a empresa que se conecta ao grande modelo para fazer aplicativos e o fornecedor de nuvem que armazena dados, etc., têm supervisão correspondente diferente.

Atualmente, existe um consenso sobre os riscos associados a grandes modelos. A indústria entende que as aplicações comerciais inevitavelmente amplificam esses riscos. Para manter a continuidade dos negócios, é necessário estar atento à supervisão.

A dificuldade é: "Como encontrar um caminho que possa regular bem sem afetar o desenvolvimento da indústria", disse Wang Yuwei.

Conclusão

Para toda a indústria, ao mesmo tempo em que aprofunda a discussão sobre tecnologia, também está provocando um pensamento mais abrangente.

Quando a IA está gradualmente ocupando uma posição dominante na indústria de tecnologia, como garantir a justiça, justiça e transparência da tecnologia? Como garantir que pequenas e médias empresas e start-ups não sejam marginalizadas quando empresas líderes controlam rigidamente a tecnologia e os fluxos de capital? O desenvolvimento e aplicação de modelos em grande escala tem um grande potencial, mas seguir cegamente a tendência nos fará ignorar outras tecnologias inovadoras?

"No curto prazo, o grande modelo de IA está sendo seriamente superestimado. Mas, no longo prazo, o grande modelo de IA está seriamente subestimado."

Em meio ano, a onda de calor da IA aumentou. No entanto, para empresas iniciantes e gigantes da tecnologia chinesas, como manter um julgamento claro e fazer planejamento e investimento de longo prazo na atmosfera aquecida do mercado será a chave para testar sua verdadeira força e visão.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

1 Curtidas

Recompensa
1
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
Gate 2025 Q2 Report Released
2k Popularidade
Gate Derivatives Volume Hits New High
4k Popularidade
CPI Data Incoming
32k Popularidade
4Join Gate VIP to Win MacBook
29k Popularidade
5MicroStrategy Buys More Bitcoin
496 Popularidade
6BTC Hits New High
111k Popularidade
7My Gate Moments
26k Popularidade
8VIP Exclusive Airdrop Carnival
26k Popularidade
9Fed June Meeting Minutes
7k Popularidade
10Gate Alpha Trading Share
14k Popularidade

Marcar

sitemap