A cortina se abre, onde estão os protagonistas comerciais da AIGC?

Fonte: Comuna Alpha

Autor: Xu Siqing

Na quinta-feira passada, vários modelos de linguagem de grande porte, como Baidu Wenxinyiyan e iFlytek Spark Model, foram oficialmente aprovados para fornecer serviços. A IA desencadeou uma mudança no paradigma da inteligência artificial. Ao mesmo tempo, as pessoas perguntam naturalmente - onde está o dinheiro na mudança de paradigma? Qual é o protagonista?

Além da lenda do MidJourney (a renda de 11 pessoas atingiu US$ 100 milhões em 2022), empreendedores e investidores sempre estiveram esperançosos e ansiosos para explorar os modelos de negócios trazidos pela AIGC (inteligência artificial generativa). Este artigo tenta analisar as oportunidades de empreendedorismo e investimento sob a perspectiva da composição de grandes modelos e, aliás, ao final, conta uma história empreendedora de “cair nos olhos do dinheiro”.

Figura 1: Exemplo de imagem vicentina – uma assassina feminina no estilo cyberpunk na chuva (esta imagem foi gerada pelo Pixeling V1.0 da HiDream.)

LLM (Large Language Model) - Grandes empresas queimam dinheiro para construir um ecossistema, uma armadilha para empreendedores

Vamos dar uma olhada na arquitetura de aplicativos de modelo de linguagem grande (veja a figura abaixo). Não é difícil ver que a camada inferior é construída sobre uma base sólida de hardware. Atualmente, existem fabricantes de GPU representados pela NVIDIA e fornecedores de energia de computação representado por CoreWeave. Tal como os telemóveis, o hardware é sempre a última palavra na comercialização.Esta é uma das oportunidades de negócio, mas não há muitas oportunidades para empreendedores e investidores, exceto para otimizar plataformas de poder computacional para grandes modelos.

Figura 2: A estrutura do grande modelo de linguagem e algumas empresas representativas

Do outro lado do oceano, existem atualmente apenas alguns grandes modelos convencionais. OpenAI, Meta, Google e outras grandes empresas começaram a traçar seus planos com base em grandes modelos. Há também LLM (Adept, Cohere, Character. ai) fundada pelos autores do transformador, que são mais tendências: diferenciação ao invés de homogeneidade.

A partir disso, vemos mais batalhas ecológicas dos grandes fabricantes – se você não tiver seus próprios grandes modelos, não haverá futuro. As pessoas estão otimistas em relação à Microsoft em relação à Amazon porque ela tem vantagem e aproveitou as vantagens dos dois principais modelos de OpenAI e Meta Llama, e todos os seus produtos adotam IA. Aqueles que ganharem o modelo ganharão o mundo. Existe uma plataforma básica construída com modelos grandes, e os aplicativos são construídos na plataforma. Eles estão tentando roubar clientes da Amazon fazendo todos os esforços.

O modelo básico de grande escala é uma enorme fera engolidora de ouro. As grandes fábricas são treinadas para competir por terras e liquidar grandes contas. As pequenas fábricas quase não têm chance, exceto nos modelos verticais. Os empresários devem ser cautelosos.

Figura 3: Evolução dos modelos de IA (provenientes de

OpenAI e modelos de grandes fábricas pertencem à primeira onda, e os grandes modelos de autores de transformadores pertencem à segunda onda.Os vários modelos que continuam a surgir mais tarde, sejam praticados por si mesmos ou usando modelos de código aberto, devem pertencer à terceira onda. A tendência de desenvolvimento de grandes modelos de linguagem vai de grandes modelos básicos a modelos verticais e, em seguida, a modelos de cauda longa focados em aplicativos corporativos.

Figura 4: Visão geral dos LLMs da China (fotos da Internet)

Deve-se notar que o LLM doméstico é esmagador. Exceto alguns grandes fabricantes, temos motivos para supor que a maioria deles são modelos treinados com modelos de código aberto (sem GPUs suficientes, como pode vir o trabalho de porcelana? ), pertence a reengenharia de modelo, que economiza o link de pré-treinamento que consome quase 99% do poder de computação (consulte o artigo Alpha Commune: Modelo de linguagem meta grande Llama 2 - virando a mesa e iniciando um novo capítulo | Investidores disseram), como rápido É econômico e digno de reconhecimento, mas a maioria deles são modelos verticais ou modelos grandes do Partido A, e não são verdadeiros modelos grandes básicos.

A formação de modelos básicos de grande escala exige muita mão-de-obra e pode facilmente custar dezenas de milhões de dólares. É um jogo para os ricos, por isso os empresários devem ser cautelosos.

A razão é muito simples: quando calculamos o valor arrecadado pelas startups, em comparação com os empreendedores estrangeiros do mesmo tipo, o valor do financiamento é de cerca de 1/10, o que não é suficiente para treinar o modelo. Se você realmente fizer o pré-treinamento do zero, a GPU vai esquentar e o dinheiro arrecadado vai acabar logo após ser ligada.

Ferramenta de IA - Venda de picaretas na corrida do ouro, alto conteúdo técnico

Embora a inteligência artificial generativa crie um novo paradigma, também cria um grande número de novas oportunidades de ferramentas. Estas ferramentas vão desde modelos de avaliação, modelos de operação e manutenção, sistemas melhorados até ferramentas operacionais, todas elas novas oportunidades trazidas pelas mudanças de paradigma.

Merecem especial atenção as ferramentas de gestão e formação de diversos tipos de dados, bem como o sistema de proteção de segurança. As ferramentas de segurança incluem ferramentas de segurança tradicionais e segurança e conformidade orientadas a modelos. Pense bem, perder dados já é terrível, se o modelo treinado for invadido, não seria uma ferramenta eficiente para ensinar as pessoas a invadirem sua própria privacidade?

Na verdade, a segurança deveria ser mais do que apenas uma ferramenta, mas uma infraestrutura essencial.

Existem tantas ferramentas antigas que não podem mais ser utilizadas e os empreendedores têm mais oportunidades de mostrar seus talentos.

Novo aplicativo de IA - um paraíso em flor

A camada de aplicação é uma mina rica com muitas oportunidades empresariais.

Quer se trate de aplicações toB ou aplicações toC, o novo paradigma criado pela nova geração de inteligência artificial oferece oportunidades infinitas.

A característica do toC é a sua entrada revolucionária em novos cenários, enquanto o toB é a coexistência do antigo e do novo.

Podemos descrever C como um aplicativo superficial. Sua característica é que os gerentes de produto têm muitas oportunidades de inovação e podem enviar aplicativos que agradam aos usuários, sem ter que se aprofundar no modelo.

Não é difícil prever que um grupo de excelentes gestores de produtos chineses se tornará um importante actor internacional na onda de mudança de paradigma.Talvez uma nova geração de Zhang Yiming esteja a emergir rapidamente.

A aplicação to B testa a compreensão dos profissionais sobre os pontos problemáticos das necessidades empresariais e o uso de novos meios para resolver problemas antigos.Exceto algumas inovações disruptivas, a maioria delas se desenvolve ao longo do caminho do valor empresarial de redução de custos e aumento de eficiência. As mudanças tecnológicas oferecem uma oportunidade para que um truque seja amplamente utilizado, mas a revolução não é fácil de ter sucesso. Em última análise, os jogadores tradicionais ocupam todos os cenários de aplicação, e novos métodos e ferramentas desempenham um papel inovador. Deve ser um padrão onde o velho e o novo coexistem.

O modelo de grande escala do Partido A, implantado de forma privada, deverá ter um rápido crescimento na demanda por um longo tempo.

A única coisa que vale a pena notar é que existem enormes diferenças entre o mercado toB da China e o mercado toB dos EUA devido às diferentes composições de clientes e comportamentos de compra. Os empresários não devem copiá-los. Estou indo para Sanya para participar da Cúpula de CIOs da China nos últimos dois dias. Estou ansioso para explorá-la com especialistas do setor. Este tópico será reservado para futuras discussões especiais.

Wensheng Vision - uma bonança comprovada; a versão chinesa do MidJourney - um produto de prazer e dor

MidJourney atrai diretamente os designers e melhora muito a eficiência do design artístico. Ele pode produzir uma imagem em segundos. Pode-se dizer que mudou completamente o método de produção. Os usuários têm uma forte disposição a pagar. 11 pessoas ganham 100 milhões de dólares americanos por ano, tornando-se até agora o AIGC, o destaque dos negócios.

No início deste ano, o autor e o designer trabalharam juntos por um longo tempo, estudando MidJourney, e vivenciaram in loco o pagamento do lado C e do lado B - a dura verdade do modelo de negócios.

Ao mesmo tempo, também sinto fortemente que o limite de uso é alto - um grande artista corrige constantemente descrições complexas e profissionais em inglês, e por meio de "reparos" (instruções), a fim de produzir desenhos criativos satisfatórios, ao mesmo tempo que suporta os defeitos do estilo chinês do modelo - —Como naquela época só existia um modelo como MidJourney que só sabia inglês e só tinha estudado materiais culturais ocidentais, os designers foram forçados a usar vários meios para melhorar a precisão do inglês e tiveram que suportar o dilema de expressar "chinês" no estilo japonês ou coreano.

Os meios subversivos provocam uma revolução na eficiência do design. Os designers suportam simultaneamente o descompasso entre a linguagem e o estilo de pintura. A combinação de intenso prazer e dor faz-nos acreditar firmemente que a China precisa do seu próprio MidJourney. Não só isso, também acreditamos que o MJ deve ser superado por duas razões: primeiro, o mercado exige ferramentas que compreendam melhor a linguagem humana do que o MidJourney; segundo, os elementos chineses ou os elementos locais globais devem ser bem expressos. Além disso, o comércio eletrônico e a publicidade têm um enorme mercado para ferramentas de produção de alta eficiência, com um grande número de fotos e vídeos curtos como núcleo, e para sistemas de produção acoplados.

Oportunidade dada por Deus, me dei bem com o acadêmico Mei Tao, um discípulo de HKUST que vem tentando "fazer coisas" juntos há vários anos. Um veterano que entende algoritmos, conhece modelos e pratica na indústria há muitos anos , por isso temos apoio inicial da Alpha Commune e ex-alunos da HKUST.HiDream iniciado pelo Acadêmico Mei Tao (veja o artigo: Que outras oportunidades empreendedoras a AIGC tem na China? Acadêmicos empreendedores e investidores anjos dizem isso | Alpha Founders Club). Em apenas alguns meses, a HiDream demonstrou uma velocidade de iteração inimaginável e resultados impressionantes, derrubando completamente o antigo “viés de empreendedorismo acadêmico” na indústria.

A seguir está um gráfico comparativo de exemplos gerados por MidJourney e Hidream nas mesmas condições.

: Retrato de personagem de Dungeons and Dragons, mulher morena de cabelos curtos, rastreador do Velho Oeste segurando uma luneta de latão, Emma Stone, inteligente, otimista e espirituosa e forte

:Um jovem Bulldog Francês parece confuso após ser emboscado, com os olhos arregalados e atordoado, estilo pixar

:Alien parece estranho, coelhinho feliz e fofo

Figura 5-7: Gráficos MidJourney e Hidream gerados pelo mesmo

MidJourney fez um trabalho pioneiro valioso. Se os retardatários puderem aplicar melhor os transformadores, construir capacidades de modelo mais fortes e não mais simplesmente confiar no modelo de difusão (MJ continua a otimizar a ferramenta atual com base neste modelo), eles deveriam. Há muito a ser feito . Também acreditamos firmemente que MJ aproveitará o início precoce, livrar-se-á da dependência do modelo de difusão e continuará a trazer surpresas ao mercado.

Quer se trate de ferramentas, aplicações superficiais ou aplicações empresariais profundas, todas elas estão nos estágios iniciais de geração de escala e tendências subjacentes. O AIGC apenas começou e esperamos que a inovação e a iteração dos algoritmos continuem a mostrar capítulos mais brilhantes para a indústria.

**Na madrugada de 6 de setembro de 2023 em Hefei. **

**O autor deste artigo é Xu Siqing, sócio fundador e CEO da Alpha Commune. **

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)