Diálogo com Ji Xinhua, CEO da Youkede: Grandes modelos competitivas não apenas deitam e vencem se tiverem um cartão

Autor| He Sisi

Editar | Zhang Jin

Fonte da imagem: Gerada por Unbounded AI

"Até certo ponto, a proibição do poder de computação nos Estados Unidos limitará o desenvolvimento de modelos domésticos de grande escala, porque não há como treinar modelos sem poder de computação central." Sobre a importância do poder de computação para modelos grandes, Ji Xinhua, presidente e CEO da UKED Diga que sim.

Desde que o modelo grande se tornou popular na China em fevereiro deste ano, o poder de computação tornou-se instantaneamente o tópico mais preocupante na indústria e também se tornou um obstáculo difícil de superar no treinamento doméstico de modelos grandes. Na verdade, de outra perspectiva, o crescimento explosivo do poder de computação também trouxe oportunidades de desenvolvimento sem precedentes para fornecedores domésticos de computação em nuvem.

A este respeito, Ji Xinhua também concordou. Ele disse que desabilitar o poder de computação é uma coisa ruim e uma coisa boa. Por um lado, se você quiser resolver o problema do gargalo em um ou dois anos, precisará acelerar a pesquisa e o desenvolvimento de chips nacionais, que não é uma tarefa fácil; por outro lado, as empresas estão prestando cada vez mais atenção ao poder da computação, isso promoverá o desenvolvimento de chips domésticos.

Como fabricante neutro de computação em nuvem, Youkede há muito sente que, por trás da concorrência de modelos grandes, o mercado de poder de computação dará início a grandes mudanças.

"Entrei em contato com o Stable Diffusion pela primeira vez em novembro do ano passado. Naquela época, achei seu efeito incrível, então comecei a prestar atenção ao modelo grande." Ji Xinhua explicou ao Leifeng.com por que ele pagou atenção ao modelo grande. Ao mesmo tempo, ele também revelou que, porque Naquela época, as empresas chinesas não começaram a prestar atenção aos modelos de grande escala e não sabiam quanto valor isso poderia criar, então eles não se decidiram a fazer negócios relacionados a modelos em grande escala naquela época.

A aplicação real de modelos de grande escala e o serviço de empresas de modelos de grande escala pelo Reino Unido começará em fevereiro deste ano, que também é o momento em que modelos de grande escala saem do círculo na China.

Leifeng.com soube que a UKED desenvolveu primeiro quatro produtos de IA para uso interno com base no modelo em grande escala, a plataforma de perguntas e respostas de conhecimento "Shiwen", a plataforma de assistente de código UCoder, a plataforma de assistente de pintura de IA e a plataforma de gerenciamento de segurança de modelo em grande escala. Para um data center autoconstruído de baixo custo e alto valor agregado, a UKED criou uma base de poder de computação AIGC, que fornece de forma flexível uma variedade de recursos de poder de computação de GPU para treinamento de modelo grande, raciocínio e processamento de dados.

Imediatamente depois, a UKED lançou uma máquina multifuncional privatizada em grande escala, que incorporou a plataforma de nuvem privada UCloudStack full-stack desenvolvida independentemente pela UKED, fornecendo soluções de privatização para modelos de virtualização, armazenamento, rede e MaaS, combinados com modelos verticais de grande escala da indústria.As empresas podem implantar aplicativos de modelo grande com um clique.

Em relação ao posicionamento do UKED na era dos modelos grandes, Ji Xinhua enfatizou mais uma vez o princípio da "neutralidade". Ele explicou que a neutralidade significa que o Reino Unido não só não tem concorrência com os clientes, mas também ajuda as grandes empresas modelo a encontrar clientes. A esse respeito, Ji Xinhua também brincou publicamente que, na era das grandes modelos, o que Youke deve fazer é "casamenteiro".

Da resposta de Ji Xinhua, também podemos obter indiretamente as razões para P&D interno do UKED e aplicação de produtos modelo em grande escala. Uma delas é que os funcionários da empresa entendam modelos em grande escala e aprendam a usar modelos em grande escala. Com base nisso, eles podem entender profundamente os modelos de grande escala, quais são os pontos problemáticos e em quais cenários podem ser implementados para atender melhor os clientes.

Quando se trata do futuro de grandes modelos, Ji Xinhua disse que há muitas incertezas no futuro, mas, em qualquer caso, a indústria da Internet ou a indústria de inteligência artificial precisam de poder de computação. As capacidades de interconexão são limitadas, então o trabalho futuro da UKEDE será concentre-se na construção de uma base de poder de computação em larga escala.

A seguir está a conversa entre Leifeng.com e Ji Xinhua:

Grandes modelos competitivos não apenas deitam e vencem se tiverem cartões. Os recursos de engenharia são cruciais para o treinamento do modelo.

**Leifeng.com:**Muitas pessoas estão dizendo que apenas alguns fornecedores de nuvem podem finalmente participar da competição de modelos de grande escala. Nem todos eles têm redes de alta velocidade. Quais você acha que são as barreiras à concorrência?

Ji Xinhua: Isso mesmo, tecnologias como redes de alta velocidade não são o principal limite para grandes modelos concorrentes. Incluindo Youkede e a maioria dos fornecedores de nuvem são capazes de fazer isso. Agora a rede tem duas estruturas: a primeira é a rede RoCE, que UKED já tem essa capacidade em 2019.

A segunda é a solução de rede IB, recomendada pela Nvidia, que é relativamente simples e só precisa ser implantada e mantida. Portanto, para fornecedores de nuvem ou empresas particularmente grandes, a tecnologia não é o limite principal.

**Leifeng.com:**Na verdade, dizem que muitas empresas de grande porte começaram a estocar cartões?

Ji Xinhua: Sim, especialmente alguns dos principais fabricantes estão acumulando cartões, incluindo A800, H800 e assim por diante. Por um lado, seu próprio negócio de IA precisa usar cartões e, com mais investimento de capital, comprará um grande número de cartões antes; por outro lado, a atenção doméstica em larga escala para modelos grandes começou em fevereiro deste ano e vários fabricantes Devido à importância, também irá acelerar a velocidade dos cartões de acumulação.

Leifeng.com: Isso significa que quanto mais cartas você tiver, mais você ganhará? Como outros fornecedores de nuvem competem com grandes players?

Ji Xinhua: Não me deitei e ganhei. Muitas empresas de modelos de IA em grande escala agora estão usando nossos cartões. Esse fenômeno é muito comum.

Existem várias razões: primeiro, não é suficiente usar apenas um cartão e, segundo, por que a grande empresa modelo está disposta a cooperar com a Youkede? É porque eles sentem que as grandes fábricas têm poder de computação, algoritmos, dados e cenários, e estão preocupados com a concorrência dos negócios no final quando cooperam com grandes fábricas. Como fornecedor de nuvem neutro e seguro, a Ukerd não tem concorrência com empresas de grande porte. Ao mesmo tempo, o UKDE é capaz de desenvolver plataformas de poder de computação, bibliotecas de modelos, etc. a partir do data center e da arquitetura subjacente, com acúmulo técnico profundo e recursos de serviço de engenharia de sistema completos.

Faça um bom trabalho no serviço de poder de computação e faça um bom trabalho no papel do grande modelo "casamenteiro"

**Leifeng.com: **Quando Youkede começou a prestar atenção em modelos grandes?

**Ji Xinhua: **O primeiro contato foi durante o Dia Nacional no ano passado. A primeira coisa que vi foi a difusão estável. Naquela época, achei seu efeito incrível, então comecei a prestar atenção ao modelo grande, então nós acompanhamos o ChatGPT anteriormente.

Leifeng.com: Então você decidiu fazer isso durante o Dia Nacional do ano passado?

Ji Xinhua: Após o Dia Nacional do ano passado, a UKED definiu o AIGC como meta para este ano e lançou a imagem da plataforma de pintura AI em novembro do ano passado. Em fevereiro deste ano, depois de me comunicar com as principais empresas de modelos de grande escala na China, percebi que o mercado doméstico de poder de computação terá um desenvolvimento explosivo, então decidi fazer isso no final de março.

Leifeng.com: Quantos clientes em potencial existem nessas empresas modelo de grande escala?

Ji Xinhua: Concluímos que existem 130 empresas modelo de grande escala na China, 78 empresas de propósito geral e 52 empresas verticais. E continua aumentando, mais de 30 deles já são nossos clientes.

Leifeng.com: De que forma o serviço será exportado?

Ji Xinhua: Um é o nosso poder de computação e o outro são os serviços de sala de informática, porque algumas empresas compram seus próprios equipamentos e os colocam em nossa sala de informática.

Leifeng.com: Como você entende o serviço de sala de informática? É porque o próprio cliente não tem capacidade operacional?

Ji Xinhua: A própria empresa precisa de uma sala de informática, não importa onde ela esteja. A sala de informática exigida por um modelo grande tem duas características: uma é que consome muita energia e a outra é que o consumo de energia de uma máquina H100 excede 10 kW. A sala de informática não pode atender a essa demanda, e o centro de dados Ulanqab de Youkede é especialmente adequado. Além disso, muitas empresas agora têm o problema de ter servidores, mas não podem usá-los.Ukerde pode ajudá-los a construir uma plataforma de poder de computação e realizar trabalhos de manutenção subseqüentes.

Leifeng.com: Além de fornecer poder de computação, Youkede também lançou "Shiwen" há algum tempo?

Ji Xinhua: UKED construiu quatro plataformas internas: plataforma de perguntas e respostas de conhecimento "Shiwen", plataforma de assistente de código UCoder, plataforma de assistente de pintura AI e plataforma de gerenciamento de segurança de modelo grande. Na verdade, antes do "conhecimento", a primeira coisa que fizemos foi o sistema de gerenciamento de aplicativos de modelo em grande escala. Este é o nosso primeiro produto e esperamos que todos possam usar o modelo em grande escala no futuro;

Em segundo lugar, para resolver problemas de segurança comercial, fizemos algumas restrições, incluindo suas perguntas e arquivos enviados, vamos registrá-los e filtrá-los para evitar que informações confidenciais da empresa vazem na Internet;

Em terceiro lugar, para problemas do usuário, incluindo problemas internos de funcionários e comunicação externa e feedback, o sistema registrará automaticamente, para que a empresa possa continuar a realizar seu próprio treinamento de modelo no estágio posterior.

Leifeng.com: Por que você fez esses quatro produtos? Pode ir para fora?

Ji Xinhua: Primeiro, para que os funcionários da empresa possam entender e usar modelos de grande escala. Com base nisso, eles podem entender profundamente quais são os pontos problemáticos das empresas modelo de grande escala e em quais cenários eles serão implementadas, de forma a melhor atender os clientes.

Atualmente, esses quatro produtos são usados internamente pela empresa, mas se os clientes precisarem, também podemos nos comunicar mais.

Leifeng.com: Em qual modelo essas plataformas são baseadas?

**Ji Xinhua: **Treine com GPT 4 primeiro, conduza a verificação do modelo e, em seguida, use gradualmente modelos grandes domésticos ou modelos grandes de código aberto para otimizar. A esse respeito, também mencionei um conceito chamado "afiar armas no exterior e lutar em casa".

Leifeng.com: Com quais outros cenários você está otimista no futuro?

Ji Xinhua: Se for distinguido de acordo com a tolerância para a natureza imprecisa do conteúdo de saída do ChatGPT, dividimos 10 cenários.

A primeira é a tradução e dublagem. A habilidade nesta área já é muito alta e pode substituir completamente os humanos; a segunda é o NPC do jogo; a terceira é a interação social; a quarta é a saída de conteúdo do e-commerce; a quinta é o design do jogo; o sexto é o atendimento ao cliente; o sétimo é a assistência a documentos e programação; o oitavo é a gestão do conhecimento dentro da empresa; o nono é a educação e os cenários de seguros; e o último é o atendimento a advogados e médicos.

Leifeng.com: Essas 10 cenas serão feitas ao mesmo tempo? Ou passo a passo?

Ji Xinhua: A Ucar não fabrica modelos grandes, apenas conecta clientes e parceiros, o que pode ser entendido como o papel de "casamenteiro". Por exemplo, conecte clientes de jogos ao MiniMax e conecte clientes dos setores de comércio eletrônico e educação a Zhipu Huazhang.

É difícil para os modelos domésticos de grande escala alcançar o GPT4 e há mais oportunidades para empresas iniciantes

Leifeng.com: Em quantos tipos você acha que as grandes empresas modelo domésticas podem ser divididas? Quem são os principais clientes da Youkede?

Ji Xinhua: Estamos divididos em cinco categorias. A primeira categoria são gigantes, incluindo Ali, Baidu, Toutiao, Huawei, JD.com, etc. A segunda categoria é iniciada por cientistas, como Zhipu Huazhang; a terceira categoria é a empresa original de IA, AI Four Tigers, Daguan, Yunzhisheng, 4Paradigm, etc.; a quarta categoria são empresas iniciantes, como MiniMax; A quinta categoria é que as empresas listadas originais mudaram para modelos de grande escala, como Kunlun, 360, e também incluem líderes empresariais como Wang Xiaochuan e Li Kaifu.

O primeiro tipo de grandes fabricantes não são os clientes-alvo da Youkede, e os últimos tipos são nossos principais clientes.

Leifeng.com: Ou seja, as grandes fábricas têm a capacidade de se construir, mas outras empresas não têm a capacidade de se construir?

Ji Xinhua: Por envolver o campo da inteligência artificial, não é apenas um problema de rede, mas também uma série de problemas como armazenamento e salas de informática. Por exemplo, empresas iniciantes também podem construir sua própria computação poder, mas o ciclo será muito longo. Espere que ele mesmo construa Depois disso, a competição acabou. A competição de grandes modelos é toda sobre velocidade, e quem tiver a velocidade mais rápida pode ocupar as alturas de comando.

Leifeng.com: Para uma grande fábrica, quantos estágios e nós existem para um modelo grande?

Ji Xinhua: O primeiro é o lançamento do modelo grande e o segundo é a verificação do efeito após o lançamento. Atualmente, sabe-se que empresas como MiniMax, Zhipu, Baidu, Ali, HKUST Xunfei, etc.

**Leifeng.com:**Qual é o melhor, depende principalmente de quanto poder de computação ele usa?

Ji Xinhua: Acho que não. Mais poder de computação para treinamento pode não produzir necessariamente um bom modelo, mas se o link de inferência for mais usado, significa que há um grande número de usuários e mais feedback será obtido. É propício para treinar um bom modelo.

**Leifeng.com:**Independentemente do treinamento ou raciocínio, para construir um modelo grande, você deve primeiro ter poder de computação?

Ji Xinhua: Sim, a primeira coisa é ter um cartão. Se você não tiver um cartão, com certeza ficará para trás. Cerca de 40-50%. Se os dois problemas acima forem resolvidos, é um problema de segurança e o problema de tráfego também é muito importante.

Leifeng.com: Qual é o nível dos modelos domésticos? Muitas pessoas dizem que ele alcançará o GPT4 até o final deste ano.

Ji Xinhua: No momento, não existe nenhum modelo que supere o GPT3.5 na China. Claro, é realmente muito fácil superar o GPT3.5 em um determinado aspecto. É difícil superar o GPT4. A chave é que os papéis anteriores ao GPT3.5 são públicos, mas o GPT4 ainda não foi tornado público, então todos não sabem o que fazer.

Leifeng.com: Esses grandes fabricantes nacionais não têm chance de alcançá-los?

Ji Xinhua: Acho que o efeito das grandes empresas não é tão bom quanto o das empresas iniciantes. Porque algumas empresas iniciantes com crenças e ideais já começaram a fazer isso, e Dachang realmente começou depois de ver a popularidade do ChatGPT.

Leifeng.com: É lógico que os grandes fabricantes acumularam tecnologia, então eles não têm mais oportunidades?

Ji Xinhua: Há muitas direções para a IA. No passado, a maioria das empresas pensava que os modelos verticais de grande escala tinham oportunidades, mas não achava que os modelos de grande escala de uso geral tinham oportunidades. Portanto, no passado Alguns anos, foram algumas equipes empreendedoras com convicção e equipes de pesquisa científica, como Zhipu Huazhang, MiniMax, Academia Chinesa de Ciências, etc.

Para os grandes fabricantes, é mais para ver que os países estrangeiros fazem o acompanhamento depois de fazer isso, e isso não está de acordo com a estratégia da empresa, então eles não têm muito acúmulo em modelos grandes de uso geral.

Leifeng.com: O problema do poder de computação será resolvido mais cedo ou mais tarde, então quais são as vantagens do UKEDe em termos de modelos grandes?

Ji Xinhua: Pode ser resumido em três pontos: Primeiro, manter a neutralidade e não ter relação competitiva com os usuários. Segundo, tem a capacidade de construir um conjunto completo de soluções AIGC para data centers, redes e armazenamento de dados, o que pode ajudar pequenas e médias empresas a construir plataformas rapidamente e resolver o problema de eficiência do uso de modelos grandes; terceiro, pode melhor ajudar as grandes empresas modelo a expandir os clientes.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)