"Preferimos resolver 100% do problema de um cliente do que resolver 70%-80% de 100 problemas do cliente."
Em 7 de julho, no Fórum Tencent da Conferência Mundial de Inteligência Artificial (WAIC) de 2023, quando perguntado por que o modelo de grande escala orientado para a indústria foi lançado primeiro, Wu Yunsheng, vice-presidente da Tencent Cloud e chefe da Tencent Cloud Intelligence, respondeu desta forma .
Modelos em grande escala são o tema mais quente no mundo da IA este ano. Em comparação com Baidu, Ali e outros gigantes que lançaram pela primeira vez o modelo subjacente de grande escala de uso geral, a Tencent concentrou sua atenção diretamente no setor - antes do WAIC ser realizado, em 19 de junho, a Tencent Cloud anunciou oficialmente o MaaS (Model as a Service ), que tem sido As 10 maiores indústrias já exportaram mais de 50 soluções, abrangendo diversos cenários como turismo cultural, finanças, mídia, educação e assuntos governamentais.
Naturalmente, a aplicação e aterrissagem de cenários se tornaram o tema de todo o WAIC Tencent Forum.
"Modelos grandes de propósito geral não são a única direção para aplicações de modelos. Modelos para indústrias verticais se tornarão o ponto de inflexão do valor de modelos grandes." Li Qiang, vice-presidente da Tencent e presidente do governo e negócios corporativos da Tencent, previu em o Fórum.
Wu Yunsheng usou o atendimento ao cliente inteligente da OTA (Agência de viagens online) como exemplo e explicou que os usuários geralmente têm várias intenções misturadas no processo de comunicação real. No processo de comunicação, a intenção também pode mudar a qualquer momento.
"(O usuário) acabou de pedir para reservar o hotel no dia 10, e a máquina estava prestes a atender, e de repente disse, deixe-me ver o hotel no dia 11." Diante do processo extremamente complicado no cenário de atendimento ao cliente, o general modelo grande não pode perfeitamente Para completar a tarefa, é necessário reconstruir alguns modelos complexos em combinação com cenários específicos.
No entanto, o atual modelo de grande escala de uso geral ainda está no estágio inicial de pesquisa e desenvolvimento e enfrentará o problema de alto custo em aplicações industriais. Wu Yunsheng disse que em alguns cenários específicos, uma vez que o grande propósito geral -modelo em escala não pode atender 100% às necessidades, então "julgando o nível de custo da solução, não há Faz muito sentido." Embora as soluções para diferentes indústrias e cenários variem muito, não há problema em melhorar a eficiência das empresas em mais de 30% em geral.
Wu Yunsheng, vice-presidente da Tencent Cloud e chefe da Tencent Cloud Intelligence. Fonte: Tencent See More
No fórum, a Tencent Cloud também apresentou as recentes atualizações importantes em torno do modelo grande. Suas duas principais bases técnicas - Xingmai Network e Vector Database passaram por atualizações de capacidade. A rede de computação de alto desempenho Xingmai atualizada pode aumentar a utilização de GPU em 40%, economizar custos de treinamento de modelo em 30% a 60% e melhorar o desempenho de comunicação de modelos grandes de IA em quase 10 vezes.
E apenas em 4 de julho, a Tencent Cloud lançou oficialmente o banco de dados de vetores nativos de IA. Comparado com o método tradicional, ele é usado para classificação, desduplicação e limpeza de dados de pré-treinamento de modelos grandes, e o banco de dados pode atingir 10 vezes aumento de eficiência. Usá-lo como uma base de conhecimento externa para inferência de modelo pode reduzir o custo em 2 a 4 ordens de grandeza.
No WAIC deste ano, também apareceu um fenômeno interessante: mais de 30 modelos de uso geral e de grande escala da indústria foram revelados na reunião, e todos disseram fazer modelos de grande escala. A questão da homogeneização tornou-se imediatamente o foco da discussão: o empreendedorismo no campo da IA ainda faz sentido? Cada grande fábrica tem seu próprio modelo grande, se todos o possuírem, o modelo grande ainda será um divisor de águas?
Wu Yunsheng acredita que no estágio inicial de desenvolvimento de grandes modelos, não há necessidade de se apressar para fazer julgamentos sobre essas questões. "Gostaria de ver que, quando a indústria estiver em plena floração, através da combinação de tecnologia e indústria, explorar várias possibilidades e melhorar a eficiência das indústrias e indústrias", disse Wu Yunsheng.
Esse julgamento também vem de seu otimismo sobre o potencial comercial de grandes modelos de IA. Na última onda de IA com avanços de ponto único, muitas empresas de IA caíram no dilema de entrega e implementação de projetos e privatizações e não conseguiram obter lucratividade.
"Na era dos modelos grandes, a situação pode ser diferente de antes." Wu Yunsheng acredita que, com o desenvolvimento da tecnologia, incluindo o desenvolvimento do poder de computação subjacente e dos chips GPU, os parâmetros dos modelos que custavam centenas de bilhões no passado estão ficando cada vez menores; Tencent Também há muito progresso no reforço do treinamento e no reforço do raciocínio, e o custo está caindo rapidamente. Por outro lado, as possibilidades na aplicação de grandes modelos estão em constante expansão e o valor está em constante aumento.
Hoje, a Tencent está expandindo sua tecnologia e ecologia de aplicativos em torno de grandes modelos de IA e também está fortalecendo sua ligação com a indústria. Em 6 de julho, a Organização das Nações Unidas para o Desenvolvimento Industrial, a Huawei e outros parceiros anunciaram conjuntamente o estabelecimento da "Aliança Global de Inteligência Artificial Industrial e de Manufatura" no WAIC.
Wu Yunsheng também enfatizou que a atualização da base técnica é "praticar a força interna": "Não importa se é um modelo de grande escala de uso geral ou um modelo industrial de grande escala, ele precisa ter os recursos de suporte subjacentes , incluindo enorme poder de computação, dados, etc.."
"Na era dos modelos de grande escala, a abertura é muito importante e todos devem ser abertos. A tecnologia subjacente muda muito rápido e os recursos de extensão são muito amplos. Quando combinado com indústrias específicas, haverá muita pesquisa e custos de desenvolvimento." Wu Yunsheng disse que somente através da abertura mais indústrias podem surgir. Somente quando especialistas e vários funcionários se juntam podemos cultivar um ecossistema mais saudável e criar mais possibilidades.
O seguinte é o registro da entrevista da mídia e Wu Yunsheng, editado por 36 Krypton:
**Mídia:**A Tencent Cloud lançou no início um modelo de larga escala voltado para o setor, em vez de um modelo de larga escala de propósito geral. É uma consideração de receita?
Wu Yunsheng: Isso não tem nada a ver com custo e investimento. Sempre enfatizamos que queremos resolver os problemas dos clientes. Preferimos resolver o problema de um cliente 100% do que resolver os problemas de 100 clientes em 70%-80%. Podemos diminuir o problema, mas devemos resolver esse problema.
Mídia: Parece que o modelo geral e o modelo da indústria estão em oposição. Como você vê o relacionamento futuro entre os dois?
Wu Yunsheng: Em primeiro lugar, quero deixar claro que pessoalmente não me oponho aos dois. Um mockup básico é algo como um pedestal que resolve uma necessidade sem customização especial. O modelo da indústria deve ser baseado no modelo geral para melhorar efetivamente a produtividade e atender ao público. Somente nos aprofundando na indústria podemos resolver problemas particularmente importantes.
A função do mapa de Vincent também terá pontos de indústria muito detalhados e específicos - por exemplo, gerando um mapa de anúncio para um pacote, e alguns clientes terão necessidades especiais, como alguma certificação especial. Quando confrontados com problemas práticos, é necessária uma abordagem diferente.
**Mídia:**Em quais áreas a Tencent se concentrará este ano e quais metas de desenvolvimento ela terá? Quais são as atualizações e iterações recentes?
**Wu Yunsheng:**Nossa grande estratégia é focar na implementação de problemas práticos, esperando resolver 100% dos problemas dos clientes em cada cenário específico, em vez de encontrar 100 produtos para resolver 70%-80% dos problemas. Portanto, vamos nos concentrar em indústrias específicas e trabalhar com os clientes para resolver os problemas da indústria.
Por exemplo, na indústria de viagens culturais, os clientes no campo OTA (Online Travel Agency) combinarão seus próprios cenários de negócios, usarão a tecnologia de modelos de grande escala em processos de negócios e usarão recursos relacionados a dados para ajustar os processos de grande escala. modelo. Em termos de desenvolvimento tecnológico, nosso modelo e rede de poder de computação foram iterados e atualizados, e continuaremos a iterar tecnologias relacionadas.
**Mídia: **Desde o último lançamento do modelo setorial, houve alguma mudança significativa no número de empresas acessando o modelo?
Wu Yunsheng: Temos muitos contatos com empresas e estudaremos honestamente os cenários reais dos clientes e como atender às necessidades comerciais atuais. "Acesso" não está especificamente definido. Existem várias necessidades no processo de exploração. Talvez você normalmente veja o AIGC com mais frequência.
Eu digo algo um pouco diferente. Temos uma empresa cliente que faz software de nível empresarial e precisa fazer formulários inteligentes. Por exemplo, em uma reunião de gerenciamento, um novo formulário é adicionado. Alguns itens do formulário são obrigatórios, outros não, e alguns menus suspensos podem selecionar apenas 4 ou 5 opções. Depois de concluída a opção, ela precisa ser transformada em um processo, que é aprovado por A, B e C, e a aprovação de cada pessoa é diferente.
O método original é projetar o formulário no sistema com suas próprias ferramentas e códigos de linguagem, compilar todo o processo e, em seguida, chamar a organização interna para realizar o processo. Mas o requisito atual é tirar uma foto e colocá-la no sistema e descrevê-la com o código do sistema (própria linguagem de script). Os indivíduos precisam apenas de comunicação e comunicação em linguagem natural simples, como quais são necessários e quais não são necessário A primeira etapa Onde ir, onde ir na segunda etapa, use sua própria linguagem de sistema para projetar o processo de encaixe.
Este exemplo é um requisito muito específico que não pode ser totalmente abordado por um modelo geral. Portanto, teremos trocas profundas com as empresas para ver de que campos trata a tabela e qual é a linguagem de script. A tecnologia de uso geral pode resolver diretamente 60% a 70% dos problemas, mas se os clientes quiserem resolver 100% dos problemas, eles precisam de uma comunicação mais aprofundada.
**Mídia: **Quanto custo a empresa economizará com a implementação do modelo de indústria em larga escala? Em comparação com os modelos de larga escala de uso geral, em quais áreas os modelos de larga escala da indústria têm vantagens?
**Wu Yunsheng: **O custo economizado realmente varia muito em diferentes empresas e diferentes cenários. Por exemplo, no cenário de atendimento ao cliente, há uma grande diferença no tamanho do atendimento ao cliente em si na empresa e quanto orçamento ele possui. Em termos de experiência real, acho que não há problema em aumentar a eficiência em mais de 30%.
Quando um grande modelo geral se depara com uma indústria específica, pode não ser capaz de resolver completamente os problemas encontrados pela indústria. Por exemplo, o que o atendimento ao cliente precisa não é de simples bate-papos de perguntas e respostas, mas de robôs e grandes modelos que possam entender as intenções humanas, pesquisar bancos de dados, extrair as informações necessárias e, em seguida, combiná-las em um texto compreensível para humanos para respostas.
O mais importante é que o processo de comunicação real do usuário geralmente é misturado com várias intenções. Existem muitos requisitos em uma descrição e a intenção pode mudar a qualquer momento durante o processo de comunicação. É muito difícil e o processo é muito complicado, especialmente ao interagir com o sistema do cliente.modelo complexo. Este processo não deve ser resolvido por um grande modelo geral e precisa ser combinado com cenários específicos.
**Mídia:**Que tipo de alcance a Tencent pode controlar o custo do modelo em grande escala da empresa?
Wu Yunsheng: Enfatizamos que por meio dessa tecnologia, as empresas podem reduzir custos, aumentar a eficiência e melhorar a eficiência da produção, mas nunca diremos em que nível controlar os custos. Nosso produto foi lançado há menos de um mês e temos alguma cooperação no estágio inicial, mas certamente não podemos fornecer dados gerais.
**36 Krypton:**Na última onda de IA, os aplicativos de tecnologia liderados por CV (reconhecimento de imagem) eram mais aplicativos de ponto único, como chamar o faturamento da API, mas depois disso, as empresas começaram a trabalhar em projetos e a privatização torna isso difícil obter lucros. Os grandes modelos de IA experimentarão a mesma coisa no futuro?
Wu Yunsheng: Ainda estou otimista, a julgar pelo momento atual, haverá desafios relativamente grandes. Mas se você espera meio ano ou prevê meio ano no futuro, o desenvolvimento da tecnologia é muito rápido, incluindo o poder de computação subjacente e os chips GPU. O modelo grande costumava ser um modelo com centenas de bilhões de parâmetros, mas com o desenvolvimento da tecnologia, os parâmetros do modelo estão ficando cada vez menores e a capacidade ainda é mantida em um nível muito forte. Ao mesmo tempo, fizemos muito progresso no reforço do treinamento e no reforço do raciocínio, e o custo está caindo rapidamente.
Por outro lado, em termos de aplicação, vemos mais possibilidades, e a tendência de aplicação e valor que pode ser gerado é cada vez maior.
**Mídia: **O que você acha do equilíbrio entre a capacitação subjacente e a implementação de cenários?
Wu Yunsheng: Nunca quisemos ver modelos grandes de uma única perspectiva. Independentemente do modelo de larga escala de uso geral ou do modelo industrial de larga escala, as capacidades de suporte subjacentes são necessárias, incluindo enorme poder de computação, dados, etc., que é a dimensão da força interna. A cena é outra dimensão.Para resolver um problema prático, usamos 50% da força interna, os outros 30% da força externa e adicionamos mais 20%.Na ecologia de modelo grande, olhamos o problema de diferentes perspectivas. Mas se você falar apenas sobre força interna, definitivamente não há problema.
**Mídia:**muitos CEOs mencionaram que o grande modelo é um divisor de águas para a indústria de computação. Agora que todos os grandes fabricantes estão lançando modelos em grande escala, esse julgamento é insustentável? Precisamos de tantos modelos grandes de uso geral ou eles já são redundantes?
Wu Yunsheng: Veja como definir uma virada de jogo. Nesta fase, a indústria de modelos em grande escala está em um estágio relativamente inicial e muitas possibilidades nasceram. Ao mesmo tempo, vemos que grandes modelos trazem mudanças tecnológicas e têm grande potencial.
Meu ponto de vista pessoal é que não há necessidade de ser muito ansioso para tirar uma conclusão agora, gostaria de ver que na fase em que cem flores estão desabrochando na indústria, através da combinação de tecnologia e indústria, várias possibilidades são exploradas para melhorar a eficiência das indústrias e indústrias.
**Mídia: **A combinação de modelo e indústria está em estágio inicial, quais problemas existirão neste estágio? Há uma visão de que, em comparação com o modelo de larga escala de uso geral, o custo do modelo industrial de larga escala pode não ser otimizado, mas pode ser maior. O que você acha desse ponto de vista?
**Wu Yunsheng: **A tecnologia de modelos grandes existe há pouco tempo e está se desenvolvendo rapidamente. O entendimento da indústria sobre o grande modelo ainda está em um estágio inicial - não sei o que o grande modelo pode fazer e quão profundo ele pode ser combinado com a indústria. Há sim mudanças na relação entre o modelo da indústria e o modelo básico, bem como na questão dos custos.
Há sim uma visão de que se um modelo grande resolver todos os problemas, o custo será menor, e também há uma visão de que para uma determinada indústria não é necessário um modelo grande, podendo-se utilizar um modelo pequeno.
Esta questão não pode ser julgada a partir de uma única dimensão, mas deve ser vista de forma objetiva e completa. Tenho enfatizado que grandes modelos gerais podem resolver problemas gerais que não estão intimamente integrados com a indústria. Mas se você quiser ir mais fundo, você tem que ir mais longe na cena. Muitos problemas parecem ser os mesmos, mas se você for mais fundo, pode não resolver o mesmo problema. Nesse caso, não faz muito sentido julgar o custo da solução.
Mídia: Do ponto de vista do setor, como julgar o incremento do mercado e o cenário incremental gerado pela mudança tecnológica em larga escala para todo o mercado de computação em nuvem?
Wu Yunsheng: Pode-se ver que, após o advento da era do modelo em grande escala, a demanda por poder de computação foi bastante promovida, especialmente para poder de computação relacionado à IA. No entanto, em termos de quantificação específica da computação em nuvem, é difícil dar um número e ainda está em processo de desenvolvimento contínuo.
Em termos de cenas, todas as esferas da vida agora combinam modelos grandes, e as cenas são muito ricas, incluindo cenas gerais e cenas da indústria. Cenários comuns incluem atualizações de conferência inteligente. O atendimento ao cliente Qidian da Tencent e a análise Qidian lançada em 619 também estão fazendo um trabalho inteligente. Também fazemos alguns assistentes de código na nuvem. Em termos de aplicação universal e atualização de eficiência, também existem muitas aplicações. Além disso, cada setor possui aplicações em vários setores, o que também trará muita demanda.
Mídia: Além do cenário de aterrissagem de modelos em grande escala, a Tencent fornecerá serviços para outras empresas de modelos em grande escala? O motor do vulcão disse que 70% dos usuários de modelos em grande escala estão no vulcão. Quais são os dados da Tencent?
**Wu Yunsheng:**Fornecemos uma série de suporte ou recursos de nuvem para empresas unicórnios ou outras soluções de modelo em larga escala. Lançamos HCC de computador de alto desempenho, banco de dados de vetores e recursos de aceleração aprimorados, que podem ser fornecidos aos fabricantes.
Para além das capacidades subjacentes, dispomos também de uma solução integrada de fine-tuning baseada no grande modelo da plataforma TI, bem como de um conjunto de ferramentas, processos e suporte de serviços.
**Mídia:**Muitos provedores de serviços SaaS acumularam por muitos anos. Nosso MaaS (Modelo como Serviço) é para eles ou para os principais clientes do setor?
Wu Yunsheng: Estes são nossos clientes.
Mídia: Combinar com a indústria é a abordagem atual da Tencent. Ontem, a Huawei estabeleceu uma aliança. Isso significa que a concorrência é mais fácil de formar uma disputa entre gigantes?
Wu Yunsheng: Não vejo essa questão dessa maneira. Acho que a abertura é muito importante na era dos modelos grandes e todos devem ser abertos. A tecnologia subjacente muda muito rápido e a capacidade de extensão da tecnologia é muito ampla, e custará muito dinheiro integrá-la a setores específicos. Nesse caso, apenas a abertura pode trazer o maior valor. Somente abrindo e permitindo que mais especialistas do setor e pessoal em várias funções se juntem, todo o ecossistema pode ser mais saudável e criar mais possibilidades.
Mídia: A abertura para cada empresa é a mesma?
Wu Yunsheng: A abertura que mencionei refere-se à capacitação e abertura ecológica. Por exemplo, a construção de um grande modelo financeiro não exige que uma pessoa resuma todos os grandes modelos financeiros.Pessoas diferentes têm experiência profunda em campos diferentes, e construir juntos é uma espécie de abertura. A abertura direta para os clientes da indústria também é uma espécie de abertura.
Além disso, com base nos recursos fornecidos pelo modelo grande, os parceiros atualizam a aplicação de ferramentas de eficiência ou soluções do setor e combinam diferentes formas de aplicativos. Em termos de fortalecer a força interna do grande modelo, os parceiros estão florescendo e todos apresentam aplicações diferentes, o que também é uma espécie de abertura.
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Tencent Cloud Wu Yunsheng: O modelo geral e o modelo da indústria não são opostos
"Preferimos resolver 100% do problema de um cliente do que resolver 70%-80% de 100 problemas do cliente."
Em 7 de julho, no Fórum Tencent da Conferência Mundial de Inteligência Artificial (WAIC) de 2023, quando perguntado por que o modelo de grande escala orientado para a indústria foi lançado primeiro, Wu Yunsheng, vice-presidente da Tencent Cloud e chefe da Tencent Cloud Intelligence, respondeu desta forma .
Modelos em grande escala são o tema mais quente no mundo da IA este ano. Em comparação com Baidu, Ali e outros gigantes que lançaram pela primeira vez o modelo subjacente de grande escala de uso geral, a Tencent concentrou sua atenção diretamente no setor - antes do WAIC ser realizado, em 19 de junho, a Tencent Cloud anunciou oficialmente o MaaS (Model as a Service ), que tem sido As 10 maiores indústrias já exportaram mais de 50 soluções, abrangendo diversos cenários como turismo cultural, finanças, mídia, educação e assuntos governamentais.
Naturalmente, a aplicação e aterrissagem de cenários se tornaram o tema de todo o WAIC Tencent Forum.
"Modelos grandes de propósito geral não são a única direção para aplicações de modelos. Modelos para indústrias verticais se tornarão o ponto de inflexão do valor de modelos grandes." Li Qiang, vice-presidente da Tencent e presidente do governo e negócios corporativos da Tencent, previu em o Fórum.
Wu Yunsheng usou o atendimento ao cliente inteligente da OTA (Agência de viagens online) como exemplo e explicou que os usuários geralmente têm várias intenções misturadas no processo de comunicação real. No processo de comunicação, a intenção também pode mudar a qualquer momento.
"(O usuário) acabou de pedir para reservar o hotel no dia 10, e a máquina estava prestes a atender, e de repente disse, deixe-me ver o hotel no dia 11." Diante do processo extremamente complicado no cenário de atendimento ao cliente, o general modelo grande não pode perfeitamente Para completar a tarefa, é necessário reconstruir alguns modelos complexos em combinação com cenários específicos.
No entanto, o atual modelo de grande escala de uso geral ainda está no estágio inicial de pesquisa e desenvolvimento e enfrentará o problema de alto custo em aplicações industriais. Wu Yunsheng disse que em alguns cenários específicos, uma vez que o grande propósito geral -modelo em escala não pode atender 100% às necessidades, então "julgando o nível de custo da solução, não há Faz muito sentido." Embora as soluções para diferentes indústrias e cenários variem muito, não há problema em melhorar a eficiência das empresas em mais de 30% em geral.
No fórum, a Tencent Cloud também apresentou as recentes atualizações importantes em torno do modelo grande. Suas duas principais bases técnicas - Xingmai Network e Vector Database passaram por atualizações de capacidade. A rede de computação de alto desempenho Xingmai atualizada pode aumentar a utilização de GPU em 40%, economizar custos de treinamento de modelo em 30% a 60% e melhorar o desempenho de comunicação de modelos grandes de IA em quase 10 vezes.
E apenas em 4 de julho, a Tencent Cloud lançou oficialmente o banco de dados de vetores nativos de IA. Comparado com o método tradicional, ele é usado para classificação, desduplicação e limpeza de dados de pré-treinamento de modelos grandes, e o banco de dados pode atingir 10 vezes aumento de eficiência. Usá-lo como uma base de conhecimento externa para inferência de modelo pode reduzir o custo em 2 a 4 ordens de grandeza.
No WAIC deste ano, também apareceu um fenômeno interessante: mais de 30 modelos de uso geral e de grande escala da indústria foram revelados na reunião, e todos disseram fazer modelos de grande escala. A questão da homogeneização tornou-se imediatamente o foco da discussão: o empreendedorismo no campo da IA ainda faz sentido? Cada grande fábrica tem seu próprio modelo grande, se todos o possuírem, o modelo grande ainda será um divisor de águas?
Wu Yunsheng acredita que no estágio inicial de desenvolvimento de grandes modelos, não há necessidade de se apressar para fazer julgamentos sobre essas questões. "Gostaria de ver que, quando a indústria estiver em plena floração, através da combinação de tecnologia e indústria, explorar várias possibilidades e melhorar a eficiência das indústrias e indústrias", disse Wu Yunsheng.
Esse julgamento também vem de seu otimismo sobre o potencial comercial de grandes modelos de IA. Na última onda de IA com avanços de ponto único, muitas empresas de IA caíram no dilema de entrega e implementação de projetos e privatizações e não conseguiram obter lucratividade.
"Na era dos modelos grandes, a situação pode ser diferente de antes." Wu Yunsheng acredita que, com o desenvolvimento da tecnologia, incluindo o desenvolvimento do poder de computação subjacente e dos chips GPU, os parâmetros dos modelos que custavam centenas de bilhões no passado estão ficando cada vez menores; Tencent Também há muito progresso no reforço do treinamento e no reforço do raciocínio, e o custo está caindo rapidamente. Por outro lado, as possibilidades na aplicação de grandes modelos estão em constante expansão e o valor está em constante aumento.
Hoje, a Tencent está expandindo sua tecnologia e ecologia de aplicativos em torno de grandes modelos de IA e também está fortalecendo sua ligação com a indústria. Em 6 de julho, a Organização das Nações Unidas para o Desenvolvimento Industrial, a Huawei e outros parceiros anunciaram conjuntamente o estabelecimento da "Aliança Global de Inteligência Artificial Industrial e de Manufatura" no WAIC.
Wu Yunsheng também enfatizou que a atualização da base técnica é "praticar a força interna": "Não importa se é um modelo de grande escala de uso geral ou um modelo industrial de grande escala, ele precisa ter os recursos de suporte subjacentes , incluindo enorme poder de computação, dados, etc.."
"Na era dos modelos de grande escala, a abertura é muito importante e todos devem ser abertos. A tecnologia subjacente muda muito rápido e os recursos de extensão são muito amplos. Quando combinado com indústrias específicas, haverá muita pesquisa e custos de desenvolvimento." Wu Yunsheng disse que somente através da abertura mais indústrias podem surgir. Somente quando especialistas e vários funcionários se juntam podemos cultivar um ecossistema mais saudável e criar mais possibilidades.
O seguinte é o registro da entrevista da mídia e Wu Yunsheng, editado por 36 Krypton:
**Mídia:**A Tencent Cloud lançou no início um modelo de larga escala voltado para o setor, em vez de um modelo de larga escala de propósito geral. É uma consideração de receita?
Wu Yunsheng: Isso não tem nada a ver com custo e investimento. Sempre enfatizamos que queremos resolver os problemas dos clientes. Preferimos resolver o problema de um cliente 100% do que resolver os problemas de 100 clientes em 70%-80%. Podemos diminuir o problema, mas devemos resolver esse problema.
Mídia: Parece que o modelo geral e o modelo da indústria estão em oposição. Como você vê o relacionamento futuro entre os dois?
Wu Yunsheng: Em primeiro lugar, quero deixar claro que pessoalmente não me oponho aos dois. Um mockup básico é algo como um pedestal que resolve uma necessidade sem customização especial. O modelo da indústria deve ser baseado no modelo geral para melhorar efetivamente a produtividade e atender ao público. Somente nos aprofundando na indústria podemos resolver problemas particularmente importantes.
A função do mapa de Vincent também terá pontos de indústria muito detalhados e específicos - por exemplo, gerando um mapa de anúncio para um pacote, e alguns clientes terão necessidades especiais, como alguma certificação especial. Quando confrontados com problemas práticos, é necessária uma abordagem diferente.
**Mídia:**Em quais áreas a Tencent se concentrará este ano e quais metas de desenvolvimento ela terá? Quais são as atualizações e iterações recentes?
**Wu Yunsheng:**Nossa grande estratégia é focar na implementação de problemas práticos, esperando resolver 100% dos problemas dos clientes em cada cenário específico, em vez de encontrar 100 produtos para resolver 70%-80% dos problemas. Portanto, vamos nos concentrar em indústrias específicas e trabalhar com os clientes para resolver os problemas da indústria.
Por exemplo, na indústria de viagens culturais, os clientes no campo OTA (Online Travel Agency) combinarão seus próprios cenários de negócios, usarão a tecnologia de modelos de grande escala em processos de negócios e usarão recursos relacionados a dados para ajustar os processos de grande escala. modelo. Em termos de desenvolvimento tecnológico, nosso modelo e rede de poder de computação foram iterados e atualizados, e continuaremos a iterar tecnologias relacionadas.
**Mídia: **Desde o último lançamento do modelo setorial, houve alguma mudança significativa no número de empresas acessando o modelo?
Wu Yunsheng: Temos muitos contatos com empresas e estudaremos honestamente os cenários reais dos clientes e como atender às necessidades comerciais atuais. "Acesso" não está especificamente definido. Existem várias necessidades no processo de exploração. Talvez você normalmente veja o AIGC com mais frequência.
Eu digo algo um pouco diferente. Temos uma empresa cliente que faz software de nível empresarial e precisa fazer formulários inteligentes. Por exemplo, em uma reunião de gerenciamento, um novo formulário é adicionado. Alguns itens do formulário são obrigatórios, outros não, e alguns menus suspensos podem selecionar apenas 4 ou 5 opções. Depois de concluída a opção, ela precisa ser transformada em um processo, que é aprovado por A, B e C, e a aprovação de cada pessoa é diferente.
O método original é projetar o formulário no sistema com suas próprias ferramentas e códigos de linguagem, compilar todo o processo e, em seguida, chamar a organização interna para realizar o processo. Mas o requisito atual é tirar uma foto e colocá-la no sistema e descrevê-la com o código do sistema (própria linguagem de script). Os indivíduos precisam apenas de comunicação e comunicação em linguagem natural simples, como quais são necessários e quais não são necessário A primeira etapa Onde ir, onde ir na segunda etapa, use sua própria linguagem de sistema para projetar o processo de encaixe.
Este exemplo é um requisito muito específico que não pode ser totalmente abordado por um modelo geral. Portanto, teremos trocas profundas com as empresas para ver de que campos trata a tabela e qual é a linguagem de script. A tecnologia de uso geral pode resolver diretamente 60% a 70% dos problemas, mas se os clientes quiserem resolver 100% dos problemas, eles precisam de uma comunicação mais aprofundada.
**Mídia: **Quanto custo a empresa economizará com a implementação do modelo de indústria em larga escala? Em comparação com os modelos de larga escala de uso geral, em quais áreas os modelos de larga escala da indústria têm vantagens?
**Wu Yunsheng: **O custo economizado realmente varia muito em diferentes empresas e diferentes cenários. Por exemplo, no cenário de atendimento ao cliente, há uma grande diferença no tamanho do atendimento ao cliente em si na empresa e quanto orçamento ele possui. Em termos de experiência real, acho que não há problema em aumentar a eficiência em mais de 30%.
Quando um grande modelo geral se depara com uma indústria específica, pode não ser capaz de resolver completamente os problemas encontrados pela indústria. Por exemplo, o que o atendimento ao cliente precisa não é de simples bate-papos de perguntas e respostas, mas de robôs e grandes modelos que possam entender as intenções humanas, pesquisar bancos de dados, extrair as informações necessárias e, em seguida, combiná-las em um texto compreensível para humanos para respostas.
O mais importante é que o processo de comunicação real do usuário geralmente é misturado com várias intenções. Existem muitos requisitos em uma descrição e a intenção pode mudar a qualquer momento durante o processo de comunicação. É muito difícil e o processo é muito complicado, especialmente ao interagir com o sistema do cliente.modelo complexo. Este processo não deve ser resolvido por um grande modelo geral e precisa ser combinado com cenários específicos.
**Mídia:**Que tipo de alcance a Tencent pode controlar o custo do modelo em grande escala da empresa?
Wu Yunsheng: Enfatizamos que por meio dessa tecnologia, as empresas podem reduzir custos, aumentar a eficiência e melhorar a eficiência da produção, mas nunca diremos em que nível controlar os custos. Nosso produto foi lançado há menos de um mês e temos alguma cooperação no estágio inicial, mas certamente não podemos fornecer dados gerais.
**36 Krypton:**Na última onda de IA, os aplicativos de tecnologia liderados por CV (reconhecimento de imagem) eram mais aplicativos de ponto único, como chamar o faturamento da API, mas depois disso, as empresas começaram a trabalhar em projetos e a privatização torna isso difícil obter lucros. Os grandes modelos de IA experimentarão a mesma coisa no futuro?
Wu Yunsheng: Ainda estou otimista, a julgar pelo momento atual, haverá desafios relativamente grandes. Mas se você espera meio ano ou prevê meio ano no futuro, o desenvolvimento da tecnologia é muito rápido, incluindo o poder de computação subjacente e os chips GPU. O modelo grande costumava ser um modelo com centenas de bilhões de parâmetros, mas com o desenvolvimento da tecnologia, os parâmetros do modelo estão ficando cada vez menores e a capacidade ainda é mantida em um nível muito forte. Ao mesmo tempo, fizemos muito progresso no reforço do treinamento e no reforço do raciocínio, e o custo está caindo rapidamente.
Por outro lado, em termos de aplicação, vemos mais possibilidades, e a tendência de aplicação e valor que pode ser gerado é cada vez maior.
**Mídia: **O que você acha do equilíbrio entre a capacitação subjacente e a implementação de cenários?
Wu Yunsheng: Nunca quisemos ver modelos grandes de uma única perspectiva. Independentemente do modelo de larga escala de uso geral ou do modelo industrial de larga escala, as capacidades de suporte subjacentes são necessárias, incluindo enorme poder de computação, dados, etc., que é a dimensão da força interna. A cena é outra dimensão.Para resolver um problema prático, usamos 50% da força interna, os outros 30% da força externa e adicionamos mais 20%.Na ecologia de modelo grande, olhamos o problema de diferentes perspectivas. Mas se você falar apenas sobre força interna, definitivamente não há problema.
**Mídia:**muitos CEOs mencionaram que o grande modelo é um divisor de águas para a indústria de computação. Agora que todos os grandes fabricantes estão lançando modelos em grande escala, esse julgamento é insustentável? Precisamos de tantos modelos grandes de uso geral ou eles já são redundantes?
Wu Yunsheng: Veja como definir uma virada de jogo. Nesta fase, a indústria de modelos em grande escala está em um estágio relativamente inicial e muitas possibilidades nasceram. Ao mesmo tempo, vemos que grandes modelos trazem mudanças tecnológicas e têm grande potencial.
Meu ponto de vista pessoal é que não há necessidade de ser muito ansioso para tirar uma conclusão agora, gostaria de ver que na fase em que cem flores estão desabrochando na indústria, através da combinação de tecnologia e indústria, várias possibilidades são exploradas para melhorar a eficiência das indústrias e indústrias.
**Mídia: **A combinação de modelo e indústria está em estágio inicial, quais problemas existirão neste estágio? Há uma visão de que, em comparação com o modelo de larga escala de uso geral, o custo do modelo industrial de larga escala pode não ser otimizado, mas pode ser maior. O que você acha desse ponto de vista?
**Wu Yunsheng: **A tecnologia de modelos grandes existe há pouco tempo e está se desenvolvendo rapidamente. O entendimento da indústria sobre o grande modelo ainda está em um estágio inicial - não sei o que o grande modelo pode fazer e quão profundo ele pode ser combinado com a indústria. Há sim mudanças na relação entre o modelo da indústria e o modelo básico, bem como na questão dos custos.
Há sim uma visão de que se um modelo grande resolver todos os problemas, o custo será menor, e também há uma visão de que para uma determinada indústria não é necessário um modelo grande, podendo-se utilizar um modelo pequeno.
Esta questão não pode ser julgada a partir de uma única dimensão, mas deve ser vista de forma objetiva e completa. Tenho enfatizado que grandes modelos gerais podem resolver problemas gerais que não estão intimamente integrados com a indústria. Mas se você quiser ir mais fundo, você tem que ir mais longe na cena. Muitos problemas parecem ser os mesmos, mas se você for mais fundo, pode não resolver o mesmo problema. Nesse caso, não faz muito sentido julgar o custo da solução.
Mídia: Do ponto de vista do setor, como julgar o incremento do mercado e o cenário incremental gerado pela mudança tecnológica em larga escala para todo o mercado de computação em nuvem?
Wu Yunsheng: Pode-se ver que, após o advento da era do modelo em grande escala, a demanda por poder de computação foi bastante promovida, especialmente para poder de computação relacionado à IA. No entanto, em termos de quantificação específica da computação em nuvem, é difícil dar um número e ainda está em processo de desenvolvimento contínuo.
Em termos de cenas, todas as esferas da vida agora combinam modelos grandes, e as cenas são muito ricas, incluindo cenas gerais e cenas da indústria. Cenários comuns incluem atualizações de conferência inteligente. O atendimento ao cliente Qidian da Tencent e a análise Qidian lançada em 619 também estão fazendo um trabalho inteligente. Também fazemos alguns assistentes de código na nuvem. Em termos de aplicação universal e atualização de eficiência, também existem muitas aplicações. Além disso, cada setor possui aplicações em vários setores, o que também trará muita demanda.
Mídia: Além do cenário de aterrissagem de modelos em grande escala, a Tencent fornecerá serviços para outras empresas de modelos em grande escala? O motor do vulcão disse que 70% dos usuários de modelos em grande escala estão no vulcão. Quais são os dados da Tencent?
**Wu Yunsheng:**Fornecemos uma série de suporte ou recursos de nuvem para empresas unicórnios ou outras soluções de modelo em larga escala. Lançamos HCC de computador de alto desempenho, banco de dados de vetores e recursos de aceleração aprimorados, que podem ser fornecidos aos fabricantes.
Para além das capacidades subjacentes, dispomos também de uma solução integrada de fine-tuning baseada no grande modelo da plataforma TI, bem como de um conjunto de ferramentas, processos e suporte de serviços.
**Mídia:**Muitos provedores de serviços SaaS acumularam por muitos anos. Nosso MaaS (Modelo como Serviço) é para eles ou para os principais clientes do setor?
Wu Yunsheng: Estes são nossos clientes.
Mídia: Combinar com a indústria é a abordagem atual da Tencent. Ontem, a Huawei estabeleceu uma aliança. Isso significa que a concorrência é mais fácil de formar uma disputa entre gigantes?
Wu Yunsheng: Não vejo essa questão dessa maneira. Acho que a abertura é muito importante na era dos modelos grandes e todos devem ser abertos. A tecnologia subjacente muda muito rápido e a capacidade de extensão da tecnologia é muito ampla, e custará muito dinheiro integrá-la a setores específicos. Nesse caso, apenas a abertura pode trazer o maior valor. Somente abrindo e permitindo que mais especialistas do setor e pessoal em várias funções se juntem, todo o ecossistema pode ser mais saudável e criar mais possibilidades.
Mídia: A abertura para cada empresa é a mesma?
Wu Yunsheng: A abertura que mencionei refere-se à capacitação e abertura ecológica. Por exemplo, a construção de um grande modelo financeiro não exige que uma pessoa resuma todos os grandes modelos financeiros.Pessoas diferentes têm experiência profunda em campos diferentes, e construir juntos é uma espécie de abertura. A abertura direta para os clientes da indústria também é uma espécie de abertura.
Além disso, com base nos recursos fornecidos pelo modelo grande, os parceiros atualizam a aplicação de ferramentas de eficiência ou soluções do setor e combinam diferentes formas de aplicativos. Em termos de fortalecer a força interna do grande modelo, os parceiros estão florescendo e todos apresentam aplicações diferentes, o que também é uma espécie de abertura.