Autor: O repórter do The Paper, Huan Yanhong, estagiário Chen Xiaorui
Fonte da imagem: Gerada pela ferramenta Unbounded AI
A tecnologia de IA generativa está mudando a indústria de inteligência artificial. Depois de apenas meio ano, o desenvolvimento de modelos domésticos de grande escala completou o salto da tecnologia para o produto e depois para o negócio, e penetrou nas indústrias verticais. Durante a Conferência Mundial de Inteligência Artificial em 6 de julho, o The Paper convidou Wang Danjun, vice-presidente do Beisen Talent Management Research Institute, Yu Zhonghai, vice-gerente geral do departamento de pesquisa do CICC, e Zhang Jie, vice-presidente da Zhongguancun Kejin Technology, para a sala de bate-papo Metaverse para discutir oportunidades de inovação de negócios sob a "emergência" de grandes modelos. O diálogo foi apresentado por Shao Wen, um repórter do The Paper. Durante o diálogo de uma hora, os convidados discutiram uma série de questões relacionadas, incluindo:
Como grandes modelos de uso geral e modelos de campo vertical em grande escala encontram seu próprio valor em cenários de negócios futuros?
Como as empresas podem aproveitar as oportunidades de negócios de grandes modelos? Qual é o ponto-chave para aproveitar a oportunidade?
A vida passada e o futuro da grande modelo
**澎湃科技: Atualmente, o mercado doméstico formou uma situação de "guerra de cem modelos". Você acha que os modelos domésticos de grande escala estão se desenvolvendo tão rápido? Que impacto isso tem em seu campo? **
**Wang Danjun (vice-presidente do Beisen Talent Management Research Institute): **Do ponto de vista técnico, o desenvolvimento de grandes modelos não é algo que aconteceu nos últimos dois anos. No campo acadêmico, há muitos anos, todo mundo começou a fazer pesquisa. É que com o aumento do volume de dados e a melhoria do nível de tecnologia nos últimos anos, especialmente depois que a OpenAI lançou o ChatGPT, atraiu atenção generalizada.
Para cada campo, todos pensam em como aplicar essa nova tecnologia em seu próprio campo e como melhorar seu modelo de negócios.
Por exemplo, nosso Beisen Talent Management Research Institute pertence ao setor de recursos humanos, e os clientes que atendemos são todos grupos de empresas de RH (recursos humanos). Pensamos que a aplicação de grandes modelos na área de recursos humanos pode produzir algum valor disruptivo no futuro, por exemplo, pode de fato melhorar melhor a eficiência do trabalho de todos; ajudará em certa medida nossos parceiros, seja RH ou Pode orientar melhor o desenvolvimento dos colaboradores e, ao mesmo tempo, também pode ajudar as empresas a responder a muitas questões de gestão de recursos humanos, incluindo o que muitas vezes fazemos quando recrutamos funcionários: quem é mais adequado e quem pode trazer mais benefícios. Bom desempenho , como o salário deve ser determinado, etc. Acho que o desenvolvimento e a aplicação de grandes modelos transformarão a indústria de recursos humanos em um período muito curto de tempo.
**Yu Zhonghai (Gerente Geral Adjunto do Departamento de Pesquisa do CICC): **O reitor Wang mencionou um ponto muito importante, ou seja, a tecnologia de modelos em larga escala não aconteceu apenas hoje. Em 2017, o Google escreveu um artigo famoso chamado Attention Is All You Need (atenção é tudo o que você precisa) e propôs a arquitetura do transformador.
Na verdade, os profissionais da indústria de inteligência artificial da China descobriram o potencial da tecnologia de modelos em larga escala muito cedo. Também escrevemos um relatório de pesquisa relacionado em 2021. Naquela época, ficamos chocados com o desenvolvimento de modelos de inteligência artificial. Agora, o produto específico do ChatGPT torna o grande modelo conhecido pelas pessoas comuns. Não importa se você entende de tecnologia ou não, você pode sentir seu charme enquanto o joga, então o grande modelo é popular.
A capacidade de grandes modelos serem aplicados em milhares de indústrias tão rapidamente também depende de direitos iguais em tecnologia, que é um conceito muito importante que apresentamos. Graças ao desenvolvimento da comunidade de código aberto e à disseminação natural do conhecimento, muitas empresas criaram rapidamente seus próprios grandes modelos.
Além disso, gostaria de acrescentar que desta vez vimos todo o círculo tecnológico e até toda a sociedade formar uma força conjunta, ou seja, “todo mundo acha isso muito importante”, o que raramente se via no passado.
**Zhang Jie (vice-presidente da Zhongguancun Kejin Technology): **Acho que o primeiro ano do grande modelo remonta ao lançamento do GPT3 em 2020. Por que se desenvolveu tão rápido nos últimos seis meses? Acho que há três razões:
O primeiro aspecto é que algumas empresas e universidades acumularam muito antes, como Baidu, Huawei, Tsinghua University, etc., eles têm modelos de linguagem pré-treinados ou grandes modelos antes, e os últimos seis meses foram uma atualização de versão iteração para eles;
O segundo aspecto é que várias empresas, incluindo algumas instituições de investimento, aumentaram seus investimentos;
O terceiro aspecto é confiar no código aberto.A comunidade de código aberto levou as empresas a lançar vários modelos de grandes domínios.
Em relação ao impacto de modelos grandes no campo, é um benefício de mão dupla para os clientes e para nós. A Zhongguancun Kejin é uma fornecedora líder de soluções de tecnologia de IA conversacional. O modelo grande reduz nosso custo de personalização e desenvolvimento de vários modelos de cena, o que é uma boa notícia para nós. Para nossos clientes, a redução de custos de projetos inteligentes levou muitas pequenas e médias empresas a considerar a criação de projetos, e todo o mercado cresceu em tamanho.
**澎湃科技: Recentemente, a Tencent Cloud e a OpenAI propuseram sucessivamente uma loja de modelo em grande escala para software de modelo personalizado, que é um pouco semelhante à forma de uma loja de aplicativos. Como você entende essa tendência? **
**Wang Danjun:**Se você é um investidor ou um praticante neste campo, acredito que todos esperam ver esta tendência, porque encoraja mais pessoas a participar da co-criação deste campo. Acreditamos que os prestadores de serviços básicos, com certeza, tenderão futuramente para o modelo de loja, o que facilitará a aproximação com os clientes. O modelo da loja de modelo grande também permite que os usuários que recebem serviços usem melhor o modelo grande para criar alguns novos cenários de aplicativos e valor de serviço.
Yu Zhonghai: Na verdade, essa é uma questão que preocupa muito o mercado de capitais. Eu acho que o desenvolvimento de grandes modelos será mais parecido com a nuvem pública e a nuvem privada da China no futuro.
Na época, a nuvem pública era chamada de IaaS (Infrastructure-as-a-Service, infraestrutura como serviço) e quando se trata de modelos grandes, chamamos de MaaS (Model as a Service). Existe uma empresa estrangeira conhecida chamada Hugging Face, que coloca muitos modelos na Internet, e você pode usar diferentes modelos de IA apenas chamando sua API (Application Program Interface, interface de programação de aplicativos).
No entanto, também existem muitas empresas que precisam implantar seu próprio modelo de grande escala e usar seu próprio conhecimento para aprimorá-lo para fazer seu próprio ajuste fino devido a requisitos como conformidade de segurança e implementação de cena subdividida. Isso pode ser como a nuvem privada mercado na China. .
De um modo geral, os modelos grandes não são adequados para uso direto de todos, incluindo o ChatGPT, que é realmente empacotado em um produto baseado no modelo grande, para que todas as pessoas comuns possam experimentá-lo. Portanto, fazer aplicativos baseados em grandes modelos é realmente um mercado muito amplo, que pode gerar muitos modelos de negócios, como funcionários digitais e o conceito de loja de aplicativos mencionado pelo host.
Na verdade, o ChatGPT também é considerado por muitas pessoas como um portal de tráfego. Pelo que eu sei, alguns fabricantes de celulares de grande porte também podem acabar fazendo buscas. Então esse assunto é completamente diferente. Seu mercado alcançável será da empresa Os gastos com TI tornam-se gastos com marketing. As empresas chinesas podem gastar uma média de 1% a 3% da receita em TI, mas podem gastar 30% da receita em marketing. Então, quando você tem tráfego, o modelo de negócio pode mudar muito, o que é muito interessante.
Zhang Jie: Acho que OpenAI e Tencent Cloud têm ênfases diferentes. O foco da OpenAI ainda pode estar no modelo grande básico. Ele usa alguns parceiros ecológicos para ajudá-lo a compensar a falta de precisão ou profissionalismo do modelo grande básico em alguns cenários fragmentados. No entanto, a Tencent Cloud não enfatiza demais seu próprio modelo básico, mas enfatiza a necessidade de ser um grande modelo para indústrias verticais.
Suas diferentes ênfases mostram um problema comum, ou seja, o modelo básico grande não pode ser usado diretamente em algumas indústrias ou cenários específicos com alto profissionalismo, e também precisa de uma camada de adaptação. Acho que pode haver um novo modelo de negócio aqui, ou seja, cada vez mais o conhecimento pode ser capitalizado no futuro. Acontece que quando todo mundo usa IA, o paradigma técnico é diferente. Portanto, os ativos que todos podem compartilhar são alguns dados brutos. Depois de obter os dados brutos, diferentes meios técnicos são usados para processá-los. Durante esse processo, a forma intermediária dos dados não pode ser negociada.
No entanto, o modelo grande basicamente unifica muitas tarefas de IA, e todo o paradigma de pesquisa e fluxo de processamento convergem, o que torna muitos produtos intermediários negociáveis, como dados rotulados, dados para alinhamento de instruções, palavras de prompt e A cadeia de prompt composta por frases de prompt , etc., e até mesmo robôs ou assistentes treinados em cenários específicos, podem fazer algumas transações e serem capitalizados, podendo ser um novo modelo de negócios no futuro.
Modelo grande geral VS modelo grande de campo vertical
**Tecnologia de papel: Na verdade, vocês três mencionaram dois caminhos de negócios diferentes, o grande modelo de domínio e o grande modelo geral. Você pode falar sobre as oportunidades e os desafios desses dois modelos de negócios diferentes em detalhes? **
Wang Danjun: No futuro, os negócios em torno de grandes modelos definitivamente se tornarão uma ecologia de negócios, e o principal recurso da ecologia de negócios é que ela será em camadas. Em primeiro lugar, haverá alguns fabricantes para fornecer serviços básicos, porque modelos grandes exigem base de dados e poder de computação. O modelo grande serve como o motor subjacente.Embora tenha fortes capacidades, não compreende o conhecimento de domínios específicos, modelos de serviço e necessidades do cliente.
Junto com isso, vêm grandes maquetes de verticais. Alguns dos modelos grandes nesses domínios verticais são os próprios modelos grandes dos fabricantes de domínio e alguns são treinados com base nos modelos grandes básicos. Em termos leigos, é tornar esses modelos um especialista. Por exemplo, na área financeira, pode haver alguns serviços dedicados a ajudar os investidores a tomar decisões de negócios e, na área de recursos humanos, pode haver serviços dedicados a ajudar as empresas a tomar decisões sobre talentos.
Pode haver muitos campos subdivididos. Essas subdivisões também podem exigir acúmulo de indústria, treinamento e compreensão de como resolver problemas do cliente e até mesmo envolver-se no nível de experiência do usuário da interface interativa. Esses acúmulos são, na verdade, alguns dos recursos por trás da loja de aplicativos de que falamos anteriormente.
Yu Zhonghai: Do nosso ponto de vista, esses dois tipos de mercado são bastante diferentes.
Em primeiro lugar, também é importante construir um bom volante de dados para o modelo geral grande.
Por exemplo, hoje eu ensino você a jogar tênis de mesa e digo que você deve jogar assim. Aí eu saco uma bola e você não pega, você sabe que não é o jeito certo de bater. Então mude para outro caminho, desta vez você o pegou, você se lembrará do caminho correto. Aí eu continuo sacando a bola para você, e você continua pegando, ajustando sua memória muscular aos poucos para encontrar o melhor caminho. Na verdade, o treinamento do modelo também é um processo desse tipo. Toda vez que você se comunicar com o ChatGPT, haverá uma curtida ou desgosto abaixo dele. Ou há momentos em que você não diz nada e fica muito desapontado por ter regenerado um. Ou, por exemplo, toda vez que você usar o Midjourney para desenhar, ele exibirá quatro imagens e, em seguida, você selecionará a terceira por padrão, ampliará, fará o download e saberá que esta parece ser melhor e irá para isso no futuro A direção é um pouco mais tendenciosa e o modelo aprenderá um pouco. Sem feedback de dados, o modelo fica aqui e não pode melhorar. Portanto, este é o volante de dados que enfatizamos, enfatizando a posição do cartão na cena. Como um modelo grande de uso geral, o mais importante é que seja usado por alguém, o que também é uma vantagem da China. Os chineses gostam de abraçar a tecnologia e aceitam mais modelos grandes. Temos muitas pessoas para dar feedback.
Para modelos de domínio grande, acho que o mais importante é o know-how (o know-how técnico e a experiência necessários para se envolver em um determinado setor ou realizar um determinado trabalho).
A chave para o modelo de grande domínio é atender às necessidades dos clientes e entender o know-how dos clientes em um determinado domínio profundo. Empresas como a Zhongguancun Kejin têm suas vantagens aqui: elas entendem o know-how do cliente e seus pontos problemáticos em cenários de campo específicos.
**Zhang Jie: **Obrigado pelo seu reconhecimento. Eu entendo que o modelo grande geral e o modelo grande de domínio são um relacionamento upstream e downstream, não um relacionamento competitivo. O modelo geral é grande e abrangente, e o modelo de domínio é um negócio pequeno, mas bonito.
O modelo geral de grande escala é caracterizado por "três altos", ou seja, alto investimento e alto retorno, mas também alta incerteza. Porque o treinamento de um grande modelo básico requer altos requisitos em termos de algoritmos, dados e talentos. Por exemplo, o poder de computação deve ser de pelo menos 10.000 kat de nível de poder de computação.
Por que a incerteza é tão alta? Como os fabricantes pré-selecionados são basicamente grandes empresas de Internet ou gigantes da tecnologia, os requisitos técnicos são muito altos para que os grandes modelos treinados tenham capacidades gerais e emergentes. run Apenas ganhando o modelo de código aberto ele pode sobreviver. No mercado futuro, acho que coexistirão muitos modelos grandes básicos, mas pode não haver muitos.
Uma maquete de domínio pode ser uma trilha pequena, mas bonita. O treinamento de um modelo de domínio grande não requer um poder de computação muito alto. De acordo com nossos experimentos, leva apenas uma semana para iterar o modelo de domínio grande. Duas cartas podem fazer algum raciocínio em tempo real. Então, em termos de dados, ainda precisamos estabelecer alguns limites próprios, que é o efeito do volante de dados que o Sr. Yu acabou de mencionar.
O ponto mais importante da competição é o talento. O grande modelo de domínio achatou a cadeia de tecnologia de todo o setor.Seus talentos devem não apenas entender algoritmos, mas também saber como projetar algoritmos bem, entender cenários, entender negócios e até mesmo entender o design do produto. É preciso estimular a capacidade composta dos talentos, para depois estimular a iniciativa e a criatividade dos talentos, que é um teste de capacidade organizacional.
**Em que campo o modelo grande é mais útil? **
**Tecnologia de Papel: Quais são as três direções de aplicação vertical mais promissoras? **
Yu Zhonghai: Nós olhamos para muitas direções, e a direção mais promissora agora é AI Answer, que é uma palavra que nós mesmos criamos, que se refere a uma categoria de produtos. Por exemplo, você me testou em um assunto hoje e me perguntou qual marca de carrinho é melhor comprar. Acredito que todos deveriam ter uma situação semelhante.Pergunte a três amigos, leia cinco artigos de Xiaohongshu e pesquise dez postagens na Internet. Por fim, depois de ler, resumi três modelos, depois olhei o preço e tomei uma decisão.
Na verdade, o mesmo se aplica a muitas coisas quando você pergunta à inteligência artificial. O modelo grande tem uma certa memória. Ele sabe que essas coisas estão relacionadas, mas terá alucinações. como ele se parece. Então, o que as empresas costumam fazer é fazer determinadas consultas com base na base de conhecimento interna e depois fazer um resumo com base nessas coisas. Além disso, há uma pergunta e resposta, resumo ou comparação com base em um documento, como uma cláusula de seguro com base em centenas de páginas. Ou dê uma resposta com base em uma pesquisa. Nos referimos coletivamente a esses produtos como AI Answer. Além disso, também prestamos mais atenção a oportunidades como trabalho de escritório e máquinas de aprendizado de IA.
Zhang Jie: Acho que podemos analisar primeiro por indústria e depois por cena. O setor ideal para modelos de domínio em larga escala é aquele com alta densidade de conhecimento, forte lógica de processo e sensível à segurança e privacidade. Por exemplo, setores como finanças, assistência médica, direito e assuntos governamentais podem ser setores ideais para a implementação de modelos de domínio em larga escala no futuro.
A cena pode ser habilitada para funcionários internos no início. Por exemplo, faça alguns testes de conhecimento, seguidos de treinamento e sparring. Depois de capacitar os funcionários internos, vamos ver como fazer algum serviço para C (para os clientes) ou capacitar a equipe de vendas e a equipe de atendimento ao cliente para se tornarem assistentes de atendimento ao cliente de marketing. Resumindo, ao aplicar, você pode primeiro considerar começar da cena com tolerância a falhas relativamente alta.
Wang Danjun: Também acreditamos que, na experiência de aplicação de todos, os modelos grandes nos ajudam a resolver a maioria dos problemas em indústrias de conhecimento intensivo. No campo To B, como Beisen ou Zhongguancun Kejin, certamente haverá algumas empresas com maior probabilidade de se beneficiar disso. Por exemplo, na gestão de recursos humanos de uma empresa, todos esperam que o grande modelo possa resolver algumas coisas chatas e chatas para as pessoas, como responder a várias preocupações comuns dos funcionários. Beisen e Zhongguancun Kejin também estão discutindo a cooperação nessa área, esperando estabelecer alguns funcionários digitais por meio das instalações subjacentes do grande modelo no futuro e responder a essas perguntas que parecem não exigir experiência e conhecimento humanos.
Além disso, descobrimos que existem algumas áreas de alto valor, como coaching de liderança corporativa. Uma empresa tem vários níveis de gerentes e cada gerente encontrará vários desafios todos os dias, mas ele não tem tantas oportunidades de pedir conselhos a outras pessoas. Acreditamos que o AIGC pode fornecer uma ajuda muito boa nesse cenário e pode muito bem atender a alguns requisitos pessoais de privacidade.
**澎湃科技: A Microsoft anunciou recentemente a cooperação com a OpenAI para abrir a ecologia de aplicativos. Zhongguancun Kejin é um representante de fabricantes de aplicativos de grande escala na China. Como está o progresso atual do desembarque e aplicação de produtos? Cada empresa terá seu próprio modelo exclusivo no futuro? **
Zhang Jie: Acho que nem toda empresa precisa de seu próprio modelo exclusivo, porque acho que a tecnologia de modelo grande pode ser dividida em três camadas, de superficial a profunda:
No primeiro nível, se a indústria ou empresa não tiver tanto conhecimento ou documentos, ou a particularidade da empresa em si não for forte, não há necessidade de usar um modelo dedicado, e um modelo geral grande pode ser usado diretamente. No modelo geral grande, de acordo com os requisitos específicos da cena, basta ajustar (prompt). Durante esse período, o que as empresas precisam é de uma ferramenta de gerenciamento de palavras rápida com boa experiência do usuário e limite baixo. Pode ser necessário que alguns especialistas de negócios acumulem alguns prompts úteis em cenários específicos; para os mais complicados, é necessário transformar alguns prompts em um pequeno conjunto de prompts e, a seguir, formar cadeias entre diferentes conjuntos, e as cadeias são sequenciadas Lógico relacionamento, basta ter uma ferramenta de gestão da cadeia pronta.
A segunda camada é um pouco mais complicada. Algumas empresas têm muito conhecimento fragmentado. Neste momento, palavras rápidas ou cadeias rápidas podem não ser suficientes. É necessário adicionar uma base de conhecimento sobre o modelo geral grande para gerenciar conhecimento de baixa frequência e cauda longa. Quando o modelo grande geral enfrenta problemas específicos, vá para a base de conhecimento para encontrar as respostas. Esta é a rota técnica do modelo geral grande + base de conhecimento + engenharia imediata.
A terceira camada, para empresas com uma grande quantidade de conhecimento de domínio, é necessário construir um grande modelo de domínio exclusivo para a empresa e inserir o conhecimento geral no domínio no cérebro do grande modelo, que não apenas mantém o comum geral senso e raciocínio, mas também tem experiência na área Conhecimento e habilidades fazem grandes modelos de estudantes de artes liberais a especialistas de domínio. Esta é uma rota de modelo de domínio grande + base de conhecimento de domínio + engenharia de prompt.
Zhongguancun Kejin tem alguma prática de aplicação para as três situações acima. Há algum tempo, tentamos resolver três dificuldades técnicas e, depois de resolvê-las, formamos dois conjuntos de aplicativos assistentes. Quais são as três dificuldades técnicas?
A primeira é resolver o problema das alucinações que costumam ocorrer em modelos grandes, ou seja, bobagens sérias. Isso requer uma base de conhecimento no campo para permitir que o grande modelo saiba que, quando for feita uma pergunta, ele precisa encontrar conhecimento relevante na base de conhecimento. Ao construir uma base de conhecimento, geralmente é necessário processar documentos em formato rich text.É necessário que o modelo grande entenda primeiro o layout do documento e depois entenda o conteúdo interno.
A segunda é evitar o problema de esquecimento durante o processo de treinamento ao treinar grandes modelos no domínio. Caso contrário, quando você alimentar seu cérebro com novos conhecimentos, ele esquecerá os conhecimentos antigos. Meios técnicos eficientes de afinação serão aqui utilizados, para que se possa não só ter o conhecimento geral original, mas também aprender o senso comum no campo.
A terceira é como fazer com que os usuários o usem de forma mais conveniente e com baixo custo. Quer seja um modelo de domínio grande, uma base de conhecimento de domínio ou palavras rápidas, não pode ser realizado da noite para o dia e requer feedback e iteração contínuos. Isso requer que os clientes tenham recursos de manutenção, e o design do produto e a embalagem de engenharia devem ser bem feitos no nível da ferramenta.
**澎湃科技: Gostaria de perguntar ao Sr. Yu do ponto de vista do investimento, em comparação com a lógica do investimento na era da Internet móvel e da tecnologia pesada, nesta rodada de surgimento de modelos em grande escala, o foco principal da seleção de projetos , incluindo pontos de decisão de investimento o que é **
**Yu Zhonghai:**Essa também é uma questão que o capital vem explorando. Nos últimos seis meses, o mercado de modelos grandes também passou por muitas fases de evolução. No início, muitos o consideravam um investimento temático.Naquela época, as empresas relacionadas à IA eram especuladas e as empresas com capacidades subjacentes reais de modelos de grande escala eram muito valorizadas por todos. Mais tarde, a "Guerra dos Cem Modelos" apareceu. Todos acharam que o modelo grande parecia um pouco complicado demais. Eles descobriram que o poder de computação parecia ser o beneficiário da compra de pás dos Nuggets, então a avaliação de empresas relacionadas ao poder de computação subiu um muito. Em maio e junho deste ano, propusemos que "aplicações de IA deram início a um período cambriano explosivo". Muitas empresas criaram seus próprios produtos e a aplicação da IA começou a crescer novamente.
Na verdade, o ritmo de investimento dos grandes modelos também é gradual. Desde o início, desde que seja uma empresa de IA, pode aumentar, e depois sairá com um aplicativo, e todos começarão a explorar se esse aplicativo tem clientes pagando por isso e se há pedidos reais. Acho que daqui a um ano todo mundo vai pensar se existem barreiras para essa aplicação e se o negócio é sustentável no longo prazo. Na verdade, o que mais nos deixa otimistas é o nível do aplicativo.Atribuímos grande importância às empresas que podem realmente conectar grandes modelos e aplicativos corporativos e podem realmente criar valor.
**The Paper: A próxima pergunta é para Dean Wang.Do ponto de vista dos talentos, o grande modelo está agora construindo uma nova relação de produção de colaboração homem-máquina. Então, que impacto isso terá na gestão de talentos das empresas? **
Wang Danjun: Esta é uma pergunta particularmente boa. Porque vemos que a nível social todos podem estar muito interessados em discutir “O meu trabalho será substituído por um grande modelo no futuro?” A propósito desta questão, sugiro que a possamos olhar sob dois aspetos:
Por um lado, o que todos discutiram mais é que a capacidade de modelos em grande escala está ficando cada vez mais forte, e a aplicação de campos verticais está ficando cada vez mais profunda, o que pode substituir o trabalho de muitos funcionários gerais no futuro. Nos últimos anos, mesmo sem o histórico de desenvolvimento de modelos em larga escala, todos estão muito preocupados em reduzir custos e aumentar a eficiência, o que envolve a proporção dos custos trabalhistas nas empresas. Se algumas novas tecnologias puderem ser usadas para reduzir os custos trabalhistas, isso será muito valioso para a empresa, o que é uma razão importante para seu desenvolvimento sustentável.
Por outro lado, o surgimento de modelos grandes e o surgimento de ferramentas de campo mais verticais no futuro serão uma bênção para os funcionários. Do lado positivo, se os funcionários puderem fazer melhor uso da colaboração homem-máquina, isso poderá criar mais valor para a empresa.
Prevemos que haverá algumas mudanças na forma organizacional no futuro. A maioria das empresas já tem uma estrutura funcional, diferentes funções atendem os mesmos clientes, há muitos problemas de colaboração e comunicação entre as funções, o que é um grande consumo para a empresa. Mas, no futuro, quando funcionários individuais ou grupos tiverem recursos completos com a ajuda de ferramentas, a unidade organizacional será inevitavelmente menor e mais ágil, flexível e responsiva.
**Tecnologia de Papel: Gostaria de perguntar a vocês três que tipo de recursos as empresas mais precisam no contexto da Guerra dos Cem Modelos. **
**Zhang Jie: **Para fabricantes de modelos básicos de larga escala, o que eles mais precisam é ter capacidades técnicas particularmente fortes e únicas. sexo de raciocínio complexo. Para fabricantes de modelos em grande escala no campo, os talentos compostos são mais necessários e as habilidades organizacionais são muito importantes. Porque é preciso dar o máximo à iniciativa e à criatividade dos talentos, conectá-lo a algumas oportunidades de negócios de ponta e informá-lo do que os clientes precisam. Além disso, deve haver alguns recursos de engenharia e recursos algorítmicos.
Yu Zhonghai: Acho que os dados são muito importantes, especialmente para empresas que desejam usar modelos grandes, os dados são muito importantes. Na verdade, os dados logo se tornarão uma barreira para nós. Empresas como Zhongguancun Kejin, que fornecem aplicativos de modelo em grande escala, têm sua maior vantagem em dados.
**Wang Danjun: **Na verdade, para a grande maioria das empresas, é mais provável que sejam consumidores de grandes modelos no futuro, em vez de criadores de grandes modelos. A adoção ativa de grandes modelos pode acelerar muito seu processo de gerenciamento digital . Tanto as organizações quanto os indivíduos podem precisar abraçar a mudança. Líderes em todos os níveis precisam aumentar sua consciência de abraçar essa nova oportunidade, e os funcionários precisam manter capacidades de aprendizado contínuo e autodirigido.
**Tecnologia do Papel: Neste processo, as empresas do ramo vertical contam com a vantagem do know-how da indústria. Eles são mais fáceis de romper os pontos do cartão de grandes dados do modelo? **
Zhang Jie: Acho que o know-how do setor precisa ser analisado em detalhes e pode haver vários formulários que requerem atenção especial.
A forma mais óbvia de know-how da indústria são alguns dados em documentos, que são expressões simbólicas. Como desenterrar (palavras de prompt) ou cadeias de prompts do documento é um tipo de problema que precisa ser tratado no estágio atual. Muitas empresas possuem um grande número de documentos, e muitos desses documentos estão no formato PPT ou PDF. É necessário entender tanto seu formato quanto seu conteúdo.
Além do know-how deste tipo de indústria, existe também o conhecimento escondido na mente dos especialistas da indústria ou especialistas em cenários. Ele precisa receber uma ferramenta, que pode ser resumida em palavras. O modelo é a indústria know-how com maior densidade.
Há também um tipo relativamente oculto de know-how da indústria, que é a sabedoria coletiva oculta nos logs do sistema. Após a mineração desses logs, é possível transformar conhecimento disperso em conhecimento em cadeia estruturada. Então, das milhares de cadeias, ele é resumido e transformado na melhor prática em um cenário específico. Por exemplo, os vendedores fazem muitos telefonemas todos os dias e há milhões de registros de conversas acumulados todos os dias. Ao adaptar de acordo com diferentes resultados, como conclusão do pedido, ordem de fluxo ou desligamento de chamadas, as melhores habilidades de fala para o marketing de novos produtos podem ser precipitados. prática.
Esses três tipos de perguntas são, na verdade, um know-how muito bom da indústria. Também existem alguns desafios técnicos aqui, como extrair palavras de prompt e cadeias de prompts de documentos e logs. doc2 e log2 são o foco da pesquisa que vale a pena investir.
Yu Zhonghai: Na verdade, Zhang Jie sempre teve um ditado que me impressionou profundamente. Ele disse que registrar as órbitas dos oito planetas do sistema solar por dezenas de milhões de anos não é tão bom quanto uma lei abstrata de gravidade que pode explicar melhor as coisas.Natureza.
Eu acho que isso é know-how. As empresas em áreas verticais têm muita experiência em áreas afins. Deixe-me dar um exemplo. Depois que a inteligência artificial se tornou popular, todos disseram que havia uma nova profissão chamada engenheiro com um salário anual de um milhão.
É o engenheiro que foi escrever. Então, por que eles são tão valiosos? Eu também uso ferramentas de pintura de inteligência artificial. Uma vez eu quis desenhar um homem de terno, mas tentei muitas palavras-chave e não funcionou. Mais tarde, digitei "gravata" e a pessoa imediatamente vestiu um terno, e você descobrirá que essa é a palavra mágica.
O modelo grande é um pouco como um jogo de probabilidade, pois na verdade tem muitas probabilidades anteriores. Na cena agora, gravata é a palavra muito importante correspondente a terno. E o engenheiro sabe quais palavras-chave podem atrapalhar o modelo e sabe que tipo de coisas queremos escrever. Esse é o valor dele. Então se colocarmos essa questão no cenário de aplicação, na verdade é o valor das empresas em verticais. Ele entende tanto de inteligência artificial quanto de know-how da indústria.
Wang Danjun: No momento, parece que, além das empresas modelo básicas de grande escala, as empresas de campo vertical são o segundo lote de empresas às quais todos prestarão muita atenção no mercado. Acho que será muito desafiador para eles no próximo período de tempo. A experiência das empresas em campos verticais pode não ser necessariamente transformada diretamente em nova criatividade sob a bênção de novas tecnologias. Preciso gastar mais tempo para aprender primeiro, para entender qual é a lógica subjacente da operação do modelo grande, para aprender como isso pode me ajudar, até mesmo para me ajudar a extrair nosso conhecimento ou nos ajudar a fornecer serviços aos clientes. Acho que por algum tempo eles enfrentarão esse desafio primeiro. Com base nesses fundamentos, encontre novas oportunidades de criar valor para os clientes com base nesses modelos.
**Tecnologia de papel: Houve algumas novas tendências recentemente, como a desaceleração no número de visitantes do ChatGPT. Na verdade, não existia como uma super entrada. Há uma visão de que o ChatGPT não pode representar o futuro do GPT, mas é apenas um produto apresentado pela OpenAI e pela Microsoft ao mercado. O que vocês três pensam sobre esse ponto de vista? **
Yu Zhonghai: Este ponto de vista é realmente muito interessante. Pessoalmente, estou relativamente otimista, porque sou uma pessoa que costuma usar produtos em grande escala. E gostaria de acrescentar que o ChatGPT atual não é sua forma final. Acho que o Google Assistant (Google Assistant) no sistema Android de próxima geração do Google será suportado por seu próprio modelo grande, porque essa também é uma entrada de tráfego muito importante.
Wang Danjun: Para muitas pessoas na indústria, todos estão muito otimistas. Sendo um produto novo, nesta fase de desenvolvimento, haverá naturalmente alguma diferenciação. Para os usuários finais, eles estarão interessados nessas ferramentas, dispostos a experimentá-las e continuar a usá-las. Mesmo que a frequência de uso diminua e o grau de atenção diminua, é difícil mudar o comportamento dos usuários.
Zhang Jie: Acho que a desaceleração da taxa de crescimento do ChatGPT é algo que vai acontecer mais cedo ou mais tarde. Afinal, o tráfego tem um teto. Mais cedo ou mais tarde, o tráfego atingirá o pico ou o entusiasmo do público pelos cenários de aplicação do bate-papo diminuirá. Afinal, o bate-papo não é uma demanda rígida de alta frequência, mas traz uma inspiração particularmente boa.
Por um lado, existem muitos aplicativos em torno do bate-papo, como geração de fotos, vídeos, relatórios, PPT etc. por meio do bate-papo, como ChatDoc, ChatPdf e ChatBI. Outro cenário é o modelo de domínio grande que acabamos de mencionar, como GPT financeiro, GPT jurídico e GPT médico. Todos esses podem ser algumas entradas de novos negócios no futuro.
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Oportunidades de negócios sob o "surgimento" de grandes modelos: quem vencerá a "Guerra das Cem Modelos"
Fonte: O Papel See More
Autor: O repórter do The Paper, Huan Yanhong, estagiário Chen Xiaorui
A tecnologia de IA generativa está mudando a indústria de inteligência artificial. Depois de apenas meio ano, o desenvolvimento de modelos domésticos de grande escala completou o salto da tecnologia para o produto e depois para o negócio, e penetrou nas indústrias verticais. Durante a Conferência Mundial de Inteligência Artificial em 6 de julho, o The Paper convidou Wang Danjun, vice-presidente do Beisen Talent Management Research Institute, Yu Zhonghai, vice-gerente geral do departamento de pesquisa do CICC, e Zhang Jie, vice-presidente da Zhongguancun Kejin Technology, para a sala de bate-papo Metaverse para discutir oportunidades de inovação de negócios sob a "emergência" de grandes modelos. O diálogo foi apresentado por Shao Wen, um repórter do The Paper. Durante o diálogo de uma hora, os convidados discutiram uma série de questões relacionadas, incluindo:
Como grandes modelos de uso geral e modelos de campo vertical em grande escala encontram seu próprio valor em cenários de negócios futuros?
Como as empresas podem aproveitar as oportunidades de negócios de grandes modelos? Qual é o ponto-chave para aproveitar a oportunidade?
A vida passada e o futuro da grande modelo
**澎湃科技: Atualmente, o mercado doméstico formou uma situação de "guerra de cem modelos". Você acha que os modelos domésticos de grande escala estão se desenvolvendo tão rápido? Que impacto isso tem em seu campo? **
**Wang Danjun (vice-presidente do Beisen Talent Management Research Institute): **Do ponto de vista técnico, o desenvolvimento de grandes modelos não é algo que aconteceu nos últimos dois anos. No campo acadêmico, há muitos anos, todo mundo começou a fazer pesquisa. É que com o aumento do volume de dados e a melhoria do nível de tecnologia nos últimos anos, especialmente depois que a OpenAI lançou o ChatGPT, atraiu atenção generalizada.
Para cada campo, todos pensam em como aplicar essa nova tecnologia em seu próprio campo e como melhorar seu modelo de negócios.
Por exemplo, nosso Beisen Talent Management Research Institute pertence ao setor de recursos humanos, e os clientes que atendemos são todos grupos de empresas de RH (recursos humanos). Pensamos que a aplicação de grandes modelos na área de recursos humanos pode produzir algum valor disruptivo no futuro, por exemplo, pode de fato melhorar melhor a eficiência do trabalho de todos; ajudará em certa medida nossos parceiros, seja RH ou Pode orientar melhor o desenvolvimento dos colaboradores e, ao mesmo tempo, também pode ajudar as empresas a responder a muitas questões de gestão de recursos humanos, incluindo o que muitas vezes fazemos quando recrutamos funcionários: quem é mais adequado e quem pode trazer mais benefícios. Bom desempenho , como o salário deve ser determinado, etc. Acho que o desenvolvimento e a aplicação de grandes modelos transformarão a indústria de recursos humanos em um período muito curto de tempo.
**Yu Zhonghai (Gerente Geral Adjunto do Departamento de Pesquisa do CICC): **O reitor Wang mencionou um ponto muito importante, ou seja, a tecnologia de modelos em larga escala não aconteceu apenas hoje. Em 2017, o Google escreveu um artigo famoso chamado Attention Is All You Need (atenção é tudo o que você precisa) e propôs a arquitetura do transformador.
Na verdade, os profissionais da indústria de inteligência artificial da China descobriram o potencial da tecnologia de modelos em larga escala muito cedo. Também escrevemos um relatório de pesquisa relacionado em 2021. Naquela época, ficamos chocados com o desenvolvimento de modelos de inteligência artificial. Agora, o produto específico do ChatGPT torna o grande modelo conhecido pelas pessoas comuns. Não importa se você entende de tecnologia ou não, você pode sentir seu charme enquanto o joga, então o grande modelo é popular.
A capacidade de grandes modelos serem aplicados em milhares de indústrias tão rapidamente também depende de direitos iguais em tecnologia, que é um conceito muito importante que apresentamos. Graças ao desenvolvimento da comunidade de código aberto e à disseminação natural do conhecimento, muitas empresas criaram rapidamente seus próprios grandes modelos.
Além disso, gostaria de acrescentar que desta vez vimos todo o círculo tecnológico e até toda a sociedade formar uma força conjunta, ou seja, “todo mundo acha isso muito importante”, o que raramente se via no passado.
**Zhang Jie (vice-presidente da Zhongguancun Kejin Technology): **Acho que o primeiro ano do grande modelo remonta ao lançamento do GPT3 em 2020. Por que se desenvolveu tão rápido nos últimos seis meses? Acho que há três razões:
O primeiro aspecto é que algumas empresas e universidades acumularam muito antes, como Baidu, Huawei, Tsinghua University, etc., eles têm modelos de linguagem pré-treinados ou grandes modelos antes, e os últimos seis meses foram uma atualização de versão iteração para eles;
O segundo aspecto é que várias empresas, incluindo algumas instituições de investimento, aumentaram seus investimentos;
O terceiro aspecto é confiar no código aberto.A comunidade de código aberto levou as empresas a lançar vários modelos de grandes domínios.
Em relação ao impacto de modelos grandes no campo, é um benefício de mão dupla para os clientes e para nós. A Zhongguancun Kejin é uma fornecedora líder de soluções de tecnologia de IA conversacional. O modelo grande reduz nosso custo de personalização e desenvolvimento de vários modelos de cena, o que é uma boa notícia para nós. Para nossos clientes, a redução de custos de projetos inteligentes levou muitas pequenas e médias empresas a considerar a criação de projetos, e todo o mercado cresceu em tamanho.
**澎湃科技: Recentemente, a Tencent Cloud e a OpenAI propuseram sucessivamente uma loja de modelo em grande escala para software de modelo personalizado, que é um pouco semelhante à forma de uma loja de aplicativos. Como você entende essa tendência? **
**Wang Danjun:**Se você é um investidor ou um praticante neste campo, acredito que todos esperam ver esta tendência, porque encoraja mais pessoas a participar da co-criação deste campo. Acreditamos que os prestadores de serviços básicos, com certeza, tenderão futuramente para o modelo de loja, o que facilitará a aproximação com os clientes. O modelo da loja de modelo grande também permite que os usuários que recebem serviços usem melhor o modelo grande para criar alguns novos cenários de aplicativos e valor de serviço.
Yu Zhonghai: Na verdade, essa é uma questão que preocupa muito o mercado de capitais. Eu acho que o desenvolvimento de grandes modelos será mais parecido com a nuvem pública e a nuvem privada da China no futuro.
Na época, a nuvem pública era chamada de IaaS (Infrastructure-as-a-Service, infraestrutura como serviço) e quando se trata de modelos grandes, chamamos de MaaS (Model as a Service). Existe uma empresa estrangeira conhecida chamada Hugging Face, que coloca muitos modelos na Internet, e você pode usar diferentes modelos de IA apenas chamando sua API (Application Program Interface, interface de programação de aplicativos).
No entanto, também existem muitas empresas que precisam implantar seu próprio modelo de grande escala e usar seu próprio conhecimento para aprimorá-lo para fazer seu próprio ajuste fino devido a requisitos como conformidade de segurança e implementação de cena subdividida. Isso pode ser como a nuvem privada mercado na China. .
De um modo geral, os modelos grandes não são adequados para uso direto de todos, incluindo o ChatGPT, que é realmente empacotado em um produto baseado no modelo grande, para que todas as pessoas comuns possam experimentá-lo. Portanto, fazer aplicativos baseados em grandes modelos é realmente um mercado muito amplo, que pode gerar muitos modelos de negócios, como funcionários digitais e o conceito de loja de aplicativos mencionado pelo host.
Na verdade, o ChatGPT também é considerado por muitas pessoas como um portal de tráfego. Pelo que eu sei, alguns fabricantes de celulares de grande porte também podem acabar fazendo buscas. Então esse assunto é completamente diferente. Seu mercado alcançável será da empresa Os gastos com TI tornam-se gastos com marketing. As empresas chinesas podem gastar uma média de 1% a 3% da receita em TI, mas podem gastar 30% da receita em marketing. Então, quando você tem tráfego, o modelo de negócio pode mudar muito, o que é muito interessante.
Zhang Jie: Acho que OpenAI e Tencent Cloud têm ênfases diferentes. O foco da OpenAI ainda pode estar no modelo grande básico. Ele usa alguns parceiros ecológicos para ajudá-lo a compensar a falta de precisão ou profissionalismo do modelo grande básico em alguns cenários fragmentados. No entanto, a Tencent Cloud não enfatiza demais seu próprio modelo básico, mas enfatiza a necessidade de ser um grande modelo para indústrias verticais.
Suas diferentes ênfases mostram um problema comum, ou seja, o modelo básico grande não pode ser usado diretamente em algumas indústrias ou cenários específicos com alto profissionalismo, e também precisa de uma camada de adaptação. Acho que pode haver um novo modelo de negócio aqui, ou seja, cada vez mais o conhecimento pode ser capitalizado no futuro. Acontece que quando todo mundo usa IA, o paradigma técnico é diferente. Portanto, os ativos que todos podem compartilhar são alguns dados brutos. Depois de obter os dados brutos, diferentes meios técnicos são usados para processá-los. Durante esse processo, a forma intermediária dos dados não pode ser negociada.
No entanto, o modelo grande basicamente unifica muitas tarefas de IA, e todo o paradigma de pesquisa e fluxo de processamento convergem, o que torna muitos produtos intermediários negociáveis, como dados rotulados, dados para alinhamento de instruções, palavras de prompt e A cadeia de prompt composta por frases de prompt , etc., e até mesmo robôs ou assistentes treinados em cenários específicos, podem fazer algumas transações e serem capitalizados, podendo ser um novo modelo de negócios no futuro.
Modelo grande geral VS modelo grande de campo vertical
**Tecnologia de papel: Na verdade, vocês três mencionaram dois caminhos de negócios diferentes, o grande modelo de domínio e o grande modelo geral. Você pode falar sobre as oportunidades e os desafios desses dois modelos de negócios diferentes em detalhes? **
Wang Danjun: No futuro, os negócios em torno de grandes modelos definitivamente se tornarão uma ecologia de negócios, e o principal recurso da ecologia de negócios é que ela será em camadas. Em primeiro lugar, haverá alguns fabricantes para fornecer serviços básicos, porque modelos grandes exigem base de dados e poder de computação. O modelo grande serve como o motor subjacente.Embora tenha fortes capacidades, não compreende o conhecimento de domínios específicos, modelos de serviço e necessidades do cliente.
Junto com isso, vêm grandes maquetes de verticais. Alguns dos modelos grandes nesses domínios verticais são os próprios modelos grandes dos fabricantes de domínio e alguns são treinados com base nos modelos grandes básicos. Em termos leigos, é tornar esses modelos um especialista. Por exemplo, na área financeira, pode haver alguns serviços dedicados a ajudar os investidores a tomar decisões de negócios e, na área de recursos humanos, pode haver serviços dedicados a ajudar as empresas a tomar decisões sobre talentos.
Pode haver muitos campos subdivididos. Essas subdivisões também podem exigir acúmulo de indústria, treinamento e compreensão de como resolver problemas do cliente e até mesmo envolver-se no nível de experiência do usuário da interface interativa. Esses acúmulos são, na verdade, alguns dos recursos por trás da loja de aplicativos de que falamos anteriormente.
Yu Zhonghai: Do nosso ponto de vista, esses dois tipos de mercado são bastante diferentes.
Em primeiro lugar, também é importante construir um bom volante de dados para o modelo geral grande.
Por exemplo, hoje eu ensino você a jogar tênis de mesa e digo que você deve jogar assim. Aí eu saco uma bola e você não pega, você sabe que não é o jeito certo de bater. Então mude para outro caminho, desta vez você o pegou, você se lembrará do caminho correto. Aí eu continuo sacando a bola para você, e você continua pegando, ajustando sua memória muscular aos poucos para encontrar o melhor caminho. Na verdade, o treinamento do modelo também é um processo desse tipo. Toda vez que você se comunicar com o ChatGPT, haverá uma curtida ou desgosto abaixo dele. Ou há momentos em que você não diz nada e fica muito desapontado por ter regenerado um. Ou, por exemplo, toda vez que você usar o Midjourney para desenhar, ele exibirá quatro imagens e, em seguida, você selecionará a terceira por padrão, ampliará, fará o download e saberá que esta parece ser melhor e irá para isso no futuro A direção é um pouco mais tendenciosa e o modelo aprenderá um pouco. Sem feedback de dados, o modelo fica aqui e não pode melhorar. Portanto, este é o volante de dados que enfatizamos, enfatizando a posição do cartão na cena. Como um modelo grande de uso geral, o mais importante é que seja usado por alguém, o que também é uma vantagem da China. Os chineses gostam de abraçar a tecnologia e aceitam mais modelos grandes. Temos muitas pessoas para dar feedback.
Para modelos de domínio grande, acho que o mais importante é o know-how (o know-how técnico e a experiência necessários para se envolver em um determinado setor ou realizar um determinado trabalho).
A chave para o modelo de grande domínio é atender às necessidades dos clientes e entender o know-how dos clientes em um determinado domínio profundo. Empresas como a Zhongguancun Kejin têm suas vantagens aqui: elas entendem o know-how do cliente e seus pontos problemáticos em cenários de campo específicos.
**Zhang Jie: **Obrigado pelo seu reconhecimento. Eu entendo que o modelo grande geral e o modelo grande de domínio são um relacionamento upstream e downstream, não um relacionamento competitivo. O modelo geral é grande e abrangente, e o modelo de domínio é um negócio pequeno, mas bonito.
O modelo geral de grande escala é caracterizado por "três altos", ou seja, alto investimento e alto retorno, mas também alta incerteza. Porque o treinamento de um grande modelo básico requer altos requisitos em termos de algoritmos, dados e talentos. Por exemplo, o poder de computação deve ser de pelo menos 10.000 kat de nível de poder de computação.
Por que a incerteza é tão alta? Como os fabricantes pré-selecionados são basicamente grandes empresas de Internet ou gigantes da tecnologia, os requisitos técnicos são muito altos para que os grandes modelos treinados tenham capacidades gerais e emergentes. run Apenas ganhando o modelo de código aberto ele pode sobreviver. No mercado futuro, acho que coexistirão muitos modelos grandes básicos, mas pode não haver muitos.
Uma maquete de domínio pode ser uma trilha pequena, mas bonita. O treinamento de um modelo de domínio grande não requer um poder de computação muito alto. De acordo com nossos experimentos, leva apenas uma semana para iterar o modelo de domínio grande. Duas cartas podem fazer algum raciocínio em tempo real. Então, em termos de dados, ainda precisamos estabelecer alguns limites próprios, que é o efeito do volante de dados que o Sr. Yu acabou de mencionar.
O ponto mais importante da competição é o talento. O grande modelo de domínio achatou a cadeia de tecnologia de todo o setor.Seus talentos devem não apenas entender algoritmos, mas também saber como projetar algoritmos bem, entender cenários, entender negócios e até mesmo entender o design do produto. É preciso estimular a capacidade composta dos talentos, para depois estimular a iniciativa e a criatividade dos talentos, que é um teste de capacidade organizacional.
**Em que campo o modelo grande é mais útil? **
**Tecnologia de Papel: Quais são as três direções de aplicação vertical mais promissoras? **
Yu Zhonghai: Nós olhamos para muitas direções, e a direção mais promissora agora é AI Answer, que é uma palavra que nós mesmos criamos, que se refere a uma categoria de produtos. Por exemplo, você me testou em um assunto hoje e me perguntou qual marca de carrinho é melhor comprar. Acredito que todos deveriam ter uma situação semelhante.Pergunte a três amigos, leia cinco artigos de Xiaohongshu e pesquise dez postagens na Internet. Por fim, depois de ler, resumi três modelos, depois olhei o preço e tomei uma decisão.
Na verdade, o mesmo se aplica a muitas coisas quando você pergunta à inteligência artificial. O modelo grande tem uma certa memória. Ele sabe que essas coisas estão relacionadas, mas terá alucinações. como ele se parece. Então, o que as empresas costumam fazer é fazer determinadas consultas com base na base de conhecimento interna e depois fazer um resumo com base nessas coisas. Além disso, há uma pergunta e resposta, resumo ou comparação com base em um documento, como uma cláusula de seguro com base em centenas de páginas. Ou dê uma resposta com base em uma pesquisa. Nos referimos coletivamente a esses produtos como AI Answer. Além disso, também prestamos mais atenção a oportunidades como trabalho de escritório e máquinas de aprendizado de IA.
Zhang Jie: Acho que podemos analisar primeiro por indústria e depois por cena. O setor ideal para modelos de domínio em larga escala é aquele com alta densidade de conhecimento, forte lógica de processo e sensível à segurança e privacidade. Por exemplo, setores como finanças, assistência médica, direito e assuntos governamentais podem ser setores ideais para a implementação de modelos de domínio em larga escala no futuro.
A cena pode ser habilitada para funcionários internos no início. Por exemplo, faça alguns testes de conhecimento, seguidos de treinamento e sparring. Depois de capacitar os funcionários internos, vamos ver como fazer algum serviço para C (para os clientes) ou capacitar a equipe de vendas e a equipe de atendimento ao cliente para se tornarem assistentes de atendimento ao cliente de marketing. Resumindo, ao aplicar, você pode primeiro considerar começar da cena com tolerância a falhas relativamente alta.
Wang Danjun: Também acreditamos que, na experiência de aplicação de todos, os modelos grandes nos ajudam a resolver a maioria dos problemas em indústrias de conhecimento intensivo. No campo To B, como Beisen ou Zhongguancun Kejin, certamente haverá algumas empresas com maior probabilidade de se beneficiar disso. Por exemplo, na gestão de recursos humanos de uma empresa, todos esperam que o grande modelo possa resolver algumas coisas chatas e chatas para as pessoas, como responder a várias preocupações comuns dos funcionários. Beisen e Zhongguancun Kejin também estão discutindo a cooperação nessa área, esperando estabelecer alguns funcionários digitais por meio das instalações subjacentes do grande modelo no futuro e responder a essas perguntas que parecem não exigir experiência e conhecimento humanos.
Além disso, descobrimos que existem algumas áreas de alto valor, como coaching de liderança corporativa. Uma empresa tem vários níveis de gerentes e cada gerente encontrará vários desafios todos os dias, mas ele não tem tantas oportunidades de pedir conselhos a outras pessoas. Acreditamos que o AIGC pode fornecer uma ajuda muito boa nesse cenário e pode muito bem atender a alguns requisitos pessoais de privacidade.
**澎湃科技: A Microsoft anunciou recentemente a cooperação com a OpenAI para abrir a ecologia de aplicativos. Zhongguancun Kejin é um representante de fabricantes de aplicativos de grande escala na China. Como está o progresso atual do desembarque e aplicação de produtos? Cada empresa terá seu próprio modelo exclusivo no futuro? **
Zhang Jie: Acho que nem toda empresa precisa de seu próprio modelo exclusivo, porque acho que a tecnologia de modelo grande pode ser dividida em três camadas, de superficial a profunda:
No primeiro nível, se a indústria ou empresa não tiver tanto conhecimento ou documentos, ou a particularidade da empresa em si não for forte, não há necessidade de usar um modelo dedicado, e um modelo geral grande pode ser usado diretamente. No modelo geral grande, de acordo com os requisitos específicos da cena, basta ajustar (prompt). Durante esse período, o que as empresas precisam é de uma ferramenta de gerenciamento de palavras rápida com boa experiência do usuário e limite baixo. Pode ser necessário que alguns especialistas de negócios acumulem alguns prompts úteis em cenários específicos; para os mais complicados, é necessário transformar alguns prompts em um pequeno conjunto de prompts e, a seguir, formar cadeias entre diferentes conjuntos, e as cadeias são sequenciadas Lógico relacionamento, basta ter uma ferramenta de gestão da cadeia pronta.
A segunda camada é um pouco mais complicada. Algumas empresas têm muito conhecimento fragmentado. Neste momento, palavras rápidas ou cadeias rápidas podem não ser suficientes. É necessário adicionar uma base de conhecimento sobre o modelo geral grande para gerenciar conhecimento de baixa frequência e cauda longa. Quando o modelo grande geral enfrenta problemas específicos, vá para a base de conhecimento para encontrar as respostas. Esta é a rota técnica do modelo geral grande + base de conhecimento + engenharia imediata.
A terceira camada, para empresas com uma grande quantidade de conhecimento de domínio, é necessário construir um grande modelo de domínio exclusivo para a empresa e inserir o conhecimento geral no domínio no cérebro do grande modelo, que não apenas mantém o comum geral senso e raciocínio, mas também tem experiência na área Conhecimento e habilidades fazem grandes modelos de estudantes de artes liberais a especialistas de domínio. Esta é uma rota de modelo de domínio grande + base de conhecimento de domínio + engenharia de prompt.
Zhongguancun Kejin tem alguma prática de aplicação para as três situações acima. Há algum tempo, tentamos resolver três dificuldades técnicas e, depois de resolvê-las, formamos dois conjuntos de aplicativos assistentes. Quais são as três dificuldades técnicas?
A primeira é resolver o problema das alucinações que costumam ocorrer em modelos grandes, ou seja, bobagens sérias. Isso requer uma base de conhecimento no campo para permitir que o grande modelo saiba que, quando for feita uma pergunta, ele precisa encontrar conhecimento relevante na base de conhecimento. Ao construir uma base de conhecimento, geralmente é necessário processar documentos em formato rich text.É necessário que o modelo grande entenda primeiro o layout do documento e depois entenda o conteúdo interno.
A segunda é evitar o problema de esquecimento durante o processo de treinamento ao treinar grandes modelos no domínio. Caso contrário, quando você alimentar seu cérebro com novos conhecimentos, ele esquecerá os conhecimentos antigos. Meios técnicos eficientes de afinação serão aqui utilizados, para que se possa não só ter o conhecimento geral original, mas também aprender o senso comum no campo.
A terceira é como fazer com que os usuários o usem de forma mais conveniente e com baixo custo. Quer seja um modelo de domínio grande, uma base de conhecimento de domínio ou palavras rápidas, não pode ser realizado da noite para o dia e requer feedback e iteração contínuos. Isso requer que os clientes tenham recursos de manutenção, e o design do produto e a embalagem de engenharia devem ser bem feitos no nível da ferramenta.
**澎湃科技: Gostaria de perguntar ao Sr. Yu do ponto de vista do investimento, em comparação com a lógica do investimento na era da Internet móvel e da tecnologia pesada, nesta rodada de surgimento de modelos em grande escala, o foco principal da seleção de projetos , incluindo pontos de decisão de investimento o que é **
**Yu Zhonghai:**Essa também é uma questão que o capital vem explorando. Nos últimos seis meses, o mercado de modelos grandes também passou por muitas fases de evolução. No início, muitos o consideravam um investimento temático.Naquela época, as empresas relacionadas à IA eram especuladas e as empresas com capacidades subjacentes reais de modelos de grande escala eram muito valorizadas por todos. Mais tarde, a "Guerra dos Cem Modelos" apareceu. Todos acharam que o modelo grande parecia um pouco complicado demais. Eles descobriram que o poder de computação parecia ser o beneficiário da compra de pás dos Nuggets, então a avaliação de empresas relacionadas ao poder de computação subiu um muito. Em maio e junho deste ano, propusemos que "aplicações de IA deram início a um período cambriano explosivo". Muitas empresas criaram seus próprios produtos e a aplicação da IA começou a crescer novamente.
Na verdade, o ritmo de investimento dos grandes modelos também é gradual. Desde o início, desde que seja uma empresa de IA, pode aumentar, e depois sairá com um aplicativo, e todos começarão a explorar se esse aplicativo tem clientes pagando por isso e se há pedidos reais. Acho que daqui a um ano todo mundo vai pensar se existem barreiras para essa aplicação e se o negócio é sustentável no longo prazo. Na verdade, o que mais nos deixa otimistas é o nível do aplicativo.Atribuímos grande importância às empresas que podem realmente conectar grandes modelos e aplicativos corporativos e podem realmente criar valor.
**The Paper: A próxima pergunta é para Dean Wang.Do ponto de vista dos talentos, o grande modelo está agora construindo uma nova relação de produção de colaboração homem-máquina. Então, que impacto isso terá na gestão de talentos das empresas? **
Wang Danjun: Esta é uma pergunta particularmente boa. Porque vemos que a nível social todos podem estar muito interessados em discutir “O meu trabalho será substituído por um grande modelo no futuro?” A propósito desta questão, sugiro que a possamos olhar sob dois aspetos:
Por um lado, o que todos discutiram mais é que a capacidade de modelos em grande escala está ficando cada vez mais forte, e a aplicação de campos verticais está ficando cada vez mais profunda, o que pode substituir o trabalho de muitos funcionários gerais no futuro. Nos últimos anos, mesmo sem o histórico de desenvolvimento de modelos em larga escala, todos estão muito preocupados em reduzir custos e aumentar a eficiência, o que envolve a proporção dos custos trabalhistas nas empresas. Se algumas novas tecnologias puderem ser usadas para reduzir os custos trabalhistas, isso será muito valioso para a empresa, o que é uma razão importante para seu desenvolvimento sustentável.
Por outro lado, o surgimento de modelos grandes e o surgimento de ferramentas de campo mais verticais no futuro serão uma bênção para os funcionários. Do lado positivo, se os funcionários puderem fazer melhor uso da colaboração homem-máquina, isso poderá criar mais valor para a empresa.
Prevemos que haverá algumas mudanças na forma organizacional no futuro. A maioria das empresas já tem uma estrutura funcional, diferentes funções atendem os mesmos clientes, há muitos problemas de colaboração e comunicação entre as funções, o que é um grande consumo para a empresa. Mas, no futuro, quando funcionários individuais ou grupos tiverem recursos completos com a ajuda de ferramentas, a unidade organizacional será inevitavelmente menor e mais ágil, flexível e responsiva.
**Tecnologia de Papel: Gostaria de perguntar a vocês três que tipo de recursos as empresas mais precisam no contexto da Guerra dos Cem Modelos. **
**Zhang Jie: **Para fabricantes de modelos básicos de larga escala, o que eles mais precisam é ter capacidades técnicas particularmente fortes e únicas. sexo de raciocínio complexo. Para fabricantes de modelos em grande escala no campo, os talentos compostos são mais necessários e as habilidades organizacionais são muito importantes. Porque é preciso dar o máximo à iniciativa e à criatividade dos talentos, conectá-lo a algumas oportunidades de negócios de ponta e informá-lo do que os clientes precisam. Além disso, deve haver alguns recursos de engenharia e recursos algorítmicos.
Yu Zhonghai: Acho que os dados são muito importantes, especialmente para empresas que desejam usar modelos grandes, os dados são muito importantes. Na verdade, os dados logo se tornarão uma barreira para nós. Empresas como Zhongguancun Kejin, que fornecem aplicativos de modelo em grande escala, têm sua maior vantagem em dados.
**Wang Danjun: **Na verdade, para a grande maioria das empresas, é mais provável que sejam consumidores de grandes modelos no futuro, em vez de criadores de grandes modelos. A adoção ativa de grandes modelos pode acelerar muito seu processo de gerenciamento digital . Tanto as organizações quanto os indivíduos podem precisar abraçar a mudança. Líderes em todos os níveis precisam aumentar sua consciência de abraçar essa nova oportunidade, e os funcionários precisam manter capacidades de aprendizado contínuo e autodirigido.
**Tecnologia do Papel: Neste processo, as empresas do ramo vertical contam com a vantagem do know-how da indústria. Eles são mais fáceis de romper os pontos do cartão de grandes dados do modelo? **
Zhang Jie: Acho que o know-how do setor precisa ser analisado em detalhes e pode haver vários formulários que requerem atenção especial.
A forma mais óbvia de know-how da indústria são alguns dados em documentos, que são expressões simbólicas. Como desenterrar (palavras de prompt) ou cadeias de prompts do documento é um tipo de problema que precisa ser tratado no estágio atual. Muitas empresas possuem um grande número de documentos, e muitos desses documentos estão no formato PPT ou PDF. É necessário entender tanto seu formato quanto seu conteúdo.
Além do know-how deste tipo de indústria, existe também o conhecimento escondido na mente dos especialistas da indústria ou especialistas em cenários. Ele precisa receber uma ferramenta, que pode ser resumida em palavras. O modelo é a indústria know-how com maior densidade.
Há também um tipo relativamente oculto de know-how da indústria, que é a sabedoria coletiva oculta nos logs do sistema. Após a mineração desses logs, é possível transformar conhecimento disperso em conhecimento em cadeia estruturada. Então, das milhares de cadeias, ele é resumido e transformado na melhor prática em um cenário específico. Por exemplo, os vendedores fazem muitos telefonemas todos os dias e há milhões de registros de conversas acumulados todos os dias. Ao adaptar de acordo com diferentes resultados, como conclusão do pedido, ordem de fluxo ou desligamento de chamadas, as melhores habilidades de fala para o marketing de novos produtos podem ser precipitados. prática.
Esses três tipos de perguntas são, na verdade, um know-how muito bom da indústria. Também existem alguns desafios técnicos aqui, como extrair palavras de prompt e cadeias de prompts de documentos e logs. doc2 e log2 são o foco da pesquisa que vale a pena investir.
Yu Zhonghai: Na verdade, Zhang Jie sempre teve um ditado que me impressionou profundamente. Ele disse que registrar as órbitas dos oito planetas do sistema solar por dezenas de milhões de anos não é tão bom quanto uma lei abstrata de gravidade que pode explicar melhor as coisas.Natureza.
Eu acho que isso é know-how. As empresas em áreas verticais têm muita experiência em áreas afins. Deixe-me dar um exemplo. Depois que a inteligência artificial se tornou popular, todos disseram que havia uma nova profissão chamada engenheiro com um salário anual de um milhão.
É o engenheiro que foi escrever. Então, por que eles são tão valiosos? Eu também uso ferramentas de pintura de inteligência artificial. Uma vez eu quis desenhar um homem de terno, mas tentei muitas palavras-chave e não funcionou. Mais tarde, digitei "gravata" e a pessoa imediatamente vestiu um terno, e você descobrirá que essa é a palavra mágica.
O modelo grande é um pouco como um jogo de probabilidade, pois na verdade tem muitas probabilidades anteriores. Na cena agora, gravata é a palavra muito importante correspondente a terno. E o engenheiro sabe quais palavras-chave podem atrapalhar o modelo e sabe que tipo de coisas queremos escrever. Esse é o valor dele. Então se colocarmos essa questão no cenário de aplicação, na verdade é o valor das empresas em verticais. Ele entende tanto de inteligência artificial quanto de know-how da indústria.
Wang Danjun: No momento, parece que, além das empresas modelo básicas de grande escala, as empresas de campo vertical são o segundo lote de empresas às quais todos prestarão muita atenção no mercado. Acho que será muito desafiador para eles no próximo período de tempo. A experiência das empresas em campos verticais pode não ser necessariamente transformada diretamente em nova criatividade sob a bênção de novas tecnologias. Preciso gastar mais tempo para aprender primeiro, para entender qual é a lógica subjacente da operação do modelo grande, para aprender como isso pode me ajudar, até mesmo para me ajudar a extrair nosso conhecimento ou nos ajudar a fornecer serviços aos clientes. Acho que por algum tempo eles enfrentarão esse desafio primeiro. Com base nesses fundamentos, encontre novas oportunidades de criar valor para os clientes com base nesses modelos.
**Tecnologia de papel: Houve algumas novas tendências recentemente, como a desaceleração no número de visitantes do ChatGPT. Na verdade, não existia como uma super entrada. Há uma visão de que o ChatGPT não pode representar o futuro do GPT, mas é apenas um produto apresentado pela OpenAI e pela Microsoft ao mercado. O que vocês três pensam sobre esse ponto de vista? **
Yu Zhonghai: Este ponto de vista é realmente muito interessante. Pessoalmente, estou relativamente otimista, porque sou uma pessoa que costuma usar produtos em grande escala. E gostaria de acrescentar que o ChatGPT atual não é sua forma final. Acho que o Google Assistant (Google Assistant) no sistema Android de próxima geração do Google será suportado por seu próprio modelo grande, porque essa também é uma entrada de tráfego muito importante.
Wang Danjun: Para muitas pessoas na indústria, todos estão muito otimistas. Sendo um produto novo, nesta fase de desenvolvimento, haverá naturalmente alguma diferenciação. Para os usuários finais, eles estarão interessados nessas ferramentas, dispostos a experimentá-las e continuar a usá-las. Mesmo que a frequência de uso diminua e o grau de atenção diminua, é difícil mudar o comportamento dos usuários.
Zhang Jie: Acho que a desaceleração da taxa de crescimento do ChatGPT é algo que vai acontecer mais cedo ou mais tarde. Afinal, o tráfego tem um teto. Mais cedo ou mais tarde, o tráfego atingirá o pico ou o entusiasmo do público pelos cenários de aplicação do bate-papo diminuirá. Afinal, o bate-papo não é uma demanda rígida de alta frequência, mas traz uma inspiração particularmente boa.
Por um lado, existem muitos aplicativos em torno do bate-papo, como geração de fotos, vídeos, relatórios, PPT etc. por meio do bate-papo, como ChatDoc, ChatPdf e ChatBI. Outro cenário é o modelo de domínio grande que acabamos de mencionar, como GPT financeiro, GPT jurídico e GPT médico. Todos esses podem ser algumas entradas de novos negócios no futuro.