A razão para escrever este artigo aconteceu há pouco tempo.
Participamos de um fórum temático que combinou grandes modelos com indústria. Após o evento, um representante do organizador da indústria se comunicou conosco e disse: "Vocês têm falado sobre modelos grandes. O que exatamente é um modelo grande? Qual é o tamanho de um modelo grande? Por que não podemos usar modelos pequenos?"
Esta série de questões faz-nos perceber mais uma vez que os lados inteligentes da oferta e da procura estão frequentemente em dois sistemas de discurso. Você já fala sobre Transfomer e Agent há muito tempo, mas ainda deve estar se perguntando de onde vêm as palavras “modelo grande”.
Esta lacuna é especialmente grave na era da IA. Como a tecnologia de IA envolve uma cadeia mais longa, aqueles que fazem algoritmos, aqueles que fazem nuvens, aqueles que fazem hardware, aqueles que fazem soluções de TI e aqueles que finalmente pagam a conta, todos podem estar falando sobre suas próprias opiniões, e ninguém pretende para realmente entender alguém.
Hoje, todo mundo está falando sobre grandes modelos industriais e grandes modelos industriais. Na verdade, do ponto de vista da lógica técnica, é fácil descobrir que grandes modelos podem trazer enormes ganhos de produtividade para muitas indústrias. Do ponto de vista técnico, as empresas chinesas são mais receptivas e têm uma maior procura de inteligência. Mover grandes modelos para a indústria para alcançar a integração digital-real é a linha mais distintiva da IA da China e tem um forte significado macroestratégico no contexto da China Digital.
Mas, na prática, este caminho está repleto de desafios e mal-entendidos.
Afinal, nove em cada dez empresas de algoritmos de IA não conseguem fazê-lo. Antes da nova janela de oportunidade do modelo grande para B, devemos primeiro determinar que tipo de modelo grande a indústria precisa?
Um grande modelo industrial não é um modelo
O maior mal-entendido quando as empresas de IA desenvolvem modelos em grande escala e combinam indústrias é que não conseguem compreender a relação entre oferta e procura.
É verdade que o atual reconhecimento e aceitação de modelos grandes pela indústria é relativamente bom, mas projetos inteligentes ainda são um mercado comprador absoluto. Os fornecedores de tecnologia precisam se adaptar às necessidades, habilidades, experiências e até mesmo habilidades de comunicação e hábitos de negócios dos usuários finais.
No entanto, devido às empresas que criam modelos de IA em grande escala, uma grande quantidade de talentos e fundos foram investidos no campo da Internet. A lógica de oferta e demanda da Internet é que um único ponto de oferta atende a uma grande demanda. Tenho um truque para trazer novas ideias de todo o mundo. É fácil pensar na adaptação de grandes modelos em muitas indústrias. Por exemplo, uma fábrica precisa de análise de ingredientes e um banco precisa de análise de investimentos. Meu grande modelo não pode analisá-lo também?
Portanto, sob esse "pensamento externo", muitas empresas de IA caíram em um grande mal-entendido: elas pensam que, como tenho um modelo grande, clientes de todos os setores deveriam vir até mim. Apresento casos de dois ou três setores, que deveriam ser reconhecidos por outros setores. Este meu modelo grande pode ser usado em qualquer lugar, por isso é chamado de modelo grande industrial.
Se esses profissionais de IA realmente acreditam que grandes modelos são iguais à panacéia da indústria ou estão apenas se gabando deliberadamente dessa forma. Do ponto de vista dos clientes industriais, esta cena equivale a um absurdo. Pensarão que a tecnologia utilizada na indústria financeira não tem nada a ver com as nossas minas de carvão? Se houvesse um alimento que os gatos pudessem comer, vacas, humanos ou até gatos, você se atreveria a comê-lo?
**A primeira coisa que a indústria precisa fazer com modelos grandes é não resumir as indústrias muito diferentes na palavra “indústria” e acabar com ela. Mesmo dentro de uma determinada indústria, grandes modelos só podem resolver um ou alguns problemas da indústria, e é impossível que um modelo “conserte todas as indústrias”. **
Quem trabalha com TI sabe que para ter produtos é preciso serviços, e para entender de tecnologia é preciso entender o setor. No entanto, as empresas de IA, especialmente aquelas que estão a investir dinheiro quente na arena dos grandes modelos, geralmente carecem de compreensão e respeito pelas diferenças nas necessidades da indústria.
É claro que diferentes indústrias também têm necessidades comuns de modelos grandes. Por exemplo, diálogo básico, currículo e capacidades multimodais. Porém, na maioria das vezes, cada setor tem requisitos diferentes, capacidades digitais básicas e até mesmo requisitos de segurança, requisitos de latência e requisitos de operação e manutenção. Na fase actual, é muito difícil replicar e promover um grande modelo numa indústria específica, e muito menos cobrir várias ou mesmo dezenas de indústrias de uma só vez.
Quando se trata de inteligência industrial, a prioridade é sempre a indústria em detrimento da inteligência.
Não mencionar a redução de hardware e engenharia é uma perda de tempo
Muitas empresas que estão engajadas em digitalização e inteligência ficarão surpresas com isso depois de olhar para o ambiente do cliente: o que o cliente gastou muito dinheiro para comprar é na verdade um software muito simples lacrado em uma caixa e feito de acordo com a indústria requisitos. Botões, UI e coisas assim. Muitos desses softwares são até reempacotados a partir de softwares de código aberto estrangeiros muito antigos e há muito que ficaram para trás tecnicamente. Neste momento, eles lamentarão que seja tão fácil enganar os clientes da indústria e obter seu dinheiro.
Mas aí vem a questão: se pensarmos nesse problema de outro ângulo, como uma empresa o utilizaria sem essa camada de encapsulamento? É necessário que uma fábrica, uma mina ou uma fazenda florestal recrute e treine um grande número de talentos em computação em nuvem e algoritmos de IA? E deixar que esses talentos digitais orientem a produção, as operações e as vendas de toda a empresa? Obviamente, isso não é confiável.
Portanto, um fato um tanto contra-intuitivo é que os usuários da indústria tendem a se preocupar mais com a “concha” do que com as deslumbrantes tecnologias avançadas. Essa camada de shell refere-se ao hardware e à engenharia, que encapsula, gerencia e mantém as capacidades técnicas de acordo com os requisitos de uso final. Embora a coisa final montada possa ser difícil de usar e não avançada, para os usuários da indústria, a condição mais importante para a inteligência é que ela possa ser usada e os funcionários possam aprendê-la.
Ao discutir modelos de grandes indústrias, hoje muitas vezes caímos neste mal-entendido. Os profissionais tendem a prestar muita atenção à liderança e à internacionalidade da camada de algoritmo, competir com escala de parâmetros e registros de teste e focar no software. Mas o que a indústria precisa que os grandes modelos façam é competir com os sistemas digitais anteriores, com os custos de utilização e com os limites operacionais. Isso requer um modelo grande que considere o ambiente de hardware, o ambiente de rede, os recursos de armazenamento e computação, o sistema operacional e até mesmo a fonte de alimentação, a umidade e a temperatura do ambiente de implantação.
**A segunda coisa que os grandes modelos industriais precisam fazer é levar em consideração a adaptação de hardware e questões de engenharia. **
Se o modelo grande pode ser implementado depende de encontrar o cenário certo. Mas o que é uma cena? O último lugar que funciona é chamado de cena.
A grande maioria das empresas não é orientada para TI. Mesmo a maioria das empresas não consegue enviar pessoal dedicado para entender cuidadosamente o que é um modelo grande. Isso não pode ser mudado por muito tempo.
A montanha não virá ver você, então você tem que ver a montanha.
Muitas pessoas comparam um modelo grande a uma mina de ouro, então treinar um modelo grande é apenas escavar a mina de ouro.Através de métodos de engenharia e integração do modelo grande na infraestrutura digital existente da indústria, a mina de ouro pode ser transportada para fora do a montanha.
Os especialistas eventualmente terão que ir à fábrica
Quer estejam contando histórias aos clientes ou comunicando-se ao público, muitos fabricantes de IA sempre mencionarão isto: não se preocupe, temos especialistas e pós-doutorandos enraizados na indústria. Fui a fábricas e terras agrícolas e lá fiquei vários meses.
Se você é um usuário potencial de modelos grandes na indústria, basta ouvir esta história. É verdade que os especialistas estão estacionados na fábrica, mas essa fábrica provavelmente não é a sua fábrica.
Na verdade, ter especialistas em IA na linha de frente da indústria é uma forma eficaz de reduzir a lacuna entre a demanda da indústria e a oferta de grandes modelos. Este é também um processo de desenvolvimento necessário para a inteligência industrial.
Mas este processo deve ser apenas temporário e não pode durar muito. Imagine só, os modelos grandes estão agora na vanguarda, quanto valem os especialistas? Uma equipe de especialistas está estacionada no local. Qual entidade pode sustentar esse custo salarial?
Os especialistas que as empresas de IA afirmam estar estacionados na fábrica estão, na verdade, fazendo casos e testes. Geralmente, eles cooperam com os principais clientes do setor.Os fabricantes estão dispostos a percorrer os modelos sem saber o que são problemas específicos.
**Os especialistas podem ir às fábricas, mas os especialistas certamente não podem ficar estacionados em uma fábrica após outra, ano após ano. **Esta é uma ação padrão quando os fabricantes de IA entram em uma indústria, mas muitas vezes é entendida como uma ação de rotina, intencionalmente ou não. Mas se você realmente precisa contar com especialistas para ir à fábrica para promover modelos grandes, então a IA nunca ser implementado devido ao custo, pois ninguém pode pagar por isso.
A terceira coisa que ** os grandes modelos industriais precisam fazer é que a tecnologia tenha replicabilidade de baixo limite dentro da indústria e não possa depender fortemente da cooperação manual personalizada. **
O que importa salientar especialmente é que, nesta fase, as grandes e médias empresas estão a tornar-se cada vez mais cautelosas no investimento em inteligência e o custo da tentativa e erro não pode ser demasiado elevado. Planos de implementação de modelos em grande escala que são demasiado experimentais e incertos são difíceis de obter o reconhecimento de grandes clientes na fase actual, muito menos de milhares de clientes de pequena e média dimensão, e é impossível contar com pesados investimentos manuais para os promover.
Resumindo, existem três desafios na implementação de modelos industriais em grande escala na fase actual:
Os fabricantes de IA sempre imaginam os grandes modelos como uma panacéia, mas o que a indústria precisa é de compreensão e foco.
Os fabricantes de IA sempre se concentram na inovação de algoritmos, mas o que a indústria precisa é de engenharia e operabilidade.
Os fabricantes de IA promovem um grande número de casos que dependem de capacidades de talentos, mas o que a indústria precisa é de baixo custo e replicabilidade.
O sol está nascendo quando modelos grandes são lançados na indústria, mas você também precisa limpar um pouco de neve conscientemente. Ao retornar à interface do usuário, muitas vezes você encontrará respostas para mais perguntas.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
De que tipo de modelos grandes a indústria precisa?
Fonte original: corpo polar do cérebro
A razão para escrever este artigo aconteceu há pouco tempo.
Participamos de um fórum temático que combinou grandes modelos com indústria. Após o evento, um representante do organizador da indústria se comunicou conosco e disse: "Vocês têm falado sobre modelos grandes. O que exatamente é um modelo grande? Qual é o tamanho de um modelo grande? Por que não podemos usar modelos pequenos?"
Esta série de questões faz-nos perceber mais uma vez que os lados inteligentes da oferta e da procura estão frequentemente em dois sistemas de discurso. Você já fala sobre Transfomer e Agent há muito tempo, mas ainda deve estar se perguntando de onde vêm as palavras “modelo grande”.
Esta lacuna é especialmente grave na era da IA. Como a tecnologia de IA envolve uma cadeia mais longa, aqueles que fazem algoritmos, aqueles que fazem nuvens, aqueles que fazem hardware, aqueles que fazem soluções de TI e aqueles que finalmente pagam a conta, todos podem estar falando sobre suas próprias opiniões, e ninguém pretende para realmente entender alguém.
Hoje, todo mundo está falando sobre grandes modelos industriais e grandes modelos industriais. Na verdade, do ponto de vista da lógica técnica, é fácil descobrir que grandes modelos podem trazer enormes ganhos de produtividade para muitas indústrias. Do ponto de vista técnico, as empresas chinesas são mais receptivas e têm uma maior procura de inteligência. Mover grandes modelos para a indústria para alcançar a integração digital-real é a linha mais distintiva da IA da China e tem um forte significado macroestratégico no contexto da China Digital.
Mas, na prática, este caminho está repleto de desafios e mal-entendidos.
Afinal, nove em cada dez empresas de algoritmos de IA não conseguem fazê-lo. Antes da nova janela de oportunidade do modelo grande para B, devemos primeiro determinar que tipo de modelo grande a indústria precisa?
Um grande modelo industrial não é um modelo
O maior mal-entendido quando as empresas de IA desenvolvem modelos em grande escala e combinam indústrias é que não conseguem compreender a relação entre oferta e procura.
É verdade que o atual reconhecimento e aceitação de modelos grandes pela indústria é relativamente bom, mas projetos inteligentes ainda são um mercado comprador absoluto. Os fornecedores de tecnologia precisam se adaptar às necessidades, habilidades, experiências e até mesmo habilidades de comunicação e hábitos de negócios dos usuários finais.
No entanto, devido às empresas que criam modelos de IA em grande escala, uma grande quantidade de talentos e fundos foram investidos no campo da Internet. A lógica de oferta e demanda da Internet é que um único ponto de oferta atende a uma grande demanda. Tenho um truque para trazer novas ideias de todo o mundo. É fácil pensar na adaptação de grandes modelos em muitas indústrias. Por exemplo, uma fábrica precisa de análise de ingredientes e um banco precisa de análise de investimentos. Meu grande modelo não pode analisá-lo também?
Portanto, sob esse "pensamento externo", muitas empresas de IA caíram em um grande mal-entendido: elas pensam que, como tenho um modelo grande, clientes de todos os setores deveriam vir até mim. Apresento casos de dois ou três setores, que deveriam ser reconhecidos por outros setores. Este meu modelo grande pode ser usado em qualquer lugar, por isso é chamado de modelo grande industrial.
Se esses profissionais de IA realmente acreditam que grandes modelos são iguais à panacéia da indústria ou estão apenas se gabando deliberadamente dessa forma. Do ponto de vista dos clientes industriais, esta cena equivale a um absurdo. Pensarão que a tecnologia utilizada na indústria financeira não tem nada a ver com as nossas minas de carvão? Se houvesse um alimento que os gatos pudessem comer, vacas, humanos ou até gatos, você se atreveria a comê-lo?
**A primeira coisa que a indústria precisa fazer com modelos grandes é não resumir as indústrias muito diferentes na palavra “indústria” e acabar com ela. Mesmo dentro de uma determinada indústria, grandes modelos só podem resolver um ou alguns problemas da indústria, e é impossível que um modelo “conserte todas as indústrias”. **
Quem trabalha com TI sabe que para ter produtos é preciso serviços, e para entender de tecnologia é preciso entender o setor. No entanto, as empresas de IA, especialmente aquelas que estão a investir dinheiro quente na arena dos grandes modelos, geralmente carecem de compreensão e respeito pelas diferenças nas necessidades da indústria.
É claro que diferentes indústrias também têm necessidades comuns de modelos grandes. Por exemplo, diálogo básico, currículo e capacidades multimodais. Porém, na maioria das vezes, cada setor tem requisitos diferentes, capacidades digitais básicas e até mesmo requisitos de segurança, requisitos de latência e requisitos de operação e manutenção. Na fase actual, é muito difícil replicar e promover um grande modelo numa indústria específica, e muito menos cobrir várias ou mesmo dezenas de indústrias de uma só vez.
Quando se trata de inteligência industrial, a prioridade é sempre a indústria em detrimento da inteligência.
Não mencionar a redução de hardware e engenharia é uma perda de tempo
Muitas empresas que estão engajadas em digitalização e inteligência ficarão surpresas com isso depois de olhar para o ambiente do cliente: o que o cliente gastou muito dinheiro para comprar é na verdade um software muito simples lacrado em uma caixa e feito de acordo com a indústria requisitos. Botões, UI e coisas assim. Muitos desses softwares são até reempacotados a partir de softwares de código aberto estrangeiros muito antigos e há muito que ficaram para trás tecnicamente. Neste momento, eles lamentarão que seja tão fácil enganar os clientes da indústria e obter seu dinheiro.
Mas aí vem a questão: se pensarmos nesse problema de outro ângulo, como uma empresa o utilizaria sem essa camada de encapsulamento? É necessário que uma fábrica, uma mina ou uma fazenda florestal recrute e treine um grande número de talentos em computação em nuvem e algoritmos de IA? E deixar que esses talentos digitais orientem a produção, as operações e as vendas de toda a empresa? Obviamente, isso não é confiável.
Portanto, um fato um tanto contra-intuitivo é que os usuários da indústria tendem a se preocupar mais com a “concha” do que com as deslumbrantes tecnologias avançadas. Essa camada de shell refere-se ao hardware e à engenharia, que encapsula, gerencia e mantém as capacidades técnicas de acordo com os requisitos de uso final. Embora a coisa final montada possa ser difícil de usar e não avançada, para os usuários da indústria, a condição mais importante para a inteligência é que ela possa ser usada e os funcionários possam aprendê-la.
Ao discutir modelos de grandes indústrias, hoje muitas vezes caímos neste mal-entendido. Os profissionais tendem a prestar muita atenção à liderança e à internacionalidade da camada de algoritmo, competir com escala de parâmetros e registros de teste e focar no software. Mas o que a indústria precisa que os grandes modelos façam é competir com os sistemas digitais anteriores, com os custos de utilização e com os limites operacionais. Isso requer um modelo grande que considere o ambiente de hardware, o ambiente de rede, os recursos de armazenamento e computação, o sistema operacional e até mesmo a fonte de alimentação, a umidade e a temperatura do ambiente de implantação.
**A segunda coisa que os grandes modelos industriais precisam fazer é levar em consideração a adaptação de hardware e questões de engenharia. **
Se o modelo grande pode ser implementado depende de encontrar o cenário certo. Mas o que é uma cena? O último lugar que funciona é chamado de cena.
A grande maioria das empresas não é orientada para TI. Mesmo a maioria das empresas não consegue enviar pessoal dedicado para entender cuidadosamente o que é um modelo grande. Isso não pode ser mudado por muito tempo.
A montanha não virá ver você, então você tem que ver a montanha.
Muitas pessoas comparam um modelo grande a uma mina de ouro, então treinar um modelo grande é apenas escavar a mina de ouro.Através de métodos de engenharia e integração do modelo grande na infraestrutura digital existente da indústria, a mina de ouro pode ser transportada para fora do a montanha.
Os especialistas eventualmente terão que ir à fábrica
Quer estejam contando histórias aos clientes ou comunicando-se ao público, muitos fabricantes de IA sempre mencionarão isto: não se preocupe, temos especialistas e pós-doutorandos enraizados na indústria. Fui a fábricas e terras agrícolas e lá fiquei vários meses.
Se você é um usuário potencial de modelos grandes na indústria, basta ouvir esta história. É verdade que os especialistas estão estacionados na fábrica, mas essa fábrica provavelmente não é a sua fábrica.
Na verdade, ter especialistas em IA na linha de frente da indústria é uma forma eficaz de reduzir a lacuna entre a demanda da indústria e a oferta de grandes modelos. Este é também um processo de desenvolvimento necessário para a inteligência industrial.
Mas este processo deve ser apenas temporário e não pode durar muito. Imagine só, os modelos grandes estão agora na vanguarda, quanto valem os especialistas? Uma equipe de especialistas está estacionada no local. Qual entidade pode sustentar esse custo salarial?
Os especialistas que as empresas de IA afirmam estar estacionados na fábrica estão, na verdade, fazendo casos e testes. Geralmente, eles cooperam com os principais clientes do setor.Os fabricantes estão dispostos a percorrer os modelos sem saber o que são problemas específicos.
**Os especialistas podem ir às fábricas, mas os especialistas certamente não podem ficar estacionados em uma fábrica após outra, ano após ano. **Esta é uma ação padrão quando os fabricantes de IA entram em uma indústria, mas muitas vezes é entendida como uma ação de rotina, intencionalmente ou não. Mas se você realmente precisa contar com especialistas para ir à fábrica para promover modelos grandes, então a IA nunca ser implementado devido ao custo, pois ninguém pode pagar por isso.
A terceira coisa que ** os grandes modelos industriais precisam fazer é que a tecnologia tenha replicabilidade de baixo limite dentro da indústria e não possa depender fortemente da cooperação manual personalizada. **
O que importa salientar especialmente é que, nesta fase, as grandes e médias empresas estão a tornar-se cada vez mais cautelosas no investimento em inteligência e o custo da tentativa e erro não pode ser demasiado elevado. Planos de implementação de modelos em grande escala que são demasiado experimentais e incertos são difíceis de obter o reconhecimento de grandes clientes na fase actual, muito menos de milhares de clientes de pequena e média dimensão, e é impossível contar com pesados investimentos manuais para os promover.
Resumindo, existem três desafios na implementação de modelos industriais em grande escala na fase actual:
Os fabricantes de IA sempre imaginam os grandes modelos como uma panacéia, mas o que a indústria precisa é de compreensão e foco.
Os fabricantes de IA sempre se concentram na inovação de algoritmos, mas o que a indústria precisa é de engenharia e operabilidade.
Os fabricantes de IA promovem um grande número de casos que dependem de capacidades de talentos, mas o que a indústria precisa é de baixo custo e replicabilidade.
O sol está nascendo quando modelos grandes são lançados na indústria, mas você também precisa limpar um pouco de neve conscientemente. Ao retornar à interface do usuário, muitas vezes você encontrará respostas para mais perguntas.