Autor: Li Zi, Ph.D. em Sociologia da Tecnologia, Pós-Doutorado, Departamento de Humanidades Médicas e Ética, Columbia University
Fonte da imagem: Gerada por Unbounded AI
No primeiro semestre do ano, nasceu o ChatGPT, e o potencial da inteligência artificial foi revelado, o que trouxe uma discussão sobre crise de sobrevivência para muitas indústrias. O GPT pode passar em exames de qualificação de barra e engenharia, escrever redações para a faculdade sem reprovar notas e até mesmo "entender" piadas. Ele pode responder às perguntas das pessoas, organizar estruturas de linguagem vívidas e imitar uma variedade de estilos de linguagem; e a combinação de grandes modelos de linguagem e tecnologias de IA de geração de imagem, como Midjourney, pode permitir que pessoas que não receberam nenhum treinamento artístico usem alguns palavras "Criar" imagens artísticas impressionantes.
A essência do ChatGPT é, na verdade, um grande modelo de linguagem (Large Language Model, LLM) inteligência artificial generativa sobreposta. Um grande modelo de linguagem, como o nome sugere, é grande, usando um grande número de morfemas para treinar um modelo de computador com métodos de aprendizado de máquina. A fórmula generativa usa um método preditivo para exibir as conexões de morfema mais prováveis durante o diálogo.
Para "processadores" e "consumidores" de conhecimento, as capacidades de grandes modelos de linguagem mais inteligência artificial generativa são enormes. Dados maciços de morfemas, rede neural profunda e enorme poder de computação são equivalentes a "achatar" todo o conhecimento da Internet e depois "montá-lo" por meio da interação humano-computador.
**Em termos de lógica computacional, o ChatGPT é equivalente a um motor de busca mais poderoso. ** Mecanismos de busca comuns, como Google e Baidu, "raspam" as informações de toda a Internet por meio do modo de rastreamento e classificam por meio de algoritmos complexos. O método de inteligência artificial usando aprendizado de máquina é equivalente a classificar as informações de forma preditiva de acordo com a lógica da linguagem. O processamento do conhecimento tornou-se mais conveniente e rápido, e o consumo tornou-se mais conciso e claro - às vezes até simples demais, dando oportunidades para trapacear nas provas.
Diante disso, os otimistas tecnológicos acreditam que, uma vez que o conteúdo que as máquinas podem gerar a partir de agora, pode não exigir que a maioria dos humanos use o cérebro para realizá-lo, assim como os mecanismos de busca substituem os cartões da biblioteca e as calculadoras substituem o ábaco. De fato, mesmo que a IA não interfira na tomada de decisão final, aquelas tarefas que exigem muita escrita repetitiva, ou enumeração e classificação mecânica, podem de fato fornecer um grau considerável de produtividade e auxiliar os humanos no processamento e consumo de conhecimento.
Então, a leitura é útil? O pessoal das principais universidades e instituições de pesquisa também pode deixar o trabalho?
O que a máquina pode "aprender"
Grandes modelos de linguagem e inteligência artificial generativa trouxeram um tópico inevitável para os futuros "produtores" de conhecimento: o que é conhecimento? Como produzir conhecimentos diversos, imparciais e autênticos?
A capacidade de "aprendizado" da inteligência artificial é incrível. O modelo de linguagem grande existente e a aplicação de inteligência artificial não podem ser separados do aprendizado de máquina como pano de fundo. A palavra "aprendizagem" é essencialmente usar uma grande quantidade de dados para treinar o modelo de previsão e encontrar um equilíbrio entre a precisão e a universalidade da previsão. Esse tipo de previsão é, na verdade, baseado no conhecimento existente, e a previsão do modelo de idioma também é baseada na conexão entre os idiomas existentes. Por exemplo, insira "carne assada" e a máquina prevê "carne"; então, com base em mais entradas, como localização, pessoas, hábitos etc., fornecerá previsões mais precisas, como "carne assada da vovó" e breve.
Como essa previsão se tornou realidade? O sistema de coordenadas com o qual estamos familiarizados é bidimensional. Por exemplo, em toda a população, existe uma correspondência aproximada entre altura e peso.Dada a altura, a máquina prevê um peso médio, que é uma previsão baseada em dados existentes. Adicione outra dimensão, como gênero, então ela se torna uma coordenada tridimensional, e as previsões de homens e mulheres serão diferentes. Se isso continuar, as dimensões dos dados podem ser infinitas, e o modelo de aprendizado de máquina é encontrar essas conexões em um espaço multidimensional que o cérebro humano não pode imaginar e ajustar constantemente os pesos entre várias dimensões. Por exemplo, "quão importante" é a previsão da altura para o peso, que pode ser ajustada após um grande número de entradas de dados.
** Portanto, a inteligência artificial baseada em aprendizado de máquina conectará dados de várias dimensões em um espaço de dimensão superior, terá a capacidade de descobrir possíveis conexões entre os dados e também "aprenderá" algumas coisas que não existem na realidade, mas muito ligações prováveis. **Usado no modelo de linguagem, a inteligência artificial também pode aprender diferentes estilos de linguagem e desenterrar a "essência" e os "problemas" no texto existente.
**Quanto maiores os dados, mais maduro o modelo e maiores suas capacidades de computação e mineração. **Semelhante à IA, como BERT e GPT, que nasceram em grandes instituições, muitas pessoas acreditam que atingiram o "ponto de inflexão" da tecnologia e não é razoável que mudanças quantitativas produzam mudanças qualitativas - isso é bom coisa para produtores de conhecimento. No entanto, grandes modelos também têm problemas inerentes e, quanto maior o modelo, mais agudos são os problemas, especialmente em relação aos aspectos diversos, justos e verdadeiros do conhecimento.
Como produzir de verdade
** e conhecimento imparcial? **
Novos conhecimentos podem ser gerados a partir de conexões e novos modelos de conhecimento existentes, o que é verdade seja no nível humano ou da máquina. No entanto, o conhecimento existente é suficiente? É suficiente? É justo? Se a base do conhecimento existente for insuficiente ou mesmo tendenciosa, o novo conhecimento construído sobre ela também será tendencioso.
Desde que a IA de aprendizado de máquina foi colocada em aplicação em larga escala, os estudiosos revelaram continuamente os preconceitos inerentes a esses modelos: sexismo, racismo, produção antiética e assim por diante. Os desenvolvedores usam vários patches e métodos de correção para compensar isso, mas a maioria dos problemas está oculta na produção de dados e no processo de treinamento, e o viés da IA também é um reflexo e amplificação do preconceito social.
Outra questão é a qualidade dos dados. O aprendizado de máquina envolve não apenas a capacidade de treinar modelos, mas também a quantidade e a qualidade dos dados. O processo de desenvolvimento existente coloca mais ênfase no desempenho do modelo e até mesmo na superstição, mas ignora o problema subjacente das fontes de dados. A maioria dos dados hoje depende de limpeza manual e formatação, categorização, rotulagem e assim por diante. Muitas vezes, esse processo de produção de dados é opaco, até rabiscado. Por exemplo, por trás do desenvolvimento de IA de grandes empresas, um grande número de mão de obra "suja e bagunçada" é terceirizada para "fábricas de IA" em áreas subdesenvolvidas. Por um lado, esse processo traz questões de ética trabalhista e, por outro lado, também traz desafios para a qualidade dos dados.
Na era dos modelos grandes, esse problema pode estar mais oculto: nem todo pesquisador ou equipe tem a capacidade de desenvolver modelos de IA do zero, especialmente modelos de linguagem grande e imagens grandes, a maioria dos quais baseada em modelos existentes. Os problemas e desvios do próprio modelo grande serão migrados para mais modelos de aplicação. E quanto menor o desvio, mais difícil é lidar com ele por meio de ajuste fino e correção de desvio.
O modo de geração de previsão do modelo de linguagem existente amplificará até mesmo o desvio existente dos dados, resultando no efeito de "overfitting": por exemplo, uma determinada doença tem uma alta proporção de dados estatísticos em um determinado grupo étnico, cerca de 60% ; Mas se o modelo de linguagem for usado para gerar um retrato de um paciente, há mais de 90% de possibilidade de que a descrição do paciente gerada pertença a esse grupo.
Agora, alguns treinamentos de modelos de IA adotam um modo de "combate mútuo" - a chamada "rede adversária generativa" (rede adversária generativa), permitindo que dois modelos gerem e corrijam continuamente um ao outro. Este método melhora a eficiência do treinamento do modelo, mas qualquer pequeno desvio será ampliado nesta "interação". No mesmo princípio, se um produtor de conhecimento que trabalha em estreita colaboração com uma máquina depende desse tipo de "geração", alguns vieses do modelo serão incorporados em mais conhecimento novo, e o novo conhecimento será absorvido como dados, além disso reforça o viés do modelo. **Os produtores de conhecimento devem permanecer vigilantes neste processo.
**O que é um novo conhecimento? Poderia a "geração" de IA representar um novo conhecimento? **
O que é o chamado novo conhecimento? Se a IA for totalmente usada para produzir conhecimento, os produtores de conhecimento devem pensar sobre essa questão do ponto de vista da combinação de homem e máquina. Qualquer informação, assim como o conhecimento adquirido por humanos do mundo real, precisa ser “limpo” e “formatado” em dados. Além da qualidade dos dados mencionada acima, o processo de geração de dados também é importante. Em suma, qual é o problema que se quer estudar? Em que tipo de dados essa pergunta é traduzida? Como esses dados são produzidos e eles representam de forma completa e justa as questões que os produtores de conhecimento desejam estudar?
Esse problema também é verdadeiro para os produtores de conhecimento "tradicionais". Tomemos a história como exemplo: embora a história estude eventos passados, nenhum evento passado pode ser 100% conclusivo. Os estudiosos geralmente estão constantemente procurando por novos materiais históricos para complementar sua compreensão de questões históricas e para desenterrar perspectivas e vozes negligenciadas no passado. Curiosamente, a historiografia atual costuma recorrer a uma grande quantidade de dados, especialmente dados econômicos, populacionais e climáticos do passado, e até mesmo depende do aprendizado de máquina para trazer novos entendimentos e perspectivas para a história.
Da mesma forma, confiar em percepções e opiniões geradas por máquinas pode ampliar a importância de certas fontes de dados. Os produtores de conhecimento de hoje dependem demais da informação convencional, da Internet e eletrônica para criar coisas que foram "traduzidas" em dados por outros. **Na era da IA, a conveniência e a extensibilidade fornecidas pela IA tornarão potencialmente mais fácil para as pessoas ignorar o conhecimento não convencional e experimental que não foi digitalizado, eletrônico e, portanto, perder a possibilidade de formação de novos pontos de vista e perspectivas . **
Em um nível mais profundo, novos conhecimentos muitas vezes surgem da escavação de novos materiais, da colisão de diferentes pontos de vista e perspectivas e da re-desconstrução do conhecimento existente. O grande modelo de linguagem oferece muitas possibilidades para a exibição do conhecimento, mas sua lógica interna e estrutura podem ser contrárias a esse método de produção.
Com base no método de treinamento do modelo de linguagem grande e nas características da saída gerada pelo modelo, o peso do conteúdo de saída com classificação mais alta e probabilidade mais alta se tornará maior e os recursos se tornarão mais singulares. "Gerado por IA" quase se tornou um adjetivo para descrever as palavras sem sentido, repetitivas e sem sentido que são ditas como se não existissem. É verdade que, para os consumidores de conhecimento, as respostas "mais prováveis" reduzem muito o limiar de compreensão; mas, para os produtores de conhecimento, essas coisas podem se tornar obstáculos.
**Para onde devem ir os produtores de conhecimento na nova era? **
Talvez muitos pesquisadores de ciências sociais como eu tenham encontrado esse problema ao usar o ChatGPT: peça para explicar um conceito e é lógico; um autor nunca escreveu um livro, nunca publicou um artigo. Quanto mais estreito e especializado o campo, maior a possibilidade de "absurdo".
Voltando ao princípio da IA, esse tipo de "criação" está na verdade explorando as "possíveis" conexões de palavras e frases em dados massivos, mas essas conexões não existem na realidade. Para ser franco, elas apenas "soam parecidas". . Esse novo fenômeno agora é chamado de "alucinação". Para os produtores de conhecimento, saber usar a inteligência artificial para minerar os padrões e conexões na base de conhecimento existente, mas permanecer vigilante contra a “visão” da máquina, o que existe e o que é duvidoso, é uma habilidade muito importante.
"Diálogo" com IA também se tornará uma nova habilidade. A IA atual ainda é uma misteriosa "caixa preta" para a maioria das pessoas não técnicas (mesmo as pessoas técnicas). Como começar do nível inferior ou médio da tecnologia para falar com as máquinas de forma mais eficaz, entender e lutar contra a "visão" requer a cooperação de produtores de conhecimento e profissionais técnicos.
Para a pesquisa de novos conhecimentos, novas perspectivas e novos materiais, a estrutura única e a interpretação de cada campo ainda são muito importantes atualmente. Os modelos preditivos de grandes modelos de linguagem e IA generativa ainda tendem a ser únicos e repetitivos, e quanto mais limitado for o material de treinamento, mais limitadas serão as capacidades. Se você deseja combinar recursos de máquina e humanos, deve começar a partir da fonte de produção de dados, usar dados precisos, diversos, justos e novos para treinar modelos de IA e estabelecer um modelo benigno de interação humano-computador.
O advento de grandes modelos de linguagem e IA generativa é apenas o começo dos desafios para os pesquisadores. Em vez de se discutir "substituição", é melhor buscar a possibilidade de rodagem e desenvolvimento sob um olhar mais prudente.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Com o ChatGPT, a leitura ainda é útil?
Autor: Li Zi, Ph.D. em Sociologia da Tecnologia, Pós-Doutorado, Departamento de Humanidades Médicas e Ética, Columbia University
No primeiro semestre do ano, nasceu o ChatGPT, e o potencial da inteligência artificial foi revelado, o que trouxe uma discussão sobre crise de sobrevivência para muitas indústrias. O GPT pode passar em exames de qualificação de barra e engenharia, escrever redações para a faculdade sem reprovar notas e até mesmo "entender" piadas. Ele pode responder às perguntas das pessoas, organizar estruturas de linguagem vívidas e imitar uma variedade de estilos de linguagem; e a combinação de grandes modelos de linguagem e tecnologias de IA de geração de imagem, como Midjourney, pode permitir que pessoas que não receberam nenhum treinamento artístico usem alguns palavras "Criar" imagens artísticas impressionantes.
A essência do ChatGPT é, na verdade, um grande modelo de linguagem (Large Language Model, LLM) inteligência artificial generativa sobreposta. Um grande modelo de linguagem, como o nome sugere, é grande, usando um grande número de morfemas para treinar um modelo de computador com métodos de aprendizado de máquina. A fórmula generativa usa um método preditivo para exibir as conexões de morfema mais prováveis durante o diálogo.
Para "processadores" e "consumidores" de conhecimento, as capacidades de grandes modelos de linguagem mais inteligência artificial generativa são enormes. Dados maciços de morfemas, rede neural profunda e enorme poder de computação são equivalentes a "achatar" todo o conhecimento da Internet e depois "montá-lo" por meio da interação humano-computador.
**Em termos de lógica computacional, o ChatGPT é equivalente a um motor de busca mais poderoso. ** Mecanismos de busca comuns, como Google e Baidu, "raspam" as informações de toda a Internet por meio do modo de rastreamento e classificam por meio de algoritmos complexos. O método de inteligência artificial usando aprendizado de máquina é equivalente a classificar as informações de forma preditiva de acordo com a lógica da linguagem. O processamento do conhecimento tornou-se mais conveniente e rápido, e o consumo tornou-se mais conciso e claro - às vezes até simples demais, dando oportunidades para trapacear nas provas.
Diante disso, os otimistas tecnológicos acreditam que, uma vez que o conteúdo que as máquinas podem gerar a partir de agora, pode não exigir que a maioria dos humanos use o cérebro para realizá-lo, assim como os mecanismos de busca substituem os cartões da biblioteca e as calculadoras substituem o ábaco. De fato, mesmo que a IA não interfira na tomada de decisão final, aquelas tarefas que exigem muita escrita repetitiva, ou enumeração e classificação mecânica, podem de fato fornecer um grau considerável de produtividade e auxiliar os humanos no processamento e consumo de conhecimento.
Então, a leitura é útil? O pessoal das principais universidades e instituições de pesquisa também pode deixar o trabalho?
O que a máquina pode "aprender"
Grandes modelos de linguagem e inteligência artificial generativa trouxeram um tópico inevitável para os futuros "produtores" de conhecimento: o que é conhecimento? Como produzir conhecimentos diversos, imparciais e autênticos?
A capacidade de "aprendizado" da inteligência artificial é incrível. O modelo de linguagem grande existente e a aplicação de inteligência artificial não podem ser separados do aprendizado de máquina como pano de fundo. A palavra "aprendizagem" é essencialmente usar uma grande quantidade de dados para treinar o modelo de previsão e encontrar um equilíbrio entre a precisão e a universalidade da previsão. Esse tipo de previsão é, na verdade, baseado no conhecimento existente, e a previsão do modelo de idioma também é baseada na conexão entre os idiomas existentes. Por exemplo, insira "carne assada" e a máquina prevê "carne"; então, com base em mais entradas, como localização, pessoas, hábitos etc., fornecerá previsões mais precisas, como "carne assada da vovó" e breve.
Como essa previsão se tornou realidade? O sistema de coordenadas com o qual estamos familiarizados é bidimensional. Por exemplo, em toda a população, existe uma correspondência aproximada entre altura e peso.Dada a altura, a máquina prevê um peso médio, que é uma previsão baseada em dados existentes. Adicione outra dimensão, como gênero, então ela se torna uma coordenada tridimensional, e as previsões de homens e mulheres serão diferentes. Se isso continuar, as dimensões dos dados podem ser infinitas, e o modelo de aprendizado de máquina é encontrar essas conexões em um espaço multidimensional que o cérebro humano não pode imaginar e ajustar constantemente os pesos entre várias dimensões. Por exemplo, "quão importante" é a previsão da altura para o peso, que pode ser ajustada após um grande número de entradas de dados.
** Portanto, a inteligência artificial baseada em aprendizado de máquina conectará dados de várias dimensões em um espaço de dimensão superior, terá a capacidade de descobrir possíveis conexões entre os dados e também "aprenderá" algumas coisas que não existem na realidade, mas muito ligações prováveis. **Usado no modelo de linguagem, a inteligência artificial também pode aprender diferentes estilos de linguagem e desenterrar a "essência" e os "problemas" no texto existente.
**Quanto maiores os dados, mais maduro o modelo e maiores suas capacidades de computação e mineração. **Semelhante à IA, como BERT e GPT, que nasceram em grandes instituições, muitas pessoas acreditam que atingiram o "ponto de inflexão" da tecnologia e não é razoável que mudanças quantitativas produzam mudanças qualitativas - isso é bom coisa para produtores de conhecimento. No entanto, grandes modelos também têm problemas inerentes e, quanto maior o modelo, mais agudos são os problemas, especialmente em relação aos aspectos diversos, justos e verdadeiros do conhecimento.
Como produzir de verdade
** e conhecimento imparcial? **
Novos conhecimentos podem ser gerados a partir de conexões e novos modelos de conhecimento existentes, o que é verdade seja no nível humano ou da máquina. No entanto, o conhecimento existente é suficiente? É suficiente? É justo? Se a base do conhecimento existente for insuficiente ou mesmo tendenciosa, o novo conhecimento construído sobre ela também será tendencioso.
Desde que a IA de aprendizado de máquina foi colocada em aplicação em larga escala, os estudiosos revelaram continuamente os preconceitos inerentes a esses modelos: sexismo, racismo, produção antiética e assim por diante. Os desenvolvedores usam vários patches e métodos de correção para compensar isso, mas a maioria dos problemas está oculta na produção de dados e no processo de treinamento, e o viés da IA também é um reflexo e amplificação do preconceito social.
Na era dos modelos grandes, esse problema pode estar mais oculto: nem todo pesquisador ou equipe tem a capacidade de desenvolver modelos de IA do zero, especialmente modelos de linguagem grande e imagens grandes, a maioria dos quais baseada em modelos existentes. Os problemas e desvios do próprio modelo grande serão migrados para mais modelos de aplicação. E quanto menor o desvio, mais difícil é lidar com ele por meio de ajuste fino e correção de desvio.
O modo de geração de previsão do modelo de linguagem existente amplificará até mesmo o desvio existente dos dados, resultando no efeito de "overfitting": por exemplo, uma determinada doença tem uma alta proporção de dados estatísticos em um determinado grupo étnico, cerca de 60% ; Mas se o modelo de linguagem for usado para gerar um retrato de um paciente, há mais de 90% de possibilidade de que a descrição do paciente gerada pertença a esse grupo.
Agora, alguns treinamentos de modelos de IA adotam um modo de "combate mútuo" - a chamada "rede adversária generativa" (rede adversária generativa), permitindo que dois modelos gerem e corrijam continuamente um ao outro. Este método melhora a eficiência do treinamento do modelo, mas qualquer pequeno desvio será ampliado nesta "interação". No mesmo princípio, se um produtor de conhecimento que trabalha em estreita colaboração com uma máquina depende desse tipo de "geração", alguns vieses do modelo serão incorporados em mais conhecimento novo, e o novo conhecimento será absorvido como dados, além disso reforça o viés do modelo. **Os produtores de conhecimento devem permanecer vigilantes neste processo.
**O que é um novo conhecimento? Poderia a "geração" de IA representar um novo conhecimento? **
O que é o chamado novo conhecimento? Se a IA for totalmente usada para produzir conhecimento, os produtores de conhecimento devem pensar sobre essa questão do ponto de vista da combinação de homem e máquina. Qualquer informação, assim como o conhecimento adquirido por humanos do mundo real, precisa ser “limpo” e “formatado” em dados. Além da qualidade dos dados mencionada acima, o processo de geração de dados também é importante. Em suma, qual é o problema que se quer estudar? Em que tipo de dados essa pergunta é traduzida? Como esses dados são produzidos e eles representam de forma completa e justa as questões que os produtores de conhecimento desejam estudar?
Esse problema também é verdadeiro para os produtores de conhecimento "tradicionais". Tomemos a história como exemplo: embora a história estude eventos passados, nenhum evento passado pode ser 100% conclusivo. Os estudiosos geralmente estão constantemente procurando por novos materiais históricos para complementar sua compreensão de questões históricas e para desenterrar perspectivas e vozes negligenciadas no passado. Curiosamente, a historiografia atual costuma recorrer a uma grande quantidade de dados, especialmente dados econômicos, populacionais e climáticos do passado, e até mesmo depende do aprendizado de máquina para trazer novos entendimentos e perspectivas para a história.
Da mesma forma, confiar em percepções e opiniões geradas por máquinas pode ampliar a importância de certas fontes de dados. Os produtores de conhecimento de hoje dependem demais da informação convencional, da Internet e eletrônica para criar coisas que foram "traduzidas" em dados por outros. **Na era da IA, a conveniência e a extensibilidade fornecidas pela IA tornarão potencialmente mais fácil para as pessoas ignorar o conhecimento não convencional e experimental que não foi digitalizado, eletrônico e, portanto, perder a possibilidade de formação de novos pontos de vista e perspectivas . **
Em um nível mais profundo, novos conhecimentos muitas vezes surgem da escavação de novos materiais, da colisão de diferentes pontos de vista e perspectivas e da re-desconstrução do conhecimento existente. O grande modelo de linguagem oferece muitas possibilidades para a exibição do conhecimento, mas sua lógica interna e estrutura podem ser contrárias a esse método de produção.
Com base no método de treinamento do modelo de linguagem grande e nas características da saída gerada pelo modelo, o peso do conteúdo de saída com classificação mais alta e probabilidade mais alta se tornará maior e os recursos se tornarão mais singulares. "Gerado por IA" quase se tornou um adjetivo para descrever as palavras sem sentido, repetitivas e sem sentido que são ditas como se não existissem. É verdade que, para os consumidores de conhecimento, as respostas "mais prováveis" reduzem muito o limiar de compreensão; mas, para os produtores de conhecimento, essas coisas podem se tornar obstáculos.
**Para onde devem ir os produtores de conhecimento na nova era? **
Talvez muitos pesquisadores de ciências sociais como eu tenham encontrado esse problema ao usar o ChatGPT: peça para explicar um conceito e é lógico; um autor nunca escreveu um livro, nunca publicou um artigo. Quanto mais estreito e especializado o campo, maior a possibilidade de "absurdo".
Voltando ao princípio da IA, esse tipo de "criação" está na verdade explorando as "possíveis" conexões de palavras e frases em dados massivos, mas essas conexões não existem na realidade. Para ser franco, elas apenas "soam parecidas". . Esse novo fenômeno agora é chamado de "alucinação". Para os produtores de conhecimento, saber usar a inteligência artificial para minerar os padrões e conexões na base de conhecimento existente, mas permanecer vigilante contra a “visão” da máquina, o que existe e o que é duvidoso, é uma habilidade muito importante.
"Diálogo" com IA também se tornará uma nova habilidade. A IA atual ainda é uma misteriosa "caixa preta" para a maioria das pessoas não técnicas (mesmo as pessoas técnicas). Como começar do nível inferior ou médio da tecnologia para falar com as máquinas de forma mais eficaz, entender e lutar contra a "visão" requer a cooperação de produtores de conhecimento e profissionais técnicos.
Para a pesquisa de novos conhecimentos, novas perspectivas e novos materiais, a estrutura única e a interpretação de cada campo ainda são muito importantes atualmente. Os modelos preditivos de grandes modelos de linguagem e IA generativa ainda tendem a ser únicos e repetitivos, e quanto mais limitado for o material de treinamento, mais limitadas serão as capacidades. Se você deseja combinar recursos de máquina e humanos, deve começar a partir da fonte de produção de dados, usar dados precisos, diversos, justos e novos para treinar modelos de IA e estabelecer um modelo benigno de interação humano-computador.
O advento de grandes modelos de linguagem e IA generativa é apenas o começo dos desafios para os pesquisadores. Em vez de se discutir "substituição", é melhor buscar a possibilidade de rodagem e desenvolvimento sob um olhar mais prudente.