A brecha no artigo de Tao Zhexuan foi descoberta pela IA, e a previsão de 26 anos se tornará realidade! Adivinhando a direção da pesquisa olhando para o nome do teorema, o grande deus chamou a habilidade de IA de incrível

Fonte do artigo: New Zhiyuan

Recentemente, Tao Zhexuan, um deus da matemática que está interessado em usar GPT-4 e Copilot para fazer pesquisas, descobriu um bug escondido em seu artigo com a ajuda da IA!

Tao Zhexuan disse que no processo de formalização do argumento na página 6 com Lean4, ele encontrou que as expressões

Em n = 3 e k = 2, é realmente divergente.

Este bug não tão óbvio foi capturado a tempo graças ao Lean4.

O motivo é que Lean pediu que ele construísse o 02. Como resultado, o Lean não pode ser baseado em um 0 negativo

Felizmente, este é apenas um pequeno bug que só existe quando o valor n é pequeno. Neste ponto, você só precisa modificar algumas constantes no papel.

Alguns fãs entusiastas da matemática exclamaram neste post: Isso é incrível, e é ótimo ver a disseminação de assistentes de prova de IA, estabelecendo uma base mais sólida para o futuro da pesquisa matemática.

Tao Zhexuan disse que isso é totalmente possível.

Talvez em um futuro próximo, possamos construir uma camada de IA em cima do Lean.
Ao descrever as etapas da prova para a IA, a IA pode usar o Lean para executar a prova e, no processo, também pode recorrer a vários pacotes de álgebra computacional.

Em junho deste ano, Tao Zhexuan previu em um blog sobre a experiência de teste GPT-4 -

Em 2026, a IA será combinada com ferramentas de pesquisa e matemática simbólica para se tornar um coautor confiável em pesquisa matemática.

Durante este período, há pessoas que continuam a provar isso. Por exemplo, estudiosos do Caltech, NVIDIA, MIT e outras instituições construíram um provador de teorema baseado em LLM de código aberto.

E Tao Zhexuan também praticou isso, e o novo artigo começou a ser escrito em GPT-4, e repetidamente exclamado - a incrível habilidade do GitHub Copilot me deixa desconfortável!

AI Abençoando Deus Pesquisa Matemática

Recentemente, Tao Zhexuan "entrou completamente no poço" da IA.

Com a ajuda do GPT-4, ele começou a aprender a escrever artigos e fazer pesquisas matemáticas com o Lean4.

Ele estava tão animado com o processo que postava no Mastodon a cada poucas horas para registrar seus aprendizados e experiências.

Ao escrever um artigo sobre a desigualdade de McLaughlin, Tao fez uso extensivo de ferramentas de IA como GPT-4, Copilot e Lean4.

Endereço:

À medida que avançamos, Tao completou o reparo do argumento na Seção 2 do artigo em Lean4.

No entanto, o processo foi muito mais tedioso do que ele esperava, e cada linha de prova levou cerca de uma hora para ser formalizada.

Durante a primeira semana do projeto, seu gargalo foi sua falta de familiaridade com a sintaxe e ferramentas Lean; Mas o gargalo atual está nas próprias ferramentas – não tão avançadas quanto as dos pacotes de álgebra computacional.

Por exemplo, em uma linha de seu artigo, ele afirma que a desigualdade:

Pode ser reorganizado como:

Supondo que todos os denominadores são positivos, esta é uma tarefa muito rápida para cálculos manuais e pode ser feita com bastante facilidade em qualquer pacote de álgebra computacional padrão.

O Lean tem ferramentas automáticas muito úteis para lidar com operações lineares, mas atualmente não existe nenhuma ferramenta para simplificar automaticamente expressões complexas envolvendo expoentes.

Portanto, temos que lidar com a lei exponencial e outras operações mencionadas acima passo a passo, e esse processo é muito demorado.

No final, Tao decidiu não usar a notação assintótica nesta parte do argumento, mas estabelecer uma desigualdade com uma constante C definida:

daí em diante

Inicialmente, Tao pensou que seria "mais simples" provar desigualdades com valores como C=7. No entanto, era complicado usar as ferramentas existentes para provar rigorosamente o C≤7, então a ideia foi abandonada em favor de um valor C mais formalmente operacional. Agora selecionado, o valor é de cerca de 6,16.

A este respeito, alguns internautas curiosos perguntaram: "Como a IA faz em provar a velocidade em comparação com a aritmética da mão?"

Tao Zhexuan disse que, com base em suas próprias observações, os tipos de tarefas que são mecânicas para pacotes de álgebra computacional e calculadoras não são necessariamente mecânicas para assistentes formais de prova.

Mas, com o advento dos LLMs, devemos ser capazes de unificar todas as ferramentas auxiliadas por computador em uma ferramenta universal e fácil de usar. E esta ferramenta terá todos os benefícios de cada componente.

Inclusive, em um futuro próximo, também podemos imaginar a construção de uma camada de IA em cima do Lean -

As etapas da prova são descritas para a IA em "Inglês Matemático", e a IA pode então tentar executá-la usando Lean, talvez invocando um pacote de álgebra computacional no processo.

Copiloto pode adivinhar os próximos passos

Anteriormente, neste artigo sobre a pesquisa de desigualdade de McLaughlin, Tao Zhexuan ficou surpreso ao descobrir que Copilot era capaz de prever o que ele queria fazer a seguir!

Não só pode prever corretamente as múltiplas linhas de código usadas para várias verificações de rotina, mas também pode deduzir em que direção ele quer fazer sua pesquisa com base no nome do teorema fornecido por Tao Zhexuan.

Isso fez Tao Zhexuan exclamar repetidamente: É incrível!

No processo de prova do teorema 1.3 no artigo, Tao Zhexuan usou Lean4 para completar a formalização da prova do teorema.

No artigo, há apenas uma página no processo de prova, mas a prova formal usa 200 linhas de Lean4.

Por exemplo, no artigo, Tao Zhexuan apenas assume

é convexa em qualquer número real de a>0 e a desigualdade de Jensen é chamada depois. Mas o código leva cerca de 50 linhas.

No processo, o Copiloto do GitHub mostrou todos os tipos de previsões divinas e previu magicamente a próxima direção da pesquisa de Tao Zhexuan.

A estratégia de reescrita de Lean permite que ele revise longas suposições ou metas por meio de substituições direcionadas.

Este recurso é extremamente importante porque permite que as pessoas manipulem livremente essas expressões sem ter que inseri-las em sua totalidade o tempo todo.

Comparativamente falando, em LaTex, esta operação é muito mais complicada.

Tao Zhexuan disse que precisava simular aproximadamente a estratégia de reescrita do Lean4 e fazer edições direcionadas em expressões longas de uma linha para a outra através de operações como cortar e colar. Isso pode fazer com que erros de digitação se espalhem por várias linhas no documento.

O Lean4 pode fazer essa reescrita de forma automatizada e verificável.

É claro que o Lean 4 não é uma panaceia no momento, e há algumas limitações. Por exemplo, reescrever expressões envolvendo variáveis de restrição nem sempre é fácil.

Tao Zhexuan disse que está ansioso para quando é fácil usar a linguagem natural para pedir LLM para fazer tal conversão.

No pit GPT-4 + Copiloto GitHub, Crazy Amway

Já no início de setembro, Tao Zhexuan postou um post elogiando o efeito do ChatGPT na geração de código Python - economizando diretamente meia hora de carga de trabalho!

Como um experimento, ele pediu ao ChatGPT para escrever um pedaço de código Python que calcula o comprimento M(n) da subsequência mais longa de 1,...,n para cada número natural n, onde o φ da função onipotente de Euler não diminui.

Por exemplo, M(6)=5 porque φ não diminui em 1,2,3,4,5 (ou 1,2,3,4,6) mas não em 1,2,3,4,5,6.

Curiosamente, ele gerou um pedaço de código extremamente engenhoso para calcular funções onipotentes, que foi tão engenhoso que Tao teve que olhar para ele por vários minutos antes de entender qual era o princípio por trás do código.

É claro que este código também é tendencioso - considera apenas subsequências de inteiros contínuos, não subsequências arbitrárias.

No entanto, isso é perto o suficiente, usando este código inicial gerado pelo ChatGPT como ponto de partida, Tao Zhexuan finalmente gerou manualmente o código que ele queria, o que lhe salvou cerca de meia hora de trabalho.

Uma vez que os resultados dados pelo ChatGPT são muito bons, Tao Zhexuan disse que ele vai usá-lo com frequência no futuro para fornecer código inicial para cálculos semelhantes.

Logo, Tao Zhexuan postou novamente que havia entrado no GitHub Copilot sob a recomendação dos internautas!

Sem surpresa, o desempenho subsequente de Copilot foi uma verdadeira surpresa para ele - apenas dando o parágrafo de abertura e adicionando uma frase, a IA recomendou algo muito próximo de sua própria visão.

Tao Zhexuan só precisa fazer pequenas modificações nessas sugestões, e ele pode completá-las em menos da metade do tempo originalmente planejado.

Em outubro, Tao Zhexuan descobriu que, embora o GPT-4 não pudesse fornecer ajuda direta para o jogo, quando ele começou a usar o Lean, o GPT-4 se tornou muito útil.

À medida que os níveis se tornam cada vez mais difíceis, o papel do GPT começa a mostrar-se.

Nos casos em que é óbvio que Z é o resultado de X e Y, perguntar ao GPT "Como posso provar Z se já conheço X e Y?" pode resolver todos os tipos de problemas gramaticais sutis no processo.

Além de conteúdo relacionado a profissionais, Tao Zhexuan descobriu que poderia usar DALL· E 3 e imediatamente começou a jogar.

Netizen: LLM pode fazer excelentes pessoas 10.000 vezes melhor

O fato de o grande deus ser tão obcecado por ferramentas de IA em pesquisas matemáticas também despertou discussões acaloradas entre os internautas.

Algumas pessoas disseram que Okami começou a aprender Lean4 com a ajuda do GPT-4 no início deste mês, e de vez em quando ele registrará seu progresso de aprendizagem no mastodonte.

Também mostra que, para as pessoas mais bem-sucedidas, os LLMs podem acelerar seu trabalho.

Algumas pessoas dizem que mesmo as pessoas que não podem escrever código, desde que sejam um bom comunicador LLM, podem automatizar funções rapidamente.

No entanto, se apenas indivíduos altamente qualificados puderem usar LLMs de forma eficaz, o resultado é que a desigualdade entre as pessoas pode aumentar.

Alguém imediatamente se apresentou para dizer que era verdade, seu amigo não podia escrever nada além de fórmulas do Excel, mas agora, ele pode escrever aplicativos Python com GPT-4!

Como um programador com 30 anos de experiência em desenvolvimento, ele também precisa implorar para que ele ensine essa tecnologia.

O seu sucesso deve-se provavelmente à sua capacidade de comunicar com LLMs.

Foi previsto que, com o tempo, as pessoas que usam LLMs colherão benefícios esmagadores, independentemente de sua própria inteligência, e subirão cada vez mais alto na escada para se tornarem especialistas em exames.

Para a elite, eles podem receber um aumento de 100 vezes dos LLMs, e para os engenheiros de topo, é cerca de 10.000 vezes o impulso.

Recursos:

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)