Definitivamente, acho que é óbvio que você recebe novas ordens de emergência/beleza/coerência com RL. Mas, claro, isso também abre caminho para todos os tipos de danos e perdas.


Eu até acho que RL pode tornar os modelos melhores em "simular" do que os modelos base! (, por exemplo, tornando-os autocorretivos de maneira agente)
THINK-4.25%
GET0.71%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 6
  • Republicar
  • Partilhar
Comentar
0/400
AirdropHunterWangvip
· 6h atrás
o efeito rl é bom, mas é perigoso.
Ver originalResponder0
TokenVelocityvip
· 6h atrás
rl está a ser uma trapaça
Ver originalResponder0
WhaleWatchervip
· 7h atrás
A auto-correção do modelo pode ser mais confiável do que os humanos.
Ver originalResponder0
SelfCustodyIssuesvip
· 7h atrás
rt realmente analisa os dois lados de forma convincente, quem entende, entende.
Ver originalResponder0
IfIWereOnChainvip
· 7h atrás
Mais uma decisão que sacrifica a segurança.
Ver originalResponder0
DataPickledFishvip
· 7h atrás
Só treina, não escreve código.
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)