MiniMax Código aberto primeiro modelo de inferência: comparado ao DeepSeek, o custo de poder de computação é de apenas cerca de 530 mil dólares.

Gate News bot mensagem, MiniMax anunciou a 17 de junho que irá lançar atualizações importantes durante cinco dias consecutivos. Hoje, o primeiro é o modelo de inferência Código aberto MiniMax-M1.

De acordo com o relatório oficial, o MiniMax-M1 em várias avaliações de desempenho está à altura do DeepSeek-R1, Qwen3 e outros modelos de Código aberto, aproximando-se dos modelos mais avançados do exterior.

O blog oficial também mencionou que, com base em duas grandes inovações tecnológicas, o processo de treinamento do MiniMax-M1 foi tão eficiente que "superou as expectativas", levando apenas 3 semanas e 512 placas H800 GPU para concluir a fase de treinamento por reforço, com um custo de aluguel de computação de apenas 53,47 mil dólares. Isso é um ordens de magnitude menor do que a expectativa inicial.

Fonte da notícia: Jin Shi

Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)