Gate News bot のメッセージ、MiniMaxは6月17日に重要な更新を5日間連続で発表することを発表しました。今日の第一弾はオープンソースの最初の推論モデルMiniMax-M1です。公式の報告によると、MiniMax-M1は複数のベンチマークテストでDeepSeek-R1やQwen3などのオープンソースモデルに匹敵し、海外の最先端モデルに迫るものとなっています。公式ブログでは、二つの技術革新に基づき、MiniMax-M1のトレーニングプロセスが効率的で「予想を超えた」と述べています。わずか3週間で、512台のH800 GPUを使用して強化学習のトレーニングステージを完了し、計算力のレンタルコストはわずか534,700ドルでした。これは当初の予想よりも1桁少ないです。ソース: ゴールデンテン
MiniMaxオープンソース初の推論モデル:DeepSeekに対抗し、コンピューティングパワーコストは約53万ドル
Gate News bot のメッセージ、MiniMaxは6月17日に重要な更新を5日間連続で発表することを発表しました。今日の第一弾はオープンソースの最初の推論モデルMiniMax-M1です。
公式の報告によると、MiniMax-M1は複数のベンチマークテストでDeepSeek-R1やQwen3などのオープンソースモデルに匹敵し、海外の最先端モデルに迫るものとなっています。
公式ブログでは、二つの技術革新に基づき、MiniMax-M1のトレーニングプロセスが効率的で「予想を超えた」と述べています。わずか3週間で、512台のH800 GPUを使用して強化学習のトレーニングステージを完了し、計算力のレンタルコストはわずか534,700ドルでした。これは当初の予想よりも1桁少ないです。
ソース: ゴールデンテン