なぜ MosaicML は設立わずか 2 年で 13 億ドルを売り上げたのでしょうか?

MosaicMLはビッグデータ大手Databricksに約13億米ドルで買収され、この取引で評価額は6倍となり、今年上半期で最大の買収となった。設立2年目で従業員数は60名以上ですが、MosaicMLの高い評価を支えているのは何でしょうか?

最近、AI分野への投資や買収の波が起きています。世界的に有名な企業である Salesforce は Anthropic に 4 億 5,000 万ドルを注入し、Runway は 1 億 4,100 万ドルの資金調達に成功しました。さらに、スノーフレークはNeevaの買収完了も発表し、中国国内大手の美団はAI企業のLight Years Awayを20億6,500万で買収した。

しかし、最も注目を集めた取引は間違いなく新興企業 MosaicML の買収でした。 MosaicMLはビッグデータ大手Databricksに約13億ドルで買収されたことがわかっており、この取引で評価額は6倍となり、今年上半期で最大の買収となった。設立2年目で従業員数は60名以上ですが、MosaicMLの高い評価を支えているのは何でしょうか?

Databricks が生成 AI テクノロジーの民主化を加速するために MosaicML を買収

Databricks は最近、企業向けに ChatGPT のようなツールを構築するサービスを提供するために、生成人工知能スタートアップの MosaicML を約 13 億ドル (約 93 億元) で買収したと正式に発表しました。

買収後、MosaicML は Databricks Lakehouse プラットフォームの一部となり、MosaicML のチームとテクノロジー全体が Databricks の旗の下に組み込まれ、企業にデータ資産を管理し、独自のデータを使用して構築できる統合プラットフォームを提供します。独自の生成 AI モデルを所有し、保護します。

2 年前に設立され、各従業員の価値は 2,100 万米ドルですが、なぜ MosaicML は 13 億米ドルを売り上げるのでしょうか?

MosaicML は、非常に若い生成 AI 企業です。2021 年にサンフランシスコで設立されました。公開された資金調達ラウンドは 1 回のみで、従業員数はわずか 62 人です。前回の資金調達ラウンドでの評価額は2億2,000万米ドルで、つまりMosaicML買収の評価額は直接6倍に跳ね上がった。この取引は、今年これまでに生成AI分野で発表された買収としては最大規模となる。少し前に、クラウド コンピューティングの巨人である Snowflake が、別の生成 AI 企業である Neeva の買収を発表したばかりです。数か月にわたる投資の熱狂を経て、生成 AI スタートアップの大規模な企業買収の波が進行中であるようだ。

Databricks はカリフォルニア大学バークレー校で誕生し、Apache Spark プロジェクトの開発に参加しました。データストレージと分析の巨人として、2022年の時点で評価額は310億ドルとなり、AT&T、シェル、ウォルグリーンなどの大企業のデータ処理を支援している。少し前に、より少ないパラメーターで ChatGPT と同様の効果を達成することを目的として、独自の大規模モデル Dolly を開いたところです。クラウド コンピューティングの人気が高まった後、Spark が提案した「レイクとウェアハウスの統合」という概念は、多くのビッグ データ スタートアップに深い影響を与えました。 2013 年の設立以来、Databricks は世界で最も注目されているデータ インフラ企業に急速に成長しました。昨年、Databricks は年間収益が 10 億ドルを超えると発表し、2021 年 8 月に最新の資金調達ラウンドを完了した後、最新の評価額は 380 億ドルに達しました。

MosaicML MPT シリーズ モデルの利点

MosaicML の MPT シリーズ モデルは、HuggingFace PretrainedModel 基本クラスからサブクラス化されており、HuggingFace エコシステムと完全に互換性があります。 MPT-7B モデルは、数十億のパラメータを備えた MosaicML の最も人気のあるモデルの 1 つで、2,000 を超える自然言語処理タスクを処理できます。その中で、MPT-7B の最適化レイヤーには、FlashAttendant や低精度レイヤー ノルムなどが含まれており、従来のトレーニング方法よりもモデルを 2 ~ 7 倍高速化でき、リソースのほぼ線形のスケーラビリティにより、数十億のモデルを確実に実行できます。のパラメータは、日ではなく時間単位でトレーニングに使用できます。 MosaicML はまた、300 億のパラメータを持ち、GPT-3 を上回る新しい商用利用可能なオープンソース大規模言語モデル MPT-30B をリリースしました。

2 年前に設立され、各従業員の価値は 2,100 万米ドルですが、なぜ MosaicML は 13 億米ドルを売り上げるのでしょうか?

データソース: MosaicML 主流モデルの MT-Bench 評価

MPT シリーズ モデルの利点は、高効率と低コストです。 「トレーニング」に大量のデータを使用する人工知能モデルの複雑さは急激に増加しており、モデルのトレーニングには少なくとも数百万ドルの費用がかかるようになり、大企業を除く中小企業には一般に手の届かない金額となっています。 MosaicML の MPT シリーズ モデルを使用すると、企業は独自の言語モデルを低コストかつ高効率でトレーニングできるため、生成 AI テクノロジーをより簡単に適用して、より優れたビジネス パフォーマンスを達成できます。ほとんどのオープンソース言語モデルは、最大でも数千のトークンを含むシーケンスしか処理できません (図 1 を参照)。ただし、MosaicML プラットフォームと 8xA100-40GB の単一ノードを使用すると、ユーザーは MPT-7B を簡単に微調整して、最大 65k のコンテキスト長を処理できます。この極端なコンテキスト長の適応を処理する機能は、MPT-7B の主要なアーキテクチャ上の選択肢の 1 つである ALiBi によって提供されます。

たとえば、『華麗なるギャツビー』の全文のトークン数は 68,000 未満です。あるテストでは、モデルの StoryWriter が『華麗なるギャツビー』を読み、エピローグを生成しました。モデル生成のエピローグの 1 つを図 2 に示します。 StoryWriter は約 20 秒で『華麗なるギャツビー』を読みました (1 分あたり約 150,000 ワード)。シーケンスの長さが長いため、「入力」速度は他の MPT-7B モデルより遅くなり、1 分あたり約 105 ワードになります。 StoryWriter は 65k のコンテキスト長で微調整されましたが、ALiBi を使用すると、モデルがトレーニングされたものよりも長い入力を推論できるようになります。つまり、『華麗なるギャツビー』の場合は 68k トークン、テストでは最大 84k トークンです。

2 年前に設立され、各従業員の価値は 2,100 万米ドルですが、なぜ MosaicML は 13 億米ドルを売り上げるのでしょうか?

図 2: MPT-7B-StoryWriter-65k+ は、『華麗なるギャツビー』のエピローグを書きました。エピローグの結果、「華麗なるギャツビー」の全文 (約 68,000 トークン) がモデルへの入力として提供され、その後に「エピローグ」という単語が続き、モデルが生成を続行できるようになります。

生成AI技術の普及

生成 AI テクノロジーは、大量のデータと深層学習アルゴリズムを使用して、元のテキスト、画像、コンピューター コードなどのコンテンツを自動的に生成する人工知能の分野です。このテクノロジーの出現により、人々はデータをより便利に処理および分析できるようになり、人間のニーズにさらに応えることができるようになります。ビッグデータと人工知能技術の急速な発展に伴い、生成AI技術は自然言語処理、画像認識、仮想現実などの分野で広く使用されています。たとえば、自然言語処理の分野では、GPT-4 は最も人気のある生成 AI モデルの 1 つとなっており、記事の生成、言語の翻訳、質問への回答などのタスクに使用できます。画像認識の分野では、StyleGAN2 は高品質の画像を生成でき、ゲーム開発、映画やテレビの制作、仮想現実に使用できます。

MosaicML の CEO である Naveen Rao 氏は、2018 年以降、「トレーニング」に大量のデータを使用する人工知能モデルの複雑さが急激に増加しており、現在モデルのトレーニングには少なくとも数百万ドルの費用がかかると述べました。一般的には余裕がありません。この買収後、Databricks の Lakehouse プラットフォームと MosaicML テクノロジーの共同製品により、企業は独自の独自データを使用して、生成 AI モデルを簡単、迅速、低コストでトレーニングおよび構築できるようになります。制御と所有権がなければ、カスタム AI モデルの開発には時間がかかる可能性があります。場所。 Databricks によると、Databricks と MosaicML のプラットフォームと技術サポートにより、企業の LLM のトレーニングと使用にかかるコストが大幅に削減され、数千ドルまで下がると予想されています。これにより、生成型 AI の普及が促進されます。

DatabricksによるMosaicML買収の意義

Databricks による MosaicML 買収の主な目的は、生成 AI テクノロジーの開発と民主化を加速することです。両社のテクノロジーとリソースを統合することで、Databricks は顧客のニーズをより適切に満たし、より効率的で便利なソリューションを提供できるようになります。具体的には、今回の買収により以下の点に変化がもたらされます。

1. より効率的な大規模言語モデル

Databricks が MosaicML を買収した後、MPT シリーズ モデルを Lakehouse プラットフォームに統合して、より効率的で低コストの大規模言語モデルを顧客に提供できるようになります。これにより、企業は自然言語処理タスクをより適切に処理し、ビジネスの効率と精度を向上させることができます。

2. モデルのトレーニング速度の高速化

MosaicML の MPT シリーズ モデルは高速トレーニングを特徴としており、Databricks がより高速なモデル トレーニング サービスを提供するのに役立ちます。これは、市場の需要に迅速に対応し、顧客のニーズをより適切に満たす必要がある企業にとって特に重要です。

3. 民主化の拡大

Databricks による MosaicML の買収は、生成 AI テクノロジーの民主化がさらに進むことも意味します。 MosaicML の MPT シリーズ モデルを使用すると、中小企業が独自の言語モデルをトレーニングしやすくなり、生成 AI テクノロジーをより適切に適用して、より良いビジネス パフォーマンスを達成できるようになります。これにより、生成AI技術の開発と応用が促進され、人工知能技術の普及と発展が促進されます。

要約

生成 AI アプリケーションは、ユーザーの自然言語の手がかりに基づいて生のテキスト、画像、コンピューター コードを生成するように設計されています。人工知能の新興企業OpenAIが昨年11月にオンラインの生成型AIチャットボットであるChatGPTを発表して以来、このテクノロジーへの関心が高まっている。 「すべての組織が AI 革命の恩恵を受け、データの使用方法をより詳細に制御できるようにする必要があります。Databricks と MosaicML には、AI を民主化し、Lakehouse をビルド生成の強力な場所にする素晴らしい機会があります。人工知能にとって最適な場所です。 」と Databricks の共同創設者兼 CEO である Ali Ghodsi 氏は述べています。

DatabricksによるMosaicML買収の意義は、生成AI技術の開発と民主化を加速するだけでなく、両社の技術とリソースを統合して顧客により効率的で便利なソリューションを提供することでもある。人工知能技術の急速な発展と応用に伴い、生成 AI 技術の役割はますます重要になると考えられており、Databricks による MosaicML の買収は、この方向におけるさまざまな企業の重要性と投資も反映しています。 Anthropic や OpenAI などの企業は、既製の言語モデルを企業にライセンスし、企業はその上に生成 AI アプリケーションを構築します。これらのモデルに対する強い商業需要によって、MosaicML のようなスタートアップ企業にチャンスが生まれています。 Snowflake と Databricks の相次ぐ買収から、大手テクノロジー企業が、独立した研究開発と戦略的投資から、生成 AI テクノロジーの合併と買収へと徐々に移行していることがわかります。

参照元:

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)