国産AI大型機種の第一弾が出たとき、ネット上ではこうした疑問の声が広く流れた。オープンソースではない大規模な AI モデルの場合、その潔白を証明するのは難しく、ChatGPT API を呼び出していないことを証明するために、推論サーバーを移動し、ネットワーク ケーブルを引き抜いてデモンストレーションを行う企業もありました。スポット。
オープンソースは間違いなく、大規模な AI モデルを自己認証する最良の方法の 1 つです。しかし、**オープンソースの本当の価値は、自己認証能力ではなく、生態系を掌握することにあります。 **
「LLaMA 2のリリース後、間違いなくOpenAIエコシステムをすぐに掌握するだろう。」ある大規模モデル開発者はHuxiuに対し、GPT-4は最も強力な機能を持つと業界でほぼ認識されているが、GPT-3以降のモデルはオープンソースではないと語った。また、GPT-4 の API インターフェースのオープン性も非常に低いため、GPT モデルの開発には多くの制限があります。その結果、多くの開発者は LLaMA などのオープンソース モデルを選択しており、これらのオープンソース モデルは命令を微調整できるだけでなく、基礎となるモデルの研究も行うことができます。
一方、オープンソース モデルはローカルにダウンロードして民営化された展開ができるため、営利企業の AI トレーニングが容易になります。このような企業の AI アプリケーションは、自社のビジネス データに基づいてトレーニングする必要があり、プライベートに展開された大規模な AI モデルにより、データ セキュリティを最大限に保護できます。同時に、クラウド サービス、ローカル展開、さらには複数の IDC の分散コンピューティング能力など、民営化された展開のためのコンピューティング能力の選択肢が増え、モデルのトレーニングと推論のコストが大幅に削減されます。
オープンソース モデルに基づくトレーニングとチューニングは、ほとんどの IT 担当者にとって難しいことではありません。ただし、モデルの詳細な研究と開発を実行するには、アルゴリズムと AI の点である程度の技術的予備力がまだ必要です。大規模な AI モデルの概念がますます一般的になるにつれて、この分野の人材の価格も上昇しています。
インターネット ビジネスに携わるほとんどの企業は、独自の IT 研究開発チームを持っており、大きなモデルが到来すれば、すぐに AI アプリケーションを開発するための「確立された」チームを形成できるようになるでしょう。しかし、多くの小売業、伝統的な製造業、サービス業にとって、デジタル変革は困難な問題であり、AI の大規模モデルのトレーニング、導入、推論を研究することは非常に困難です。
こうした企業にとって、最適な AI 製品は汎用 AI プラグインです。 「私たちが必要としているのは、会話がそれほどばかげていない顧客サービスロボットだけです。私はモデルをトレーニングする方法を学ぶように頼んだのですが、それは少し刺激的です。」ある電子商取引ブランドのビジネスラインマネージャーは Huxiu に次のように語った。 AIの対話能力が以前より強化されていると言われていますが、ChatGPTはまだ試していません。彼は新しいテクノロジーを積極的に受け入れるつもりですが、今、学習に時間を費やし、AI に資金を投資するのは十分な動機ではありません。
「** 販売者はそれを行うために AI を必要としています。そして、それは感情を抱かずに適用され、強化されることができます。**」 SaaS メーカーの Weimob は、デジタル マーケティングにおいてそのようなアプリケーション WAI を作成しました。これは、販売者が既存のアプリケーションを埋め込む形で AI 機能を呼び出すのに役立ちます。大規模な言語モデルに基づいた AI 対話機能とテキストおよび画像生成機能を販売者に提供します。
アルゴリズム レベルでは、オープンソース AI の大規模モデルは比較的後期の段階にあります。初期の AI 研究開発では、ほぼすべての AI モデルで機械学習フレームワークが使用されていました。これは AI ツールボックスの構築に相当します。 TensorFlow、Pytorch、PaddlePaddle (フライングパドル) など、現在の主流の機械学習フレームワークはすべてオープンソース フレームワークです。
Zhiyuan Research Institute のような非営利組織の場合、モデルがオープンソースかクローズドソースかに関係なく、商業的な考慮事項はあまりないかもしれません。しかし、Microsoft、Google、Meta、OpenAI、または国内の Zhipu AI や Baichuan Intelligent のいずれであっても、商用 AI 企業にとって、大規模な AI モデルは間違いなく「科学研究」だけを目的としたものではありません。 **
OpenAIが危機に瀕している
制作 | Tiger Sniff Technology Group 著者 | チー・ジャン 編集者 | 廖英
8 月 7 日、別の国内 AI スタートアップ企業が、独自のオープンソースで無料の商用 AI モデル XVERSE-13B をリリースしました。 Yuanxiang XVERSE という会社は、Tencent の元副社長であり Tencent AI lab の創設者である Yao Xing によって設立されました。
Metaが7月にオープンソースのLLaMA 2シリーズ大型モデルを商用無料で公開して以来、AI大型モデル市場では「オープンソース」の新たな波が巻き起こっている。
8月2日、Baidu傘下のAI大規模モデルプラットフォームWenxin Qianfanは、LLaMA2のオープンソースモデル全シリーズへのアクセスを発表し、プラットフォーム上で呼び出せる大規模モデルの数が33に増加した。 3 つの Wenxin モデルを除き、他の 30 のモデルはすべてオープンソースです。モデルには、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon などが含まれます。
その翌日、Alibaba Cloudもオープンソースモデルの仲間入りを発表した。オープン ソースの Tongyi Qianwen 70 億パラメータ モデルには、一般モデル Qwen-7B と対話モデル Qwen-7B-Chat が含まれており、この 2 つのモデルは Mota コミュニティで公開されており、オープン ソース、無料、商用利用可能です。
興味深いことに、オープンソースとオープン性に対するこの積極的な姿勢は、クローズド ソース モデル ChatGPT の大所有者である Microsoft から始まりました。 ** 7 月 18 日、Microsoft は Meta と協力して LLaMA 2 モデルのオープンソース商用版をリリースし、OpenAI および Google モデルの代替手段を企業に提供すると発表しました。 **AIの大規模モデル市場におけるOpenAIの独占的地位は、最も近いパートナーを含む業界全体によって「標的にされている」ようです。
OpenAI の GPT-4 は、世界的に最も認知されている大規模言語モデルとして、現在、多くのユーザーが料金を支払う意思のある唯一の大規模言語モデルです。
クラスのトップの生徒は通常、学習グループに参加する意欲がありません。同様に、**OpenAI にはオープンソースにする理由も動機もありません。 **
しかし、LLaMA 2 の完全なオープンソースにより、ますます多くの開発者がメタやさまざまなオープンソース モデルに投資しています。 Android がオープンソースを使用して iOS と戦うのと同じように、多数のオープンソース AI モデルが GPT-4 の技術的障壁を積極的に回避し、オープンソース エコシステムで OpenAI を取り囲んでいます。 **
なぜオープンソースなのか?
OpenAI が最初にプラグイン機能をリリースしたとき、多くの人が AI モデルを将来の Windows、iOS、Android と比較しました。さて、LLaMA 2のリリースにより、AI大型モデルは機能だけでなく、市場構造までもがOSの方向に発展しつつあります。
カリフォルニア大学バークレー校が主導する組織 LMSYS Org が主催する、大規模言語モデル (LLM) のランキング コンテストです。7 月 20 日の時点で、最新版のランキングでは 40 の大規模 AI モデルがカウントされており、上位 5 つはまだ決まっていません。ソースモデル (独自)、GPT-4、GPT-3.5-turbo、Claude の 3 つのモデルです。ただし、Google の PaLM-Chat-Bison-001 を除く以下の 34 モデルはすべてオープンソース モデルであり、そのうち 15 モデルは非商用です。
モデルの機能という点では、市場全体を見ると、オープンソースかクローズドソースかを問わず、GPT-4 と真っ向から競合できるモデルはありません。しかし、タイガースはオオカミに対抗することはできず、GPT-4 の大型モデルに勝つこともできず、「車線を変更して追い越す」ことを選択し、オープンソースを使用してアプリケーションのエコロジーを掌握することを選択したようです。これは Android の iOS に対する戦いに似ています。
「現時点では、すべてのオープンソースの大きなモデルには 1 つの目的があります。それはマーケティングです。」
国内のオープンソース大規模モデルの研究開発会社の創設者は、オープンソースの大規模モデルとオープンソースの Android システムを推進する主な理由は無料で市場をつかむことであると Tiger Sniff に認めました。 「多くの大企業が大規模な AI モデルをリリースしたり、既存のモデルに基づいてアプリケーションを作成しただけで、それを大々的に宣伝し始めました。実際、基本的な大規模モデルのユーザーにとって、広告に費やす費用が高くなるのは事実です」これは、AI 企業が自社の強みを証明する最良の方法でもあります。
まず、オープンソース モデルはクローズド モデルよりも評価が簡単です。オープンソース モデルのコードとデータセットは公開されているため、研究者はモデルのアーキテクチャ、トレーニング データ、トレーニング プロセスを直接検査してモデルをより深く分析し、その長所と短所を理解できます。
「一部の AI 大型モデルは非常に有能であるように見えますが、それらはオープンソースではなく、彼の出力の結果のみを見ることができます。」
オープンソース モデルと比較して、クローズド ソース モデルは、モデルのパフォーマンス評価を通じてのみモデルの長所と短所を理解できます。これは、クローズドソース モデルのパフォーマンスが人為的に誇張されたり、その欠点が隠されたりする可能性があるという事実につながります。オープンソース モデルの透明性は、開発者がモデルをより深く理解し、より公平に評価するのに役立ちます。
後発企業にとって、クローズドソース モデルには別の問題があります。それは、テクノロジーの独自性が疑問視されやすいということです。多くの大規模モデル開発者はかつて Huxiu にこう語った。「オープンソースではないモデルの場合、率直に言って、それがシェル LLaMA であっても、バックグラウンドで ChatGPT インターフェイスを呼び出すだけであっても、誰にも分かりません。」
国産AI大型機種の第一弾が出たとき、ネット上ではこうした疑問の声が広く流れた。オープンソースではない大規模な AI モデルの場合、その潔白を証明するのは難しく、ChatGPT API を呼び出していないことを証明するために、推論サーバーを移動し、ネットワーク ケーブルを引き抜いてデモンストレーションを行う企業もありました。スポット。
オープンソースは間違いなく、大規模な AI モデルを自己認証する最良の方法の 1 つです。しかし、**オープンソースの本当の価値は、自己認証能力ではなく、生態系を掌握することにあります。 **
「LLaMA 2のリリース後、間違いなくOpenAIエコシステムをすぐに掌握するだろう。」ある大規模モデル開発者はHuxiuに対し、GPT-4は最も強力な機能を持つと業界でほぼ認識されているが、GPT-3以降のモデルはオープンソースではないと語った。また、GPT-4 の API インターフェースのオープン性も非常に低いため、GPT モデルの開発には多くの制限があります。その結果、多くの開発者は LLaMA などのオープンソース モデルを選択しており、これらのオープンソース モデルは命令を微調整できるだけでなく、基礎となるモデルの研究も行うことができます。
「LLaMA は OpenAI よりも開発者の間で間違いなく人気があります。」
LLaMA 2 が 7 月 19 日に初めてリリースされたとき、GitHub 上には「LLaMA」を含むキーワードを持つ 5,600 以上のプロジェクト、「GPT-4」を含む 4,100 以上のプロジェクトがありました。リリースから 2 週間後、LLaMA の成長速度はさらに速くなり、この記事の執筆時点で、「LLaMA」は 6,200 以上、「GPT-4」は 4,400 以上あります。
一方、オープンソース モデルはローカルにダウンロードして民営化された展開ができるため、営利企業の AI トレーニングが容易になります。このような企業の AI アプリケーションは、自社のビジネス データに基づいてトレーニングする必要があり、プライベートに展開された大規模な AI モデルにより、データ セキュリティを最大限に保護できます。同時に、クラウド サービス、ローカル展開、さらには複数の IDC の分散コンピューティング能力など、民営化された展開のためのコンピューティング能力の選択肢が増え、モデルのトレーニングと推論のコストが大幅に削減されます。
ChatGPT はわずか 2 か月で月間アクティブ ユーザー数 1 億人を獲得しましたが、開発者エコシステムでは、オープンソース モデルがユーザーの心をつかむ速度はさらに速いようです。
現在、国内のAI企業の多くはオープンソースモデルのリリースを選択しています。これらには、Zhipu AI がリリースしたオープンソース モデル ChatGLM-6B、復旦大学がリリースした MOSS、Zhiyuan Research Institute がリリースした Wudao Tianying Aquila、Baichuan Intelligent がリリースした Baichuan-7B (13B) が含まれます。そのうち、**Zhipu AI がリリースしたオープンソースの大型モデルである ChatGLM-6B は、世界中で 400 万回以上ダウンロードされ、GitHub で 32,000 個のスターを獲得しており、LLaMA よりも 3,000 個多いスターを獲得しています。 **
「オープンソースモデルを作らなければ、すぐに市場はLLaMAでいっぱいになるだろう。」 オープンソースモデルを立ち上げたAI企業の幹部は、オープンソースは中国のAI開発における重要なステップであるとHuxiuに語った。大型モデル。
実際、LLM のトレンドが始まる前に、生成 AI はすでにオープンソースとクローズドソースの戦いを戦っていました。
**多数の開発者と製品アプリケーションを抱えたオープンソースの Wensheng グラフ モデル Stable Diffusion は、OpenAI の最初のクローズドソース モデル Dall-E 2 を窮地に追い込むところでした。 ユーザーは一般に、Stable Diffusion のモデル機能は別のクローズドソース製品 MidJourney ほど優れていないと考えていますが、 Stable Diffusion は、そのオープンソースと無料という特性により、多くの Vincent グラフ市場を掌握し、最も主流の Vincent グラフ モデルであり、その開発会社 RunwayML And Stability AI も多くの注目と資金提供を受けています。 **
LLaMA 2 のオープンソース モデルは、LLM の分野で OpenAI を強制することを意図しているようです。
グッズを備えたオープンソース
LLaMA 2 は現在オープンソースであり、シリーズの 3 つのモデル (70 億、130 億、700 億パラメータ バージョン) がすべてオープンソースです。しかし、市場では「メタには実はパラメータが大きいバージョンがまだリリースされていない。次のバージョンにはパラメータが大きいバージョンがあるかもしれないが、オープンソースではないかもしれない」という噂もある。
現時点では、多くのオープンソース モデルがすべてオープンソースであるわけではないことに注意してください。 Zhiyuan Research InstituteがリリースしたEnlightenment 3.0モデルでは、「Tianying」基本言語モデルのみがオープンソースであり、Zhipu AIがリリースしたChatGLMは一連のモデルの一部のみが公開されており、より大きな1,300億パラメータのモデルはまだ公開されていません。クローズドソース。 **
LLaMA 2が大型モデル向けに「予約」されているかどうかに関係なく、「無料」形式は間違いなく大型モデル市場でのメタの形成を加速し、それをAndroidの「古い道」に押し込むでしょう。
Android システムは、オープンソース エコシステムを通じて、世界中に多数の開発者とユーザーを蓄積してきました。テクノロジーエコロジーの観点からは、主要なクローズドソースシステムiOSを大きく抑制し、バランスを取り、一部の市場では独自の独占を形成することさえありました。 2018年以来、欧州連合はAndroidシステムの独占メカニズムを理由にGoogleに40億ユーロ以上の罰金を課している。この高額な罰金からも、オープンソースの Android システムがいかに収益性が高いかが分かります。
調査会社Sensor Towerのレポートによると、Google Playへのユーザー支出は2022年に約530億米ドルとなり、この数字は2023年には600億米ドルに増加すると予想されています。別の調査機関 Statista が発表したレポートによると、2022 年 1 月の時点で、Google Play ストアには約 140,000 のアプリケーションがあります。
現段階では、オープンソース AI モデルは明らかにまだ携帯電話ほど普及していません。しかし、たとえAIが実際に携帯電話と同じくらい人気があるとしても、Metaのような巨人はLLaMA 2で多額の利益を上げた企業を簡単に手放すことはないだろう。
LLaMA 2 のオープンソース契約には、次のような規定があります。 **月間アクティブ ユーザー数が 7 億人を超える場合は、Meta からライセンスを申請する必要があります。 Meta は独自の裁量でお客様にライセンスを付与することができますが、お客様はこれらの権利を行使する権利を有しないものとします。 **
同時に、オープンソース モデルのクローズドソース バージョンと AI の大規模モデルのアプリケーションに加えて、**コンピューティング パワーの「成果物をもたらす」**こともできます。
中国で最初に AI 大規模モデルを推進した 2 つのメーカー、Baidu と Ali は、どちらもクラウド メーカーです。他の 2 つのクラウド ベンダーである Tencent Cloud と Huawei Cloud も、Wenxin Yiyan や Tongyi Qianwen のような LLM 製品を持っていませんが、AI モデルについても叫び続けています。この背後にある主な理由は、クラウド上の大型モデルの「キャリー効果」です。
「AIの大規模モデルに関するいくつかのアクションの発表も、市場と顧客が共同で推進している。ここ数カ月間、大規模モデルについて問い合わせに来る顧客が多すぎる」とテンセントのクラウドビジネスリーダーは語った。 Huxiu の計算能力がキューに達したことは、AI 大型モデルが物品を運ぶ能力があることの最良の証拠です。
**モデルは利益を得る必要はありませんが、コンピューティング能力は利益を生む必要があります。 **Alibaba は Tongyi Qianwen をオープンし、Baidu は Wenxin Qianfan 大規模モデル プラットフォームに 30 のオープンソース モデルを導入しました。これら 2 つのアクションは、ユーザーに「無料」の AI 機能を提供することです。オープンソース モデルを使用するユーザーは AI に料金を支払う必要はなくなりましたが、AI が Alibaba Cloud と Baidu Smart Cloud 上で実行される限り、コンピューティング パワーの料金を支払わなければなりません。
「AI もクラウドの考えに立ち返り、クラウドから収益を上げる必要があります。」Baidu スマート クラウド AI およびビッグデータ プラットフォームのゼネラル マネージャーである Xin Zhou 氏は、大型モデルプラットフォームは、顧客のビジネスに価値を創造することを目的としており、価値を創造しながら、古い顧客の定着率を高め、より多くの新規顧客を拡大することができます。これはクラウドベンダーのスケール効果を拡大する上で大いに役立つ。
無料の方が高価です
「1000万って、大型モデルのカスタム開始価格と同じくらいですね」
オープンソースの大規模モデル会社の創業者は、電話で相談に来た仲介業者に見積もりを提示した。
「オープンソース モデルがユーザーに認知されたら、カスタム開発のサービス料金について他の人に相談できます。」 創設者は電話を切った後、LLaMA 2 のようなモデルの開発コストは次のとおりであると Huxiu に説明しました。少なくとも数千万ドルの費用がかかります。したがって、彼が狙う市場は開発コストの数十倍、数百倍に違いない。
現在の観点から見ると、**AI 企業がオープンソース モデルから収益を得る最善の方法は、サービスから始めることです。 **
幸いなことに、AI 大規模モデルのほとんどのユーザーはこれらのサービスを非常に必要としています。
「モデルはオープンソースで、無料で商用利用可能です。つまり、モデルのダウンロードから始まり、モデルのデプロイ、トレーニング、チューニング、実際のアプリケーションでのアプリケーション開発まで、すべての作業を自分で行う必要があります。」 LLaMA アプリケーション開発者Huxiu 氏によれば、クローズドソース モデルのほとんどのサプライヤーはトレーニングと導入サービスを提供しており、ユーザーのニーズに応じて開発機能をカスタマイズできます。しかし、オープンソース モデルを使用する場合、これらすべてのタスクを自分で行う必要があり、誰もトレーニングを手伝ってくれず、計算能力を見つけてくれず、開発のカスタマイズを手伝ってくれる人もいません。
「実際には、クローズドソースモデルのメーカーがサービスを販売しています。」LLaMAモデルに基づくAI応用研究を行っているオンライン教育機関の担当者はHuxiuにこう語った、「オープンソースモデルは無料のようですAI モデルを追加した後、IT 部門の人件費とコンピューティング能力のコストが大幅に上昇しました。
オープンソース モデルに基づくトレーニングとチューニングは、ほとんどの IT 担当者にとって難しいことではありません。ただし、モデルの詳細な研究と開発を実行するには、アルゴリズムと AI の点である程度の技術的予備力がまだ必要です。大規模な AI モデルの概念がますます一般的になるにつれて、この分野の人材の価格も上昇しています。
「人件費の増加は実際には浮いているが、サーバーやハードウェアのコストは実質的なものである。大型モデルへの投資から現在に至るまで、コストは約 20% ~ 30% 増加している。」と担当者は語ります。前述のオンライン教育機関の氏 現在、彼の組織はまだ AI シーンの探索段階にあり、最大の困難は各シーンで実験する必要があることです。 「1 台が故障したら、別の 1 台に交換します。このプロセスでは、すべての段階でコストがかかります。」
これに関連して、Huxiu は Baidu Smart Cloud の内部関係者に、Baidu Wenxin Qianfan のサービスと導入コストについて尋ねました。費用の節約になります。**」
実際、オープンソース モデルかクローズドソース モデルかに関係なく、モデルの導入コストは 1 人あたり/日ベースで計算され、その後のコンピューティング パワー コストに本質的な違いはありません。訓練と推論。 「**ただし、オープンソース モデルを使用して自分でトレーニング、デプロイ、開発を行うと、このプロセスが非常に面倒になるだけです。」 Baidu の内部関係者は、具体的なデプロイメント コストは特定のプロジェクトによって異なり、その差は非常に大きいと述べました。ただし、実際には、展開コストと使用コストの点では、オープンソースとクローズドソースの間に本質的な違いはありません。 **データ セキュリティの観点から、ほとんどのクローズド ソース モデルは非公開でデプロイすることもできます。
**現段階では、AI が包括性を達成することはまだ困難です。 **
インターネット ビジネスに携わるほとんどの企業は、独自の IT 研究開発チームを持っており、大きなモデルが到来すれば、すぐに AI アプリケーションを開発するための「確立された」チームを形成できるようになるでしょう。しかし、多くの小売業、伝統的な製造業、サービス業にとって、デジタル変革は困難な問題であり、AI の大規模モデルのトレーニング、導入、推論を研究することは非常に困難です。
こうした企業にとって、最適な AI 製品は汎用 AI プラグインです。 「私たちが必要としているのは、会話がそれほどばかげていない顧客サービスロボットだけです。私はモデルをトレーニングする方法を学ぶように頼んだのですが、それは少し刺激的です。」ある電子商取引ブランドのビジネスラインマネージャーは Huxiu に次のように語った。 AIの対話能力が以前より強化されていると言われていますが、ChatGPTはまだ試していません。彼は新しいテクノロジーを積極的に受け入れるつもりですが、今、学習に時間を費やし、AI に資金を投資するのは十分な動機ではありません。
「今使っているプラットフォームやソフトウェアにプラグインがなければ、手に取るだけで使えます。そうでなければ、お金をかけてすぐにAIアシスタントをアップグレードすることはあまり考えません」 」 低い。
「** 販売者はそれを行うために AI を必要としています。そして、それは感情を抱かずに適用され、強化されることができます。**」 SaaS メーカーの Weimob は、デジタル マーケティングにおいてそのようなアプリケーション WAI を作成しました。これは、販売者が既存のアプリケーションを埋め込む形で AI 機能を呼び出すのに役立ちます。大規模な言語モデルに基づいた AI 対話機能とテキストおよび画像生成機能を販売者に提供します。
大規模なモデルを SaaS サービス ツールにオープンに接続することは、Baidu Wenxin Qianfan のモデル呼び出しに似ています。インターフェイス呼び出しと Finetune のみが行われますが、より多くの、より高速で、より安定した AI 着陸機能をユーザーに提供します。
「オープンソース モデルにより、ユーザーは簡単に使い始めることができ、現在、多くのオープンソース モデルは大手メーカーよりも早く更新されています。」Weimob COO COO ying Shiming は、オープンソースとオープン性により AI 機能を迅速に提供できると信じています。ユーザーへ ユーザーが本当に必要としているのは、「プラグ アンド プレイ」AI です。 **
AI の大規模モデルをまだテスト、実験、体験している段階にあるほとんどのユーザーにとって、オープンソース モデルの敷居は明らかに低く、立ち上げコストはほぼゼロです。
多くのユーザーは当初からオープンソース モデルを使用しており、今後もオープンソース モデルを使用し続けるでしょう。前述の展開とトレーニングの問題により、オープンソース モデルのサービス産業チェーンが生み出されています。
Chen Ran ビッグ モデルの隆盛の波の中で、新しく設立された OpenCSG は、オープンソースのビッグ モデルを中心としたサービス ビジネスを行っています。
OpenCSG が提供する大規模モデル サービスは、主に企業向けのオープンソース モデルのトレーニングと実装を目的としています。オープンソースモデルの選択から、ハイブリッド分散コンピューティングパワー、ビジネスモデルトレーニングと組み合わせたバックエンドアプリケーション開発などに至るまで、企業向けにサービスを提供できる。
「**大規模モデルはすべての SaaS に似ていると私は考えています。上流と下流の業界は徐々に充実し、顧客はモデルの機能だけに注目するわけではありません。」 Chen Ran 氏は、顧客の最終的な要求は、最も優れたモデルを見つけることではないと信じています。有能なモデルですが、AI の大きなモデルをより適切に、より簡単に、よりシンプルに使用してビジネスに役立てることができます。
AI を中心としたオープンソース エコロジー
AI 産業チェーン全体において、オープンソースはモデルをはるかに超えています。研究開発から展開、アプリケーションに至るまで、ほぼすべてのリンクがオープンソースのトピックから切り離せません。
**アルゴリズム、コンピューティング能力、データ、AI の 3 つの要素は、それぞれオープンソースのサポートを必要とします。 **
アルゴリズム レベルでは、オープンソース AI の大規模モデルは比較的後期の段階にあります。初期の AI 研究開発では、ほぼすべての AI モデルで機械学習フレームワークが使用されていました。これは AI ツールボックスの構築に相当します。 TensorFlow、Pytorch、PaddlePaddle (フライングパドル) など、現在の主流の機械学習フレームワークはすべてオープンソース フレームワークです。
データ レベルでは、Commen Crawl オープン ソース データセットは、GPT モデル トレーニング プロセスにおける重要なデータ ソースです。現在、多くの機関やデータ会社が、知源研究所の COIG-PC データセットやハイチ AAC の DOTS-MM-0526 マルチモーダル データセットなど、AI トレーニング データセットに関するオープンソース製品をリリースしています。
データセット発行者にとって、オープンソースは影響力とブランド価値を高めるだけでなく、オープンソース データセットはオープンソース コミュニティから肯定的なフィードバックを収集し、データ内のエラーや不一致を見つけて修正することもできます。この外部レビューは、パブリッシャーの製品エコシステムをさらに充実させながら、データ品質を向上させるのに役立ちます。
「**アルゴリズム エンジニアは、研究開発においてデータ不足の問題に直面することがよくあります。高品質のデータは、モデルの評価に質的な改善をもたらします。**私の国は現在、高品質のデータ セットの不足という問題に直面しています。 「ハイチ AAC は、オープンソース モデル LLaMA 2 のトレーニング データ プロバイダーの 1 つです。ハイチ AAC の COO、Li Ke 氏は次のように述べています。」
** AI 開発における最大のボトルネックであるコンピューティング能力の点では、オープンソースのチップ フレームワークも業界の発展を刺激しています。 **
クアルコムは8月4日、オープンソースのRISC-Vアーキテクチャに基づくチップの商品化を加速するため、半導体企業4社と合弁会社を設立したと発表した。現在、市場には 3 つの主流チップ フレームワークがあります。Intel CPU で使用される x86、Nvidia GPU で使用される Arm、およびオープンソース チップ フレームワークである RISC-V です。
「RISC-V はプログラム可能な環境を提供できます。チップ開発チームは RISC-V を使用して多くの前処理および後処理作業を行うことができ、ユーザーのニーズを満たす特別なアクセラレータや機能モジュールを追加することもできます。 SiFive のマーケティングおよびビジネス開発担当シニアバイスプレジデントである Gang Zhijian 氏は、RISC-V エコシステムはチップの研究開発に豊富なオプションを提供しており、これは今日急速に増大する AI チップの需要に非常に役立っていると述べました。
Arm と x86 は、RISC-V に比べて比較的閉じたエコシステムを持っています。 **Arm エコシステムでは、ユーザーは Arm が提供する限られたオプションしか選択できませんが、RISC-V エコシステムには多くの企業が参加しており、製品の種類と選択肢はさらに増えます。 **
オープンソース アーキテクチャは、チップ業界の競争を加速させる刺激にもなっており、Gang Zhijian 氏は、「** オープンソース チップ アーキテクチャのサービス プロバイダーとして、当社は他の企業とも競争します。しかし、当社が勝つか他の企業が勝つかは関係ありません。一種の競争であり、最終的には、RISC-V エコシステムの繁栄と進歩を促進することになります。**」
RISC-V 命令セット アーキテクチャは無料でオープン ソースですが、RISC-V 命令セット アーキテクチャの二次開発に基づいてチップ設計メーカーによって形成されたコア IP は独立した知的財産権を有しており、外部料金を通じて認可することができます。 RISC-V 国際財団のデータによると、2022 年には会員数が前年比 26% 以上増加し、会員ユニットの総数は 3,180 を超え、70 か国/地域をカバーすると予想されています。 Intel、Google、Alibaba、Huawei、UNISOC、シャープ、その他多くの大手チップ企業。
オープンソースは RISC-V にとって利点ですが、いくつかの問題も生じます。 RISC-V には 40 以上の基本命令セットと数十の基本モジュール拡張命令しかありませんが、どの企業や開発者も RISC-V を無料で使用して、独立した知的財産権を持つチップを作成できます。
ただし、オープンソース、高度にカスタマイズ可能なモジュール機能により、RISC-V エコシステムはより細分化され、複雑になります。
「各チップ研究開発会社が RISC-V の命令セットをアップグレードした後、実際には新しいアーキテクチャが作成されます。RISC-V と呼ばれていますが、さまざまな会社が RISC-V と互換性がなく、オープンソース エコロジーは実際には.**」Weiwei Technology 社長兼中華圏ゼネラルマネージャーの Lu Tao 氏は、オープンソースのチップ アーキテクチャとソフトウェア エコロジーは非常に重要であると考えていますが、さまざまなチームがオープン性とオープン性のバランスを見つけるのは非常に困難です。カスタマイズと断片化、研究開発チームの知恵と能力をテストします。
さらに、Arm アーキテクチャは、AI のトレーニングと推論に適した GPU、IPU、その他のチップをすでに生産しており、技術エコロジーはより完全で成熟しています。 RISC-V の本来の目的は CPU の設計であり、非常にオープンですが、AI チップの設計はまだ模索段階にあります。
調査会社 Counterpoint Research によると、2025 年までに RISC-V プロセッサの累計出荷台数は 800 億台を超え、年間平均成長率は 114.9% になると予想されています。それまでに、RISC-V は世界の CPU 市場の 14%、IoT 市場の 28%、産業市場の 12%、自動車市場の 10% を占めることになります。
クアルコムはすでに 2019 年に Snapdragon 865 SoC のマイクロコントローラーに RISC-V を実装しており、これまでに 6 億 5,000 万個を超える RISC-V チップを出荷しています。 2022年9月のAIハードウェアサミットフォーラムで、RISC-Vの発明者であるクルステ・アサノビッチ教授は、Googleが機械学習フレームワークTensorFlow TPUチップの開発にRISC-VベースのSiFive Intelligence X280の使用を開始したことを明らかにした。 **これに先立ち、Google は 10 年以上にわたって TPU チップ アーキテクチャに関する自主研究を実施してきました。
RISC-Vチップをゼロから開発するのは難しいが、RISC-Vのオープンソースの性質は、やはりゼロからスタートした中国のチップに、封鎖と独占の中で生き残るチャンスを与えた。 「中国企業は世界で最も急速に成長している。中国のチップ企業はより積極的で、困難に立ち向かう意欲がある」とGang Zhijian氏は、中国市場がチップ産業の発展を刺激する鍵であると述べた。中国のチップ市場は巨大で、たとえば、中国の自動車用チップのコンピューティング電力需要は、ヨーロッパやアメリカの市場をはるかに上回っています。 **AI コンピューティング能力に対する中国企業の需要が高まる中、中国の AI チップ産業は将来的には間違いなくさらなるチャンスをもたらすでしょう。
## 結論
**オープンソースは、商業的な考慮事項に加えて、技術出版社がモデルを最適化するのにも役立ちます。 **
「ChatGPT は、実際にはエンジニアリングの勝利です。」 今日の大規模言語モデルの成功は、実際には、モデルのトレーニングとチューニングの繰り返しに基づいています。基本モデルが確立された後、そのモデルがオープンソースコミュニティに昇格し、より多くの開発者がモデル最適化作業に参加するようになれば、AI大型モデルの発展に大きな助けとなることは間違いありません。
さらに、「オープンソースの大規模モデルは車輪の再発明を避けることができる」と北京知源人工知能研究所の副社長兼チーフエンジニアの林永華氏は2023年の知源会議中のインタビューで、**の全員がTheの出身であると仮定すると述べた。汎用大規模モデルの研究開発には多大な計算能力、データ、電力が必要であり、社会資源の合理的利用とは全く異なる車輪の再発明です。 **
Zhiyuan Research Institute のような非営利組織の場合、モデルがオープンソースかクローズドソースかに関係なく、商業的な考慮事項はあまりないかもしれません。しかし、Microsoft、Google、Meta、OpenAI、または国内の Zhipu AI や Baichuan Intelligent のいずれであっても、商用 AI 企業にとって、大規模な AI モデルは間違いなく「科学研究」だけを目的としたものではありません。 **
OpenAIの製品は技術的には絶対的な優位性を持っていますが、プラグインの形で構築されるChatGPTエコシステムはエコロジー構築の点で弱いです。 AIのオープンソースとクローズドソースの争いでは、将来的にはモバイルOSとは異なるパターンが見られるかもしれない。