白川VSジプ、中国のOpenAIは誰ですか?

記事の出典:ライトコーンインテリジェンス

テキスト:ハオシン

編集者:劉玉奇

6月初旬、外国メディアは「中国のOpenAIは誰なのか」という拷問を発し、大規模モデルの起業家精神の波を経験した後、大きな波が砂に押し寄せ、最終的に残ったのはほんの数人でした。

清華大学の外のいくつかの交差点にあるXaarビルは、スター起業家のWang Xiaochuanの白川インテリジェンスであり、捜狐ネットワークビルは、アカデミーから送信された知恵スペクトルAIです。 市場のテストを経て、彼らは2つの最も有望な候補になりました。

2つの建物をめぐる戦いは静かに始まったようです。

**資金調達の観点から、Zhipu AIとBaichuan Intelligent は今年、複数の大規模資金調達を完了しました。 **

(ライトコーンインテリジェントマッピング:公開情報に従って編成)

今年、Zhipu AIの累積総資金調達額は25億元を超え、白川インテリジェントの総資金調達額は3億5000万米ドル(約23億元)に達しました。 公開情報によると、**Zhipu AIの最新の評価額は100億元を超えており、最高または150億元であり、100億元以上の評価額を持つ国内最速企業の1つです。 **最新の資金調達ラウンド後、白川インテリジェントは10億米ドル(約66億元)以上と評価されています。

チーム構成の観点から、Zhipu AIとBaichuan Intelligent Masterは同じ家を出て行き、Zhipu AIの社長であるWang ShaolanとSogouの創設者であるWang Xiaochuanはどちらも清華省の起業家チームです。

**技術キャッチアップのスピードの観点からも、この2つは区別がつかない。 **Zhipu AIのGLM-130BはGPT-3が発売されるとすぐに打ち負かし、新しくリリースされたBaichuan 2はあらゆる面でLlama 2を上回り、中国のオープンソースエコシステムの開発を開拓しました。

すべての兆候は、Zhipu AIとBaichuan Intelligenceが中国のビッグモデルトラックの「ダークホース」になり、激しい競争の下で、鹿の死者は誰ですか?

OpenAIを信じる者:知恵AI

Zhipu AIとOpenAIの関係は、Zhipu AIのCEOであるZhang Pengが心の中で真の「AIビッグランゲージモデルの最初の年」と見なした2020年にさかのぼることができます。

Zhipu AIとOpenAIの関係は、Zhipu AIのCEOであるZhang Pengが心の中で真の「AIビッグランゲージモデルの最初の年」と見なした2020年にさかのぼることができます。

Zhipu AIの記念日には、楽しい雰囲気の中で、GPT-3の誕生によってもたらされる不安を時々嗅ぐことができます。 1,750億のパラメータに達するGPT-3は、厳密な意味での最初の大規模言語モデルです。

当時、張鵬はGPT-3の出現能力にショックを受けただけでなく、当時であろうと今であろうと、「従うかどうか」という考えに陥り、超大規模パラメータ大型モデルの方向はすべて非常に危険なものです。 検討後、Zhipu AIはOpenAIをベンチマークとし、超大規模な事前トレーニングモデルの開発に投資することを決定しました。

(ライトコーンインテリジェントマッピング:公開情報に従って編成)

**テクノロジーパスの選択に関しては、Zhipu AIはOpenAIと同じ独立した考え方を持っています。 **

当時、BERT、GPT、T5などの大規模なモデル事前トレーニングフレームワークがいくつかありました。 3 つのパスには、トレーニング ターゲット、モデル構造、トレーニング データ ソース、およびモデル サイズの点で、それぞれ長所と短所があります。

大規模なモデルトレーニングプロセスを英語の試験と比較すると、BERTは単語と文の関係を通じて質問を行い、理解を通じて試験を受けるのが得意であり、そのレビュー資料は主に教科書とウィキペディアから来ています。 GPTは、次の単語を予測し、多くのライティング練習を通じて試験の準備をするのが得意であり、そのレビュー資料は主にさまざまなWebページから提供されています。 T5は、問題を形式化し、最初に質問を中国語に翻訳してから問題を解き、復習するときは教科書を読むだけでなく、多数の質問バンクをブラッシングするという戦略を採用しています。

ご存知のように、GoogleはBERTを選択し、OpenAIはGPTを選択し、Zhipu AIは盲目的に従わず、**これらの2つのルートに基づいてGLM(一般言語モデル)アルゴリズムフレームワークを提案しました。 このフレームワークは、BERTとGPTの補完的な長所と短所を実際に実現しており、「空白を継続して埋めながら理解できます」。 **

このようにGLMは、Zhipu AIがOpenAIを追求するための最大の自信となり、この枠組みの下で、GLM-130B、ChatGLM-6B、ChatGLM2-6BなどのGLMシリーズモデルが順次成長してきました。 実験データによると、GLMシリーズの大規模モデルは、言語理解の精度、推論速度、メモリ比率、および大規模モデル適応アプリケーションの点でGPTよりも優れています。

(出典:インターネット)

OpenAIは現在、海外で基本モデルサービスを提供できる最も完全な機関であり、その商用化は主にAPI収集料金とChatGPTサブスクリプション料金の2つのカテゴリに分けられます。 商業化に関しては、Zhipu AIも一般的な考え方に従い、国内の大型モデルの比較的成熟した商業化を行う企業の段階にあります。

光コーンインテリジェントコーミングによると、中国企業の着陸と相まって、**Zhipu AIのビジネスモデルはAPI収集料金と民営化料金モードに分かれています。 **

提供されるモデルの全体的なタイプは、言語大規模モデル、超擬人化大規模モデル、ベクター大規模モデル、コード大規模モデルであり、標準価格設定、クラウドプライベート価格設定、ローカルプライベート価格設定などの各大規模モデルオプションの下にあります。 OpenAIと比較して、Zhapu AIは音声と画像の大規模モデルサービスの提供を欠いていますが、超擬人化された大型モデルを追加し、中国のデジタルヒューマン、インテリジェントNPC、その他の業界のニーズにも応えます。

(ライトコーンインテリジェントマッピング:公開情報に従って編成)

ライトコーンインテリジェンスは開発者から、「現在、百度文新銭帆プラットフォームの特性は完璧であり、同義銭文の特性は柔軟であり、Zhipu AIは市場の主流メーカーの中で最も安いAPI料金を持つ企業の1つです」と学びました。

ChaGLM-Proの料金は0.01元/千トークンで、18元が配られ、ChaGLM-Liteの料金は0.002元/千トークンに減額されます。 参考までに、OpenAI GPT-3.5は0.014元/千トークン、アリ・トンギ・チェンウェンターボは0.012元/千トークン、百度文新一ワードエミーボットターボは0.008元/千トークンを請求します。

Zhang Peng氏が言ったように、Zhipu AIもOpenAIを目標として「もはやOpenAIに従わない」という新しい段階を経ている。

製品ビジネスに関しては、ChatGPTのアップグレードと構築のみに焦点を当てたOpenAIとは異なり、Zhipu AIは3つの側面から攻撃することを選択しました。

公式ウェブサイトによると、Zhipu AIの現在のビジネスは、主に大型モデルMaaSプラットフォーム、AMinerテクノロジーインテリジェンスプラットフォーム、コグニティブデジタルヒューマンの3つのブロックに分かれています。 その結果、大型モデル製品、AMiner製品、デジタルヒューマン製品の3つの主要なAI製品マトリックスが形成されました。 その中で、大型モデル製品は、基本的な対話ロボットだけでなく、プログラミング、書き込み、塗装ペンダントロボット部門もカバーしています。

(出典:ジプAI公式サイト)

同時に、Zhipu AIは投資を通じてアプリケーション側を探求し続けています。 これまで、Zhipu AIはLingxin IntelligenceとPainting Wall Intelligenceに投資しており、今年9月にLingxin Intelligent の保有を再び増やしました。

Lingxin Intelligenceは、清華大学のコンピュータサイエンス学部からもインキュベートされていますが、同種ですが、Lingxin Intelligenceはアプリケーションに傾倒しており、それによって開発されたAiUインタレストインタラクティブコミュニティは、Zhipu AIに基づく超擬人化された大規模モデルです。 その製品の開発アイデアは外国のキャラクターAIに似ており、さまざまな性格やキャラクターを持つAIキャラクターを作成し、それらと対話してチャットすることで、Cエンドアプリケーションに傾倒し、エンターテインメントの属性を強調しています。

** OpenAIからLIamaへの移行:白川インテリジェンス**

Light Cone Intelligenceは、OpenAIと比較して、Baichuan IntelligenceはLlamaに似ていることを発見しました。

**まず、独自の技術と経験に基づいて、リリースとイテレーションの速度は非常に速いです。 **

設立から半年後、白川インテリジェントは、白川-7B / 13B、白川2-7B / 13Bの4つのオープンソース商用モデルと、白川-53Bと白川2-53Bの2つのクローズドソース大型モデルを連続してリリースしました。 9月25日にBaichuan2-53B APIインターフェースがオープンした時点で、過去168日間で、Baichuan Intelligent は平均月数で大型モデルをリリースしました。

(ライトコーンインテリジェントマッピング:公開情報に従って編成)

メタはAIの地位を取り戻すためにLLama2に依存しており、Baichuan Intelligent は Baichuan2シリーズのオープンソースモデルでLLama2を打ち負かしたことで有名です。

テスト結果によると、白川2-7B-塩基と白川2-13B-塩基は、MMLU、CMMLU、GSM8Kなどのいくつかの権威ある評価ベンチマークでLLaMA2よりも優れており、同じパラメータを大量に持つ他のモデルと比較して性能も非常に高く、LLaMA2や同じサイズの他のモデルの競合他社よりも性能が大幅に優れています。

事実は、白川インテリジェントラージモデルが実際にテストに耐えたことを証明しています。 公式データによると、Baichuanはオープンソースコミュニティで500万回以上、月に300万回以上ダウンロードされています。

Light Cone Intelligent は、Baichuan インテリジェント シリーズ モデルが Hugging Face オープンソース コミュニティで最もダウンロード数 110,000 を超えており、中国および外国のオープンソース モデル間で依然として競争力があることを発見しました。

(出典:ハグ顔公式サイト)

オープンソースに利点がある理由は、その強力な互換性にも関連しており、Baichuan Intelicは、その大規模なモデルベース構造全体がメタのLLAMAの構造に近いことを公に紹介しているため、オープンソース設計から企業やメーカーに非常に優しいです。

**「オープンソースの後、エコロジーはLLaMAを中心に構築され、LLaMAに続いて推進する海外のオープンソースプロジェクトがたくさんあるので、私たちの構造はLLaMAに近いです。」 王小川は言った。

光コーンインテリジェンスによると、Baichuan Intelligent はアーキテクチャ設計にホットプラグ対応を採用しており、LLAMA を使用したモデルのトレーニングなど、白川モデルと LLAMA モデルおよび白川モデルの異なるモジュール間のランダムな切り替えをサポートできます。 これは、ほとんどのインターネットメーカーが現在白川モデルを使用し、クラウドベンダーが白川シリーズモデルを導入している理由も説明しています。

歴史がたどってきた道は過去と未来の両方につながり、王暁川の大規模モデル起業家精神はこのようなものです。

Sogouの創設者のアイデンティティと検索技術の経験に基づいて、起業家精神の初期に、Wang Xiaochuanは多くの人々の評価を受けました、「Xiaochuanは、大きなモデルに最適です」。

**検索エクスペリエンスとフレームワークで大規模なモデルを構築することは、白川インテリジェンスの背景色になっています。 **

Baichuan Intelligent Technologyの共同創設者であるChen Weipeng氏はかつて、検索R&Dは大規模モデル開発と多くの類似点があると述べ、「Baichuan Intelligent は、検索体験を大規模モデルの研究開発に迅速に移行し、これは『ロケット製造』体系的なプロジェクトであり、複雑なシステムを解体し、チームコラボレーションを促進し、プロセス評価を通じてチームの有効性を向上させる」と述べた。

Wang Xiaochuanも記者会見で、「Baichuan Intelligenceは以前に検索遺伝子を持っているため、何兆ものWebページの真ん中から最適なページを選択する方法を自然に知っています。これは重複排除とゴミ対策が可能です。」 データ処理においても、Baichuan Intelligent は以前の検索の経験を活用し、数千億のデータのクリーニングと重複排除を 1 時間で完了できる」と語った。

その大規模なモデル検索のコアは、白川-53Bに鮮やかに表示されます。 検索技術の沈殿と相まって、大規模モデルの「錯覚」の問題に対処する際に、Baichuan Intelligent は情報取得、データ品質の改善、および検索の強化を最適化しました。

データ品質の向上に関して、Baichuan Intelligent のコアアイデアは、「常に最善を尽くし」、低品質と高品質のデータを標準として分類し、Baichuan2-53Bが常に高品質のデータを事前トレーニングに使用するようにすることです。 情報取得に関しては、Baichuan2-53Bは、ユーザーの指示を深く理解することで、指示意図の理解、インテリジェントな検索、結果の強化などの主要コンポーネントを含む複数のモジュールをアップグレードし、クエリ用語の検索を正確に推進し、最終的に大規模な言語モデルテクノロジーを組み合わせてモデル結果生成の信頼性を最適化しました。

オープンソースから始まりましたが、白川インテリジェントは商業化の道を模索し始めています。 公式情報によると、Baichuan Intelligenceの目標は「中国で最高の大規模モデルベースを構築する」ことであり、垂直次元の目標は、検索、マルチモダリティ、教育、医療、その他の分野で強化することです。

今日の商品化はBaichuan2-53Bに集中しており、公式ウェブサイトは、モデルのAPI呼び出しが時間ベースの充電標準を採用していることを示しています。 0:00-8:00は0.01元/千トークンを請求し、8:00-24:00は0.02元/千トークンを請求し、比較すると、日中の料金価格は夜よりも高くなります。

(出典:白川インテリジェント公式サイト)

終了

中国のOpenAIが誰であるかを議論することは、大規模なモデル開発の初期にはあまり意味がありません。 Zhipu AIやBaichuan Intelligent などの多くのスタートアップは、OpenAIの足跡を盲目的にたどることはお勧めできないことを認識しており、例えば、Zhipu AIは「中国のGPTを行わない」という技術的な道筋を明確にしています。 さらに、オープンソースが普及し、包囲を形成しているとき、OpenAIの絶対的な技術的優位性は壊れないようには見えません。

Zhipu AI、Baichuan Intelligent は、スーパーアプリケーションは、より広い市場であるだけでなく、中国の大規模なモデル企業の快適ゾーンは、もはやその場にとどまらず、例えば、Zhipu AIに近い人物がかつてメディアにニュースを報じ、Zhipu AIチームは、情報とイノベーション市場を目指して、2Bルートをしっかりと決定し、5ヶ月で、その後の2Bビジネス予備要員のために、チームを200人から500人に急速に拡大しました。

商業化の道のりにおいて、Baichuan Intelligent は Llama2 のオープンソースエコロジーを参照することを選択し、小さなステップで反復も開始しました。

わずか半年で、白川インテリジェントとZhipu AIがテクノロジーの無人地帯を通過し、産業着陸の商業化段階に到達したことは肉眼で見ることができます。 AI1.0の起業家ブームと比較して、技術の研磨期間は3年(2016-2019)と長く、商業着陸の障害により、多くのAI企業が2022年に集合的に衰退し、夜明け前に倒れます。

前段階の教訓から学ぶだけでなく、大型モデル技術の汎用性が着陸に便利であるため、Baichuan IntelligenceとZhipu AIに代表されるスタートアップは、次の段階に向けて技術、製品、人材の予備を準備するために軍隊と馬を育てています。

しかし、最初の銃声はマラソンでしか聞こえず、結果が早すぎたと言うのは時期尚早でした。 しかし、少なくともトラックの最初の段階は分解されており、目標が明確になった後、競争はさらに忍耐強く忍耐力があります。 これは、Baichuan Intelligence、Zhipu AI、OpenAIでも同じです。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)