幕が開き、AIGCの商業的主役はどこに?

出典: アルファコミューン

著者:徐思清

先週の木曜日、Baidu Wenxinyiyan や iFlytek Spark Model などの多数の大規模言語モデルがサービスの提供を正式に承認されました。 AI は人工知能のパラダイム変化を引き起こしましたが、同時に人々は自然に「パラダイム変化の中でお金はどこにあるのか?」と疑問に思うようになりました。主人公は何ですか?

MidJourney の伝説 (2022 年に 11 人の収入が 1 億米ドルに達した) に加えて、起業家や投資家は常に希望を持ち、AIGC (生成人工知能) によってもたらされるビジネス モデルを探索することを楽しみにしています。この記事は、起業家精神と投資の機会を大きなモデルの構成の観点から分析しようとしています。ところで、最後には「お金の目に陥る」という起業家の物語が語られています。

図 1: ヴィンセントの画像の例 — 雨の中のサイバーパンク スタイルの女性殺人者 (この画像は HiDream の Pixeling V1.0 によって生成されました。)

LLM (Large Language Model) - 大企業はエコシステムを構築するために資金を浪費し、起業家にとっての罠

大規模言語モデル アプリケーションのアーキテクチャを見てみましょう (下図を参照)。最下層が強固なハードウェア基盤の上に構築されていることがわかります。現在、NVIDIA に代表される GPU メーカーとコンピューティング パワー プロバイダーが存在します。 CoreWeaveに代表される。携帯電話と同様、ハードウェアは常に商品化の最終決定であり、これはビジネス チャンスの 1 つですが、大規模モデル向けのコンピューティング パワー プラットフォームの最適化を除いて、起業家や投資家にとってチャンスはそれほど多くありません。

図 2: 大規模言語モデルの構造と代表的な企業

海の向こうでは、現在主流の大規模モデルは数えるほどしかなく、OpenAI、Meta、Google などの大手企業が大規模モデルに基づいた計画を立て始めており、LLM (Adept、Cohere、Character. ai) トランスフォーマーの作者によって設立され、同質性よりも差別化がトレンドになっています。

このことから、大手メーカーによるエコロジーの戦いがさらに浮き彫りになります。自社の大型モデルを持たなければ、未来はありません。人々が Amazon よりも Microsoft に楽観的なのは、Microsoft が OpenAI と Meta Llama という 2 つの主要モデルを優位に活用しており、すべての製品が AI を採用しているためです。モデルを制する者は世界を制する、大規模なモデルで構築された基本プラットフォームがあり、その上にアプリケーションが構築され、あらゆる手を尽くしてアマゾンから顧客を奪おうとしている。

基本的な大規模モデルは金を貪る巨大な獣です。大工場は土地を争って大金を決済するように訓練されています。小規模工場には垂直モデルを除いてほとんどチャンスがありません。起業家は注意すべきです。」

図 3: AI モデルの進化 (出典:

OpenAI やビッグファクトリーモデルは第 1 の波に属し、トランス作者の大規模モデルは第 2 の波に属し、個人で実践するかオープンソースモデルを使用するかにかかわらず、その後次々に登場するさまざまなモデルは第 3 の波に属するはずです。大規模言語モデルの開発傾向は、基本的な大規模モデルから垂直モデル、そしてエンタープライズ アプリケーションに焦点を当てたロングテール モデルになります。

図 4: 中国の LLM の概要 (インターネットからの画像)

なお、国産のLLMが圧倒的であり、一部の大手メーカーを除いて、そのほとんどがオープンソースモデルでトレーニングされたモデルであると推測できます(GPUが足りず、磁器の動作はどうやって生まれるのでしょうか?)。モデルのリエンジニアリングにより、コンピューティング能力のほぼ 99% を消費する事前トレーニング リンクが節約されます (Alpha Commune の記事を参照: メタ大規模言語モデル Llama 2—形勢逆転して新しい章の開始 | 投資家は述べた)。速い 経済的で評価に値するが、その多くは縦型モデルや甲の大型モデルであり、真の基本的な大型モデルではない。

基本的な大規模モデルのトレーニングには多大な労力がかかり、簡単に数千万ドルの費用がかかる可能性があり、富裕層向けのゲームであるため、起業家は注意が必要です。

理由は非常に単純で、スタートアップ企業の資金調達額を計算してみると、同種の外国人起業家に比べて資金調達額が1/10程度であり、モデルを訓練するには十分ではないからです。本当にゼロから事前トレーニングを行うと、GPU が発熱し、電源を入れた直後に調達した資金が使い果たされてしまいます。

AI ツール - ゴールド ラッシュでのつるはしの販売、高度な技術コンテンツ

生成人工知能は新しいパラダイムを生み出すと同時に、多数の新しいツールの機会も生み出します。これらのツールは、評価モデル、運用および保守モデル、強化されたシステムから運用ツールまで多岐にわたりますが、それらはすべてパラダイムの変化によってもたらされる新たな機会です。

特に注目すべきは、さまざまな種類のデータを管理およびトレーニングするためのツールとセキュリティ保護システムです。セキュリティ ツールには、従来のセキュリティ ツールとモデル指向のセキュリティとコンプライアンスの両方が含まれます。考えてみてください、データの損失はすでにひどいことです。訓練されたモデルが侵害された場合、それは人々に自分のプライバシーを侵害するように教えるための効率的なツールではないでしょうか?

実際、セキュリティは単なるツールではなく、不可欠なインフラストラクチャである必要があります。

使えなくなった古いツールがたくさんあり、起業家が才能を発揮する機会が増えています。

新しい AI アプリケーション - 開花した楽園

アプリケーション層は、起業家としてのチャンスが数多くある豊富な鉱山です。

toB アプリケーションであっても toC アプリケーションであっても、新世代の人工知能によって生み出された新しいパラダイムは無限の機会を提供します。

toCは新しいシーンへの革新的な参入が特徴であり、toBは新旧の共存が特徴です。

C は浅いアプリケーションとして記述することができ、その特徴はプロダクトマネージャーがイノベーションの機会を多く持ち、モデルを深く掘り下げることなくユーザーが好むアプリケーションを提出できることです。

パラダイム変化の潮流の中で、中国の優れたプロダクトマネージャーのグループが主要な国際プレーヤーになることを予測するのは難しくありません。おそらく、新世代の張一銘が急速に台頭しつつあるのでしょう。

to B アプリケーションでは、企業ニーズの問題点を理解し、古い問題を解決するための新しい手段を使用するかどうかがテストされます。少数の破壊的イノベーションを除いて、そのほとんどは、コスト削減と効率向上という企業価値の向上に沿って発展します。技術の変化は、1 つのトリックが広く使用される機会を提供しますが、革命は簡単には成功しません。最終的には、従来のプレーヤーがすべてのアプリケーション シナリオを占め、新しい手法やツールが革新的な役割を果たします。それはパターンであるはずです。古いものと新しいものが共存します。

A 社が民間で展開する大規模モデルは、長期にわたって需要が急速に増加するはずです。

唯一注目に値するのは、中国の toB 市場と米国の toB 市場は顧客構成や購買行動が異なるため大きく異なっており、起業家はそれらを真似してはなりません。過去 2 日間に開催される中国 CIO サミットに出席するため三亜に行く予定です。業界の専門家たちとこの問題について検討することを楽しみにしています。このトピックは今後の特別な議論のために取っておきます。

Wensheng Vision - 実績のある大当たり、中国版 MidJourney - 喜びと苦痛の両方の産物

MidJourneyはデザイナーに直接訴えかけ、アートデザインの効率を大幅に向上 数秒で絵が完成する 制作方法を完全に変えたと言える ユーザーの支払い意欲が高い 11人で1億ドル稼ぐAIGC になってから 1 年が経ち、これまでのビジネスのハイライトです。

今年の初め、著者とデザイナーは長い間協力してMidJourneyを研究し、ビジネスモデルの厳然たる真実であるC側支払いとB側支払いを現場で体験しました。

同時に、敷居の高さも強く感じます。偉大なアーティストは、複雑で専門的な英語の記述を常に修正し、「修復」(プロンプト)を介して、満足のいく創造的な絵を作成すると同時に、中国風の模型の欠点に耐えながら――当時はミッドジャーニーのような英語しか分からず西洋文化資料しか勉強していない模型しかなかったため、設計者は英語の精度を高めるために様々な手段を講じざるを得ず、 「中国語」を日本風に表現するか韓国風に表現するかというジレンマに耐えなければなりませんでした。

破壊的な手段はデザイン効率に革命をもたらし、デザイナーは同時に言語と絵画スタイルの不一致に耐え、強烈な喜びと痛みの組み合わせにより、中国には独自のミッドジャーニーが必要であると強く信じさせられます。それだけでなく、私たちは次の 2 つの理由から MJ を超えるべきであると考えています: 第一に、市場は MidJourney よりも人間の言語をよりよく理解するツールを求めていること、第二に、中国要素またはグローバル ローカル要素がうまく表現されるべきであること。また、電子商取引や広告業界では、大量の写真やショートビデオを核とした高効率な制作ツールや、制作システムをドッキングする巨大な市場を抱えています。

神が与えてくださった機会で、私は数年間一緒に「何かをしよう」と努力してきた香港大学の弟子で、アルゴリズムを理解し、モデルを知り、業界で長年実践してきたベテラン、メイ・タオと意気投合しました。 , そのため、Alpha Commune と HKUST の卒業生からシードラウンドのサポートを受けています。HiDream はアカデミアンの Mei Tao によって始められました (記事を参照してください: AIGC には中国に他の起業機会はありますか? アカデミアンの起業家とエンジェル投資家がこれを言っています | Alpha Founders Club)。わずか数か月で、HiDream は想像を絶する反復速度と驚くべき結果を実証し、業界で長年続いてきた「学者による起業家精神への偏見」を完全に覆しました。

以下は、同じ条件下で MidJourney と Hidream によって生成された例の比較表です。

:ダンジョンズ&ドラゴンズのキャラクターポートレート、黒髪の短髪の女性、真鍮製小型望遠鏡を持った西部開拓時代の追跡者、エマ・ストーン、賢く、陽気で機知に富み、そして強い

:待ち伏せされた後、目を丸くして呆然としている若いフレンチ ブルドッグの様子、ピクサー風

:エイリアンの見た目が奇妙でかわいい幸せなウサギ

図 5-7: 同じによって生成された MidJourney グラフと Hidream グラフ

MidJourney は貴重な先駆的な仕事を行ってきました。後発企業がトランスフォーマーをより適切に適用し、より強力なモデル機能を構築し、単純に拡散モデルに依存するのではなく (MJ はこのモデルに基づいて現在のツールの最適化を続けています) できるのであれば、やるべきことはたくさんあります。 。私たちはまた、MJ が早期のスタートを活かし、普及モデルへの依存を脱却し、市場に驚きをもたらし続けると確信しています。

ツールであれ、表面的なアプリケーションであれ、深いエンタープライズ アプリケーションであれ、それらはすべてスケール生成と底流の初期段階にあります。 AIGC は始まったばかりですが、アルゴリズムの革新と反復により、業界にさらに輝かしい章を示し続けることを楽しみにしています。

**2023年9月6日早朝、合肥。 **

**この記事の著者は、Alpha Commune の創設パートナー兼 CEO である Xu Siqing です。 **

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)