**Yu Zhonghai (CICC 研究部副部長): **Dean Wang 氏は非常に重要な点について言及しました。それは、大規模モデル技術は今日だけ起こったものではないということです。 2017 年、Google は Attending Is All You Need (必要なのは注意だけです) という有名な論文を執筆し、トランスフォーマー アーキテクチャを提案しました。
パブリッククラウドは、実は当時はIaaS(Infra Structure-as-a-Service、サービスとしてのインフラストラクチャ)と呼ばれていましたが、大規模なモデルになるとMaaS(Model as a Service)と呼ばれます。 Hugging Faceという海外の有名な会社があり、インターネット上にたくさんのモデルを公開していて、そのAPI(Application Program Interface、アプリケーションプログラミングインターフェース)を呼び出すだけでさまざまなAIモデルを利用することができます。
ただし、セキュリティコンプライアンスや細分化されたシーンの実装などの要件により、独自の大規模モデルを展開し、独自の知識を活用して強化し、独自の Fine Tune を行う必要がある企業も多くあります。これはプライベート クラウドに似ているかもしれません。中国の市場です。
それらの異なる重点は、共通の問題を示しています。つまり、基本的な大規模モデルは、一部の特定の業界や高度な専門性を備えたシナリオでは直接使用できず、適応層も必要です。ここに新たなビジネスモデルが生まれるかもしれない、つまり、将来的にはより多くの知識を活用できるのではないかと思います。誰もが AI を使用すると、技術的なパラダイムが異なることがわかります。したがって、誰もが共有できる資産は生データであり、生データを取得した後、さまざまな技術的手段を使用して処理されますが、この過程では、データの中間形式を取引することはできません。
ただし、大規模なモデルは基本的に多くの AI タスクを統合し、研究パラダイム全体と処理フローが収束するため、ラベル付きデータ、命令調整用のデータ、プロンプト ワード、プロンプト フレーズで構成されるプロンプト チェーンなど、多くの中間生成物が取引可能になります。など、さらには特定のシナリオで訓練されたロボットやアシスタントさえも、何らかの取引を行って資産化することができ、これは将来の新しいビジネスモデルとなる可能性があります。
一般的な大規模モデルは、高投資・高リターンであるが、不確実性も高いという「3高」を特徴としている。基本的な大規模モデルのトレーニングには、アルゴリズム、データ、才能の点で高い要件が必要なためです。たとえば、計算能力は少なくとも 10,000 kat レベルの計算能力が必要です。
なぜ不確実性がこれほど高いのでしょうか?最終候補に挙げられたメーカーは基本的に大手インターネット企業またはテクノロジー巨人であるため、訓練された大規模モデルが一般的な機能と創発的な機能を備えているためには、技術的な要件が非常に高くなります。 run オープンソースモデルを勝ち取ることによってのみ生き残ることができます。今後の市場では、ベーシックな大型モデルが多く混在すると思いますが、それほど多くないかもしれません。
実際、人工知能に質問すると、同じことが多くのことに当てはまります。大きなモデルには特定の記憶があります。人工知能はこれらのことが関連していることを知っていますが、幻覚が見られます。それがどのように見えるかです。したがって、企業がよく行うことは、社内の知識ベースに基づいて特定のクエリを作成し、それらに基づいて要約を作成することです。さらに、数百ページに及ぶ保険約款などの文書に基づいた質疑応答、要約、比較もあります。または、検索に基づいて回答します。これらの製品を総称して AI Answer と呼びます。また、オフィスワークやAI学習機などの機会にも注目しています。
Wang Danjun: 私たちはまた、皆さんのアプリケーション体験において、知識集約型産業におけるほとんどの問題の解決には大規模モデルが役立つと信じています。北泉や中関村科金のようなTo B分野では、その恩恵を受ける可能性がより高い企業も確かに存在するだろう。たとえば、企業の人事管理では、従業員のさまざまな共通の懸念に答えるなど、人々にとって退屈で退屈な事柄を大きなモデルが解決できることを誰もが期待しています。北仙と中関村科金はこの分野での協力についても話し合っており、将来的には大規模モデルの基盤施設を通じてデジタル従業員を確立し、人間の経験や知識を必要としないと思われるこれらの質問に答えたいと考えている。
業界のノウハウの最も明白な形式は、文書内のデータであり、これは記号表現です。文書から(プロンプトワード)あるいはプロンプトチェーンをどのように掘り出すかは、現段階で取り組むべき問題の一種である。多くの企業は大量のドキュメントを所有しており、それらのドキュメントの多くは PPT または PDF 形式です。その形式と内容の両方を理解する必要があります。
Wang Danjun: 現在、基本的な大規模モデル企業に加えて、垂直フィールド企業が市場で誰もが注目する第二陣の企業であるようです。次の時期は彼らにとって非常に挑戦的なものになると思います。垂直分野における企業の経験は、必ずしも新しいテクノロジーの恩恵を受けて新たな創造性に直接変換されるとは限りません。まず学習し、大規模なモデル操作の基礎となるロジックが何であるかを理解し、それがどのように役立つかを学び、知識を掘り起こしたり、顧客にサービスを提供したりするために、より多くの時間を費やす必要があります。今後しばらくは、彼らがまずこの課題に直面することになると思います。これらの基盤に基づいて、これらのモデルに基づいて顧客に価値を生み出す新たな機会を見つけてください。
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
大型モデルの“台頭”によるビジネスチャンス「百戦錬磨」の勝者は?
出典: ザ・ペーパー
著者: The Paper記者フアン・ヤンホン・インターンチェン・シャオルイ
生成 AI 技術は人工知能業界を変えつつあり、国内の大規模モデルの開発はわずか半年で技術から製品、そしてビジネスへの飛躍を完了し、垂直産業に浸透しました。 7月6日の世界人工知能会議中に、本紙は北泉人材管理研究所副所長の王丹軍氏、CICC研究部副部長の兪中海氏、中関村科金科技副社長の張潔氏を招待した。 Metaverse チャット ルームでは、大規模モデルの「出現」によるビジネス イノベーションの機会について議論します。対話はThe Paperの記者Shao Wen氏が司会を務め、1時間の対話の間、ゲストらは以下のような多くの関連問題について議論した。
汎用大型モデルと垂直フィールド大型モデルは、今後のビジネスシーンにおいてどのように価値を見出していくのでしょうか?
企業はどうすれば大型モデルのビジネスチャンスを掴むことができるのでしょうか?チャンスを掴むためのポイントは何でしょうか?
ビッグモデルの過去と未来
**澎湃科技: 現在、国内市場は「百モデル戦争」の状況を形成していますが、なぜ国内の大型モデルがこれほど急速に発展していると思いますか。それはあなたの分野にどのような影響を与えますか? **
**Wang Danjun (北泉人材管理研究所副所長): **技術的な観点から見ると、大型モデルの開発は過去 2 年間に起こったことではありません。学術分野では何年も前から誰もが研究を始めています。ただ、近年のデータ量の増加と技術レベルの向上に伴い、特にOpenAIがChatGPTをリリースして以来、広く注目を集めています。
そういった新しい技術を自分の分野にどう応用し、ビジネスモデルを改善していくかを、分野ごとにみんなで考えています。
例えば、私たち北泉タレントマネジメント研究所は人材業界に属しており、お客様はすべてHR(人事)グループの企業です。私たちは、人事の分野で大規模なモデルを適用することで、将来何らかの破壊的な価値を生み出す可能性があると考えています。たとえば、実際に全員の作業効率を向上させることができ、人事であろうとパートナーであろうと、ある程度の助けになるでしょう。これは、従業員の能力開発をより適切に導くことができると同時に、企業が、従業員を採用する際によく尋ねられること、誰がより適任で、誰がより多くの利益をもたらす可能性があるかなど、人事管理に関する多くの質問に答えるのにも役立ちます。 、給与はどのように決定されるべきかなど。大規模なモデルの開発と適用により、人材業界は非常に短期間で変革されると思います。
**Yu Zhonghai (CICC 研究部副部長): **Dean Wang 氏は非常に重要な点について言及しました。それは、大規模モデル技術は今日だけ起こったものではないということです。 2017 年、Google は Attending Is All You Need (必要なのは注意だけです) という有名な論文を執筆し、トランスフォーマー アーキテクチャを提案しました。
実際、中国の人工知能業界の専門家は、大規模モデル技術の可能性を非常に早い段階で発見しました。 2021年には関連する研究報告書も書きました。当時、私たちは人工知能モデルの開発に衝撃を受けました。今ではChatGPTという特定の製品によってビッグモデルが一般の人にも知られるようになり、技術がわかるかどうかに関わらず、プレイすればその魅力を感じられるため、ビッグモデルは人気があります。
大規模なモデルを何千もの業界にこれほど迅速に適用できるかどうかは、テクノロジーにおける平等な権利にも依存しており、これは私たちが提唱する非常に重要な概念です。オープンソース コミュニティの発展と知識の自然な普及のおかげで、多くの企業が独自の大規模モデルを迅速に作成しました。
さらに、今回はテクノロジー界全体、さらには社会全体が「みんながこれを非常に重要だと考えている」という、これまであまり見られなかった共同力を形成していることも付け加えておきたいと思います。
**Zhang Jie (中関村科金科技副社長): **このビッグモデルの初年度は、2020 年の GPT3 の発売まで遡ることができると思います。なぜ過去 6 か月でこれほど急速に発展したのでしょうか?理由は3つあると思います。
1 つ目の側面は、Baidu、Huawei、清華大学など、一部の企業や大学がこれまでに多くの蓄積を行っており、事前にトレーニングされた言語モデルや大規模なモデルがあり、過去 6 か月間は言語モデルの更新の反復でした。彼ら;
第 2 の側面は、一部の投資機関を含むさまざまな企業が投資を増やしていることです。
3 番目の側面は、オープンソースへの依存であり、オープンソース コミュニティにより、企業はさまざまな大規模ドメイン モデルを立ち上げるようになりました。
大型モデルが現場に与える影響に関しては、お客様と当社にとって双方向のメリットがあります。 Zhongguancun Kejin は、会話型 AI テクノロジー ソリューションの大手プロバイダーであり、大規模なモデルにより、さまざまなシーン モデルのカスタマイズと開発のコストが削減され、これは私たちにとって朗報です。お客様にとっては、インテリジェントプロジェクトのコスト削減により、多くの中小企業がプロジェクト立ち上げを検討するようになり、市場全体の規模が拡大してきました。
**澎湃科技: 最近、Tencent Cloud と OpenAI が相次いで、アプリ ストアの形式に似た、カスタマイズされたモデル ソフトウェアのための大規模なモデル ストアを提案していますが、この傾向をどのように理解していますか? **
**Wang Danjun:**この分野の投資家であろうと実践者であろうと、誰もがこの傾向を期待していると思います。なぜなら、この傾向はより多くの人がこの分野の共創に参加するよう促すからです。基本的なサービスを提供する企業にとって、今後は間違いなく店舗型が主流になると考えており、その方が顧客との距離が近づきやすくなります。また、大規模モデル ストアのモデルを使用すると、サービスを受けるユーザーが大規模モデルをより適切に使用して、いくつかの新しいアプリケーション シナリオやサービス価値を作成できるようになります。
Yu Zhonghai: これは実際、資本市場が非常に懸念している問題です。今後、大規模モデルの開発は中国のパブリッククラウドやプライベートクラウドに似てくると思います。
パブリッククラウドは、実は当時はIaaS(Infra Structure-as-a-Service、サービスとしてのインフラストラクチャ)と呼ばれていましたが、大規模なモデルになるとMaaS(Model as a Service)と呼ばれます。 Hugging Faceという海外の有名な会社があり、インターネット上にたくさんのモデルを公開していて、そのAPI(Application Program Interface、アプリケーションプログラミングインターフェース)を呼び出すだけでさまざまなAIモデルを利用することができます。
ただし、セキュリティコンプライアンスや細分化されたシーンの実装などの要件により、独自の大規模モデルを展開し、独自の知識を活用して強化し、独自の Fine Tune を行う必要がある企業も多くあります。これはプライベート クラウドに似ているかもしれません。中国の市場です。
大まかに言えば、大きなモデルは実際には誰もが直接使用するのには適していません。ChatGPT は実際に大きなモデルに基づいて製品にパッケージ化されており、一般の人がすべて体験できるようになっています。したがって、大規模なモデルに基づいてアプリケーションを作成することは、実際には非常に幅広い市場であり、デジタル従業員や、ホストが先ほど述べたアプリストアの概念など、多くのビジネスモデルを生み出す可能性があります。
実際、ChatGPT はトラフィック ポータルとして多くの人に考えられています。私の知る限り、一部の大手携帯電話メーカーも最終的に検索を行う可能性があります。その場合、この問題はまったく異なります。到達可能な市場は企業からになります。 IT 支出はマーケティング支出になります。中国企業は収益の平均 1% ~ 3% を IT に費やしますが、収益の 30% をマーケティングに費やす可能性があります。したがって、トラフィックがある場合、ビジネス モデルは大きく変化する可能性があり、これは非常に興味深いことです。
Zhang Jie: OpenAI と Tencent Cloud には異なる重点があると思います。 OpenAI は依然として基本的な大規模モデルに焦点を当てている可能性があり、いくつかの断片化されたシナリオで基本的な大規模モデルの精度や専門性の欠如を補うために、いくつかのエコロジカル パートナーを利用しています。ただし、Tencent Cloud は独自の基本モデルを過度に強調するのではなく、垂直産業向けの大規模モデルである必要性を強調しています。
それらの異なる重点は、共通の問題を示しています。つまり、基本的な大規模モデルは、一部の特定の業界や高度な専門性を備えたシナリオでは直接使用できず、適応層も必要です。ここに新たなビジネスモデルが生まれるかもしれない、つまり、将来的にはより多くの知識を活用できるのではないかと思います。誰もが AI を使用すると、技術的なパラダイムが異なることがわかります。したがって、誰もが共有できる資産は生データであり、生データを取得した後、さまざまな技術的手段を使用して処理されますが、この過程では、データの中間形式を取引することはできません。
ただし、大規模なモデルは基本的に多くの AI タスクを統合し、研究パラダイム全体と処理フローが収束するため、ラベル付きデータ、命令調整用のデータ、プロンプト ワード、プロンプト フレーズで構成されるプロンプト チェーンなど、多くの中間生成物が取引可能になります。など、さらには特定のシナリオで訓練されたロボットやアシスタントさえも、何らかの取引を行って資産化することができ、これは将来の新しいビジネスモデルとなる可能性があります。
一般大型モデル VS 垂直フィールド大型モデル
**ペーパーテクノロジー: 実は今、お三方はドメインビッグモデルとジェネラルビッグモデルという2つの異なるビジネスパスについて言及されましたが、この2つの異なるビジネスモデルの機会と課題について詳しくお話しいただけますか。 **
Wang Danjun: 将来、大型モデルを中心としたビジネスは間違いなくビジネス エコロジーになります。ビジネス エコロジーの中核となる特徴は、それが階層化されることです。まず第一に、大規模なモデルにはデータ基盤とコンピューティング能力が必要となるため、基本的なサービスを提供するメーカーがいくつか存在します。大規模なモデルは基盤となるエンジンとして機能し、強力な機能を備えていますが、特定のドメイン、サービス モデル、顧客のニーズに関する知識は理解できません。
それに加えて、垂直方向の大きなモックアップも付属します。これらの垂直ドメインの大規模モデルの一部はドメイン メーカー独自の大規模モデルであり、一部は基本的な大規模モデルに基づいてトレーニングされます。平たく言えば、これらのモデルをエキスパートにすることです。たとえば、金融分野には、投資家によるビジネス上の意思決定の支援に特化したサービスが存在する場合があります。また、人事分野には、企業の人材に関する意思決定の支援に特化したサービスが存在する場合があります。
細分化されたフィールドが多数存在する場合があります。これらの細分化には、顧客の問題を解決する方法についての業界の蓄積、トレーニング、理解が必要になる場合があり、さらにはインタラクティブ インターフェイスのユーザー エクスペリエンス レベルに関与することもあります。これらの蓄積は、実際には、先ほど説明したアプリ ストアの背後にある機能の一部です。
Yu Zhonghai: 私たちの観点からすると、これら 2 つのタイプの市場は実際にはまったく異なります。
まず、一般的な大型モデルに対して適切なデータ フライホイールを構築することも重要です。
たとえば、今日私は卓球の遊び方を教えていますが、「こうやってプレーしなさい」と言います。それから私がボールをサーブしたのですが、あなたはそれをキャッチできませんでした。それが正しい打ち方ではないことがわかります。次に、別の方法を変更します。今度はそれをキャッチすると、正しい方法を覚えます。それから私はあなたにボールをサーブし続け、あなたはそれをキャッチし続け、筋肉の記憶を少しずつ調整して最善の方法を見つけます。実際、モデルのトレーニングもそのようなプロセスです。 ChatGPT と通信するたびに、その下に「好き」または「嫌い」が表示されます。あるいは、何も言わずに、再生したことにとてもがっかりすることもあります。または、たとえば、Midjourney を使用して描画するたびに、4 つの画像が表示され、デフォルトで 3 番目の画像を選択し、拡大してダウンロードすると、この画像の方が優れていることがわかり、次の画像が表示されます。将来的にはこれに向けて、方向性はもう少し偏り、モデルは少し学習する予定です。データのフィードバックがなければ、モデルはそこにとどまり、改善することはできません。したがって、これは私たちが強調するデータ フライホイールであり、シーンのカードの位置を強調します。汎用大型モデルとしては誰かに使われることが最も重要であり、それが中国の利点でもある。中国人はテクノロジーを受け入れることを好み、大型モデルをより受け入れています。フィードバックをくれる人がたくさんいます。
大規模なドメインモデルの場合、より重要なのはノウハウ(特定の業界や仕事に従事するために必要な技術的ノウハウや専門知識)だと思います。
大規模ドメイン モデルの鍵は、顧客のニーズに応え、特定の深いドメインにおける顧客のノウハウを理解することです。中関村科金のような企業は、顧客のノウハウを理解し、特定の現場シナリオにおける顧客の問題点を理解しているという利点を持っています。
**張杰: **認識していただきありがとうございます。一般ラージモデルとドメインラージモデルは上流と下流の関係であり、競合関係ではないと理解しています。一般モデルは大規模で包括的であり、ドメイン モデルは小規模ですが美しいビジネスです。
一般的な大規模モデルは、高投資・高リターンであるが、不確実性も高いという「3高」を特徴としている。基本的な大規模モデルのトレーニングには、アルゴリズム、データ、才能の点で高い要件が必要なためです。たとえば、計算能力は少なくとも 10,000 kat レベルの計算能力が必要です。
なぜ不確実性がこれほど高いのでしょうか?最終候補に挙げられたメーカーは基本的に大手インターネット企業またはテクノロジー巨人であるため、訓練された大規模モデルが一般的な機能と創発的な機能を備えているためには、技術的な要件が非常に高くなります。 run オープンソースモデルを勝ち取ることによってのみ生き残ることができます。今後の市場では、ベーシックな大型モデルが多く混在すると思いますが、それほど多くないかもしれません。
ドメインのモックアップは、小さいながらも美しいトラックである可能性があります。大規模なドメイン モデルのトレーニングにはそれほど高いコンピューティング能力は必要なく、私たちの実験によると、大規模なドメイン モデルの反復には 1 週間しかかかりません。 2 枚のカードはリアルタイムで何らかの推論を行うことができます。次に、データに関しては、独自のしきい値をいくつか設定する必要があります。これは、Yu 氏が先ほど述べたデータ フライホイール効果です。
競争で最も重要なポイントは才能です。大規模なドメイン モデルにより、業界全体のテクノロジー チェーンが平坦化されました。人材には、アルゴリズムを理解するだけでなく、アルゴリズムを適切に設計する方法、シナリオ、ビジネス、さらには製品設計を理解する方法も理解する必要があります。人材の複合能力を刺激し、次に人材の自発性と創造性を刺激することが必要であり、これは組織能力の試金石となります。
**大型モデルはどの分野で最も役に立ちますか? **
**製紙技術: 最も有望な垂直用途の 3 つの方向は何ですか? **
Yu Zhonghai: 私たちはさまざまな方向性を検討してきましたが、現在最も有望な方向性は AI Answer です。AI Answer は、私たちが独自に作った言葉で、製品のカテゴリーを指します。たとえば、今日、あなたは私にある問題についてテストし、どのブランドのベビーカーを買うのが良いか尋ねました。誰もが同じような状況にあるはずで、友人 3 人に質問し、小紅書の記事を 5 件読み、その後インターネットで 10 件の投稿を検索します。最後に読んでから3モデルを総合し、価格を見て決めました。
実際、人工知能に質問すると、同じことが多くのことに当てはまります。大きなモデルには特定の記憶があります。人工知能はこれらのことが関連していることを知っていますが、幻覚が見られます。それがどのように見えるかです。したがって、企業がよく行うことは、社内の知識ベースに基づいて特定のクエリを作成し、それらに基づいて要約を作成することです。さらに、数百ページに及ぶ保険約款などの文書に基づいた質疑応答、要約、比較もあります。または、検索に基づいて回答します。これらの製品を総称して AI Answer と呼びます。また、オフィスワークやAI学習機などの機会にも注目しています。
Zhang Jie: まず業界別に見て、次にシーン別に見ることができると思います。大規模ドメイン モデルに理想的な業界は、知識密度が高く、プロセス ロジックが強力で、セキュリティとプライバシーに敏感な業界です。たとえば、金融、医療、法律、官公庁などの業界が実装に最適です。将来の大規模ドメインモデルの開発に向けて。
シーンは最初は社内の従業員に権限を与えられるかもしれません。たとえば、知識に関するクイズをいくつか行い、その後にトレーニングとスパーリングを行います。社内従業員に権限を与えた後、C (顧客) に対して何らかのサービスを提供する方法、または営業スタッフと顧客サービス スタッフにマーケティングの顧客サービス アシスタントになる権限を与える方法を見てみましょう。つまり、適用する場合は、まず比較的耐障害性の高いシーンから検討することができます。
Wang Danjun: 私たちはまた、皆さんのアプリケーション体験において、知識集約型産業におけるほとんどの問題の解決には大規模モデルが役立つと信じています。北泉や中関村科金のようなTo B分野では、その恩恵を受ける可能性がより高い企業も確かに存在するだろう。たとえば、企業の人事管理では、従業員のさまざまな共通の懸念に答えるなど、人々にとって退屈で退屈な事柄を大きなモデルが解決できることを誰もが期待しています。北仙と中関村科金はこの分野での協力についても話し合っており、将来的には大規模モデルの基盤施設を通じてデジタル従業員を確立し、人間の経験や知識を必要としないと思われるこれらの質問に答えたいと考えている。
さらに、企業のリーダーシップコーチングなど、価値の高い分野がいくつかあることもわかりました。企業には複数のレベルのマネージャーがおり、各マネージャーは毎日さまざまな課題に直面しますが、他のマネージャーにアドバイスを求める機会はそれほど多くありません。AIGC はこのシナリオで非常に優れた支援を提供できると考えています。プライバシーに関する個人的な要件。
**澎湃科技:マイクロソフトは最近、アプリケーションエコロジーをオープンにするためにOpenAIとの協力を発表しました.中関村科金は中国の大規模アプリケーションメーカーの代表的企業ですが、製品の上陸と応用の現在の進捗状況はどうですか?将来的には各社が独自の専用モデルを用意するようになるのでしょうか? **
Zhang Jie: すべての企業が独自の専用モデルを必要とするわけではないと思います。なぜなら、大規模モデルのテクノロジーは浅いものから深いものまで 3 つの層に分類できると考えているからです。
第1レベルでは、業界や企業の知識や資料がそれほど多くない場合、あるいは企業自体の特殊性が強くない場合には、専用のモデルを使用する必要はなく、一般的な大きなモデルをそのまま使用することができる。一般的な大型モデルでは、特定のシーンの要件に応じて調整(プロンプト)するだけで十分です。この期間中、企業が必要とするのは、優れたユーザー エクスペリエンスと低い敷居を備えた迅速な単語管理ツールです。ビジネスの専門家によっては、特定のシナリオで有用なプロンプトをいくつか蓄積する必要がある場合があります。より複雑なシナリオの場合は、いくつかのプロンプトを小さなプロンプトのセットに変換し、異なるセット間でチェーンを形成し、そのチェーンが論理的に順序付けされる必要があります。関係を構築するには、迅速なチェーン管理ツールがあれば十分です。
2 番目の層はもう少し複雑です。企業によっては、多くの断片的なナレッジを保有している場合があります。現時点では、プロンプトの言葉やプロンプトの連鎖だけでは不十分な場合があります。低頻度でロングテールのナレッジを管理するには、一般的な大規模モデルの上にナレッジ ベースを追加する必要があります。一般的な大規模モデルで特定の問題が発生した場合は、ナレッジ ベースにアクセスして答えを見つけてください。一般大型モデル+ナレッジベース+プロンプトエンジニアリングの技術ルートです。
第 3 層では、大量のドメイン知識を持つ企業の場合、企業専用の大規模なドメイン モデルを構築し、一般的な共通性を維持するだけでなく、ドメイン内の一般知識をその大規模モデルの頭脳にインプットする必要があります。センスと推理力だけでなく、その分野の専門知識も備えています。知識とスキルは、文系学生から専門分野の専門家まで大きなモデルを作ります。これは、大規模ドメイン モデル + ドメイン ナレッジ ベース + プロンプト エンジニアリングのルートです。
中関村科金では、上記の 3 つの状況に対する応用演習を行っており、以前から 3 つの技術的問題を解決しようとしており、解決後に 2 セットの補助アプリケーションを作成しました。 3 つの技術的困難とは何ですか?
1 つ目は、大型モデルでよく発生する幻覚の問題、つまり深刻なナンセンスを解決することです。これには、質問されたときに知識ベース内で関連する知識を見つける必要があることを大きなモデルに知らせるために、フィールドに知識ベースが必要です。ナレッジ ベースを構築する場合、リッチ テキスト形式のドキュメントを処理する必要があることがよくありますが、大規模なモデルではまずドキュメントのレイアウトを理解してから、その内部のコンテンツを理解する必要があります。
2 つ目は、ドメイン内で大規模なモデルをトレーニングするときに、トレーニング プロセス中に忘れてしまう問題を防ぐことです。そうしないと、新しい知識を脳に入力すると、古い知識が忘れられてしまいます。ここでは効率的かつきめ細かな技術的手段を用いて、本来の一般知識だけでなく、現場の常識も学びます。
3つ目は、ユーザーにいかに便利に低コストで使ってもらうかです。大規模なドメイン モデル、ドメインのナレッジ ベース、プロンプト ワードのいずれであっても、それは一夜にして達成できるものではなく、継続的なフィードバックと反復が必要です。これには顧客のメンテナンス能力が必要であり、製品設計とエンジニアリング パッケージングは現場で適切に行われなければなりません。ツールレベル。
**澎湃科技: モバイルインターネットとハードテクノロジーの時代の投資ロジックと比較して、プロジェクト選択の中心となる今回の大規模モデルの隆盛期における投資の観点からYu氏にお聞きしたいです。 、投資判断のポイントも含めて何ですか? **
**Yu Zhonghai:**これは資本が模索してきた問題でもあります。過去 6 か月の間に、大型モデルの市場も多くの進化を遂げました。当初はテーマ投資として捉える人も多かったですが、当時はAI関連の企業が投機され、実際に大規模モデルの基礎力を持つ企業が皆から高く評価されました。その後、「百モデル戦争」が起こりました。大きなモデルは少し複雑すぎると誰もが感じました。ナゲッツからシャベルを買うことで恩恵を受けるのは計算能力であることがわかり、計算能力に関連する企業の評価は大幅に上昇しました。多く。今年の5月から6月までに、私たちは「AIアプリケーションが爆発的なカンブリア紀の到来を告げた」と提案した。多くの企業が独自の製品を開発し、AI の応用が再び高まり始めています。
実は、大きなモデルの投資リズムも緩やかで、最初からAI企業であれば大きくなって、アプリケーションが出てきて、このアプリケーションはどうかと皆で模索し始めるのです。顧客が代金を払っているかどうか、そして実際の注文があるかどうか。おそらくあと 1 年かそこらで、このアプリケーションに障壁があるかどうか、そしてビジネスが長期的に持続可能であるかどうかについて誰もが考えることになると思います。実際、私たちが最も楽観的に考えているのはアプリケーション レベルであり、大規模なモデルとエンタープライズ アプリケーションを真に接続し、真に価値を生み出すことができる企業を非常に重視しています。
**論文: 次の質問は Dean Wang です。人材の観点から見ると、ビッグモデルは現在、人間と機械のコラボレーションによる新しい生産関係を構築しています。それでは、これは企業の人材管理にどのような影響を与えるのでしょうか? **
Wang Danjun: これは特に良い質問です。社会レベルでは、誰もが「将来、自分の仕事が大きなモデルに取って代わられるだろうか?」という議論に非常に熱心であると考えられるため、この質問については、次の 2 つの側面から見ることができると考えています。
一方で、全員がより議論したのは、大規模モデルの能力がますます強化され、垂直分野の適用がますます深まり、将来的には多くの一般従業員の仕事に取って代わられる可能性があるということです。近年、大規模なモデル開発の背景がなくても、企業は人件費の比率に関わるコスト削減や効率化に誰もが非常に関心を持っています。いくつかの新しいテクノロジーを使用して人件費を削減できれば、企業にとって非常に価値があり、それが企業の持続可能な発展の重要な理由となります。
一方で、将来的には大型モデルの登場や、より多くの垂直フィールドツールの登場が従業員にとっては幸いとなるでしょう。良い面としては、従業員が人間と機械のコラボレーションをうまく活用できれば、会社により多くの価値を生み出すことができます。
今後、組織形態に若干の変更が生じることが予想されます。現在、ほとんどの企業は機能別構造を採用しており、異なる機能が同じ顧客にサービスを提供していますが、機能間のコラボレーションやコミュニケーションには多くの問題があり、企業にとって多大な労力を費やしています。しかし将来的には、個々の従業員やグループがツールの助けを借りて万能な能力を備えれば、組織単位は必然的に小さくなり、より機敏で柔軟、即応性が高まるでしょう。
**製紙技術:お三方にお聞きしたいのですが、百機種戦争の中で企業に最も必要とされる能力は何でしょうか? **
**Zhang Jie: **基礎的な大規模モデルのメーカーにとって、最も必要なのは、特に強力でユニークな技術力を持つことです。オープンソースの大規模モデルを上回るパフォーマンスを発揮し、マルチモーダルまたはマルチモーダルな独自の技術を備えていることです。複雑な推理セックス。現場の大規模模型メーカーにとって最も求められるのは複合的な人材であり、組織力が非常に重要です。人材の自発性と創造性を最大限に発揮し、最先端のビジネスチャンスに結びつけ、顧客のニーズを伝えていく必要がある。さらに、エンジニアリング能力とアルゴリズム能力も必要です。
Yu Zhonghai: データは非常に重要だと思います。特に大規模なモデルを使用したい企業にとって、データは非常に重要です。実際、データはすぐに私たちにとって障壁になるでしょう。大規模なモデル アプリケーションを提供する中関村科金のような企業は、データに最大の利点を持っています。
**Wang Danjun: **実際には、大多数の企業にとって、将来的には大規模モデルの作成者ではなく、大規模モデルの消費者になる可能性が高くなります。大規模モデルを積極的に採用することで、デジタル管理プロセスが大幅に加速する可能性があります。 。組織と個人の両方が変化を受け入れる必要があるかもしれません。あらゆるレベルのリーダーはこの新しい機会を受け入れる意識を高める必要があり、従業員は継続的かつ自発的な学習能力を維持する必要があります。
**製紙技術: このプロセスでは、垂直分野の企業は業界のノウハウを活用できます。大規模なモデル データのカード ポイントを突破するのは簡単ですか? **
Zhang Jie: 業界のノウハウは詳細に検討する必要があると思います。特別な注意が必要な形式がいくつかあるかもしれません。
業界のノウハウの最も明白な形式は、文書内のデータであり、これは記号表現です。文書から(プロンプトワード)あるいはプロンプトチェーンをどのように掘り出すかは、現段階で取り組むべき問題の一種である。多くの企業は大量のドキュメントを所有しており、それらのドキュメントの多くは PPT または PDF 形式です。その形式と内容の両方を理解する必要があります。
この種の業界のノウハウに加えて、業界の専門家やシナリオの専門家が頭の中に隠している知識があり、それを言葉で要約できるツールを与える必要があります。テンプレートは業界です。ノウハウをより高密度に。
また、システム ログに隠された集合知である、比較的隠されたタイプの業界ノウハウもあります。これらのログをマイニングした後、分散した知識を構造化された連鎖的な知識に変えることができます。次に、何千ものチェーンから要約され、特定のシナリオの下でのベスト プラクティスに変換されます。たとえば、営業マンは毎日たくさんの電話をかけており、毎日何百万件もの会話ログが蓄積されていますが、注文の完了、流れの順番、電話の切り方などのさまざまな結果に応じてカスタマイズすることで、新しいマーケティングに最適なスピーチ スキルが得られます。生成物が沈殿する可能性があります。
これら 3 種類の質問は、実際には業界の非常に優れたノウハウです。ここには、文書やログからプロンプトワードやプロンプトチェーンをどのように掘り出すかなど、技術的な課題もいくつかあります。 doc2 と log2 は、投資する価値のある研究の焦点です。
Yu Zhonghai: 実際、張潔にはいつも私に深い感銘を与える言葉がありました。彼は、太陽系の 8 つの惑星の軌道を数千万年にわたって記録することは、抽象的な法則ほど優れたものではない、と言いました。物事をよりよく説明できる重力、自然。
これはノウハウだと思います。垂直分野の企業は関連分野の経験が豊富なので、例を挙げますと、人工知能が普及してから、年収100万のエンジニアという新しい職業があると誰もが言いました。
書きに行ったエンジニアです。では、なぜそれらはそれほど価値があるのでしょうか?私自身も人工知能ペイントツールを使用しています。一度、スーツを着た男性を描きたいと思ったのですが、いろいろなキーワードを試してみましたが、うまくいきませんでした。後で「ネクタイ」と入力すると、相手はすぐにスーツを着ました。これが魔法の言葉であることがわかります。
大規模モデルは確率ゲームに似ており、実際には多くの事前確率を持っています。先ほどのシーンでは、ネクタイはスーツに相当する非常に重要な単語です。そしてエンジニアは、どのキーワードがモデルを混乱させる可能性があるかを知っており、私たちがどのようなものを書きたいのかを知っており、これが彼の価値です。では、これを応用シナリオに落とし込んでみると、実は垂直分野の企業の価値ということになります。彼は人工知能と業界のノウハウの両方を理解しています。
Wang Danjun: 現在、基本的な大規模モデル企業に加えて、垂直フィールド企業が市場で誰もが注目する第二陣の企業であるようです。次の時期は彼らにとって非常に挑戦的なものになると思います。垂直分野における企業の経験は、必ずしも新しいテクノロジーの恩恵を受けて新たな創造性に直接変換されるとは限りません。まず学習し、大規模なモデル操作の基礎となるロジックが何であるかを理解し、それがどのように役立つかを学び、知識を掘り起こしたり、顧客にサービスを提供したりするために、より多くの時間を費やす必要があります。今後しばらくは、彼らがまずこの課題に直面することになると思います。これらの基盤に基づいて、これらのモデルに基づいて顧客に価値を生み出す新たな機会を見つけてください。
**ペーパーテクノロジー: 最近、ChatGPT 訪問者数の減速など、いくつかの新しい傾向が見られます。実はスーパーエントランスとしては存在しませんでした。 ChatGPT は GPT の将来を表すことはできず、OpenAI と Microsoft が市場に提示した製品にすぎないという見方があります。この観点についてお三方はどう思いますか? **
Yu Zhonghai: この視点は確かに非常に興味深いです。私自身は大型製品をよく使う人間なので比較的楽観視しています。そして、現在の ChatGPT は最終形ではないことを付け加えておきたいと思います。 Googleの次世代AndroidシステムにおけるGoogle Assistant(グーグルアシスタント)は、非常に重要な交通の入り口でもあるため、自社の大型モデルでサポートされることになると思います。
Wang Danjun: 業界の多くの人々にとって、誰もが非常に楽観的です。新製品として、開発のこの段階では、当然、何らかの差別化が行われます。エンドユーザーにとっては、そのようなツールに興味があり、喜んで試して使い続けるでしょう。利用頻度が減り、注目度が下がっても、ユーザーの行動は変わりにくい。
Zhang Jie: ChatGPT の成長率の鈍化は、遅かれ早かれ起こることだと思います。結局のところ、トラフィックには上限があります。遅かれ早かれ、トラフィックがピークに達するか、チャットのアプリケーション シナリオに対する一般の熱意が低下するでしょう。結局のところ、チャットは高頻度の固定的な需要ではありませんが、特に良いインスピレーションをもたらします。
一方では、ChatDoc、ChatPdf、ChatBI など、チャットを通じて写真、ビデオ、レポート、PPT などを生成するなど、チャット周りのアプリケーションが数多くあります。もう 1 つのシナリオは、金融 GPT、法律 GPT、医療 GPT など、先ほど述べた大規模ドメイン モデルであり、これらはすべて将来の新しいビジネスの入り口になる可能性があります。