著者:クリス・ディクソン、a16z暗号の創設者。 エリザベス・ハーカビー、パートナー、a16z暗号; 翻訳:ゴールデンファイナンスシャオゾウ現代の人工知能システムは、計算能力やアルゴリズムだけでなく、人間のフィードバックも不可欠です。企業は、人間のフィードバック強化学習(RLHF)や直接的な好みの最適化(DPO)などの訓練後(post-training)最適化技術を用いてモデルを改善しています。これらの技術は偏見を減少させ、モデルがプロンプトに対してより高品質で一貫した応答をすることを可能にします。これはAIの発展を加速させるために重要です。モデル評価も同様に重要ですが、何が「より良い」のかを定義しなければモデルの最適化は実現できません。ここで課題が生じます:企業は共有することに消極的であり、データやトレーニングプロセスを機密として扱います。 その結果、AIモデルの評価は、クローズドシステムからの限られた情報、または実際のアプリケーションから切り離された静的ベンチマークにしか依存できず、モデルの改善の余地が大幅に制限されています。 また、ユーザーも盲点に立たされており、フィードバックがモデルにどのような影響を与えるのか、あるいはモデルが採用されるのかどうかさえわかりません。 モデルリーダーボードやクラウドソーシングプラットフォームの中には、透明性の向上を試みているものもありますが、多くの場合、ユーザーが自分の貢献を追跡したり、参加に対する具体的なリターンを提供したりすることはできません。 公正で透明性が高いと主張するプラットフォームは、多くの場合、強制力のある基準ではなく、完全性に依存しています。私たちは、暗号技術がこのAIのグレーゾーンに透明性と所有権をもたらすと信じています。ブロックチェーンは、貢献者が便利に報酬を得る手助けをするだけでなく、AI開発者にフィードバックデータの質と出所の信頼できる保証を提供します。ユーザーはインセンティブを得て、開発者は信頼できるデータを得て、すべての人がこのオープン市場で双方向監査を実現できます。そのために、私たちは消費者向け製品Yuppの3300万ドルのシードラウンドにリード投資しました。このプラットフォームは、誰もが最新のAIモデルを無料で探索し、比較できるようにしています。Yuppはクラウドソーシングモデルを使用してモデル評価を行います:ユーザーはプロンプトを入力し、複数のAIが生成した応答を並行して確認し、最良の答えを選択します。彼らの選択は数字署名付きの好みデータ「データパッケージ」を生成し、これらのデータはAIのトレーニング後の最適化と評価に非常に価値があります。ユーザーは最新モデルを無料で使用できるだけでなく、提供したフィードバックに基づいて報酬を得ることができます。Yuppのデザインは人間の判断を再生可能な経済資源に変換します。新しいインタラクションデータの生成に伴い、古いデータは「期限切れ」となり、自然なフライホイールが形成されます:より多くの採用が新鮮な評価をもたらし;新鮮な評価がより高品質なモデルを生み出し;より高品質なモデルがより多くの利用を引き寄せます。すべての参加者—一般ユーザーでもAIモデル開発者でも—が参加でき、誰にでも適用される透明なルールを目にし、市場の信頼できる中立性が保たれることを保証します。スコアを隠す者はいなく、報酬や結果を操作できる者もいません。創業チームはAIと暗号分野において豊富な経験を持っています。彼らはTwitterの初期に消費者向けの機械学習製品を共同開発しました。Pankaj GuptaはGoogle PayおよびCoinbaseのグローバル消費者エンジニアリング責任者を務め、Gilad MishneはGoogleXの機械学習責任者でした。スタートアップチームはGoogle、Coinbase、およびトップラボからの上級エンジニアを集結させています。AIは大規模な人間の入力に基づく堅牢で信頼できる評価システムを必要とし、暗号技術はその目標を実現するための信頼の機械です。世界中のユーザーがモデルの改善に対するフィードバックを提供することで、Yuppは未来のAIの基盤評価層になることを目指しています。私たちはYuppを支援できることを光栄に思い、AIの革新の成果がすべてのビルダーに共有されるよう、オンチェーンフィードバックのクローズドループを構築する手助けをすることを楽しみにしています。
a16z:私たちがYuppに投資する理由
著者:クリス・ディクソン、a16z暗号の創設者。 エリザベス・ハーカビー、パートナー、a16z暗号; 翻訳:ゴールデンファイナンスシャオゾウ
現代の人工知能システムは、計算能力やアルゴリズムだけでなく、人間のフィードバックも不可欠です。企業は、人間のフィードバック強化学習(RLHF)や直接的な好みの最適化(DPO)などの訓練後(post-training)最適化技術を用いてモデルを改善しています。これらの技術は偏見を減少させ、モデルがプロンプトに対してより高品質で一貫した応答をすることを可能にします。これはAIの発展を加速させるために重要です。モデル評価も同様に重要ですが、何が「より良い」のかを定義しなければモデルの最適化は実現できません。
ここで課題が生じます:企業は共有することに消極的であり、データやトレーニングプロセスを機密として扱います。 その結果、AIモデルの評価は、クローズドシステムからの限られた情報、または実際のアプリケーションから切り離された静的ベンチマークにしか依存できず、モデルの改善の余地が大幅に制限されています。 また、ユーザーも盲点に立たされており、フィードバックがモデルにどのような影響を与えるのか、あるいはモデルが採用されるのかどうかさえわかりません。 モデルリーダーボードやクラウドソーシングプラットフォームの中には、透明性の向上を試みているものもありますが、多くの場合、ユーザーが自分の貢献を追跡したり、参加に対する具体的なリターンを提供したりすることはできません。 公正で透明性が高いと主張するプラットフォームは、多くの場合、強制力のある基準ではなく、完全性に依存しています。
私たちは、暗号技術がこのAIのグレーゾーンに透明性と所有権をもたらすと信じています。ブロックチェーンは、貢献者が便利に報酬を得る手助けをするだけでなく、AI開発者にフィードバックデータの質と出所の信頼できる保証を提供します。ユーザーはインセンティブを得て、開発者は信頼できるデータを得て、すべての人がこのオープン市場で双方向監査を実現できます。そのために、私たちは消費者向け製品Yuppの3300万ドルのシードラウンドにリード投資しました。このプラットフォームは、誰もが最新のAIモデルを無料で探索し、比較できるようにしています。
Yuppはクラウドソーシングモデルを使用してモデル評価を行います:ユーザーはプロンプトを入力し、複数のAIが生成した応答を並行して確認し、最良の答えを選択します。彼らの選択は数字署名付きの好みデータ「データパッケージ」を生成し、これらのデータはAIのトレーニング後の最適化と評価に非常に価値があります。ユーザーは最新モデルを無料で使用できるだけでなく、提供したフィードバックに基づいて報酬を得ることができます。
Yuppのデザインは人間の判断を再生可能な経済資源に変換します。新しいインタラクションデータの生成に伴い、古いデータは「期限切れ」となり、自然なフライホイールが形成されます:より多くの採用が新鮮な評価をもたらし;新鮮な評価がより高品質なモデルを生み出し;より高品質なモデルがより多くの利用を引き寄せます。すべての参加者—一般ユーザーでもAIモデル開発者でも—が参加でき、誰にでも適用される透明なルールを目にし、市場の信頼できる中立性が保たれることを保証します。スコアを隠す者はいなく、報酬や結果を操作できる者もいません。
創業チームはAIと暗号分野において豊富な経験を持っています。彼らはTwitterの初期に消費者向けの機械学習製品を共同開発しました。Pankaj GuptaはGoogle PayおよびCoinbaseのグローバル消費者エンジニアリング責任者を務め、Gilad MishneはGoogleXの機械学習責任者でした。スタートアップチームはGoogle、Coinbase、およびトップラボからの上級エンジニアを集結させています。
AIは大規模な人間の入力に基づく堅牢で信頼できる評価システムを必要とし、暗号技術はその目標を実現するための信頼の機械です。世界中のユーザーがモデルの改善に対するフィードバックを提供することで、Yuppは未来のAIの基盤評価層になることを目指しています。私たちはYuppを支援できることを光栄に思い、AIの革新の成果がすべてのビルダーに共有されるよう、オンチェーンフィードバックのクローズドループを構築する手助けをすることを楽しみにしています。