人工知能の熾烈な分野で、メタはコードを生成し解釈するための機械学習システムである Code Llama をリリースし、注目を集めることを目指しました。同社はこのイノベーションをオープンソースとして共有し、人工知能の分野をさらに前進させています。Meta は、その革新的でオープンなアプローチにより、テキストの生成、言語の翻訳、音声の作成のための一連の AI モデルを以前にリリースしました。現在、彼らはこの取り組みをオープンソースの Code Llama を通じてコードの分野に拡張し、Python、C++、Java、PHP、TypeScript、C#、Bash などのさまざまなプログラミング言語でコードを生成しています。Code Llama は、GitHub Copilot や Amazon CodeWhisperer などのいくつかの有名なオープンソース人工知能コード ジェネレーターに似ています。これは、特定の自然言語 (特に英語) のコードを生成および解釈できる Llama 2 テキスト生成モデルに基づいています。Meta が TechCrunch と共有したブログ投稿の中で、彼らは次のように述べています。「Meta では、AI モデル、特にコーディング用の大規模言語モデルがオープンなアプローチから最も恩恵を受けると固く信じています。オープンでコードに焦点を当てたモデルは、新しいテクノロジーが開発されて、 「人々の生活を改善します。Code Llama などのコード モデルを公開することで、コミュニティ全体がその機能を評価し、問題を特定し、脆弱性を修正できます。」Code Llama にはいくつかのバージョンがあり、Python 用に最適化されたものや、命令を理解できるように微調整されたものなどがあります。これらのモデルは、コードを含むデータのサブセットに焦点を当て、Web 上で公開されているソースからのデータセットを使用してトレーニングされました。モデルのサイズは 70 億から 340 億のパラメーターの範囲にあり、5,000 億のコード トークンを使用してトレーニングされます。このうち、Python 固有のバージョンは 1,000 億の Python コード トークンに基づいて微調整され、命令理解バージョンはヒューマン アノテーターからのフィードバックを使用して微調整され、質問に対する「有用」かつ「安全な」回答が生成されました。コード生成ツールは、プログラマーにとっても非プログラマーにとっても同様に大きな魅力を持ちます。たとえば、GitHub によると、400 以上の組織が Copilot を使用しており、これにより開発者は以前より 55% 速くコーディングできるようになりました。 Stack Overflow の調査では、70% の人が生産性と学習速度を向上させるために人工知能コーディング ツールをすでに使用しているか、使用する予定であることも示しています。ただし、あらゆる形式の生成 AI と同様に、コーディング ツールによって新たなリスクが生じる可能性があります。人工知能ツールを使用しているエンジニアは、アプリケーションにセキュリティの脆弱性を持ち込む可能性が高いことが調査でわかっています。さらに、一部のコード生成モデルは著作権で保護されたライセンスまたは制限されたライセンスに基づいてトレーニングされる場合があり、知的財産の問題が発生する可能性があります。また、ハッカーがオープンソース コード ジェネレーターを使用して悪意のあるコードを作成しようとするリスクもあります。Code Llama はメタ内でレッドチーム化されていますが、それにもかかわらず、場合によっては依然として不正確または攻撃的な応答を生成する可能性があります。 Meta は、Code Llama は場合によっては問題が発生する可能性があることを認めており、そのため開発者は、Code Llama をアプリケーションに導入する前に、セキュリティをテストして調整する必要があります。リスクはありますが、Meta は Code Llama の展開に対して比較的緩やかな制限を設けています。開発者は、モデルを悪意のある目的で使用しないことに同意するだけでよく、月間アクティブ ユーザー数が 7 億人を超えるプラットフォームにモデルを展開する場合はライセンスを申請する必要があります。Code Llama のオープンソース配布は、研究、産業、オープンソース プロジェクト、NGO、企業など、さまざまな分野のソフトウェア エンジニアをサポートすることを目的としています。 Meta は、この取り組みが、他の人が Llama 2 を使用して、研究や商用製品の開発をサポートする新しい革新的なツールを作成するよう促すことを望んでいます。全体として、Meta の Code Llama は人工知能の分野における重要な進歩を表しており、コード生成の力を新たなレベルに押し上げています。潜在的なリスクや課題はいくつかありますが、テクノロジーが進化し続けるにつれて、開発者やユーザーのニーズをより適切に満たすためのより多くのイノベーションやソリューションが登場することが期待できます。
Meta が Code Llama をリリース: オープンソース AI コード生成モデル
人工知能の熾烈な分野で、メタはコードを生成し解釈するための機械学習システムである Code Llama をリリースし、注目を集めることを目指しました。同社はこのイノベーションをオープンソースとして共有し、人工知能の分野をさらに前進させています。
Meta は、その革新的でオープンなアプローチにより、テキストの生成、言語の翻訳、音声の作成のための一連の AI モデルを以前にリリースしました。現在、彼らはこの取り組みをオープンソースの Code Llama を通じてコードの分野に拡張し、Python、C++、Java、PHP、TypeScript、C#、Bash などのさまざまなプログラミング言語でコードを生成しています。
Code Llama は、GitHub Copilot や Amazon CodeWhisperer などのいくつかの有名なオープンソース人工知能コード ジェネレーターに似ています。これは、特定の自然言語 (特に英語) のコードを生成および解釈できる Llama 2 テキスト生成モデルに基づいています。
Meta が TechCrunch と共有したブログ投稿の中で、彼らは次のように述べています。「Meta では、AI モデル、特にコーディング用の大規模言語モデルがオープンなアプローチから最も恩恵を受けると固く信じています。オープンでコードに焦点を当てたモデルは、新しいテクノロジーが開発されて、 「人々の生活を改善します。Code Llama などのコード モデルを公開することで、コミュニティ全体がその機能を評価し、問題を特定し、脆弱性を修正できます。」
Code Llama にはいくつかのバージョンがあり、Python 用に最適化されたものや、命令を理解できるように微調整されたものなどがあります。これらのモデルは、コードを含むデータのサブセットに焦点を当て、Web 上で公開されているソースからのデータセットを使用してトレーニングされました。モデルのサイズは 70 億から 340 億のパラメーターの範囲にあり、5,000 億のコード トークンを使用してトレーニングされます。このうち、Python 固有のバージョンは 1,000 億の Python コード トークンに基づいて微調整され、命令理解バージョンはヒューマン アノテーターからのフィードバックを使用して微調整され、質問に対する「有用」かつ「安全な」回答が生成されました。
コード生成ツールは、プログラマーにとっても非プログラマーにとっても同様に大きな魅力を持ちます。たとえば、GitHub によると、400 以上の組織が Copilot を使用しており、これにより開発者は以前より 55% 速くコーディングできるようになりました。 Stack Overflow の調査では、70% の人が生産性と学習速度を向上させるために人工知能コーディング ツールをすでに使用しているか、使用する予定であることも示しています。
ただし、あらゆる形式の生成 AI と同様に、コーディング ツールによって新たなリスクが生じる可能性があります。人工知能ツールを使用しているエンジニアは、アプリケーションにセキュリティの脆弱性を持ち込む可能性が高いことが調査でわかっています。さらに、一部のコード生成モデルは著作権で保護されたライセンスまたは制限されたライセンスに基づいてトレーニングされる場合があり、知的財産の問題が発生する可能性があります。また、ハッカーがオープンソース コード ジェネレーターを使用して悪意のあるコードを作成しようとするリスクもあります。
Code Llama はメタ内でレッドチーム化されていますが、それにもかかわらず、場合によっては依然として不正確または攻撃的な応答を生成する可能性があります。 Meta は、Code Llama は場合によっては問題が発生する可能性があることを認めており、そのため開発者は、Code Llama をアプリケーションに導入する前に、セキュリティをテストして調整する必要があります。
リスクはありますが、Meta は Code Llama の展開に対して比較的緩やかな制限を設けています。開発者は、モデルを悪意のある目的で使用しないことに同意するだけでよく、月間アクティブ ユーザー数が 7 億人を超えるプラットフォームにモデルを展開する場合はライセンスを申請する必要があります。
Code Llama のオープンソース配布は、研究、産業、オープンソース プロジェクト、NGO、企業など、さまざまな分野のソフトウェア エンジニアをサポートすることを目的としています。 Meta は、この取り組みが、他の人が Llama 2 を使用して、研究や商用製品の開発をサポートする新しい革新的なツールを作成するよう促すことを望んでいます。
全体として、Meta の Code Llama は人工知能の分野における重要な進歩を表しており、コード生成の力を新たなレベルに押し上げています。潜在的なリスクや課題はいくつかありますが、テクノロジーが進化し続けるにつれて、開発者やユーザーのニーズをより適切に満たすためのより多くのイノベーションやソリューションが登場することが期待できます。