Meta 氏は、AudioCraft は音楽、サウンド、オーディオ ファイルの圧縮と生成に適していると指摘しています。構築と再利用が非常に簡単であるため、より優れたサウンド ジェネレーター、圧縮アルゴリズム、または音楽ジェネレーターを構築したい人は、すべてを同じコードベースで実行し、他の人が行ったものを基にして構築することができます。
Meta は、音質を損なうことなくオーディオ ファイルを圧縮および解凍するための AI ツールとして、2022 年 10 月に EnCodec の最初のバージョンをリリースし、ユーザーがオーディオ ドキュメントを迅速かつ簡単に共有できるようにしました。その目的は、音楽ファイルだけでなく、すべてのオーディオ ファイルの品質を向上させることです。当時は、特にネットワーク接続が不十分な場合などの不利な状況における、音声通話と音声メッセージの品質を向上させることを特に目的としていました。その後このモデルは進化し、現在では、合成サウンドや音楽を実際に再生したときによりリアルに見えるようにするツールとして、AudioGen および SoundGen とともに導入されています。
創造性を高めるために AI 生成ツールを採用するアーティストもいますが、著作権侵害を批判するアーティストもいます。
原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Meta は、オーディオと音楽のための新しい生成 AI ツールである AudioCraft で敷居を高めます
出典: ウォールストリートニュース
著者: 曹則西
8 月 2 日水曜日、Meta は、ユーザーがテキスト プロンプトに基づいて音楽やオーディオを作成できるようにする、AudioCraft と呼ばれるオーディオおよび音楽用の新しい生成 AI ツールを発表しました。
この AI ツールは、AudioGen、EnCodec、MusicGen の 3 つのモデルまたはテクノロジーを 1 つに結合し、テキスト コンテンツからほぼ人間が作成した高品質のオーディオと音楽を生成できます。
その中で、MusicGen はメタ所有の特別に認可された音楽トレーニングを受けており、テキスト プロンプトから音楽を生成できます。AudioGen は公開効果音トレーニングを受けており、犬の鳴き声や足音のシミュレートなど、テキスト プロンプトから音声を生成できます。EnCodec と組み合わせて使用できます。コーデック プレーヤーの改良されたバージョンを使用すると、ユーザーはより効率的に高品質の音楽を生成できます。
AudioCraft を使用すると、この分野での以前の研究と比較してオーディオ生成モデルの全体的な設計が簡素化され、Meta が過去数年間に開発した既存のモデルを完全に使用できるようになり、同時に限界を押し広げて独自の開発を行うことも可能になります。自身のモデル。
Meta 氏は、AudioCraft は音楽、サウンド、オーディオ ファイルの圧縮と生成に適していると指摘しています。構築と再利用が非常に簡単であるため、より優れたサウンド ジェネレーター、圧縮アルゴリズム、または音楽ジェネレーターを構築したい人は、すべてを同じコードベースで実行し、他の人が行ったものを基にして構築することができます。
Meta称:
強固なオープンソース基盤を持つことはイノベーションを促進し、将来オーディオや音楽を作り、聴く方法を補完するでしょう。より多くのコントロールを使えば、シンセサイザーが最初に登場したときと同じように、MusicGen は新しい種類の楽器になる可能性があると私たちは考えています。
すべての Facebook ユーザーが AudioCraft をインストールでき、Meta は特に研究者や音楽専門家にこのツールの使用を勧めています。
私たちは、AudioCraft のモデル コレクションをミュージシャンやサウンド デザイナーにとってインスピレーションを与えるツールとして捉えており、人々が新しい方法で楽曲を素早くブレインストーミングして反復するのに役立ちます。人々が Audiocraft を使って何を作成するのかを見るのが待ちきれません。
Meta は、音質を損なうことなくオーディオ ファイルを圧縮および解凍するための AI ツールとして、2022 年 10 月に EnCodec の最初のバージョンをリリースし、ユーザーがオーディオ ドキュメントを迅速かつ簡単に共有できるようにしました。その目的は、音楽ファイルだけでなく、すべてのオーディオ ファイルの品質を向上させることです。当時は、特にネットワーク接続が不十分な場合などの不利な状況における、音声通話と音声メッセージの品質を向上させることを特に目的としていました。その後このモデルは進化し、現在では、合成サウンドや音楽を実際に再生したときによりリアルに見えるようにするツールとして、AudioGen および SoundGen とともに導入されています。
創造性を高めるために AI 生成ツールを採用するアーティストもいますが、著作権侵害を批判するアーティストもいます。