 画像ソース: Unbounded AI によって生成Google Nose のことを今でも覚えている人がどれだけいるかわかりません。2013 年のエイプリル フールに Google が立ち上げたこの面白いプロジェクトは、1,500 万の匂いを含む匂いデータベースがあると主張しています。ユーザーは、Google 検索ボックスにキーワードを入力し、[匂い] をクリックするだけで、コンピュータの横で直接匂いを嗅ぐことができます。新車の匂い、キャンプファイヤーの匂い、エジプトの墓(?)の匂いなど。10 年前のこのとんでもなく素晴らしいジョークが、発明者によって部分的に現実化されています。今年9月上旬の「サイエンス」誌は、新興企業のオスモ(グーグルからスピンオフ)とモネル化学感覚センター(モネル化学感覚センター)を含む複数の研究チームが共同で発表した論文を掲載し、その中で** AIモデルは次のように述べています。機械に人間よりも優れた「嗅覚」を与えます**。 一見、信じられないことのように聞こえますが、結局のところ、一般の人にとって嗅覚は視覚や聴覚よりもはるかに抽象的な存在です。 RGB カラースペクトルは人間の目で見える色を表すことができ、人間の耳で聞こえる音もさまざまな周波数の波長に変換し、振動を感じることさえできますが、嗅覚だけは見ることができず、また見ることができません。触れられていますが、定量的な指標で説明するのはさらに困難です。言い換えれば、匂いをデジタル化することは不可能に思えます。本論文における研究者らの中心的な課題は、匂いの特徴を忠実に反映できる高次元人間嗅覚マップ、すなわちPOM(Principle Odor Map)の作成を試みることである。では、それは具体的にどのように行われるのでしょうか?匂いは、空気中に散在する特定の分子に対する人間の嗅覚系の反応であることがわかっています。匂い分子が鼻孔に入った後、鼻腔の上にある嗅細胞(受容体)と反応し、発生した生体電波が神経を通って脳に伝わり、匂いが認識されます。匂いの構成は実際には色や音よりもはるかに複雑で、何百万もの異なる種類があり、それぞれの匂いは異なる特性を持つ数百の化学分子で構成されています。これに対応して、人間には機能的な嗅覚受容体が約 400 個あり、視覚に使用される 4 個と味覚に使用される約 40 個をはるかに上回っています。このような複雑な嗅覚メカニズムに直面して、研究者らが最初に行ったのは、機械学習モデルであるメッセージ パッシング ニューラル ネットワーク (MPNN) を作成することでした。 モデル図これは特定のグラフ ニューラル ネットワーク (GNN) です。グラフ ニューラル ネットワークはグラフ構造に基づく深層学習手法であり、従来のグラフ分析を導入し、不規則なデータから特徴を抽出する手法を提供するため、学習にも非常に適しています。複雑な匂いの特徴。モデルが構築された後の次のステップは、モデルに学習教材を供給することです。研究者らは、Good Scents and Leffingwell & Associates (GS-LF) のフレーバーとフレグランスのデータベースを組み合わせて、基本的なトレーニング素材として約 5,000 個の分子を含む参照データセットを確立しました。各分子には、フルーティー、フローラル、チーズなどの複数の匂いラベルを付けることができます。 、ミントなど。 GS-LF データベース内の一部の分子分子の形状と構造をデータ入力として受け取ることで、モデルは特定の匂いを最もよく表す対応する匂いの単語を出力できます。トレーニング結果をより正確にするために、研究者はさまざまな方法を使用してモデルパラメータを最適化します。たとえば、GS-LF のフレーバーとフレグランスのデータベースは、トレーニング セットとテスト セットに 8:2 の比率で分割され、トレーニング セットはさらに 5 つの相互検証サブセットに分割され、ベイジアン最適化アルゴリズムが使用されます。データの相互検証や、GNN モデルのハイパーパラメータの最適化など。この実験により、最終的に次のような高次元嗅覚マップ POM (部分) が形成されます。 この絵は、各香りの知覚距離を直感的に表しています。たとえば、花、肉、幻想的なカテゴリの間には大きな知覚距離がありますが、各カテゴリの下には、ユリ (ミュゲ)、ラベンダー (ラベンダー)、ジャスミンなど、より具体的な香りが含まれています。 (ジャスミン) フローラルの香りの下で、知覚距離が近くなります。この論文は、POM と以前に研究されたモーガンの指紋ベースのマップを比較し、後者は上記の知覚距離をまだ反映できないことを発見しました。 モデルのトレーニング効果をさらに検証するために、研究者らは 15 人の匂いの専門家を採用し、誰がより正確に匂いを識別できるかをモデルと競わせました。15 人の専門家はそれぞれ 400 の匂いを嗅ぐ必要があります。研究者は 55 の匂いの形容詞を与え、各匂いの 55 の選択肢を 1 ~ 5 のスケールで評価して、各匂いの形容詞がどの程度適切であるかを評価するように依頼します。匂い。テスト分子の 53% について、モデルのパフォーマンスがパネル メンバーの平均よりも優れていることがわかりました。研究者らはまた、モデルの予測結果を臭気記述子ごとに分類したところ、ジャコウを除いて、分子臭気に関するモデルの予測結果はすべて人間グループの誤差分布内にあり、30 の臭気記述子の予測結果を上回っていることがわかりました。 : その後、研究者らはモデルの性能を繰り返し検証し、比較的安定した分子構造と匂いの関係を取得しました。ここで、臭気マップの大規模な描画という最もエキサイティングな段階に入り、最終的に次の図を取得します。 上の嗅覚距離を示す座標図は、この図を無限に拡大したものとして理解できます。論文では、このマップには約 500,000 個の匂い分子が含まれており、その多くは発見または合成さえされていない (ただし、確かに計算は可能) と述べています。より直観的に比較するために、訓練を受けた人間の評価者がこれらの匂いを検索した場合、すべてを収集するには約 70 年の継続的な作業が必要になります。この論文は本当に大きなことを成し遂げたようです。このとき、一部のネチズンは、なぜ機械に匂いを付ける必要があるのかと尋ねました。 また、工場下水処理の品質管理、爆発物、麻薬、死体の嗅ぎ分けなどに利用できるのではないか、など独自の意見を述べている人もいます。 その結果、警察犬や捜索救助犬が勤務を外される場合があります。人はランニングやウェイトリフティングなどの有酸素運動をたくさんした後に悪臭を放つため、これに基づいて優れた消臭剤の開発を期待する人もいます。 また、嗅覚障害の新しい治療法の開発や嗅覚による病気の検出など、この研究結果の医療応用に非常に興味を持っている人もいます。 香水業界の専門家の中には、これがとても役立っていると感じている人もいます。「同僚にコロンをつけすぎていることを知らせてくれます。」 これらの予測は実際には不合理ではありません。まず第一に、機械は確かに、人間が時々不正確に匂いを識別するという問題を解決するのに役立ちます。研究によると、匂いに対する人それぞれの認識が異なり、経験や期待、性格や状況要因の影響。そして、匂いは時々人々にとって非常に重要です。言うまでもなく、悪臭や一部の有害なガスも健康に害を及ぼす可能性がありますが、現時点では、人間や動物の作業を支援する特定の職業を機械に置き換えることができれば素晴らしいと思います。調香師、シェフ、デザイナー、アーティスト、建築家など、香りが恩恵をもたらす他の職業にとっても、より機能的な香りを準備する必要があります。環境内で香りを使用する場合もあります。たとえば、ニューヨークのスローンケタリングがんセンターでは、磁気共鳴画像法 (MRI) 検査中の患者の閉所恐怖症を軽減するためにバニラオイルを空気中に散布しています。また、シカゴ商品取引委員会も特定の香りを散布しています。立会場の騒音デシベルを減らすため。他の研究では、人間の匂いに関する記憶のほとんどは乳児期から幼少期の最初の10年間に由来するのに対し、言語と視覚によって生成される記憶は通常10歳から30歳の間に作られることが示されています。これは、匂いが遠い記憶を呼び起こす理由の一部を説明しており、匂いによって呼び出される記憶は、視覚や聴覚によって呼び起こされる記憶よりも多くの場合、より感情的なものになります。そのため、匂いと人間との関わりは今でも非常に密接であるにもかかわらず、私たちはそのことになかなか気づかないことが多いのです。ネチズンの推測は、論文の著者の一人、オスモ社のアレックス・ウィルチコ氏によっても検証された。彼はオスモの公式ウェブサイトに掲載された記事の中で次のように書いている。> **「匂いマッピングは、私たちのより大きな目標の基礎です。私たちの鼻や犬の鼻を再現する機能システムが開発できれば、病気を早期に発見することができます。また、人工知能は医師が病気を発見する可能性を高めるのにも役立ちます。」成功する医薬品を開発し、合成化学者や調香師の仕事をより良く支援すること...私たちの将来の仕事の目標は、人間の健康と幸福を改善するための強固な科学的および商業的基盤を築くことです。」**しかし同氏は、この論文にはまだ多くの欠点があるとも述べた。たとえば、分子の匂いの強度を反映することは不可能であり、それがどのような匂いであるかを予測することしかできません。単一分子の匂いのみが予測されますが、実際の匂いはむしろ混合された匂いです。能力は達成されるが、臭いは予測できない、複製と復元も大きな課題となるなど。最後に、ここまで言いましたが、あるネチズンのコメントは非常にシンプルでした。「これではワインのテイスティングが楽しくなくなると思います」。
AIが匂いを学習すると、人間は70年分の仕事を節約できる
Google Nose のことを今でも覚えている人がどれだけいるかわかりません。
2013 年のエイプリル フールに Google が立ち上げたこの面白いプロジェクトは、1,500 万の匂いを含む匂いデータベースがあると主張しています。ユーザーは、Google 検索ボックスにキーワードを入力し、[匂い] をクリックするだけで、コンピュータの横で直接匂いを嗅ぐことができます。新車の匂い、キャンプファイヤーの匂い、エジプトの墓(?)の匂いなど。
10 年前のこのとんでもなく素晴らしいジョークが、発明者によって部分的に現実化されています。
今年9月上旬の「サイエンス」誌は、新興企業のオスモ(グーグルからスピンオフ)とモネル化学感覚センター(モネル化学感覚センター)を含む複数の研究チームが共同で発表した論文を掲載し、その中で** AIモデルは次のように述べています。機械に人間よりも優れた「嗅覚」を与えます**。
言い換えれば、匂いをデジタル化することは不可能に思えます。
本論文における研究者らの中心的な課題は、匂いの特徴を忠実に反映できる高次元人間嗅覚マップ、すなわちPOM(Principle Odor Map)の作成を試みることである。
では、それは具体的にどのように行われるのでしょうか?
匂いは、空気中に散在する特定の分子に対する人間の嗅覚系の反応であることがわかっています。匂い分子が鼻孔に入った後、鼻腔の上にある嗅細胞(受容体)と反応し、発生した生体電波が神経を通って脳に伝わり、匂いが認識されます。
匂いの構成は実際には色や音よりもはるかに複雑で、何百万もの異なる種類があり、それぞれの匂いは異なる特性を持つ数百の化学分子で構成されています。これに対応して、人間には機能的な嗅覚受容体が約 400 個あり、視覚に使用される 4 個と味覚に使用される約 40 個をはるかに上回っています。
このような複雑な嗅覚メカニズムに直面して、研究者らが最初に行ったのは、機械学習モデルであるメッセージ パッシング ニューラル ネットワーク (MPNN) を作成することでした。
これは特定のグラフ ニューラル ネットワーク (GNN) です。グラフ ニューラル ネットワークはグラフ構造に基づく深層学習手法であり、従来のグラフ分析を導入し、不規則なデータから特徴を抽出する手法を提供するため、学習にも非常に適しています。複雑な匂いの特徴。
モデルが構築された後の次のステップは、モデルに学習教材を供給することです。
研究者らは、Good Scents and Leffingwell & Associates (GS-LF) のフレーバーとフレグランスのデータベースを組み合わせて、基本的なトレーニング素材として約 5,000 個の分子を含む参照データセットを確立しました。各分子には、フルーティー、フローラル、チーズなどの複数の匂いラベルを付けることができます。 、ミントなど。
分子の形状と構造をデータ入力として受け取ることで、モデルは特定の匂いを最もよく表す対応する匂いの単語を出力できます。
トレーニング結果をより正確にするために、研究者はさまざまな方法を使用してモデルパラメータを最適化します。たとえば、GS-LF のフレーバーとフレグランスのデータベースは、トレーニング セットとテスト セットに 8:2 の比率で分割され、トレーニング セットはさらに 5 つの相互検証サブセットに分割され、ベイジアン最適化アルゴリズムが使用されます。データの相互検証や、GNN モデルのハイパーパラメータの最適化など。
この実験により、最終的に次のような高次元嗅覚マップ POM (部分) が形成されます。
この論文は、POM と以前に研究されたモーガンの指紋ベースのマップを比較し、後者は上記の知覚距離をまだ反映できないことを発見しました。
15 人の専門家はそれぞれ 400 の匂いを嗅ぐ必要があります。研究者は 55 の匂いの形容詞を与え、各匂いの 55 の選択肢を 1 ~ 5 のスケールで評価して、各匂いの形容詞がどの程度適切であるかを評価するように依頼します。匂い。
テスト分子の 53% について、モデルのパフォーマンスがパネル メンバーの平均よりも優れていることがわかりました。
研究者らはまた、モデルの予測結果を臭気記述子ごとに分類したところ、ジャコウを除いて、分子臭気に関するモデルの予測結果はすべて人間グループの誤差分布内にあり、30 の臭気記述子の予測結果を上回っていることがわかりました。 :
ここで、臭気マップの大規模な描画という最もエキサイティングな段階に入り、最終的に次の図を取得します。
より直観的に比較するために、訓練を受けた人間の評価者がこれらの匂いを検索した場合、すべてを収集するには約 70 年の継続的な作業が必要になります。
この論文は本当に大きなことを成し遂げたようです。
このとき、一部のネチズンは、なぜ機械に匂いを付ける必要があるのかと尋ねました。
人はランニングやウェイトリフティングなどの有酸素運動をたくさんした後に悪臭を放つため、これに基づいて優れた消臭剤の開発を期待する人もいます。
そして、匂いは時々人々にとって非常に重要です。
言うまでもなく、悪臭や一部の有害なガスも健康に害を及ぼす可能性がありますが、現時点では、人間や動物の作業を支援する特定の職業を機械に置き換えることができれば素晴らしいと思います。
調香師、シェフ、デザイナー、アーティスト、建築家など、香りが恩恵をもたらす他の職業にとっても、より機能的な香りを準備する必要があります。環境内で香りを使用する場合もあります。たとえば、ニューヨークのスローンケタリングがんセンターでは、磁気共鳴画像法 (MRI) 検査中の患者の閉所恐怖症を軽減するためにバニラオイルを空気中に散布しています。また、シカゴ商品取引委員会も特定の香りを散布しています。立会場の騒音デシベルを減らすため。
他の研究では、人間の匂いに関する記憶のほとんどは乳児期から幼少期の最初の10年間に由来するのに対し、言語と視覚によって生成される記憶は通常10歳から30歳の間に作られることが示されています。これは、匂いが遠い記憶を呼び起こす理由の一部を説明しており、匂いによって呼び出される記憶は、視覚や聴覚によって呼び起こされる記憶よりも多くの場合、より感情的なものになります。
そのため、匂いと人間との関わりは今でも非常に密接であるにもかかわらず、私たちはそのことになかなか気づかないことが多いのです。
ネチズンの推測は、論文の著者の一人、オスモ社のアレックス・ウィルチコ氏によっても検証された。彼はオスモの公式ウェブサイトに掲載された記事の中で次のように書いている。
しかし同氏は、この論文にはまだ多くの欠点があるとも述べた。
たとえば、分子の匂いの強度を反映することは不可能であり、それがどのような匂いであるかを予測することしかできません。単一分子の匂いのみが予測されますが、実際の匂いはむしろ混合された匂いです。能力は達成されるが、臭いは予測できない、複製と復元も大きな課題となるなど。
最後に、ここまで言いましたが、あるネチズンのコメントは非常にシンプルでした。「これではワインのテイスティングが楽しくなくなると思います」。