Không biết có bao nhiêu người còn nhớ đến Google Nose.
Dự án vui nhộn này được Google triển khai vào ngày Cá tháng Tư năm 2013 tuyên bố có cơ sở dữ liệu về mùi chứa 15 triệu hương vị, người dùng chỉ cần nhập từ khóa vào hộp tìm kiếm của Google và nhấp vào "ngửi" để ngửi chúng ngay bên cạnh máy tính của mình. của sự vật, chẳng hạn như mùi xe mới, mùi lửa trại, mùi mộ Ai Cập (?), v.v.
Chính trò đùa kỳ quặc nhưng xuất sắc này mười năm trước đã được người phát minh ra nó biến một phần thành hiện thực.
Tạp chí "Science" vào đầu tháng 9 năm nay đã xuất bản một bài báo do nhiều nhóm nghiên cứu cùng xuất bản, bao gồm công ty khởi nghiệp Osmo (sản phẩm tách ra từ Google) và Trung tâm Cảm giác Hóa học Monell (Trung tâm Cảm giác Hóa học Monell), trong đó tuyên bố, ** Các mô hình AI có thể giúp máy móc có “khứu giác” tốt hơn con người**.
Thoạt nhìn, điều này nghe có vẻ khó tin. Xét cho cùng, đối với công chúng, khứu giác là một sự tồn tại trừu tượng hơn nhiều so với thị giác và thính giác. Phổ màu RGB có thể mô tả màu sắc mà mắt người nhìn thấy và âm thanh mà tai người nghe được cũng có thể được chuyển đổi thành các bước sóng có tần số khác nhau, thậm chí khiến con người cảm thấy rung động, tuy nhiên, chỉ có khứu giác là không thể nhìn thấy hoặc không thể nhìn thấy. đã xúc động và càng khó diễn tả bằng các chỉ số định lượng.
Nói cách khác, việc số hóa mùi nghe có vẻ bất khả thi.
Nhiệm vụ cốt lõi của các nhà nghiên cứu trong bài báo này là cố gắng tạo ra một bản đồ khứu giác nhiều chiều của con người có thể phản ánh trung thực các đặc điểm của mùi, tức là POM (Bản đồ mùi nguyên tắc).
Vậy chính xác thì nó được thực hiện như thế nào?
Chúng ta biết rằng mùi là phản ứng của hệ thống khứu giác của con người đối với một số phân tử cụ thể nằm rải rác trong không khí. Sau khi các phân tử mùi đi vào lỗ mũi, chúng sẽ phản ứng với các tế bào khứu giác phía trên khoang mũi (thụ thể), sóng điện sinh học sinh ra sẽ được truyền đến não thông qua dây thần kinh, từ đó khứu giác sẽ được nhận biết.
Thành phần của mùi thực ra phức tạp hơn nhiều so với màu sắc và âm thanh, có hàng triệu loại khác nhau và mỗi loại mùi bao gồm hàng trăm phân tử hóa học có tính chất khác nhau. Tương ứng, con người có khoảng 400 cơ quan khứu giác chức năng, vượt xa 4 cơ quan chúng ta sử dụng cho thị giác và khoảng 40 cơ quan được sử dụng cho vị giác.
Vì vậy, đối mặt với một cơ chế khứu giác phức tạp như vậy, điều đầu tiên các nhà nghiên cứu làm là tạo ra một mô hình học máy—Mạng thần kinh truyền tin nhắn (MPNN).
Sơ đồ mô hình
Đây là một mạng nơ-ron đồ thị cụ thể (GNN), vì mạng nơ-ron đồ thị là một phương pháp deep learning dựa trên cấu trúc đồ thị, giới thiệu phân tích đồ thị truyền thống và cung cấp phương pháp trích xuất các đặc điểm từ dữ liệu bất quy tắc nên cũng rất phù hợp dùng để học tính chất mùi phức tạp.
Sau khi mô hình được xây dựng, bước tiếp theo là cung cấp tài liệu học tập cho nó.
Các nhà nghiên cứu đã kết hợp cơ sở dữ liệu về hương vị và hương thơm của Good Scents và Leffingwell & Associates (GS-LF) rồi thiết lập một bộ dữ liệu tham chiếu chứa khoảng 5.000 phân tử làm tài liệu đào tạo cơ bản. Mỗi phân tử có thể có nhiều nhãn mùi, chẳng hạn như mùi trái cây, mùi hoa, mùi phô mai , bạc hà và hơn thế nữa.
Một số phân tử trong cơ sở dữ liệu GS-LF
Bằng cách lấy hình dạng và cấu trúc của phân tử làm dữ liệu đầu vào, mô hình có thể đưa ra các từ mùi tương ứng mô tả chính xác nhất một mùi nhất định.
Để làm cho kết quả huấn luyện chính xác hơn, các nhà nghiên cứu còn sử dụng nhiều phương pháp khác nhau để tối ưu hóa các tham số mô hình. Ví dụ: cơ sở dữ liệu về hương vị và hương thơm GS-LF được chia thành tập huấn luyện và tập kiểm tra theo tỷ lệ 8:2 và tập huấn luyện được chia thành năm tập hợp con xác thực chéo; và thuật toán tối ưu hóa Bayes được sử dụng để xác thực chéo dữ liệu và Tối ưu hóa các siêu tham số của mô hình GNN, v.v.
Thí nghiệm cuối cùng sẽ hình thành bản đồ khứu giác chiều cao POM (một phần):
Bức tranh này thể hiện một cách trực quan khoảng cách cảm nhận của từng mùi. Ví dụ: có khoảng cách cảm nhận lớn giữa các loại hoa, mùi thịt và thanh tao, nhưng trong mỗi loại Các mùi cụ thể hơn bao gồm, chẳng hạn như hoa huệ (muguet), hoa oải hương (hoa oải hương) và hoa nhài (hoa nhài) dưới hương hoa, có khoảng cách cảm nhận gần hơn.
Bài báo đã so sánh POM với các bản đồ dựa trên dấu vân tay của Morgan, đã được nghiên cứu trước đây và nhận thấy rằng bản đồ sau chưa thể phản ánh khoảng cách nhận thức nêu trên:
Để xác minh thêm hiệu quả của việc huấn luyện mô hình, các nhà nghiên cứu sau đó đã tuyển dụng 15 chuyên gia về mùi để cạnh tranh với mô hình để xem ai có thể xác định mùi chính xác hơn.
Mỗi chuyên gia trong số 15 chuyên gia cần ngửi 400 mùi, các nhà nghiên cứu sẽ đưa ra 55 tính từ mùi và yêu cầu họ đánh giá 55 lựa chọn trên thang điểm từ 1-5 cho mỗi mùi để đánh giá mức độ phù hợp của từng tính từ mùi cho việc này. mùi.
Người ta nhận thấy rằng đối với 53% phân tử thử nghiệm, mô hình hoạt động tốt hơn mức trung bình của các thành viên trong nhóm.
Các nhà nghiên cứu cũng phân loại kết quả dự đoán của mô hình theo các yếu tố mô tả mùi và nhận thấy rằng, ngoại trừ xạ hương, các kết quả dự đoán của mô hình đối với mùi phân tử đều nằm trong phân bố lỗi của nhóm người và vượt trội hơn kết quả dự đoán của 30 yếu tố mô tả mùi. :
Sau đó, các nhà nghiên cứu cũng nhiều lần xác minh hiệu suất của mô hình và thu được mối quan hệ cấu trúc phân tử-mùi tương đối ổn định.
Bây giờ chúng ta bước vào giai đoạn thú vị nhất của việc vẽ bản đồ mùi quy mô lớn và cuối cùng có được bức tranh sau:
Bạn có thể hiểu sơ đồ tọa độ trên biểu thị khoảng cách nhận biết mùi là phiên bản phóng to vô hạn của sơ đồ này. Bài báo đề cập rằng bản đồ này chứa khoảng 500.000 phân tử mùi, nhiều trong số đó thậm chí còn chưa được phát hiện hoặc tổng hợp (nhưng thực sự có thể tính toán được).
Để so sánh trực quan hơn, nếu một người đánh giá được đào tạo bài bản muốn tìm kiếm những mùi này, thì sẽ phải mất khoảng 70 năm làm việc liên tục để thu thập hết chúng.
Có vẻ như bài viết này đã thực sự đạt được một điều lớn lao.
Lúc này, một số cư dân mạng đặt ra câu hỏi tại sao máy lại cần có mùi?
Những người khác cũng đưa ra ý kiến riêng của họ, chẳng hạn như cho rằng nó có thể được sử dụng để kiểm soát chất lượng xử lý nước thải của nhà máy, đánh hơi chất nổ, ma túy hoặc xác chết, v.v.:
Do đó, chó cảnh sát và chó tìm kiếm cứu nạn có thể phải nghỉ làm.
Một số người hy vọng sẽ phát triển được chất khử mùi tốt dựa trên điều này, vì mọi người sẽ tỏa ra mùi khó chịu sau khi tập nhiều bài tập aerobic như chạy hoặc nâng tạ:
Một số người cũng rất quan tâm đến ứng dụng y học của kết quả nghiên cứu này, chẳng hạn như việc phát triển các phương pháp điều trị mới cho chứng mất khứu giác, hay phát hiện bệnh qua khứu giác, v.v.:
Cũng có những người hành nghề trong ngành nước hoa cảm thấy điều này đã giúp ích cho họ rất nhiều: “Nó nói với đồng nghiệp của tôi khi họ xức quá nhiều nước hoa”:
Những dự đoán này thực ra không phải không có lý. Trước hết, máy móc thực sự có thể giúp con người giải quyết vấn đề đôi khi nhận dạng mùi không chính xác - nghiên cứu cho thấy mỗi người có nhận thức khác nhau về mùi và sẽ kích hoạt các phản ứng khác nhau dựa trên các tín hiệu cảm giác và sinh lý, cũng bị ảnh hưởng bởi kinh nghiệm, kỳ vọng, và tính cách, hoặc sự ảnh hưởng của các yếu tố hoàn cảnh.
Và mùi đôi khi rất quan trọng đối với con người.
Khỏi phải nói, mùi hôi, một số loại khí độc hại cũng có thể gây hại cho sức khỏe, lúc này sẽ thật tuyệt nếu máy móc có thể thay thế một số nghề nhất định để giúp con người hoặc động vật làm việc.
Đối với những ngành nghề khác mà mùi hương có thể mang lại lợi ích như thợ nước hoa, đầu bếp, nhà thiết kế, nghệ sĩ, kiến trúc sư… cũng cần chuẩn bị nhiều mùi hương có chức năng hơn. Một số trường hợp sử dụng mùi hương trong môi trường. Ví dụ, Trung tâm Ung thư Sloan-Kettering ở New York phân tán dầu vani trong không khí để làm giảm nỗi sợ bị giam cầm của bệnh nhân trong quá trình kiểm tra chụp cộng hưởng từ (MRI), Ủy ban Thương mại Chicago cũng phân tán các mùi hương cụ thể. Để giảm tiếng ồn decibel trên sàn giao dịch.
Các nghiên cứu khác đã chỉ ra rằng hầu hết ký ức liên quan đến mùi của con người đều xuất hiện trong 10 năm đầu đời của trẻ sơ sinh và thời thơ ấu, trong khi ký ức được tạo ra bởi ngôn ngữ và thị giác thường được hình thành trong độ tuổi từ 10 đến 30. Điều này phần nào giải thích tại sao mùi có thể gợi lên những ký ức xa xôi, và những ký ức được gợi lên qua mùi thường mang nhiều cảm xúc hơn những ký ức được gợi lên bằng thị giác hoặc thính giác.
Vì vậy, mối liên hệ giữa khứu giác và con người vẫn rất chặt chẽ nhưng trong nhiều trường hợp chúng ta không dễ dàng nhận biết được.
Phỏng đoán của cư dân mạng cũng đã được xác minh bởi một trong những tác giả của bài báo, Alex Wiltschko từ Công ty Osmo. Anh ấy đã viết trong một bài báo đăng trên trang web chính thức của Osmo,
"Bản đồ mùi là cơ sở cho các mục tiêu lớn hơn của chúng tôi. Nếu có thể phát triển được một hệ thống chức năng mô phỏng mũi của chúng ta hoặc mũi của chó, chúng ta có thể phát hiện bệnh sớm; trí tuệ nhân tạo cũng sẽ giúp các bác sĩ tìm ra nhiều khả năng được phát hiện trong để phát triển các loại thuốc thành công và hỗ trợ tốt hơn cho các nhà hóa học tổng hợp và các nhà chế tạo nước hoa bậc thầy trong công việc của họ...Mục tiêu công việc trong tương lai của chúng tôi là đặt nền tảng khoa học và thương mại vững chắc để cải thiện sức khỏe và hạnh phúc của con người."
Tuy nhiên, ông cũng cho rằng bài báo vẫn còn nhiều thiếu sót.
Ví dụ, không thể phản ánh cường độ mùi của một phân tử và chỉ có thể dự đoán nó có mùi như thế nào; chỉ có mùi của một phân tử được dự đoán, nhưng trong thực tế, nó có nhiều mùi hỗn hợp hơn; và thậm chí nếu tất cả đạt được khả năng thì không thể đoán trước được mùi hôi, việc nhân rộng và phục hồi cũng sẽ là một thách thức lớn, v.v.
Cuối cùng, đã nói rất nhiều, bình luận của một cư dân mạng khá đơn giản, “Tôi nghĩ điều này sẽ khiến việc nếm rượu trở nên kém thú vị hơn”:
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Khi AI học cách ngửi, con người có thể tiết kiệm 70 năm công sức
Không biết có bao nhiêu người còn nhớ đến Google Nose.
Dự án vui nhộn này được Google triển khai vào ngày Cá tháng Tư năm 2013 tuyên bố có cơ sở dữ liệu về mùi chứa 15 triệu hương vị, người dùng chỉ cần nhập từ khóa vào hộp tìm kiếm của Google và nhấp vào "ngửi" để ngửi chúng ngay bên cạnh máy tính của mình. của sự vật, chẳng hạn như mùi xe mới, mùi lửa trại, mùi mộ Ai Cập (?), v.v.
Chính trò đùa kỳ quặc nhưng xuất sắc này mười năm trước đã được người phát minh ra nó biến một phần thành hiện thực.
Tạp chí "Science" vào đầu tháng 9 năm nay đã xuất bản một bài báo do nhiều nhóm nghiên cứu cùng xuất bản, bao gồm công ty khởi nghiệp Osmo (sản phẩm tách ra từ Google) và Trung tâm Cảm giác Hóa học Monell (Trung tâm Cảm giác Hóa học Monell), trong đó tuyên bố, ** Các mô hình AI có thể giúp máy móc có “khứu giác” tốt hơn con người**.
Nói cách khác, việc số hóa mùi nghe có vẻ bất khả thi.
Nhiệm vụ cốt lõi của các nhà nghiên cứu trong bài báo này là cố gắng tạo ra một bản đồ khứu giác nhiều chiều của con người có thể phản ánh trung thực các đặc điểm của mùi, tức là POM (Bản đồ mùi nguyên tắc).
Vậy chính xác thì nó được thực hiện như thế nào?
Chúng ta biết rằng mùi là phản ứng của hệ thống khứu giác của con người đối với một số phân tử cụ thể nằm rải rác trong không khí. Sau khi các phân tử mùi đi vào lỗ mũi, chúng sẽ phản ứng với các tế bào khứu giác phía trên khoang mũi (thụ thể), sóng điện sinh học sinh ra sẽ được truyền đến não thông qua dây thần kinh, từ đó khứu giác sẽ được nhận biết.
Thành phần của mùi thực ra phức tạp hơn nhiều so với màu sắc và âm thanh, có hàng triệu loại khác nhau và mỗi loại mùi bao gồm hàng trăm phân tử hóa học có tính chất khác nhau. Tương ứng, con người có khoảng 400 cơ quan khứu giác chức năng, vượt xa 4 cơ quan chúng ta sử dụng cho thị giác và khoảng 40 cơ quan được sử dụng cho vị giác.
Vì vậy, đối mặt với một cơ chế khứu giác phức tạp như vậy, điều đầu tiên các nhà nghiên cứu làm là tạo ra một mô hình học máy—Mạng thần kinh truyền tin nhắn (MPNN).
Đây là một mạng nơ-ron đồ thị cụ thể (GNN), vì mạng nơ-ron đồ thị là một phương pháp deep learning dựa trên cấu trúc đồ thị, giới thiệu phân tích đồ thị truyền thống và cung cấp phương pháp trích xuất các đặc điểm từ dữ liệu bất quy tắc nên cũng rất phù hợp dùng để học tính chất mùi phức tạp.
Sau khi mô hình được xây dựng, bước tiếp theo là cung cấp tài liệu học tập cho nó.
Các nhà nghiên cứu đã kết hợp cơ sở dữ liệu về hương vị và hương thơm của Good Scents và Leffingwell & Associates (GS-LF) rồi thiết lập một bộ dữ liệu tham chiếu chứa khoảng 5.000 phân tử làm tài liệu đào tạo cơ bản. Mỗi phân tử có thể có nhiều nhãn mùi, chẳng hạn như mùi trái cây, mùi hoa, mùi phô mai , bạc hà và hơn thế nữa.
Bằng cách lấy hình dạng và cấu trúc của phân tử làm dữ liệu đầu vào, mô hình có thể đưa ra các từ mùi tương ứng mô tả chính xác nhất một mùi nhất định.
Để làm cho kết quả huấn luyện chính xác hơn, các nhà nghiên cứu còn sử dụng nhiều phương pháp khác nhau để tối ưu hóa các tham số mô hình. Ví dụ: cơ sở dữ liệu về hương vị và hương thơm GS-LF được chia thành tập huấn luyện và tập kiểm tra theo tỷ lệ 8:2 và tập huấn luyện được chia thành năm tập hợp con xác thực chéo; và thuật toán tối ưu hóa Bayes được sử dụng để xác thực chéo dữ liệu và Tối ưu hóa các siêu tham số của mô hình GNN, v.v.
Thí nghiệm cuối cùng sẽ hình thành bản đồ khứu giác chiều cao POM (một phần):
Bài báo đã so sánh POM với các bản đồ dựa trên dấu vân tay của Morgan, đã được nghiên cứu trước đây và nhận thấy rằng bản đồ sau chưa thể phản ánh khoảng cách nhận thức nêu trên:
Mỗi chuyên gia trong số 15 chuyên gia cần ngửi 400 mùi, các nhà nghiên cứu sẽ đưa ra 55 tính từ mùi và yêu cầu họ đánh giá 55 lựa chọn trên thang điểm từ 1-5 cho mỗi mùi để đánh giá mức độ phù hợp của từng tính từ mùi cho việc này. mùi.
Người ta nhận thấy rằng đối với 53% phân tử thử nghiệm, mô hình hoạt động tốt hơn mức trung bình của các thành viên trong nhóm.
Các nhà nghiên cứu cũng phân loại kết quả dự đoán của mô hình theo các yếu tố mô tả mùi và nhận thấy rằng, ngoại trừ xạ hương, các kết quả dự đoán của mô hình đối với mùi phân tử đều nằm trong phân bố lỗi của nhóm người và vượt trội hơn kết quả dự đoán của 30 yếu tố mô tả mùi. :
Bây giờ chúng ta bước vào giai đoạn thú vị nhất của việc vẽ bản đồ mùi quy mô lớn và cuối cùng có được bức tranh sau:
Để so sánh trực quan hơn, nếu một người đánh giá được đào tạo bài bản muốn tìm kiếm những mùi này, thì sẽ phải mất khoảng 70 năm làm việc liên tục để thu thập hết chúng.
Có vẻ như bài viết này đã thực sự đạt được một điều lớn lao.
Lúc này, một số cư dân mạng đặt ra câu hỏi tại sao máy lại cần có mùi?
Một số người hy vọng sẽ phát triển được chất khử mùi tốt dựa trên điều này, vì mọi người sẽ tỏa ra mùi khó chịu sau khi tập nhiều bài tập aerobic như chạy hoặc nâng tạ:
Và mùi đôi khi rất quan trọng đối với con người.
Khỏi phải nói, mùi hôi, một số loại khí độc hại cũng có thể gây hại cho sức khỏe, lúc này sẽ thật tuyệt nếu máy móc có thể thay thế một số nghề nhất định để giúp con người hoặc động vật làm việc.
Đối với những ngành nghề khác mà mùi hương có thể mang lại lợi ích như thợ nước hoa, đầu bếp, nhà thiết kế, nghệ sĩ, kiến trúc sư… cũng cần chuẩn bị nhiều mùi hương có chức năng hơn. Một số trường hợp sử dụng mùi hương trong môi trường. Ví dụ, Trung tâm Ung thư Sloan-Kettering ở New York phân tán dầu vani trong không khí để làm giảm nỗi sợ bị giam cầm của bệnh nhân trong quá trình kiểm tra chụp cộng hưởng từ (MRI), Ủy ban Thương mại Chicago cũng phân tán các mùi hương cụ thể. Để giảm tiếng ồn decibel trên sàn giao dịch.
Các nghiên cứu khác đã chỉ ra rằng hầu hết ký ức liên quan đến mùi của con người đều xuất hiện trong 10 năm đầu đời của trẻ sơ sinh và thời thơ ấu, trong khi ký ức được tạo ra bởi ngôn ngữ và thị giác thường được hình thành trong độ tuổi từ 10 đến 30. Điều này phần nào giải thích tại sao mùi có thể gợi lên những ký ức xa xôi, và những ký ức được gợi lên qua mùi thường mang nhiều cảm xúc hơn những ký ức được gợi lên bằng thị giác hoặc thính giác.
Vì vậy, mối liên hệ giữa khứu giác và con người vẫn rất chặt chẽ nhưng trong nhiều trường hợp chúng ta không dễ dàng nhận biết được.
Phỏng đoán của cư dân mạng cũng đã được xác minh bởi một trong những tác giả của bài báo, Alex Wiltschko từ Công ty Osmo. Anh ấy đã viết trong một bài báo đăng trên trang web chính thức của Osmo,
Tuy nhiên, ông cũng cho rằng bài báo vẫn còn nhiều thiếu sót.
Ví dụ, không thể phản ánh cường độ mùi của một phân tử và chỉ có thể dự đoán nó có mùi như thế nào; chỉ có mùi của một phân tử được dự đoán, nhưng trong thực tế, nó có nhiều mùi hỗn hợp hơn; và thậm chí nếu tất cả đạt được khả năng thì không thể đoán trước được mùi hôi, việc nhân rộng và phục hồi cũng sẽ là một thách thức lớn, v.v.
Cuối cùng, đã nói rất nhiều, bình luận của một cư dân mạng khá đơn giản, “Tôi nghĩ điều này sẽ khiến việc nếm rượu trở nên kém thú vị hơn”: