이제 기계가 냄새를 맡는 법을 배우고 있습니다
구글 연구원들은 분자 구조가 화학 구조에 따라 어떻게 냄새가 나는지 예측하는 새로운 기술로 신경망을 훈련시키고있다.
Google 은 자체 향수를 보유하고 있거나 회사 연구원 중 한 명 이상의 팀이 보유하고 있습니다. 전문 프랑스 향수의지도하에 제작 된 혼합물에는 바닐라, 자스민, 멜론 및 딸기가 있습니다. "반쯤 나쁘지 않았다"고 주방에 향수병을 보관하는 Alex Wiltschko는 말합니다.
구글은 언제라도 그 향기를 마케팅하지 않지만, 코는 우리 삶의 또 다른 측면 인 냄새에 고착되고있다. 목요일 구글 뇌의 연구자들은 프리 프린트 사이트 Arxiv에 구조를 기반으로 분자의 냄새를 예측하기 위해 일련의 기계 학습 알고리즘을 훈련시킨 방법을 보여주는 논문을 발표했다. 세계 대부분의 지역에지도를 제공하는 것만 큼 유용합니까? 아마. 그러나 후각 분야에서는 크고 오래 지속되는 질문을 해결하는 데 도움이 될 수 있습니다.
냄새의 과학은 다른 많은 분야보다 뒤떨어져 있습니다. 예를 들어 빛은 수세기 동안 이해되어 왔습니다. 17 세기에 Isaac Newton은 프리즘을 사용하여 태양의 백색광을 현재 익숙한 빨강, 주황, 노랑, 녹색, 파랑, 남색 및 보라색 무지개로 나눕니다. 그 이후의 연구에 따르면 다른 색상으로 인식하는 것은 실제로 다른 파장 이라는 것이 밝혀졌습니다 . 컬러 휠을 살펴보면 파장이 어떻게 비교되는지, 더 긴 빨강과 노랑이 더 짧은 파랑과 자주색으로 전환되는 방식을 간단히 표현할 수 있습니다. 그러나 냄새는 그런 가이드가 없습니다.
파장이 빛의 기본 구성 요소 인 경우 분자는 향기의 구성 요소입니다. 그들이 우리의 코에 들어갔을 때, 그 분자들은 후각 전구라고 불리는 뇌의 작은 부분으로 신호를 보내는 수용체와 상호 작용합니다. 갑자기 우리는“음, 팝콘!”이라고 생각합니다. 과학자들은 파장을보고 그것이 어떤 색으로 보일지 알 수 있지만 분자와 냄새에 대해서는 같은 것을 할 수 없습니다.
사실, 화학 구조에서 분자의 냄새를 알아내는 것은 극히 어려운 것으로 판명되었습니다. 프로젝트의 Google 리서치 팀을 이끌었던 Wiltschko는“원자 또는 결합을 변경하거나 제거하면“장미에서 썩은 알로 갈 수 있습니다”라고 말합니다.
한 분자가 마늘과 다른 재스민 냄새를 일으키는 패턴을 감지 하기 위해 기계 학습 을 사용하려는 이전의 시도가있었습니다 . 연구자 들은 2015 년에 DREAM Olfaction Prediction Challenge 를 만들었습니다 .이 프로젝트는 수백 명의 사람들로부터 향기 설명을 크라우드 소싱했으며, 연구자들은 분자의 냄새를 예측하기 위해 다른 기계 학습 알고리즘을 테스트하여 학습 할 수 있는지 확인했습니다.
다른 여러 팀이 AI를 해당 데이터에 적용하고 성공적인 예측을했습니다 . 그러나 Wiltschko의 팀은 다른 접근 방식을 취했습니다. 그들은 그래프 신경망 또는 GNN이라는 것을 사용했습니다. 대부분의 기계 학습 알고리즘은 정보가 직사각형 그리드로 제공되어야합니다. 그러나 모든 정보가 해당 형식에 맞는 것은 아닙니다. GNN은 소셜 미디어 사이트의 친구 네트워크 또는 저널의 학술 인용 네트워크와 같은 그래프 를 볼 수 있습니다 . 소셜 미디어의 다음 친구가 누구인지 예측하는 데 사용할 수 있습니다. 이 경우에, GNN은 각 분자의 구조를 처리 할 수 있고, 하나의 분자에서 탄소 원자가 예를 들어 질소 원자로부터 5 원자 떨어져 있다는 것을 이해할 수있다.
Google 팀은 전문가 코를 가진 향수 전문가의 약 5,000 개의 분자 세트를 사용하고 각 분자를 "우디", "재스민"또는 "달콤한"과 같은 설명과 신중하게 일치 시켰습니다. 그런 다음 나머지 분자의 향기를 예측할 수 있는지 테스트했습니다. 효과가있었습니다.
실제로 첫 번째 반복에서 GNN은 다른 그룹이 만든 모델뿐만 아니라 작동했습니다. Wiltschko는 팀이 모델을 개선할수록 더 나아질 수 있다고 말합니다. "우리는 현장을 발전 시켰습니다."
머신 러닝 도구와 마찬가지로 Google의 GNN은 데이터 품질에 의해 제한됩니다. 그럼에도 불구하고 콜드 스프링 하버 연구소 (Cold Spring Harbor Laboratory)의 연구원 인 알렉세이 코 울라 코프 (Alexei Koulakov)는이 프로젝트는 냄새 데이터 세트에 수천 개의 새로운 분자를 도입하는 데 가치가 있으며, 이는 상대적으로 작은 크기이며,이 데이터는 "개선의 기초가 될 수있다"고 말했다. Koulakov는 신경망의 설계가 인간 후각 시스템과 동일하지 않기 때문에 기계 학습 모델에서 인간 후각에 대해 무엇을 배울 수 있는지는 확실하지 않다고 지적합니다.
AI가 냄새를 이해하는 방법과 우리가 그것을 인식하는 방법은 매우 다른 두 가지 일 수 있습니다. 두 분자가 다른 냄새를 맡을 수, 아직 심지어 훈련 코는 것 둘 다 레이블 "우디"또는 "흙." "그것은 큰주의"라고 Wiltschko는 말한다.
그는 또한 GNN이 하나의 핵심 영역, 즉 동일한 원자와 결합을 갖지만 서로의 거울상으로 배열 된 소위 키랄 쌍 (chiral pair)에 속한다고 인정한다. 방향이 다르다는 것은 냄새가 완전히 다르다는 것을 의미합니다. 캐러 웨이와 스피어민트가 그 예입니다. 그러나 GNN은 그것들을 동일하게 분류 할 것입니다. Wiltschko는“데이터 세트에 키랄 쌍이 있고이를 정확하게 예측할 수 없다는 것을 알고 있습니다. 다음 단계는 처리 방법을 알아내는 것입니다.
게다가,이 연구는 우리가 단일 분자를 인식하는 방법을 근본적으로 바꿀 수있는 향기의 혼합물 또는 조합에 대해 많은 것을 알려주지 않습니다. 그러나 어떤 특성이나 패턴으로 인해 분자가 특정 방식으로 냄새를 맡게되는지 파악하는 것은이 분야에서 큰 발전 일 것입니다. Monell Chemical Senses Center의 냄새 연구자 인 Johannes Reisert는“우리가이 일을 할 수 있다면 정말 놀라운 일이라고 생각합니다. 결국, 우리는 냄새에 대한 일종의 컬러 휠을 만들어 어떤 분자가 서로 더 가깝고 서로 관련되어 있는지를 파악할 수 있습니다. Reisert는 Google 프로젝트가 아직 진행 중이지만 "앞으로 나아가는 단계"임을 인정합니다.