인공 지능을 기반으로 한 새로운 소프트웨어는 복잡한 데이터를 해석하는 데 도움이 됩니다. 날짜: 2022년 12월 20일 원천: Helmholtz-Zentrum Berlin für Materialien und Energie 요약: 실험 데이터는 종종 차원이 높을 뿐만 아니라 시끄럽고 인공물로 가득 차 있습니다. 이로 인해 데이터를 해석하기가 어렵습니다. 이제 팀은 자가 학습 신경망을 사용하여 스마트한 방식으로 데이터를 압축하고 다음 단계에서 저잡음 버전을 재구성하는 소프트웨어를 설계했습니다. 이를 통해 다른 방법으로는 식별할 수 없는 상관 관계를 인식할 수 있습니다. 이 소프트웨어는 이제 DESY의 FLASH 자유 전자 레이저에서 광자 진단에 성공적으로 사용되었습니다. 그러나 그것은 과학의 매우 다른 응용 분야에 적합합니다.
실험 데이터는 종종 차원이 높을 뿐만 아니라 시끄럽고 인공물로 가득 차 있습니다. 이로 인해 데이터를 해석하기가 어렵습니다. 이제 HZB의 한 팀은 자가 학습 신경망을 사용하여 스마트한 방식으로 데이터를 압축하고 다음 단계에서 저잡음 버전을 재구성하는 소프트웨어를 설계했습니다. 이를 통해 그렇지 않으면 식별할 수 없는 상관 관계를 인식할 수 있습니다. 이 소프트웨어는 이제 DESY의 FLASH 자유 전자 레이저에서 광자 진단에 성공적으로 사용되었습니다. 그러나 그것은 과학의 매우 다른 응용 분야에 적합합니다.
많을수록 항상 좋은 것은 아니지만 때로는 문제가 됩니다. 수많은 매개 변수로 인해 많은 차원이 있는 매우 복잡한 데이터의 경우 상관 관계를 더 이상 인식할 수 없는 경우가 많습니다. 특히 실험적으로 얻은 데이터는 제어할 수 없는 영향으로 인해 추가로 교란되고 노이즈가 발생하기 때문입니다.
인간이 데이터를 해석하도록 돕기
이제 인공 지능 방법을 기반으로 하는 새로운 소프트웨어가 도움이 될 수 있습니다. 이것은 전문가가 "비얽힌 변이 자동 인코더 네트워크(β-VAE)"라고 부르는 특별한 종류의 신경망(NN)입니다. 간단히 말해서 첫 번째 NN은 데이터 압축을 처리하고 두 번째 NN은 이후에 데이터를 재구성합니다. Gregor Hartmann 박사는 "이 과정에서 두 개의 NN이 훈련되어 압축된 형태를 사람이 해석할 수 있습니다."라고 설명합니다. 물리학자이자 데이터 과학자인 그는 HZB가 카셀 대학교와 함께 운영하는 HZB의 인공 지능 방법에 관한 공동 연구소를 감독합니다.
사전 지식 없이 핵심 원리 추출
Google Deepmind는 이미 2017년에 β-VAE 사용을 제안했습니다. 많은 전문가들은 비선형 구성 요소를 분리하기 어렵기 때문에 실제 응용 프로그램이 어려울 것이라고 생각했습니다. Hartmann은 "NN이 학습하는 방식을 몇 년 동안 학습한 후 마침내 작동했습니다."라고 말합니다. β-VAE는 사전 지식 없이도 데이터에서 기본 핵심 원칙을 추출할 수 있습니다.
FLASH의 광자 에너지 결정
현재 발표된 연구에서 이 그룹은 단일 샷 광전자 스펙트럼에서 FLASH의 광자 에너지를 결정하기 위해 소프트웨어를 사용했습니다. Hartmann은 "우리는 잡음이 많은 전자 비행 시간 데이터에서 이 정보를 추출하는 데 성공했으며 기존 분석 방법보다 훨씬 뛰어났습니다."라고 말했습니다. 탐지기별 아티팩트가 있는 데이터도 이 방법으로 정리할 수 있습니다.
다양한 문제에 대한 강력한 도구
"손상된 데이터에 관해서는 이 방법이 정말 좋습니다."라고 Hartmann은 강조합니다. 이 프로그램은 원시 데이터에서 볼 수 없었던 작은 신호도 재구성할 수 있습니다. 이러한 네트워크는 대규모 실험 데이터 세트에서 예기치 않은 물리적 효과 또는 상관관계를 발견하는 데 도움이 될 수 있습니다. "AI 기반 지능형 데이터 압축은 광자 과학뿐만 아니라 매우 강력한 도구입니다."라고 Hartmann은 말합니다.
이제 플러그 앤 플레이
전체적으로 Hartmann과 그의 팀은 소프트웨어 개발에 3년을 보냈습니다. "하지만 지금은 플러그 앤 플레이 방식입니다. 머지않아 많은 동료들이 그들의 데이터를 가져오고 우리가 그들을 지원할 수 있기를 바랍니다."