과학자들은 인공 지능 모델 관리를 위한 FAIR 표준을 홍보합니다.
날짜:
2022년 11월 10일
원천:
DOE/아르곤 국립 연구소
요약:
전산 과학자들은 AI 모델을 더 찾기 쉽고, 접근 가능하고, 상호 운용 가능하고, 재사용할 수 있도록 만들기 위한 새로운 프레임워크를 채택합니다.
AI 모델에 대한 새로운 데이터 표준이 생성되었습니다.
야심 찬 제빵사는 다양한 주방 설정을 기반으로 수상 경력에 빛나는 요리법을 적용해야 하는 경우가 많습니다. 예를 들어, 누군가는 스탠드 믹서 대신 에그비터를 사용하여 수상 경력에 빛나는 초콜릿 칩 쿠키를 만들 수 있습니다.
다양한 상황과 다양한 설정으로 레시피를 재현할 수 있다는 것은 재능 있는 요리사와 계산 과학자 모두에게 매우 중요합니다. 후자는 검증 및 작업을 시도할 때 자신의 "레시피"를 적용하고 재현하는 유사한 문제에 직면해 있습니다. 새로운 AI 모델. 이 모델은 기후 분석에서 뇌 연구에 이르기까지 다양한 과학 분야에서 응용할 수 있습니다.
미국 에너지부(DOE) 아르곤 국립연구소(DOE) 아르곤 국립연구소의 과학자이자 번역 AI 책임자인 엘리우 후에르타는 "데이터에 대해 이야기할 때 우리가 다루는 디지털 자산에 대해 실질적으로 이해하고 있다"고 말했다. "AI 모델을 사용하면 좀 더 명확하지 않습니다. 우리는 스마트한 방식으로 구조화된 데이터에 대해 이야기하고 있습니까, 아니면 컴퓨팅 또는 소프트웨어 또는 혼합에 대해 이야기하고 있습니까?"
새로운 연구에서 Huerta와 그의 동료들은 AI 모델 관리를 위한 새로운 표준 세트를 명확히 했습니다. 자동화된 데이터 관리에 대한 최근 연구에서 채택된 이러한 표준을 FAIR라고 하며 이는 찾기 가능, 액세스 가능, 상호 운용 가능 및 재사용 가능을 나타냅니다.
Argonne 컴퓨터 과학자 Ben Blaiszik은 "AI 모델을 공정하게 만들면 더 이상 매번 처음부터 각 시스템을 구축할 필요가 없습니다. "다른 그룹의 개념을 재사용하는 것이 더 쉬워져 팀 간에 교차 수분을 생성하는 데 도움이 됩니다."
Huerta에 따르면 많은 AI 모델이 현재 공정하지 않다는 사실이 과학적 발견에 도전이 된다고 합니다. 그는 "지금까지 수행된 많은 연구의 경우 문헌에 참조된 AI 모델에 액세스하고 재현하기가 어렵다"고 말했다. "FAIR AI 모델을 만들고 공유함으로써 중복 작업을 줄이고 이러한 모델을 사용하여 훌륭한 과학을 구현하는 방법에 대한 모범 사례를 공유할 수 있습니다."
다양한 사용자 커뮤니티의 요구를 충족하기 위해 Huerta와 그의 동료들은 고유한 데이터 관리 제품군과 고성능 컴퓨팅 플랫폼을 결합하여 FAIR 프로토콜을 설정하고 AI 모델의 "FAIR-ness"를 정량화했습니다. 연구원들은 Materials Data Facility라는 온라인 리포지토리에 게시된 FAIR 데이터와 Data and Learning Hub for Science라는 다른 온라인 리포지토리에 게시된 FAIR AI 모델, ALCF(Argonne Leadership Computing Facility)의 AI 및 슈퍼컴퓨팅 리소스를 연결했습니다. ). 이러한 방식으로 연구원들은 다양한 하드웨어와 소프트웨어를 연결하는 데 도움이 될 수 있는 계산 프레임워크를 만들고 플랫폼 간에 유사하게 실행할 수 있고 재현 가능한 결과를 산출하는 AI 모델을 만들 수 있었습니다. ALCF는 DOE Office of Science 사용자 시설입니다.
이 프레임워크를 만드는 두 가지 핵심은 funcX와 Globus라는 플랫폼으로, 연구자가 랩톱에서 바로 고성능 컴퓨팅 리소스에 액세스할 수 있도록 합니다. "FuncX와 Globus는 하드웨어 아키텍처의 차이를 초월하는 데 도움이 될 수 있습니다."라고 공동 저자인 Argonne의 데이터 과학 및 학습 부서 이사인 Ian Foster가 말했습니다. "누군가 하나의 컴퓨팅 아키텍처를 사용하고 있고 다른 누군가가 다른 아키텍처를 사용하고 있다면 이제 우리는 공통 AI 언어를 사용할 수 있습니다. 이는 AI를 보다 상호 운용 가능하게 만드는 데 큰 부분을 차지합니다."
이 연구에서 연구원들은 DOE Office of Science 사용자 시설이기도 한 Argonne의 Advanced Photon Source의 회절 데이터를 사용하는 AI 모델의 데이터 세트 예를 사용했습니다. 계산을 수행하기 위해 팀은 ALCF AI 테스트베드의 SambaNova 시스템과 Theta 슈퍼컴퓨터의 NVIDIA GPU(그래픽 처리 장치)를 사용했습니다.
NVIDIA 솔루션 아키텍처 및 엔지니어링 담당 부사장인 마크 해밀턴(Marc Hamilton)은 "더 많은 연구자들이 고성능 컴퓨팅 리소스에 액세스할 수 있도록 모델 및 데이터 공유를 통한 FAIR 생산성 이점을 보게 되어 매우 기쁩니다."라고 말했습니다. "우리는 과학적 발견의 속도를 높이기 위해 AI와 함께 실험 데이터 및 기기 작동을 결합하는 고성능 컴퓨팅의 확장된 세계를 함께 지원하고 있습니다."
SambaNova Systems의 고객 엔지니어링 담당 부사장인 Jennifer Glore는 "SambaNova는 AI 및 새로운 하드웨어 아키텍처의 인터페이스에서 혁신을 추구하기 위해 Argonne National Laboratory의 연구원들과 협력하게 된 것을 기쁘게 생각합니다. "AI는 과학 컴퓨팅의 미래에서 중요한 역할을 할 것이며 새로운 도구와 함께 AI 모델을 위한 FAIR 원칙의 개발은 연구자들이 대규모의 자율적 발견을 가능하게 할 것입니다. 우리는 지속적인 협력과 개발을 기대합니다. ALCF AI 테스트베드"
연구를 기반으로 한 논문 "가속된 고에너지 회절 현미경을 위한 실제 적용과 함께 AI 모델을 위한 FAIR 원리"가 2022년 11월 10일 Nature Scientific Data에 게재되었습니다 .
출처 : https://www.sciencedaily.com/