고객이 인증 및 로그인 오류를 포함하여 AWS에 연결된 서비스에 액세스하는 데 문제가 발생한 화요일 정오 직전에 문제가 시작되었습니다. Amazon의 엔지니어링 팀은 고객에게 직간접적으로 오류를 일으킨 AWS Lambda 관련 하위 시스템의 문제를 조사하고 발견했습니다.
Reuters에 따르면 고객이 기본 서버를 관리할 필요 없이 컴퓨터 프로그램을 실행할 수 있는 서비스인 AWS Lambda는 T-Mobile, Netflix 및 Autodesk를 비롯한 여러 회사에서 사용하고 있습니다. Amazon Music 및 Alexa와 같은 다른 Amazon 서비스도 영향을 받았습니다.
플랫폼에서 사용자가 제출한 오류의 상태 보고서를 수집하여 중단을 추적하는 웹 사이트 Downdetector.com은 문제와 관련된 중단에 대해 약 12,000건의 최고 보고를 보고했습니다.
Amazon Web Services는 클라우드 컴퓨팅에 중점을 둔 Amazon의 자회사입니다. (AP 이미지를 통한 노아 버거/아마존 웹 서비스/AP 뉴스룸)
AWS는 태평양 표준시로 대략 오후 2시에 "많은 AWS 서비스가 이제 완전히 복구되었으며 이 이벤트에서 해결됨으로 표시되었습니다. 우리는 모든 서비스를 완전히 복구하기 위해 계속 노력하고 있습니다."라고 발표했습니다.
30분 후 AWS는 자사 시스템이 다른 AWS 서비스(예: SQS 및 EventBridge)의 호출을 포함하여 이벤트 중에 누적된 비동기식 Lambda 호출의 백로그를 여전히 처리하고 있다고 말했습니다. 몇 시간 동안 그리고 이 시간 동안 비동기 호출 실행이 계속 지연될 것으로 예상합니다."
태평양 표준시 오후 3시 40분 직전에 AWS는 백로그가 "완전히 처리"되었으며 "문제가 해결되었으며 모든 AWS 서비스가 정상적으로 작동하고 있습니다."라고 발표했습니다.