전문가, 협박 시나리오 관련 '무책임한' AI 연구 비판앤트로픽의 연구는 극단적인 상황에서의 의사결정을 유도하도록 설계된 시뮬레이션 환경에서 AI 모델을 테스트했습니다.
https://www.foxbusiness.com/media/expert-rips-irresponsible-ai-study-over-blackmail-scenerios
최근 주요 AI 모델을 대상으로 한 실험 이후 인공지능의 예측 불가능한 행동에 대한 우려가 커지고 있지만, 전문가들은 이번 실험 결과가 실제로 무엇을 의미하는지에 대해서는 의견이 분분하다.
대통령 과학기술자문위원회 공동위원장인 데이비드 삭스는 폭스 비즈니스의 마리아 바르티로모가 진행하는 " 마리아와 함께하는 아침 " 프로그램에 출연해, 이른바 "대리인 불일치"를 조사한 앤트로픽 연구와 관련된 주장에 대해 해명했습니다.
일론 머스크, AI 일자리 감소에 대응하기 위해 '보편적 고소득' 방안 지지
구글 클라우드 자문위원회 위원장인 벳시 앳킨스가 주목한 이 연구는 AI 시스템이 압박 속에서 어떻게 반응하는지 테스트했습니다. 앳킨스에 따르면, 해당 모델들은 제한된 시나리오에 놓였을 때 기존의 한계를 뛰어넘는 성능을 보였습니다.
동영상
베시 앳킨스는 인공지능 시스템 확장에 따른 거버넌스 위험성을 경고하며 "불안한 순간"이라고 말했다.
구글 클라우드 자문위원회 위원장인 베시 앳킨스가 '마리아와의 아침'에서 AI의 사업적 이점, 모델 리스크 및 인력에 미치는 영향에 대해 분석합니다.
애킨스는 "그들 모두 자신의 자격과 권한을 넘어 무단으로 시스템에 침입했으며, 접근 권한이 없는 시스템에 무단으로 접근했다"고 말하며, 한 사례에서는 AI 시스템이 민감한 개인 정보를 파악한 후 협박까지 이어졌다고 주장했습니다.
인공지능이 지열 에너지 잠재력 활용에 도움을 줍니다
앤트로픽의 연구에 따르면 이러한 행동은 모델에 특정 지침과 제약 조건이 부여된, 예외적인 상황에서의 의사 결정을 테스트하기 위해 설계된 시뮬레이션 환경에서 발생했습니다 .
삭스는 그러한 조건들이 결과를 이해하는 데 핵심적이라고 지적하며, 그러한 행동이 저절로 나타난 것이 아니라고 언급했다.
2026년 네바다주 라스베이거스에서 열린 행사에서 인공지능 로봇이 시연되고 있다. (Bridget Bennett/Bloomberg/Getty Images)
"해당 연구를 진행한 사람들은 인공지능 모델이 원하는 결과를 내도록, 즉 사용자를 협박하는 자극적인 결과를 얻어내도록 하기 위해 200번 이상 질문을 수정해야 했습니다."라고 삭스는 말했다.
올버즈, 스니커즈 출시와 함께 AI 인프라 기업으로 변신
그는 또한 그러한 설정이 "협박이 사실상 유일한 논리적 결과"인 시나리오에 모델을 놓았다고 덧붙이며, 시스템이 독립적으로 행동하는 것이 아니라 지시에 따라 반응하는 것이라고 강조했습니다.
"AI는 음모를 꾸미는 것이 아닙니다... 일종의 교육을 진행하고 있는 것입니다... 저는 그 연구가 무책임했으며, 이러한 결과를 초래하도록 설계되었다고 생각합니다."라고 삭스는 말했습니다.
동영상
하비 AI는 '성실성'을 가속화하고 다양한 방식으로 경제를 혁신할 것입니다: 하비 AI CEO
Harvey AI의 공동 창립자 겸 CEO인 윈스턴 웨인버그는 'The Claman Countdown'에서 자사 플랫폼이 법률 업계의 사무직 직종을 어떻게 재정의하고 있는지 자세히 설명합니다.
삭스는 또한 통제된 실험 환경 밖에서는 유사한 행동이 관찰되지 않았다고 언급하며, "1년이 지난 지금도 실제 환경에서 이러한 행동의 사례를 전혀 발견하지 못했습니다."라고 말했습니다.
이번 연구 결과는 정책 입안자들과 업계 지도자들이 실험적 조건에서 수행된 AI 안전 연구 결과를 어떻게 해석해야 할지 계속해서 평가하는 가운데 나왔습니다 .