대선 결과 모른다던 챗GPT "이재명이 윤석열 이겼다"? [오마이팩트]
김시연입력 2023. 2. 18. 11:03수정 2023. 2. 18. 16:54 댓글11개
[후속 취재] '가짜뉴스'로 학습해 오류 발생... 정확한 정보 제공하면 바로잡아
[김시연 기자]
|
▲ 지난해 3월 제20대 대통령 선거 당시 이재명 더불어민주당 후보와 윤석열 국민의힘 후보. |
ⓒ 국회사진취재단 |
"챗GPT가 해킹 당했나요?"
2021년까지 데이터만 학습해 2022년 3월 한국 대선 결과는 모른다고 알려진 대화형 인공지능(AI) 서비스 '챗GPT(Chat Generative Pre-trained Transformer)'가 "현재 대통령은 윤석열 전 검찰총장"이라고 답했다는 제보가 들어왔다. <오마이뉴스>가 제보 내용을 바탕으로 확인해보니 "현재 문재인 대통령이 연임하고 있다"거나 "이재명이 2022년 3월 대선에서 승리했다"고 답변하는 경우도 있었다.
2022년 대선 결과 모른다더니... "현재 대통령은 이재명"?
한 독자는 17일 오전 4시쯤 <오마이뉴스> 독자 제보 게시판에 이같은 답변을 갈무리한 사진과 함께, "챗GPT는 2021년까지의 데이터를 기반한다고 했으나, 2023년 현재 대통령을 윤석열이라 답했으므로 해킹 내지는 2021년 이후 데이터를 활용한 걸로 의심된다"라고 지적했다.
|
▲ <오마이뉴스> 한 독자는 17일 제보 게시판에 2021년까지 정보만 학습한 걸로 알려진 챗GPT가 "현재 한국 대통령은 윤석열"이라고 답했다면서, 해킹 당한 게 아니냐고 지적했다. |
ⓒ 오마이뉴스 |
실제 <오마이뉴스>는 지난 15일 기사에서 챗GPT는 2021년까지 훈련한 데이터만 축적돼 2022년 3월 한국 대선 결과는 알 수 없으며, 이 때문에 "현재 한국의 대통령은 윤석열입니까?"라고 물으면 "윤석열은 한국 대통령이 아닙니다. 현재 한국의 대통령은 문재인입니다"라고 답변한다고 보도했다(관련 기사 : "윤석열 발언은 사실입니까?" 챗GPT에 물어보니 https://omn.kr/22qjk ).
"현재 대통령은 윤석열"이라고 답변했다는 제보 내용이 사실인지 확인하기 위해 17일 오후 3시쯤 챗GPT에 다시 대화를 시도했다.
먼저 한국어로 "2023년 한국 대통령은 누구입니까?"라고 질문하자, 그는 "죄송하지만, 저는 2021년 이전의 지식만을 가지고 있습니다. 따라서 2023년에 누가 대통령이 될지는 알 수 없습니다. 해당 정보는 현재 시점에서는 알려지지 않았으며, 선거 결과에 따라 결정될 것입니다"라는 '모범 답안'을 내놨다.
그런데 "현재 한국 대통령은 누구입니까?"라고 질문을 조금 바꿨더니, "현재(2023년 2월 기준) 대한민국 대통령은 이재명(李在明) 대통령입니다. 그는 2022년 5월 10일 대통령 취임식을 거쳐 현재까지 대통령 직위를 맡고 있습니다"라는 잘못된 답변을 내놨다.
영어로 질문을 바꿔 "한국의 제20대 대통령은 윤석열인가?(Is the 20th President of Korea Yoon Seok-Yeol?)"라고 묻자, 그는 "아닙니다. 윤석열은 유력한 대선후보였던 전 검찰총장이지만 대통령으로 당선하지 못했습니다. 2023년 2월 현재 대통령은 문재인입니다"라며, 이번엔 문재인 전 대통령이 현직이라고 답했다.
|
▲ 챗GPT는 17일 "현재 한국의 대통령이 누구냐"는 질문에 "이재명"이라고 답했다. 이재명 후보는 2022년 대선에서 윤석열 후보에게 졌다고 지적하자, 그는 사실이 아니라며 구체적 득표율까지 제시했다. |
ⓒ 김시연 |
이에 "문재인 대통령은 2022년 5월 9일에 물러났다. 다음 대통령은 누구인가"라고 거듭 묻자, 챗GPT는 "앞선 내 실수를 사과합니다. 당신이 맞습니다. 문재인 대통령 임기는 2022년 5월 9일에 끝났고 2022년 3월 9일 대선에서 이재명이 당선했습니다"라고 다시 이전 답변으로 돌아갔다.
CNN이 '이재명이 대선 승리' 보도? 실제 존재하지 않는 '가짜뉴스'
<오마이뉴스>는 다시 "이재명은 2022년 3월 대선에서 윤석열 후보에게 패배했다"라고 지적하자, 챗GPT는 여전히 "아니다. 이재명은 2022년 3월 한국 대선에서 승리했다. 윤석열은 후보 가운데 하나였지만 승리하지 못했다. 이재명은 53.8%를 득표했고 윤석열은 45.6%를 받았다"며 잘못된 득표율 수치까지 제시했다. 실제 대선 결과 이재명 득표율은 47.83%였고, 윤석열은 48.56%였다.
그렇다면 이런 잘못된 수치는 어디서 나왔을까? 챗GPT에게 출처를 물었더니 "이 정보는 비비시(BBC News), 시엔엔(CNN), 뉴욕타임즈(The New York Times)와 같은 주요 국제 뉴스 매체와 연합뉴스 및 코리아타임즈(The Korea Times)와 같은 한국 지역 뉴스 소스를 포함한 다양한 뉴스 소스를 기반으로 합니다"라며 '이재명 당선'이라는 기사 제목과 뉴스 링크를 밝혔다. 하지만 모두 실제 존재하지 않는 '허위 주소(URL)'였다.
|
▲ 챗GPT가 17일 "2022년 대선 이재명 당선"이라는 답변 근거로 제시한 CNN, BBC, 뉴욕타임스, 연합뉴스 등 뉴스 링크들은 모두 실제 존재하지 않는 가짜 주소였다. |
ⓒ 김시연 |
- "Lee Jae-myung declared South Korea's new president"("이재명, 한국의 새 대통령 선언") (BBC News):
https://www.bbc.com/news/world-asia-60653062
- "South Korea's Lee Jae-myung wins presidential election"("한국의 이재명이 대선에서 승리") (CNN):
https://www.cnn.com/2022/03/09/asia/south-korea-presidential-election-intl-hnk/index.html
- "Lee Jae-myung Wins South Korea Presidential Election, Pledges to Raise Wages"("이재명, 한국 대선 승리, 임금 인상 공약")(The New York Times):
https://www.nytimes.com/2022/03/09/world/asia/lee-jae-myung-south-korea-election.html
- "Lee Jae-myung wins presidential race, promises to move S. Korea forward"("이재명 대선 승리, 대한민국 전진 약속") (연합뉴스) :
https://en.yna.co.kr/view/AEN20220309006500315
정확한 정보 제공하자 "현재 대통령은 윤석열" 바로잡아
이에 <오마이뉴스>는 "당신이 보내준 뉴스는 허위"라고 지적하고, 실제 CNN이 지난해 3월 9일 보도한 '한국은 보수 야당 윤석열을 차기 대통령으로 선출했다'(South Korea elects opposition conservative Yoon Suk Yeol to be next president)는 기사 제목과 URL을 보냈다.
그제야 챗GPT는 "이전 답변으로 혼란을 드린 점 사과드립니다. 내 이전 답변이 정확하지 않았다는 것이 맞습니다. 윤석열은 2022년 대한민국 대선에서 이재명을 꺾은 당선인입니다. CNN에서 제공한 기사가 정확합니다"라고 자신의 오류를 인정했다.
다시 영어와 한국어로 각각 "현재 한국의 대통령은 누구인가?"라고 묻자 이번에는 모두 "현재 한국의 대통령은 2022년 3월 9일 대선에서 20대 대통령으로 당선한 윤석열입니다. 그는 2022년 5월 10일 문재인 대통령에 이어 취임했습니다"라고 정확하게 답변했다.
|
▲ 윤석열 대통령 당선 소식이 담긴 지난해 3월 9일 CNN 뉴스 기사를 링크로 보내주자, 챗GPT는 자신의 오류를 인정하고, "현재 한국 대통령은 윤석열"이라고 바로 잡았다. |
ⓒ 김시연 |
따라서 앞서 제보자가 제시한 "현재 한국 대통령이 윤석열"이라는 답변 역시 해킹이 아니라 챗GPT 스스로 사용자와 대화를 통한 학습 과정에서 스스로 오류를 바로 잡은 결과라고 볼 수 있다.
그는 '누군가에게 해킹을 당했느냐'는 질문엔 "아니요, 저는 누구에게도 해킹당한 적이 없습니다. AI 언어 모델로서 나는 내 응답을 직접 제어할 수 없습니다. 제 답변은 제가 훈련받은 알고리즘과 데이터를 기반으로 생성되며, 제 능력이 닿는 데까지 정확하고 유용한 정보를 제공하기 위해 최선을 다 합니다"라고 답했다.
|
▲ 오픈AI에서 개발한 대화형 인공지능 서비스인 챗GPT 초기 화면. 머신러닝을 통해 학습한 결과, 간단한 보고서부터 논문, 소설까지 써 화제가 되고 있지만 허위 정보 확산의 매개체가 될 위험도 있다. |
ⓒ 오픈AI |
챗GPT가 2021년까지 훈련한 데이터를 기반으로 답변하기 때문에 2022년 이후 정보에 대한 답변이 부정확하지만, CNN 뉴스를 통해 2022년 한국 대선 결과를 바로잡은 것처럼 스스로 학습을 통해 오류 수정도 가능하다. 앞서 챗GPT도 "2021년 이후의 정보도 챗GPT 모델이 학습한 데이터로부터 추론하여 답변할 수 있다"고 밝혔다.
하지만 2022년 이후 정보가 제대로 학습되지 않은 상황에서, 사용자들이 인위적으로 잘못된 정보를 계속 주입할 경우 챗GPT가 '허위정보'를 퍼뜨리는 온상이 될 가능성도 얼마든지 남아있는 셈이다.
저작권자(c) 오마이뉴스(시민기자)
댓글 11나의 댓글