A) 학우 게시글을 택한 이유와 게시글에 대한 본인의 내용설명
내가 흥미롭다고 여겼던 게시물은 04분반 게시판의 게시글 113번 박소윤 학우의 “빅데이터 시대, 개인정보보호는…?” 이다. 그 이유는 사용자의 음성을 녹취하여 정보를 유출한다는 부분이 흥미롭다고 생각했었기 때문에 빅데이터 시대에 개인정보 유출 피해에 대하여 더 자세한 내용을 알아보고 싶어서 이 게시물을 선택하게 되었다.
게시물에 기재되어있는 뉴스는 구글의 음성수집에 대한내용이다. 인터넷 사이트에서는 배너광고를 흔히 볼 수 있다. 배너 광고란 인터넷 홈페이지에 뜨는 막대 모양의 광고로 배너 광고를 클릭하게 되면 해당 웹페이지로 바로 이동을 할 수 있다. 이 배너 광고에는 사용자의 인터넷 이용 패턴에 따라서 각각 다르게 나타나게 된다. 많이 접속하는 웹사이트, 검색을 많이 하는 키워드 등이 종합되어 나타나게 된다. 하지만 검색을 하거나 웹사이트에 접속도 해본 적 없는 카테고리의 광고가 배너 광고로 뜨게 되었다. 한 커뮤니티의 게시글 작성자는 구글 크롬을 이용하고 있었다. 그리고 아내와 아이의 컴퓨터 의자를 사줘야겠다는 등의 대화를 몇 마디 나누고 배너광고로 컴퓨터 의자가 뜨는 것을 발견했다. 그 후 책상을 사야겠다는 혼잣말을 몇 번 하였더니 높낮이 조절이 가능한 책상이 배너 광고로 뜨게 되었다. 실제로 비슷한 경험을 한 사람들이 꽤 있었다. 이를 통하여 구글이 사용자의 음성을 녹취하고 이를 사업에 활용한다는 의혹을 받게 되었다. 이것이 사실이라면 매우 심각한 개인정보 유출 그리고 사생활침해까지 이어질 수 있다.
B) 게시글과 관련된 부분에 본인 스스로 추가하여 보강하는 내용/ 자료 그리고 보완설명
음성녹취 및 유출에 관하여 많은 사례를 찾아볼 수 있었다. 사실 구글의 이런 논란은 이번이 처음이 아니다. 구글의 모바일 인공지능 비서 서비스인 ‘구글 어시스턴트’를 통해 이용자 음성을 녹취해 오다 문제가 불거지자 이를 중단하였다. 구글은 1천 건 이상의 대화녹음이 협력사를 통해 벨기에의 뉴스 사이트에 유출된 것을 시인하였다. 구글이나 아마존 등은 AI 음성비서의 반응을 개선하기 위하여 대화 정보를 보관하며 분석해왔다. 하지만 기밀로 유지돼야 할 정보가 유출되었다. 대화 내용 중에는 사용자의 주소까지 등장하였다. 구글은 대화 분석가 중 한 명이 데이터 보안 정책을 어기고 기밀인 네덜란드어 음성데이터를 유출했다며 유출을 인정하였다. 구글에 따르면 이 회사의 협력사들은 음성 파일의 약 0.2%만 청취하며 음성 파일들은 사용자 계정과 연관돼있지 않다고 하였지만 녹음된 사람의 신원을 파악할 수 있을 정도라며 지적하기도 하였다. 그리고 아마존은 세계 전역에서 수천 명의 계약직 인력을 동원하여, 인공지능 스피커 ‘알렉사’의 사용자 음성 명령을 녹취해와 논란이 되었다. 애플 또한 대화 내용을 유출하였는데 사용자와 시리 대화 내용 일부를 계약업체 직원들이 들을 수 있도록 ‘시리 평가 프로그램 ’시리 내용을 평가하는 일부 애플 직원들이 개인적으로 의료정보나 마약 거래와 같은 내용을 들었다. 이후 애플은 ‘시리 평가 프로그램’중단을 발표하였다.
외국 기업뿐만 아니라 네이버도 AI 서비스인 ‘클로바’의 성능개선을 목적으로 이용자의 대화를 녹음하여 문자로 바꾸는 작업을 해왔다. 음성 인식률을 높이기 위하여 음성데이터를 활용한 것이지만 녹음 내용 문자입력을 자회사에 맡겼다. 네이버 직원이 아닌 제삼자가 임의로 사용자의 음성데이터를 청취한 것이다. 카카오도 마찬가지다 AI 스피커인 ‘카카오 미니’를 통해 음성 명령 데이터를 수집하고 수집한 음성데이터 중 0.2%의 데이터를 무작위로 추출했다. 이 추출된 데이터는 자회사 직원이 직접 듣고 글로 옮기는 전사 작업에 활용되었다.
소비자시민모임이 2019년 인공지능 스피커에 대한 소비자 의식을 온라인을 통하여 조사하였다. 인공지능 스피커 사용 시 음성인식 기능을 사용하는 과정에서 개인정보가 수집된다고 생각하는지를 조사해본 결과 개인정보가 수집된다는 응답이 약 65%로 나타났고 그중 개인정보 유출 위험이 있다가 42.3%, 사생활을 침해할 우려가 있다고 36.3%가 응답하였다. 인공지능 스피커 사용자의 개인정보 유출 우려가 큰 것으로 나타났다.
참고자료
[출처 : https://www.yna.co.kr/view/AKR20190712012100091]
[출처 : https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=104&oid=421&aid=0004169080]
[출처 : https://biz.chosun.com/site/data/html_dir/2019/09/05/2019090500244.html]
C) 종합적인 본인 생각과 의견 서술
이처럼 많은 기업이 음성 데이터를 수집 및 활용을 하고 있다. 하지만 이 과정에서는 성능개선에 불필요한 개인정보가 유출될 가능성이 높다. 그리고 음성 데이터를 수집하는 목적이 대부분 성능개선이다. 성능개선에는 음성데이터가 필요하다고 생각한다. 하지만 성능개선을 이유로 나도 모르는 사이에 나의 대화 내용이 수집되어 나의 개인정보가 유출된다고 생각하면 당연히 기분이 나쁠 수밖에 없다. AI 스피커 사용 시 개인정보처리방침이나 이용약관에 음성정보 수집을 고지하지만 이를 꼼꼼히 읽어보고 파악하여 사용하는 이용자는 거의 없을 것이다. 약관에 동의하지 않게 된다면 서비스 또한 이용할 수 없다. 이것은 거의 반강제적이라고 생각한다. 삶의 편리함을 위하여 사용하는 것인데 내 개인정보를 침해하고 있어서는 안 된다고 생각한다.
하지만 빅데이터 시대에 있어서 어느 정도의 데이터 수집은 필수라고 생각한다. 이제는 빅데이터가 필요하지 않은 영역은 거의 없을 것이다. 빅데이터로 인하여 우리 또한 더욱더 편리한 삶을 누릴 수 있는 것이다. 그 이외의 목적으로 개인정보를 가져간다면 이는 분명히 엄중한 처벌이 필요하다. 이러한 개인정보 유출을 최소화하기 위하여 제도적인 측면과 데이터를 활용하는 기업들의 충분한 설명 또는 선택적인 동의가 이루어져야 한다고 생각한다. 데이터를 활용하는 기업은 개인정보 수집의 명확한 기준을 세워야 하며 이용자에게 개인정보를 수집한다는 개인정보 취급방침의 충분하고 강조된 설명 및 선택적 동의가 필요하다. 사실 가입할 때 동의 부분에서는 필수라고 하는 항목이 많기 때문에 이를 선택적으로 동의할 수 있도록 해야 한다고 생각한다. 그리고 선택적 동의로 의하여 서비스 이용에 제한을 둔다는 등의 차별을 두어서는 안 된다. 그리고 유출 피해가 발생했을 경우 그에 따른 방침을 자세히 세워야 할 것이다. 자신의 개인정보 유출이 조금이라도 싫은 이용자는 데이터 수집을 아예 배제하고 선택적으로 데이터 수집을 하는 것이 개인정보 유출 피해를 조금이라도 줄이는 방법이 될 수 있을 것으로 생각한다. 그리고 앞으로 더 많은 방안이 추가되고 강력한 규제를 하여 개인정보의 침해 피해가 감소하면 좋겠다. 특히 보안에 대한 부분이 더 강화되어야 한다고 생각한다.
빅데이터 시대에서 앞으로 더 많은 데이터가 효율적으로 관리되어 더 많은 분야에서 적용되어 더 수준 높은 기술 발전을 이룰 수 있을 것이다. 제도적인 측면의 강화와 기업의 노력으로 개인정보 유출 피해를 최소화하면서 윤리적으로 데이터를 활용하며 발전해 나가야 한다.
첫댓글 확인