|
정향미 문화체육관광부 저작권국장 초청
인공지능 저작권 제도개선과 민간대책 포럼
(월간현대경영 2024년 5월호 BIZ&전략)
이해와 상생
현대경영포럼 OVERVIEW
주 제 좌 장 일 정 장 소 | 인공지능 저작권 제도개선과 민간대책 정향미 국장 문화체육관광부 저작권국장 2024년 4월 8일(월) 08:00-09:30 서울시청 앞 조선호텔 1층 ‘나인스게이트’ |
AI(artificial intelligence) 시대가 활짝 열렸다. AI 즉 인공지능 시대 저작권 포럼에 난데없이(?) ‘이해와 상생’이라는 고전적인 단어가 등장했다. AI가 만든 생성물에 저작권을 어떻게 적용해야 할까? 저작권 침해 범위를 어디까지 정할 수 있을까? 현대경영포럼은 정향미 문화체육관광부 저작권국장을 특별초청, AI 저작권 제도개선과 민간대책을 주제로 조찬회를 가졌다. 정향미 국장은 AI 저작권 관련, 문해(文解)가 어려운 당면 이슈들을 거론한 후 문체부의 대응방안에 관해 조목조목 설명했고, 포럼 참석자들은 AI 저작권의 모호성과 관련, AI 저작권의 규제완화와 데이터 양성화, 정책지원 등을 건의했다. AI 저작권도 역시 ‘AI 심리’가 중요하단 판단이 들었다. 연세대에서 심리학을 공부하고 행시 40회로 공직에 입문한 정향미 국장은 오늘 포럼에서 ‘이해와 상생’이라는 키워드를 해법으로 내놓았다.
UNDERSTANDING & WIN-WIN
현대경영포럼 참석인사
곽용재 네이버클라우드 CTO 박종남 롯데이노베이트 본부장 김선정 LG CNS CTO임형주 윤경아 KT AI테크랩장 윤일용 포스코DX AI기술센터장 | 이지은 법무법인 김&장 변호사 박홍래 법무법인 동인 대표변호사 법무법인 율촌 변호사 권동주 법무법인 화우 그룹장 – 기업/법무법인명 가나다순 |
정향미 국장의 ‘이해와 상생’이라는 해법에 화답이라도 하듯이 포럼 참석자들은 열렬한 감사와 박수갈채를 전했다. 기자는 일찍이 오늘처럼 ‘포럼다운 포럼’을 운영해본 적이 없었다. 문체부의 정향미 국장과, 네이버, 롯데, LG, KT, 포스코DX(회사명 가나다순) 등 AI 리딩 컴퍼니, 그리고 김&장, 동인, 율촌, 화우 등 AI 전문 법무법인까지 합세해 내놓은 오늘의 ‘AI 저작권’ 해법을 AI 관련업계의 벤치마킹 자료로 강추(강력추천)하면서, 피터 드러커(P.F. Drucker)박사의 한 말씀을 올린다.
“조직은 때때로 ‘내가 그걸 성공시켜 볼 거야’라고 하는, 그런 용감한 사람을 필요로 한다.”
“Organization sometimes needs somebody who says: I am going to make this succeed.”
기자의 눈엔 오늘 이른 아침 조선호텔 나인스게이트에 모인 AI 포럼 참석자들이 모두들 ‘용감한 사람’으로 보였다.
글_홍윤기 기자
디지털 신질서 대응, 디지털 권리장전 발표
정향미 문체부 저작권국장 안녕하십니까. 문화체육관광부 정향미 국장입니다. 먼저 AI와 저작권이라는 주제로 관련 산업계, 법조계 전문가들과 함께 논의하는 자리를 마련해 주신 현대경영포럼 관계자 여러분에게 감사를 드립니다. 지난 2022년 12월 오픈 AI가 ‘Chat-GPT’를 공개한지 2개월여 만에 가입자 1억 명을 돌파하는 등 전 세계적으로 큰 반향을 일으킨 바 있습니다. GPT-4 출시로 자연어뿐만 아니라 이미지까지 인식하고 상호작용이 가능한 멀티모달(Multi-Modal) 인공지능 기술이 구현되고 있습니다. 이렇듯 놀라운 속도의 생성형 AI 기술 발전에 대응하여 작년 3월에 과기정통부 주관으로 민간 전문가 20인으로 구성된 ‘디지털 신질서 정립 협의체’를 구성, 관련 논의를 이어가고 있으며, 작년 9월에는 정부 부처 공동으로 디지털 공동 번영 사회의 가치와 원칙을 담은 ‘디지털 권리장전’을 수립 발표하였습니다. 이밖에도 작년 12월 정부는 일반 국민을 대상으로 ‘디지털 심화 시대에 우려되는 쟁점 및 분야’가 무엇인지를 알아보기 위한 조사를 실시하였습니다. 그 결과, 많은 국민들께서 “인공지능 기술을 개발하기 위해 활용된 저작물에 대해 그 저작권을 어느 정도까지 허락해야 되는가”의 문제와 “인공지능이 만들어낸 산출물이 저작권 보호의 대상이 될 것인가” 여부에 대해 깊은 관심과 우려를 나타냈습니다. 정부는 이러한 AI와 저작권 쟁점을 포함한 AI 기술발전 관련 핵심 쟁점들의 진단, 분석을 바탕으로 그 대응책을 담은 범부처 차원의 ‘디지털 신질서 적립 추진계획’을 마련하여, 조만간 발표할 예정입니다.
미국 및 EU의 AI 저작권 대응
2024년 3월 EU(유럽연합)의 본회의에서 인공지능 법안을 통과시켰습니다. 해당 법안의 저작권 관련 내용을 말씀드리겠습니다. 범용 AI시스템과 그 기반이 되는 파운데이션(foundation) 모델은 이를 활용한 산출물이 AI 산출물임을 공개적으로 명시해야 합니다. 이런 의무는 특히 딥페이크(deep fake) 기술을 활용한 가짜 뉴스 생성이라든가, 아니면 AI로 만든 저작물임을 밝히지 않고 창작 공모전에 나가 당선이 되었을 때의 문제 등과 관련이 되어 있습니다. 저작권 보호 대상이 되는 저작물(데이터)을 학습에 이용하면, 이에 대한 상세한 요약 정보를 문서화하여, 일반 공중에게 제공토록 의무화하고 있는데, 이는 관련 저작권자의 저작권 행사에 관련된 주요 의사결정을 하는데 필요한 조치라고 볼 수 있습니다. 또한 저작권을 가진 창작자가 자신의 저작물이 학습에 이용되기를 원하지 않는다면 온라인상에 동 저작물을 공표할 때 미리 거부의사를 밝혀, 학습 데이터에 쓰이지 않도록 하고, AI 개발자나 시스템 제공자도 이런 옵트아웃(Opt out) 의사 표시가 있는 데이터(저작물)인지를 반드시 확인하도록 하는 의무를 부여하고 있습니다. 美 바이든 행정부는 상무부에게 AI 콘텐츠의 워터마크(watermark) 사용 등에 대한 지침을 개발토록 하고 저작권청에게는 저작권 및 인공지능 관련 잠재적 행정 조치 권고안을 마련해서 제출하도록 하는 행정명령을 내린 바 있습니다. 아울러 美 저작권청은 올해 말까지 ▲초상,음성 등을 모방하는 생성형 AI관련 이슈 ▲AI 생성물이 포함된 콘텐츠의 저작물성 여부 판단 이슈 ▲AI 학습 및 생성물 관련 법적 책임 이슈와 관련하여 순차적으로 검토 보고서를 발행 의회에 제출할 예정입니다.
생성형 AI 저작권 안내서 그리고 제도개선 워킹그룹
문체부는 2023년 1년간 학계, 법조계, 권리자, 사업자, 산업 기술계 등으로 구성된 AI 저작권 제도개선 워킹그룹(working group)을 운영하여 다양한 저작권 쟁점에 관해 연구하고 논의를 진행했고, 이를 바탕으로 작년 12월 ‘생성형 AI 저작권 안내서’를 발간하였습니다. 이 안내서는 주로 AI 사업자, 개발자나 서비스 제공자, 사업자들 그리고 저작권 권리자들, 이용자들이 AI와 관계된 업무나 활동을 할 때 어떤 부분을 유의해야 하는지에 중점을 두고, 이슈 해결의 기본 방향을 제시했습니다. 우선 개발자나 서비스 제공자 등 사업자들이 AI를 학습시키기 위해 저작물을 이용해야 할 경우 적절한 보상을 통해 적법한 이용 권한을 확보할 수 있도록 권고했습니다. 창작자들 즉, 저작권 소비자들이 디지털 온라인상에 자신의 저작물을 올려놓은 경우, 로봇 배제 표준(웹 사이트에 로봇 접근을 방지하기 위한 규약) 등의 방법을 통해 저작물을 AI가 기계적으로 판독하여 이용하지 못하도록 미리 거부 의사를 표시할 수 있음을 안내한 바가 있습니다. 끝으로, 사용자가 생성형 AI 산출물을 계획 공표할 때 자신이 만든 부분을 공표하지 않으면 문제가 되지 않지만, 공표하면 사적복제(개인적인 목적으로 저작물을 복제하는 것)의 범위를 넘어가게 되어 저작권 침해의 소지가 있음을 유의해야 하며, AI 명령어를 입력할 때 기존 저작물과 유사한 산출물이 도출되지 않도록, 예컨대 저작권의 보호를 받는 저명한 화가의 작품처럼 만들라는 명령을 넣지 않도록 권고하고 있습니다. 문체부는 올해도 AI 저작권 제도개선 워킹그룹 운영하여, AI 학습 과정에서의 저작권 이슈와 AI 산출물과 관련된 이슈를 각각의 분과를 통해 심층 논의할 예정입니다. 3월에 개최된 학습분과 1차 회의에서는 권리자와 사업자들이 AI가 대량의 저작물 이용 시 사전에 모두 이용 허락을 받기가 현실적으로 어렵다는 게 중론이었습니다. 산출분과 1차 회의에서는 AI산출물의 침해 판단과 관련, 인간의 기여가 있는 AI 산출물은 그것이 저작물이냐 여부와 무관하게 저작권 침해 소재가 있고, AI 산출물의 경우에도 기존 저작권 침해 법리인 의거성과 실질적 유사성에 따라 침해를 판단할 수 있다는 견해가 있었습니다. 저작권 침해 시 이용자, 개발자, 서비스 제공자 등 침해 주체의 개별 상황에 따라 책임 소재가 있을 수 있다는, 기본적인 인식을 공유하고 좀 더 논의를 발전시켜 나가기로 했습니다. 앞으로 정부는 ▲AI 커버곡(cover songs), 딥페이크 등 관련 초상, 음성 등에 관한 권리, ▲AI 학습데이터 공개 여부, ▲AI 산출물 표시 방안, ▲AI 산출물 보호 방안에 대해서 논의할 예정입니다. 오늘 이 자리도 그러한 이슈들에 관해 산업계와 법조계 분들의 고견을 듣고 워킹그룹의 참고자료가 되도록 의견을 전달하는 기회로 삼고자 합니다. 여러분의 좋은 의견을 활발히 개진해주시면 감사하겠습니다.
ROUND TABLE가비지 아웃(garbage out) 막기 위한 양질의 데이터 확보
곽용재 네이버클라우드 CTO 네이버클라우드는 클라우드가 갖고 있는 규모성과 AI가 갖고 있는 지능적인 부분, 자원을 많이 쓰는 부분이 시너지를 일으키면서 좋은 효과를 거두고 있습니다. 가비지 아웃(garbage out)이란 말처럼 쓰레기 데이터가 들어가면 쓰레기 결과물이 나오기 때문에 좋은 데이터를 확보하는 게 무엇보다 중요합니다. 좋은 데이터는 도서관에 있는 데이터, 우리가 많이 접하고 괜찮다고 여기는 데이터, 지식이 많이 들어있는 데이터라고 할 수 있습니다. 저희는 2024년부터 생성형 AI를 활용해서 작성된 기사는 본문 상단에 AI 저작물임을 공지함으로써 누가 만들었는지 판별할 수 있도록 하는 장치를 만들고 있습니다. 앞으로 정부 각 기관에서 도와주신다면 더 좋은 서비스를 만들 수 있을 것입니다.
리터치(Retouch)된 AI 저작물 보호 범위 명료화
박종남 롯데이노베이트 본부장 롯데이노베이트는 기업을 대상으로 AI 모델을 만들고 있어서 공개된 공공 데이터나 기업 정보를 주로 활용하며, 자체적으로 확보한 데이터를 주로 사용합니다. AI를 통해 학습데이터를 만들면 그 데이터가 저작권 대상이 되는지, 유출시 보호를 받을 수 있는지 고민입니다. 또한 어느 데이터를 어디까지 썼는지 나중에 불명확해질 수 있습니다. AI 산출물인 기업의 캐릭터나 캐릭터 내 구성 이미지가 저작권 보호 대상인지, 이미지 산출물을 인간이 리터치(retouch)해도 여전히 AI 저작물인지 등 논의할 대상이 많은 것 같습니다. 끝으로, 외국 기업이 한국어 음성 데이터 등을 요구할 때 해당 데이터에 관한 저작권을 인정해주면 국내 기업의 경쟁력이 높아질 것 같습니다.
AI 기술 개발 위한 데이터 양성화도
김선정 LG CNS CTO LG CNS는 클라우드, Al빅데이터, 스마트팩토리, 스마트물류, 스마트시티 등 다양한 영역에서 고객의 DX(Digital Transformation)를 선도하는 디지털 비즈니스 이노베이터(Digital Business Innovator) 역할을 수행하고 있으며, 생성형 AI 기반 사업을 LG그룹 뿐 아니라 공공, 금융 등 다양한 산업 영역에서 활발히 전개하고 있습니다. 저는 한국의 생성형 AI 기술 수준을 OpenAI 등 글로벌 수준까지 캐치업(Catch Up)하려면 추가적인 노력이 필요하다고 생각합니다. 이러한 생성형 AI의 기술발전을 위해 무엇보다도 저작권 문제가 해결된 공개 데이터의 양성화가 매우 중요한 요소라고 생각합니다. 먼저 공개 가능한 데이터의 범위 확대, AI의 발전을 위해 원제작자가 데이터 도네이션(donation)을 할 수 있는 환경 조성이 시급하다고 생각합니다. 또한 AI가 만든 산출물의 저작권을 일률적으로 적용하기보다, 공공, 기업 등 폐쇄적 환경과 B2C(Business To Consumer)등 일반 대중을 상대로 하는 범용 활용을 구분하여, 각 특성에 맞는 저작권 정책을 검토해야 한다고 생각합니다. 끝으로, 글로벌 빅테크(Global Big Tech) 기업의 생성형 AI 서비스 활용이 확대됨에 따라, 글로벌 GenAI 서비스 활용에 대한 저작권 및 보안 측면의 다양한 검토도 필요할 것으로 생각됩니다.
데이터 양성화 차원의 ‘AI 데이터 마켓’
윤경아 KT AI테크랩장 KT는 올해 AI윤리 기준을 강화하여 ‘리스판서블(responsible) AI’란 개념으로 저작권, 개인정보 이슈에 대비하고 있습니다. 의도치 않게 저작권이 걸린 데이터, 개인 정보, 사회에 위해를 가하는 콘텐츠가 학습데이터로 활용될 수 있어서, 사용 전 꼼꼼히 검수하며 사용하는 작업의 일부를 자동화 개발하여 정확도 향상과 비용 절감에 노력을 기울이고 있습니다. 다만, 저작권의 범위가 모호한 점이 있습니다. 가령, 데이터 크롤링(crawling: 웹 페이지를 그대로 가져와서 거기서 데이터를 추출해 내는 행위)시 저작권 이슈가 발생하기 쉽습니다. 이러한 대규모의 웹 크롤링된 데이터를 검수하는데 상당한 비용이 필요하므로 중소기업에서는 AI 개발을 위한 데이터 확보부터 부담이 클 것으로 보입니다. 저는 데이터 양성화의 차원에서, ‘AI 데이터 마켓’을 구축하여 저작권 이슈가 없도록 정제된 학습 데이터를 비즈니스 도메인(domain) 별로 판매와 구매를 할 수 있는 방안을 제안 드리고자 합니다.
N차 모델 활용 시 저작권 명확성 필요
윤일용 포스코DX AI센터장 저작권 관련해 두 가지 견해를 말씀드리자면, 첫째, 저희는 데이터에 특화된 온프레미스 (on-premis)모델을 개발하기 때문에 오픈소스 모델들을 주로 사용하고, 그래서 AI 모델 자체의 저작권에 관심이 많습니다. 오픈소스 모델을 기반으로 만들어진 파생 오픈소스 모델들을 과연 N차 저작물로 볼 수 있을지 고민이며, 법적으로도 N차 모델의 저작권이 불분명하므로, 모델 자체의 저작권에 관한 논의도 필요하다고 봅니다. 둘째, 특정 단계의 모델에서 학습데이터 관련 저작권 문제가 발생하면 이후 파생 모델들의 연쇄적인 문제로 이어질 수 있습니다. 따라서 LLM의 안전한 활용을 촉진하기 위해서는 각 모델들 및 해당 학습 데이터들의 연관, 상속 관계에 대한 연구조사와 가이드가 필요하다고 생각합니다.
AI기업 위해 TDM 규정 등 고민
이지은 법무법인 김&장 변호사 김&장은 B2B, B2C 서비스를 포함한 AI 관련 다양한 고객 자문을 진행하고 있으며, 데이터 보호 등의 이슈도 다루고 있습니다. 업계에서는, 비록 완전하지 않더라도 TDM (Text and Data Mining) 규정 도입을 통해 AI 학습데이터셋 준비와 활용의 기초적인 근거 마련이 필요하다는 입장입니다. 진흥과 규제 사이의 조화, 다양한 이해 및 권리관계의 복잡성 등이 존재하지만, 궁극적으로는 AI를 통해 창출되는 이익을 저작권 관점에서 여러 이해관계자들 간 배분하는 일이 중요한 문제일 것입니다. 예컨대 AI 학습을 원하는 사업자는 공개된 뉴스 데이터를 자유롭게 쓰기를 원하지만, 오랜 기간 축적한 자신의 데이터를 경쟁 대상 서비스의 개발 및 제공에 이용하는 것을 문제 삼을 수 있을 것입니다. 기존 저작권법에서 저작인접권자의 보상청구권 등과 같이 권리의 제한과 보상의 조화 규범 사례를 참고할 수 있을 것입니다. 또한 사회적 약자를 포함한 다수의 이해관계자들의 동의 방식도 고민할 때라고 생각합니다(개인정보 분야의 고지 및 동의 방식 참고). 한편, 산업계는 여러 데이터 규제로 인한 사업의 위축과 이노베이션(innovation) 저해를 우려하고 있습니다. 이미 정부부처 합동 논의가 활발히 진행되고 있지만, AI 사업자들이 규제의 홍수 속에서 표류하지 않도록 규제 통합 역시 필요할 것으로 생각됩니다. EU AI법은 오픈소스 활용 AI 규제를 완화하고 있으니, 신규 AI기업의 개발 활동 보장 측면에서 이를 참고할 수 있을 것으로 보입니다.
‘공정이용 독트린’ 참고 국내 산업계 보호도
박홍래 법무법인 동인 대표변호사 기존 데이터의 저작권을 어떻게 보호할 것이냐, AI 생산물별로 저작권을 어떻게 보호할 것이냐에 관한 규범이나 기준이 만들어지기까지 시간이 필요해서, 대부분 보수적인 입장을 취할 수밖에 없는 것 같습니다. 미국에서는 벌써 신문사가 학습데이터 관련 소송을 제기하고 있으며 이런 소송을 통해 규범들이 만들어질 것입니다. 한국에서도 이 같은 소송이 자주 발생할 수 있으니, 유럽과 미국의 법을 빨리 받아들이고 분석하여 우리의 산업계나 생태계에 맞춰 발전시켜야 한다고 봅니다. 규제만 하기보다 미국의 페어유스(fair use:공정 이용) 독트린을 참고해 저작권으로부터 국내 기업을 보호하는 장치도 마련되어야 한다고 생각합니다.
난마(亂麻)처럼 얽힌 AI 저작권 규제완화도
임형주 법무법인 율촌 변호사 현재 AI 관련 논의가 많이 이뤄지고 있습니다만, 그만큼 관련 문제가 난마(亂麻)처럼 얽혀있는 것 같습니다. 저작권은 세계적 흐름을 따르고 있고 국제적 문제입니다. 한국에서 괜찮더라도 미국과 유럽에서는 저작권이 문제가 될 수 있기 때문에 국내 기업 의견만 듣기도 어려운 실정입니다. 미국과 유럽의 법은 영미법계를 따라서 판례들이 나와 줘야 구체화가 가능하기 때문에 미국과 유럽의 법을 벤치마킹(benchmarking)하는 데 시간이 많이 소요될 것 같습니다. 저작권 관련 주요 이슈로서, 저작권 때문에 개발자가 피의자가 되는, 형사처벌 이슈도 존재합니다. 저는 AI의 안정적 개발을 위해 고의 또는 악의적인 저작권 침해만 처벌하는 게 낫다고 생각합니다. 한국만큼 저작권 침해 금지가 쉽게 인정되는 국가는 없는 듯합니다. 데이터베이스 침해도 유럽에서는 인정되지 않는 법제입니다. 여러 빅데이터 중 일부만 침해했다고 산업 전체를 멈춰서야 되겠습니까. AI 저작권에 따른 규제 완화가 필요하다고 생각합니다.
AI 저작권 문제는 원숭이의 셀카와 다르다
권동주 법무법인 화우 그룹장 AI 학습 과정에서 데이터 저작권 침해 문제가 발생할 수 있고, AI가 생성한 결과물의 저작권 인정 여부 등이 이슈가 되는 것 같습니다. 과거 영국의 자연사진작가가 인도네시아 밀림에 카메라를 가지고 간 적이 있습니다. 그때 원숭이가 사진작가의 카메라로 셀카를 찍었습니다. 그 원숭이 사진의 저작권이 인정되는지 미국 법원에서 실제로 다뤄졌습니다. 미국 법원은 저작물 주체가 인간이 아니라며 그 사진의 저작권을 인정하지 않았습니다. 다만, AI는 원숭이와 다릅니다. 각국에서 AI 저작물을 어떻게 규제할지 논의하고 있고 한국도 문체부를 중심으로 AI 저작권에 관한 논의가 진행되는 것 같습니다. 저희 화우는 앞으로 기업의 저작권 관련 이슈에 적극 대응해나아가도록 하겠습니다.
CLOSING ADDRESS서로의 입장을 이해해야만 상생의 길도 열린다
정향미 문체부 저작권국장 오늘 산업계와 법조계 여러분들의 AI와 관련한 고견을 적극 경청했습니다. 산업계는 AI 저작권의 모호성 때문에 애로사항을 겪고 계신 듯 합니다. 단계적으로라도 합의를 이룰 수 있는 부분은 합의해서 모호성을 제거하는 노력을 하겠습니다. 또한 문체부는 양질의 데이터 제공을 위해 저작권 보호기간이 만료된 데이터나 기증된 저작물을 모아서, 공유저작물로 개방하고 있습니다. 아울러 문체부 소속 국립국어원은 저작권으로부터 자유로운 음성 및 문자 형태의 언어 말뭉치를 구축, 한국어에 특화된 AI 기술 개발에 활용토록 공개할 예정입니다. 창작자들은 AI 산업이 자신의 창작물을 비롯해 많은 저작물(데이터)을 통해 발전할 수 있음을 인정하면서, 그 발전에 기여한 창작물에 대한 적정한 보상도 이뤄져야 하지 않느냐고 말합니다. 특히 자신들이 만든 저작물을 발판삼아 발전한 AI가 음악이나 문학작품, 기사를 너무 쉽게 만들게 되면, 일자리 소멸로 인한 문제를 누군가는 책임져야 하지 않겠느냐고 묻습니다. 한편, 산업계는 너무 높은 학습데이터 사용 비용 때문에 글로벌 AI 산업을 리드할 기회를 놓칠 수도 있다고 강조합니다. 양측 모두 일리 있는 주장입니다. 문체부는 창작자와 AI업계 모두 열린 마음으로 소통을 통해 서로의 입장을 이해하는 가운데 상생할 수 있는 제도를 만들어가자는 것이 기본적인 입장입니다. 오늘 좋은 말씀을 많이 들었고 새롭게 검토해야 될 과제들도 배우게 된 것을 감사드리며, 앞으로도 좋은 자리가 마련되어 우리 모두의 소망인 AI 강국으로 나아가는데 힘을 모으자는 말로 폐회의 말씀을 대신하고자 합니다.
* 자세한 내용은 월간현대경영에 문의하시기 바랍니다.
2024. 5월호