대한민국 국제저작권법학회

제33회 ALAI Korea 월례연구회 (2023년 5월 17일)

[주제1] 생성AI의 학습데이터에 관한 저작권 쟁점 [발제자: 이철남(충남대학교 법학전문대학원 교수)] ; [주제2] 데이터마이닝과 저작권 면책의 범위 및 한계 [발제자: 김창화(한밭대학교 법학과 교수)]

23.05.21 조회수:693

[주제1] 생성AI의 학습데이터에 관한 저작권 쟁점

발제자: 이철남(충남대학교 법학전문대학원 교수)

머신러닝을 기반으로 하는 인공지능 기술이 발전함에 따라 대량의 학습데이터가 필요하다. 저작물에 해당하는 학습데이터의 경우 원칙적으로 저작권자의 허락을 얻어 이용해야 하지만, 현실적으로 개별적인 저작자들의 허락을 구하는 것이 쉽지 않다. 유럽연합의 경우 TDM에 관한 입법을 통해 일정한 요건을 갖춘 경우 저작권을 제한하여 학습데이터로 활용할 수 있도록 허용했다. 우리도 이에 유사한 입법을 통해 인공지능 또는 빅데이터 관련 산업의 발전을 도모하는 한편, 저작자의 정당한 이익이 침해받지 않도록 하는 내용의 개정안을 국회에 상정해 두고 있는 상황이다.

그런데 최근 GPT 등 생성 AI(Generative Artificial Intelligence)가 빠르게 확산되면서 TDM을 둘러싼 국내에서의 논의는 새로운 상황 변화에 대응해야 하는 상황이다. 미국에서는 컴퓨터프로그램이나 이미지를 생성하는 AI에 대한 소송이 제기되었고, 학습데이터의 활용행위가 공정이용에 해당하는지의 여부 등이 중요한 쟁점이 되고 있다. 물론 미국 법원의 판단이 내려지기까지는 상당한 시간이 필요하겠지만, 저작권법상 공정이용 조항을 두고 있는 우리에게도 시사하는 바가 크다.

발제자: 김창화(한밭대학교 법학과 교수)

데이터 마이닝은 데이터에서 통계적 규칙이나 패턴을 분석하여 가치 있는 정보를 추출하는 과정을 말한다. 데이터는 저작권의 대상인 저작물을 포함할 수 있으며, 이 경우 권리자의 동의 없이 이용하게 되면 저작권 침해의 문제가 발생할 수 있다. 한편, 데이터 마이닝은 최근 미래 산업의 핵심인 인공지능이나 빅데이터와 관련하여 필수 기술로 여겨지고 있어, 이에 대한 이용의 필요성이 매우 높다. 여기서 저작물인 데이터의 보호와 데이터의 이용이 충돌하게 되고, 이에 대한 조정이 필요하다.

최근 해외 많은 나라가 데이터 마이닝을 위한 저작권 침해 면책을 인정하고 있고, 우리도 이러한 추세에 따라 여러 시도가 이루어지고 있다. 본 글은 이러한 시점에서 데이터 이용의 방향과 범위 그리고 방법을 검토하였다. 먼저, 면책의 방향은 목적과 여러 저작권 원칙들을 검토한 결과 저작권자의 이익을 부당하게 해치지 않는 한, 저작권자의 이익보다는 더 큰 혁신과 산업의 촉진이 저작권법의 목적에 가깝기에 저작권이 제한될 수 있음을 확인할 수 있었다. 다음으로, 면책의 범위는 저작물을 본래 목적으로 이용하지 않는 한, 산업의 필요성과 활성화 측면에서 영리적 이용인 경우도 포함해야 하며, 이용의 유형은 복제를 포함하여 전송과 개작까지 포함하여 넓게 인정하는 것이 바람직하다고 보인다. 마지막으로, 면책의 방법은 우리 법의 특성을 생각할 때 일반조항에 의한 해석보다는 권리와 의무를 구체적으로 정하여 입법하는 방식이 법적 안정성이나 예측 가능성 측면에서 타당해 보인다. 또한, 이러한 데이터 이용 규정을 두는 것 이외에 인터넷에서의 저작권 이용 방식을 옵트-인의 전통적인 방식에서 인터넷 시대에 적합한 옵트-아웃으로 변경하고, 항변 방법으로서 묵시적 이용허락의 도입을 제안한다. 많은 정보가 인터넷에서 이용 가능한 것을 고려할 때, 옵트-아웃 방식을 채택하여 저작권자의 이익을 부당하게 해치지 않는 범위 내에서 저작물을 자유롭게 이용할 수 있게 하되, 저작권자가 이를 거부할 수 있도록 하고, 데이터를 이용한 자는 묵시적 이용허락이라는 항변 사유를 갖고 저작권 침해의 책임 등에서 대항할 수 있게 한다면, 저작물의 이용과 보호가 좀 더 현실적이고, 더욱 간편하며, 효율적인 방법에 의해 균형이 맞춰질 수 있을 것이다.

List