Monthly Seminar
제62회 ALAI Korea 월례연구회(2026년 5월 27일)
[주제1] “인공지능 학습에서의 저작물 이용과 부당이득 법리의 적용”발제자 : 김창화 (한밭대학교 공공행정학과 교수)/ [주제2] “대규모 언어모델 훈련 목적의 저작물 이용과 공정이용 문제 — 앤트로픽 사건과 메타 사건을 중심으로 —”발제자 : 이주연 (한양대학교 법학전문대학원 교수)
26.05.29 조회수:55
[주제1] “인공지능 학습에서의 저작물 이용과 부당이득 법리의 적용”
발제자 : 김창화 (한밭대학교 공공행정학과 교수)
저작권법은 저작권자 허락 없이 저작물을 이용할 수 있는 공정이용(fair use) 제도를 두고 있다. 인공지능 학습에서 가장 큰 논쟁 중 하나는 인공지능의 학습이 공정이용에 해당하는지이고, 그리하여 많은 국내외 법원들은 이 문제를 해결하기 위해 노력하고 있다. 그런데, 저작권법의 공정이용은 인공지능 학습의 문제를 적절히 해결할 수 없다. 최근, 공정이용과 달리, 저작권자와 인공지능 학습 기업(이하 '인공지능기업') 간의 이익을 적절히 조정할 방안으로써 부당이득(unjust enrichment) 법리가 제안되고 있다. 생성형 인공지능은 인간 창작자의 노동을 대가 없이 이용하는 것이어서 부당하다. 부당이득을 막기 위해, 생성형 인공지능은 시장 가치에 해당하는 보상을 해야 한다. 이것은 당연한 법적 대응이며 원칙적으로 타당한 것일 뿐만 아니라, 생성형 인공지능의 책임 있는 지속적인 발전을 가능하게 하는 공정한 해결책이다.
부당이득 법리(원상회복(restituion) 법리)는 이득에 기반한 구제책과 이득에 기반한 책임을 제공한다. 부당이득 법리의 기본 원칙은 타인의 노력(expense)으로 부당하게 이득을 얻은 사람은 그 부당한 이익을 반환해야 한다는 것이다. 인공지능 훈련을 부정 이득으로도 분류할 수 있으나, 설득력이 부족하고 정책적으로 역효과를 초래할 수 있어 도움이 되지 않는다. 또한, 인간 창작자들의 노동에 대한 보상이 전혀 주어지지 않기 때문에, 적정 이득의 판단은 정책적인 측면에서도 문제가 된다. 세 번째 선택지는 인공지능 훈련을 부당이득으로 분류하는 것이다. 이는 인공지능기업들이 대가를 지급하지 않고 저작물을 향유하고 있기에, 직관적으로 이해가 된다. 만약, 인공지능 학습이 부당이득으로 분류된다면, 이는 저작권법에 따른 대응보다 더욱 맞춤화된 법적 대응책을 마련할 수 있는 길을 열어줄 것이다. 저작권법에 따른 강화된 구제책은 우리가 알고 있는 생성형 인공지능 학습을 효과적으로 막을 수 있지만, 부당이득에 따른 적정 비용 지급은 인공지능기업에 과도한 부담을 주지 않으면서 인간 창작자의 이익을 보호할 수 있다.
생성형 인공지능 학습의 상황에서 저작권 및 부당이득에서 가능한 구제책을 비교하면, 부당이득 법리가 더 나은 맞춤형 구제책을 제공한다는 것과 생성형 인공지능 개발의 거버넌스에 대해 더 미묘한 접근을 제공한다는 것을 확인할 수 있다. 저작권 체계에서, 인간 창작자는 재산 규칙에 따라 보호받는다. 부당이득 원칙은 인간 창작자에게 책임 규칙 보호를 제공하며, 인간 창작자들은 자신의 노동과 노력에 대한 권리를 유지할 수 있도록 하고, 인공지능기업은 법원이 정한 적절한 가격에 자산을 사용하고 누릴 수 있도록 허용하는 가상의 협상을 추정한다. 특히, 이러한 책임 규칙은 거래 비용이 높을 때 적합하다. 생성형 인공지능 학습 과정에서, 데이터셋에 포함된 콘텐츠의 출처, 그것이 훈련 과정에서 실제로 사용되었는지 또는 결과에 어떤 영향을 미쳤는지를 식별하는 것이 항상 가능하지는 않은데, 부당이득 원칙을 인공지능 학습 문제에 적용하는 것은 법원들이 특정 데이터가 특정 생성형 인공지능 모델의 학습 공정에서 중요한지나 어떤 가치가 부여되었는지를 확인하도록 요구하지 않는다. 부당이득의 원칙은 전문가가 제공하는 서비스와 일반인이 제공하는 서비스를 구분하며, 부당이득 법리는 인간과 컴퓨터 간의 공정한 경쟁 환경을 조성하여, 깔끔한 새 출발과 나아갈 길을 제시한다. 또한, 저작권은 외국 기업에는 비슷한 어려움을 초래하지 않으면서도 현지 피고에게 과도한 부담을 지울 위험이 있어, 결과적으로 미국 기업에 경쟁적 불리함을 초래할 수 있는데, 부당이득 법리는 이러한 어려움을 해결하는 데 도움이 된다.
생성형 인공지능 학습 과정에는 미연방 저작권법 106조에 규정된 배타적 권리 중 어느 것과도 관련되지 않으므로, 미연방 저작권법 301조의 우선 적용 조항(preemption)은 부당이득에 의해 제공되는 보호를 포함하여, 그러한 행위에 대한 다른 유형의 법적 보호를 배제하지 않는다. 부당이득 법리는 저작권법을 대체하는 것이 아니라 저작권법을 보완하고 그 작동 방향을 제시한다. 부당이득의 원칙을 생성형 인공지능 훈련에 적용하면 창작자의 이익을 보호하는 동시에, 인공지능기업들은 혁신적인 활동을 계속 추진할 수 있게 된다. 부당이득의 원칙은 새로운 기술에 대한 적절한 법적 대응으로, 저작권법에 의해 고려되지 않는 이점을 제공한다. 이는 인류가 인간 창조와 컴퓨터 기반 생성형 인공지능이 제공하는 이점을 계속 누릴 수 있도록 법적으로 책임 있는 방법을 제공한다.
[주제2] “대규모 언어모델 훈련 목적의 저작물 이용과 공정이용 문제 — 앤트로픽 사건과 메타 사건을 중심으로 —”
발제자 : 이주연 (한양대학교 법학전문대학원 교수)
대규모 언어모델(LLM) 훈련을 목적으로 타인의 저작물을 무단으로 이용하는 행위는 저작권 침해에 해당하는가, 아니면 공정이용으로 평가되어야 하는가? 텍스트 및 데이터 마이닝(TDM) 면책 조항을 도입한 국가이든, 미국과 우리나라와 같이 일반 공정이용 조항에 의존하여 이 문제를 해결하여야 하는 국가이든, 이에 대한 해법을 도출하기는 쉽지 않다. 저작권자 권리 보장 문제, 산업계 간 이해관계 차이, 새로운 기술 개발이 사회 전체에 미치는 효용 등 여러 관점과 이해관계인의 입장 차이로 인해, LLM을 포함한 생성형 AI를 둘러싼 법적·사회적 논의에서 단기간에 합의점을 찾기는 어려울 것으로 보인다.
최근 미국 캘리포니아 북부지구 연방지방법원은 앤트로픽의 클로드와 메타의 라마 훈련에 이용된 책의 작가들이 각각 앤트로픽과 메타를 상대로 제기한 저작권(복제권) 침해 소송에서, 원고 작가들의 책을 LLM 훈련 목적으로 이용한 행위가 공정이용에 해당한다는 취지의 약식판결을 내린 바 있다. 이 두 사건은 모두 온라인 불법사이트에서 원고들의 책을 다운로드하여 LLM 훈련에 이용한 것이 문제되었고, 원고 작가들은 클로드와 라마의 생성단계에서 자신들의 책에 대한 저작권침해물이 생성된다는 것까지는 주장·증명하지 않았다. 두 사건은 담당 판사가 William Alsup 판사와 Vince Chhabria 판사로 서로 달랐고, 그러한 이유로 그들이 약식판결의 이유에서 설시한 공정이용 법리의 분석에서도 일부 차이가 나타났다.
앤트로픽 사건에서 Alsup 판사는 앤트로픽의 단계별 개별 행위마다 그 목적을 개별적으로 파악하고 각 행위별로 공정이용 해당 여부를 판단한 반면, 메타 사건의 Chhabria 판사는 메타의 전체 행위에 대하여 통합적으로 공정이용 여부를 판단하였다. 양 판사 모두 공정이용 분석에서 결과적으로 제1요소와 제4요소를 피고에게 유리하게 판단하였다는 점에서는 공통적이었으나, 제4요소, 즉 ‘저작권으로 보호되는 저작물의 잠재적 시장 또는 가치에 미치는 영향’에 관한 구체적인 분석에서는 일정한 차이를 보였다.
이들 약식판결은 LLM 훈련과 공정이용 문제에 관하여 미국 법원이 처음으로 제시한 판단이라는 점에서 의의가 있으며, 그 결론의 측면에서는 TDM 관련 사건에서 공정이용 해당성을 비교적 적극적으로 인정해 온 미국 법원의 기존 선례와도 궤를 같이한다고 평가할 수 있다. 특히 우리 저작권법 제35조의5의 입법적 모델이 미국 연방저작권법 제107조라는 점을 고려할 때, 우리 법제에도 일정한 시사점을 제공할 수 있다.
다만 이 두 약식판결은 아직 1심 단계의 판단에 불과할 뿐 아니라, 판결 이유에 있어서도 모든 LLM에 일반적으로 적용될 수 있는 원칙을 제시하였다기보다는, 개별 사안에 대한 분석을 통해 특정 사실관계에 기초하여 클로드와 라마라는 개별 LLM에 관한 판단에 초점을 맞추고 있다는 점에서 그 영향력을 과대평가할 것은 아니다. 또한 이 두 약식판결의 이유 중 공정이용 해당 여부를 판단하기 위한 분석에서는 LLM 훈련 목적의 저작물 라이선스 시장을 잠재적 시장으로 보지 않았는데, 이 점은 재고할 필요가 있다. LLM 훈련을 위한 저작물 이용이 매우 변형적인 2차적 이용에 해당한다고 하더라도, 그러한 2차적 이용에 관하여 잠재적 시장이 형성될 개연성이 높다면 이는 저작권자에게 유리한 요소로 작용하여야 할 것이며, 이때 개연성에 대한 판단은 저작권법이 추구하는 정상적 상황을 전제로 하여 이루어지는 것이 타당하다.
