저작권 뉴스

메타, 생성형 AI 학습 데이터 무단 사용 논란

Spike Lee, 2025. 4. 4. 09:29

생성형 인공지능(AI) 프로그램의 학습데이터 무단 사용에 관한 논란이 확산되고 있습니다.

메타, 마크 저커버그. Courtesy of Meta

프랑스의 주요 출판 및 문인 단체들이 메타(META)를 상대로 저작권 침해 소송을 제기했습니다. 이들은 메타의 생성형 AI 모델이 자사의 저작물을 허가 없이 사용해 훈련된 데이터를 이용한 것으로 주장하고 있습니다. 소송을 제기한 단체들은 프랑스 국립 출판 협회(SNE), 문인협회(SGDL), 작가 및 작곡가 협회(SNAC)입니다. 이들은 메타가 자신들의 저작물을 무단으로 사용하여 AI를 학습시킨 것에 대해 법적 대응에 나섰습니다.

특히, 유럽연합의 AI법을 근거로 AI 개발 기업들이 저작권을 존중하고 데이터 출처를 투명하게 해야 한다고 강조했습니다. 또한, '국제 문화 및 혁신 헌장'을 언급하며 AI 발전과 창작물에 대한 권리 보호의 중요성을 주장했습니다.

프랑스의 주요 출판 단체들은 메타의 데이터셋에 자신들이 출판한 많은 저작물이 포함되어 있다고 주장하며, 저작권 침해를 법적으로 대응해야 한다고 밝혔습니다. 이들은 AI 기술의 발전과 문화 생태계 보호 사이의 균형을 맞추는 것이 중요하다고 강조했습니다.

이번 소송은 단순히 프랑스 출판계와 메타 간의 문제를 넘어서, AI 기술 발전과 저작권 보호 문제를 다루는 중요한 사례로 향후 글로벌 AI 산업에 큰 영향을 미칠 것으로 예상됩니다.

  • 출판 단체들은 메타의 생성형 AI 모델자신들의 저작물무단으로 사용하여 학습에 활용되었다고 주장하고 있습니다. 즉, 메타가 저작권자의 동의 없이 자사의 출판물 등을 데이터셋에 포함시켜 AI를 훈련시킨 것에 대해 문제를 제기한 것입니다.
  • AI 기술의 사용: 메타의 생성형 AI 모델이 훈련되는 과정에서, 저작물의 원저자 동의 없이 데이터가 사용되었으며, 이는 저작권 침해에 해당한다고 주장하고 있는데 논란은 있습니다.

미국의 '공정이용(Fair Use)'은 저작권법에서 정한 예외 조항으로, 특정 조건 하에 저작물을 저작권자의 허락 없이 사용할 수 있게 합니다. 주요 기준으로는 목적과 성격, 저작물의 성격, 사용된 부분의 양시장에 미치는 영향 등이 고려됩니다. 공정이용은 주로 비영리적 교육, 비평, 뉴스 보도, 연구 등의 용도로 인정됩니다. AI 모델이 생성하는 콘텐츠가 공정이용에 해당할 수 있지만, 이는 법원 판단에 따라 달라질 수 있습니다. 특히, AI 학습에 사용된 데이터가 상업적 목적으로 활용될 경우, 저작권 침해 여부에 대한 논란이 일어날 수 있습니다.

미국의 공정이용(Fair Use) 사례로는 구글 북스(Google Books)가 있습니다. 

구글 북스 (Google Books) 사례  
- 구글은 "구글 북스" 프로젝트를 통해 수백만 권의 책을 디지털화하여 사용자가 검색하고 일부 내용을 미리 볼 수 있게 했습니다. 이에 대해 출판사들이 저작권 침해를 주장했으나, 법원은 구글의 디지털화가 공정이용에 해당한다고 판결했습니다. 법원은 구글이 책의 일부를 검색할 수 있게 제공함으로써, 책의 내용에 대한 정보 접근을 촉진하고, 출판 시장에 긍정적인 영향을 미친다고 판단했습니다. 따라서 구글의 활동은 상업적인 목적보다는 학문적, 연구적 목적에 부합한다고 봤습니다.

공정이용에 해당하는지 아닌지 판단은 어려운 문제입니다. 인공지능 프로그램은 학습용 데이터가 기본적으로 필요합니다. 이것을 막으면 인공지능 프로그램은 무의미해집니다. 단순히 저작권 침해냐 아니냐의 관점으로 접근하면 해결책이 나오지 않을 수 있습니다. 기존의 데이터를 갖고 있는 권리자의 이익을 침해하지 읺으면서 해결할 수 있는 방향으로 합의점이 모아지기를 바랍니다.