| 국가 | 미국 | 장르 | 방송, 게임, 캐릭터, 만화, 애니메이션, 패션, 음악, 스타트업, 신기술 융합콘텐츠, 기타, 스토리 |
|---|---|---|---|
| 기관 | (-) | 구분 | 분쟁사례 |
| 제정일 | (-) | 개정일 | (-) |
공정이용-저작권 침해 간 경계 불명확성 관련 분쟁사례 및 시사점:
미국 Raw Story Media, Inc. v. OpenAI 분쟁사례
1. 소송의 개요
Raw Story Media, Inc. 및 The Intercept가 OpenAI와 Microsoft를 상대로 제기한 저작권 침해 소송은 AI 기술 발전의
이면에 있는 핵심적인 법적 과제를 수면 위로 끌어올린 사례로 평가됨. 이 소송은 언론사들의 저작물인 뉴스 기사를 대규모로
무단 수집하여 GPT와 같은 거대 언어 모델(LLM)을 훈련시킨 행위가 저작권법상 '공정 이용(Fair Use)'에 해당하는지를
다투는 대표적인 사례에 해당함. 본 사례는 AI 학습 과정에서의 데이터 복제가 저작물의 시장 가치를 훼손하고 잠재적인
라이선스 시장을 파괴하는지에 대한 법원의 판단을 구하고 있다는 점에서 주목받고 있음.
2. 주요 쟁점
1) 저작권 관리 정보(CMI) 제거
Raw Story Media는 OpenAI가 학습 데이터의 수집 및 처리 과정에서 기사에 포함된 저작자, 출처, 저작권 표시 등 저작권
관리 정보(Copyright Management Information, CMI)를 의도적으로 제거함으로써 저작권 침해를 용이하게 하여
미국 디지털 밀레니엄 저작권법(Digital Millenium Copyright Act, DMCA) 제1202조를 위반했다고 주장함.
그러나 이후 법원은 CMI 제거가 원고에게 실질적인 피해를 입혔다는 증거가 부족하다고 판단한 바 있음.
2) 공정 이용(Fair Use)
OpenAI의 데이터 사용이 공정 이용에 해당하는지 여부는 논의되지 않았으나, 이 사건은 AI 학습 데이터 사용과 관련된
공정 이용의 경계를 설정하는 데 중요한 선례로 작용할 가능성이 있다고 평가받고 있음. 물론 과거 변형적 이용을 위해
저작물 전체를 복제하는 것이 필수불가결한 경우 예외적으로 공정 이용이 인정된 사례가 있음.
3) 결과물의 실질적 유사성
Raw Story Media는 ChatGPT가 사용자의 프롬프트에 따라 자신들의 기사 내용을 거의 그대로 또는 일부만 수정하여 요약,
재생산하는 결과물을 생성한다고 지적하였음. 이는 AI가 단순히 아이디어를 학습한 것을 넘어, 보호받는 표현을 '기억'하고
이를 상업적으로 이용하고 있음을 보여주는 증거라고 주장했음.
3. 한국 기업에 대한 시사점
1) AI 학습 데이터의 저작권 준수
AI 모델 개발 시 학습 데이터의 저작권 문제를 철저히 검토해야 함. 특히, 데이터 수집 과정에서 저작권 관리 정보를
제거하거나 무단으로 사용하는 행위는 법적 리스크를 초래할 가능성이 있음. 아무리 공개되어 있는 언론기사라고 하더라도
이를 활용하여 AI 학습에 사용하는 과정에서 저작권 침해 소지가 없는지 확인할 필요가 있음.
언론기사는 사실 보도에 기반하지만, 상당한 수준의 분석, 논평, 문체 등 창작적 요소가 포함된 저널리즘 저작물에 해당하며,
이처럼 창작성이 높은 저작물일수록 공정 이용이 인정될 가능성은 낮아진다는 점에 유의해야 함.
2) 데이터 라이선스 시장 대비
미국과 유럽에서 AI 학습 데이터를 위한 라이선스 시장이 형성되고 있는 만큼, 우리나라 기업들도 데이터 제공자와의 협력을
통해 정당한 대가를 지불하는 방안을 모색해야 함. 또한 양질의 데이터를 보유하고 있다면,
이에 대한 대가를 받을 수 있도록 준비하고, 자사의 데이터를 불법적으로 사용하는 자가 있는지에 대해서도 꾸준히 모니터링할 필요가 있음.
※ 자세한 내용은 첨부(PDF)파일을 참고하시기 바랍니다.