| 국가 | 미국 | 장르 | 방송, 게임, 캐릭터, 만화, 애니메이션, 패션, 음악, 스타트업, 신기술 융합콘텐츠, 기타, 스토리 |
|---|---|---|---|
| 기관 | (-) | 구분 | 분쟁사례 |
| 제정일 | (-) | 개정일 | (-) |
데이터 크롤링과 저작권 관련 분쟁사례 및 시사점
미국 Reddit vs. Perplexity 분쟁사례
1. 소송의 개요
2025년 10월, 커뮤니티 사이트 Reddit은 생성형 AI 모델인 Perplexity가 사용자 생성 콘텐츠를 무단 수집해 AI 모델을
학습시켰다고 주장하며 저작권 침해 소송을 제기했음. 이에 대해 Perplexity는 공정 이용(fair use) 원칙을 근거로 방어할
것으로 예상되고 있으며, Reddit은 상업적 목적성과 약관 위반을 근거로 반박하고 있음.
이 사례는 AI 학습을 위한 데이터 크롤링의 법적 한계를 가늠함과 동시에 AI 산업 전반의 콘텐츠 사용 계약 구조를 변화시킬
수 있을 것으로 평가됨.
2. 주요 쟁점
1) 우회적 데이터 수집의 위법성
Reddit은 Perplexity가 Reddit의 사용자 생성 콘텐츠를 무단으로 수집해 AI 모델 학습에 사용했다고 주장함.
이 과정에서 Perplexity가 Google 검색 결과 페이지를 통해 보안 시스템(SearchGuard)을 우회하여 데이터를 수집했고
이는 디지털 밀레니엄 저작권법(Digital Millenium Copyright Act, DMCA) 및 불공정 경쟁법을 위반한 것이라고 주장했음.
2) 데이터 라이선싱
Reddit은 OpenAI 및 Google과 데이터 라이선싱 계약을 체결해 데이터를 합법적으로 제공하고 있는데,
Perplexity는 라이선싱 비용을 회피하기 위해 이러한 절차를 무시했다고 비판했음.
Perplexity는 자신들은 AI 모델을 직접 학습시키지 않는 애플리케이션 회사로, Reddit의 데이터를 요약하고 출처를
인용하는 방식으로 사용했을 뿐 불법적인 행위를 하지 않았다고 반박함.
3) 기술적 보호 조치 우회
Reddit은 Perplexity와 그 협력사들이 IP 주소 변경(데이터 수집 활동을 숨기기 위함), CAPTCHA 우회(자동화된 스크래핑
방지를 위한 시스템의 무력화), 사용자 에이전트 위조(웹 크롤러의 정체를 숨기기 위해 브라우저 정보를 위조) 등 다양한
기술을 사용하여 Reddit과 Google의 보안 시스템을 우회했다고 주장했음.
이에 대해 Perplexity의 구체적인 반박은 아직 없음.
4) 데이터 경제와 윤리적 사용
Reddit은 데이터가 새로운 지적 재산권의 핵심 자산이 되는 AI 시대에 Perplexity의 행위와 같은 무단 데이터 수집은 데이터
경제 전반의 신뢰를 훼손한다고 주장했음. 이는 데이터 소유권, 데이터의 윤리적 사용에 대한 논쟁을 심화시켰음.
3. 한국 기업에 대한 시사점
1) AI 학습을 위한 데이터 확보 전략의 재검토
본 사례는 과거 톰슨 로이터 vs 로스의 분쟁사례와 흡사하게 AI 학습을 위한 데이터 수집 과정에서의 저작권 계약의 중요성을
상기시키고 있음. Perplexity처럼 데이터를 무단으로 수집, 기술적으로 우회하여 수집하는 등의 행위는 저작권 침해에
해당할 가능성이 높은 것으로 해석되고 있음. 따라서 AI 학습을 위해 데이터를 확보하는 과정에서 저작권 침해 여부를 면밀히
따져보고, 비용이 들더라도 안전하게 라이선싱 계약을 체결해 법적 분쟁 가능성을 해소하는 등의 준비가 필요할 것임.
2) 기술적 보호 조치의 재검토
Perplexity가 보안 및 무단 수집을 방지하기 위한 기술적 장벽들을 우회한 것이 사실일 경우,
이는 저작권 있는 데이터 소유자의 보안 기술이 여전히 무력화될 수 있다는 것을 시사하는 것임. 최근 국내 대기업들의
해킹 사고 발생 등 보안과 관련한 이슈가 지속적으로 발생하고 있는데, 이는 특정 기업에만 해당하는 것이 아닌
모든 기업들에게 발생할 수 있는 위험이라는 점을 명심해야 할 것임.
3) 데이터 경제의 고도화
AI의 발전으로 데이터가 가진 경제적 가치가 점점 중요해짐. 즉 데이터가 단순한 자원이 아닌 경제적 자산으로 자리 잡았음을 의미함.
타인의 데이터를 활용함에 있어서 그에 대한 정당한 대가를 지불하는 계약을 체결함을 의미함과 동시에, 양질의 데이터를
보유하고 이를 통해 추가적인 사용료를 받을 기회가 늘어났음을 의미함.
※ 자세한 내용은 첨부(PDF)파일을 참고하시기 바랍니다.