| 국가 | 미국 | 장르 | 방송, 게임, 캐릭터, 만화, 애니메이션, 패션, 음악, 스타트업, 신기술 융합콘텐츠, 기타, 스토리 |
|---|---|---|---|
| 기관 | (-) | 구분 | 기타 |
| 제정일 | (-) | 개정일 | (-) |
앤트로픽 판결의 주요 쟁점 및 시사점
(Andrea Bartz, et al. v. Anthropic PBC, et al., 3:24-cv-05417, United States District Court for
the Northern District of California, 2025. 6. 23. 선고)
1. 소송의 개요
피고 앤트로픽(Anthropic)은 거대 언어모델(Large Language Model; LLM:)인 ‘클로드(Claude)’를 학습시키기 위하여
전자도서관을 구축하고, 이 과정에서 칠백만 권 이상의 불법복제 서적을 다운로드하는 한편, 수백만 권의 책을 구매하여
전자화하였음. 해당 책들의 저작권자 Bartz 등은 저작권 침해를 이유로 앤트로픽을 상대로 집단소송을 제기하였고,
이에 대해 앤트로픽은 공정이용을 주장한 사건임. 주요 쟁점은 다음 세 가지 행위에 대한 저작권 침해 여부였음.
1. 저작권이 있는 도서를 대규모 언어모델(LLM) 훈련에 사용하는 행위
2. 구매한 인쇄본 도서를 스캔 및 보관 등 디지털화하는 행위
3. 해적 전자도서관인 리브젠(LibGen) 및 필리미(PiLiMi)에서의 무단 다운로드 및 보관하는 행위
앤트로픽은 이 모든 행위가 미국 저작권법 제107조의 공정 이용(fair use)에 해당한다고 주장하며 요약판결(summary
judgment)을 신청한 것임. 이 사건은 단순한 기술 경쟁을 넘어, 특허 문서 작성의 정확성, 기술의 독창성,
그리고 출원 전략의 타이밍이 얼마나 중요한지를 보여주는 대표적인 사례로 볼 수 있음.
2. 양사의 주요 주장과 법적 쟁점
1) 원고(작가 Bartz et al. 측)의 주장
• 원고는 앤트로픽이 작가들의 저작물을 무단으로 복제·사용하여 LLM을 훈련시켰으며, 이는 저작권 침해에 해당한다고 주장.
• 불법 복제본을 수집하고 보관한 행위는 명백한 위법이며, 대규모 중앙 라이브러리 구축은 공정이용의 범위에 포함되지 않음.
2) 피고(앤트로픽)의 주장
• LLM 훈련은 변형적(transformative) 사용으로, 원 저작물을 그대로 재현하거나 배포하지 않았기 때문에 공정 이용에 해당함.
• 인쇄본의 디지털화는 내부적 이용을 위함이고 배포할 목적이 없었으므로, 기존 판례에 비추어 공정 이용으로 인정될 수 있음.
• 해적본의 사용은 일부 예외적이며, 전체 시스템의 훈련 목적을 고려하면 공정 이용으로 간주되어야 함.
3) 법원의 판단
• 중간 판단 (2025.6.23):
· 법원은 LLM 훈련이 고도로 변형적 이용(transformative use)으로서 공정이용(Fair Use)에 해당한다고 판단했으나,
해적본을 중앙 라이브러리로 영구 보관하는 행위는 공정이용이 아니라고 보았음.
· 합법 구매본을 스캔하여 원본을 폐기하고 내부 검색 및 보관용으로 대체하는 것은 공정이용으로 인정되었음.
• 집단인정 (2025.7.17):
· 법원은 “리브젠·필리미 해적본 집단(LibGen & PiLiMi Pirated Books Class)”만을 원고로서 공식 인정하고,
북스3(Books3) 집단 및 스캔본 집단은 원고로 인정하지 아니함
· 또한 피고는 해당 해적본의 서지정보(제목, 저자, ISBN/ASIN 등)를 제공하도록 명령받았음.
• 소송중지 기각 (2025.8.11):
· 피고의 소송중지 신청은 기각되었음. 법원은 요약판결 및 집단인정에서 남은 쟁점은 재판으로 가야 한다고 판단했음.
• 합의 (2025.9.25 예비승인):
· 최소 15억 달러 규모의 합의기금을 4회 분납(후반 2회는 이자 지급)하고, 피고는 리브젠·필리미에서 받은 서적과
그 사본을 파기하기로 했음.
· 다만, AI에 원고들의 저작물이 출력되는 것과 관련된 청구는 면제되지 않으며, 면제 범위는 2025.8.25. 이전의 과거
행위로 한정됨. 최종승인 심리는 2026. 4. 23.로 예정되어 있음.
3. 소송의 경과
• 2024.8.19. 제소(집단소송 제기).
• 2025.6.23. 공정이용 판시:
· 훈련 및 합법 스캔은 공정이용으로 인정, 해적본의 라이브러리 보관은 공정이용 불인정(남은 쟁점은 재판으로).
• 2025.7.17. 집단인정:
· 리브젠·필리미 해적본 집단만을 원고로 인정(Books3 및 스캔본 집단은 원고로 인정하지 아니함).
• 2025.8.11. 소송중지 기각:
· 항소 절차와 무관하게 하급심 절차 진행 필요성 확인.
• 2025.9.25. 합의 예비승인:
· 최소 15억 달러, 4회 분납(후반 이자), 리브젠·필리미 자료 파기, Output 비면제, 면제 범위: 2025.8.25.까지의
과거행위, 최종승인 심리 2026.4.23. 예정.
4. 한국 기업에 대한 시사점
• 데이터 출처 무결성 확보 필요
· 법원은 “무엇을 했는가”를 세분화하여 판단함. 합법적으로 취득한 데이터의 훈련은 공정이용으로 보았지만,
해적본의 수집 및 영구 보관은 별개의 침해에 해당할 수 있다는 입장임. 따라서 데이터 출처에 특별한 문제가 없다는
근거 유보 필요.
• 훈련과 보관 분리 설계:
· 모델의 개발, 평가, 제공 전체 수명주기에서 필요 최소 보관 원칙과 목적 제한을 문서화하고, 학습 후 원본 데이터의
파기 정책을 명확히 해야 함.
• 계약 및 거버넌스 업그레이드:
· 서드파티 데이터 계약에 적법 출처 보증, 침해 시 면책 및 배상, 감사권을 반영해야 하며, 내부 규정에는 크롤링 및 업로드
소스 금지목록 및 예외 승인 절차를 포함해야 함.
• AI 출력 리스크 별도 관리 필요:
· 이번 합의는 AI에 저작물이 출력되는 것과 관련된 청구를 면제하지 않으므로 훈련 데이터를 적법하게 수집ㆍ이용하는
것과 출력관련 컴플라이언스를 분리하여 관리해야 함
※ 자세한 내용은 첨부(PDF)파일을 참고하시기 바랍니다.