주요내용
브라우저 보안정책에 따라 이미지가 보이지 않을 수 있습니다 (Mixed Content)
저작권 동향
2025년 제4호
미국
[미국] OpenAI가 GPT-4o 모델 학습을 위해 저작권으로 보호받는 유료 콘텐츠를 무단으로 이용하였다는 연구 결과 발표(이철남)
1. 개요
민간 비영리 기관 사회과학연구협의회(Social Science Research Council)1)의 “AI 공개 프로젝트(The AI
Disclosure Project)2)”의 일환으로 진행된 연구에서 OpenAI의 GPT 시리즈 모델의 학습 데이터셋에
저작권으로 보호받는 비공개 서적이 포함되었는지에 대한 테스트가 진행되었음. 연구에서는 34권의 O'Reilly
Media 서적 데이터셋을 사용함. 각 O'Reilly 서적은 공개적으로 접근 가능한 무료 콘텐츠와 비공개 유료
콘텐츠를 모두 포함하고 있음. 이를 통해 OpenAI가 주로 공개적으로 이용 가능한 데이터로 모델을
학습했는지, 아니면 유료 제한을 우회하여 비공개 데이터를 사용했는지를 확인했음. 연구 결과에 따르면
OpenAI의 GPT-4o 모델은 비공개 유료 데이터에 대해 "높은 인식률"을 보였음.3)