검색

2025년 제4호-[미국] OpenAI가 GPT-4o 모델 학습을 위해 저작권으로 보호받는 유료 콘텐츠를 무단으로 이용하였다는 연구 결과 발표(이철남)

2025-05-22 한국저작권위원회

주요내용

  • 2025년 제4호-[미국] OpenAI가 GPT-4o 모델 학습을 위해 저작권으로 보호받는 유료 콘텐츠를 무단으로 이용하였다는 연구 결과 발표(이철남)
  • 저작권 동향

    2025년 제4호

    미국

    • [미국] OpenAI가 GPT-4o 모델 학습을 위해 저작권으로 보호받는 유료 콘텐츠를 무단으로 이용하였다는 연구 결과 발표(이철남)

    1. 개요

    • 민간 비영리 기관 사회과학연구협의회(Social Science Research Council)1)의 “AI 공개 프로젝트(The AI Disclosure Project)2)”의 일환으로 진행된 연구에서 OpenAI의 GPT 시리즈 모델의 학습 데이터셋에 저작권으로 보호받는 비공개 서적이 포함되었는지에 대한 테스트가 진행되었음. 연구에서는 34권의 O'Reilly Media 서적 데이터셋을 사용함. 각 O'Reilly 서적은 공개적으로 접근 가능한 무료 콘텐츠와 비공개 유료 콘텐츠를 모두 포함하고 있음. 이를 통해 OpenAI가 주로 공개적으로 이용 가능한 데이터로 모델을 학습했는지, 아니면 유료 제한을 우회하여 비공개 데이터를 사용했는지를 확인했음. 연구 결과에 따르면 OpenAI의 GPT-4o 모델은 비공개 유료 데이터에 대해 "높은 인식률"을 보였음.3)

※ 자세한 내용은 첨부(PDF)파일을 참고하시기 바랍니다.