목록으로
Anthropic, 책 작가들과의 소송 합의 위해 15억 달러 지불에 동의 | GeekNews
News2025.09.14

Anthropic, 책 작가들과의 소송 합의 위해 15억 달러 지불에 동의 | GeekNews

요약

Anthropic은 작가들과의 소송 합의를 위해 최소 15억 달러를 지불하기로 동의했으며, 이는 미국 저작권 소송 역사상 최대 규모의 배상금입니다.
이 합의에 따라 50만 저작물에 대해 작품당 3,000달러가 지급되며, Anthropic은 LibGen 및 PiLiMi에서 획득한 불법 데이터셋을 모두 파기할 예정입니다.
️ 이번 합의는 법적 선례를 남기지 않으며, AI 모델 훈련의 "fair use" 여부와 불법 복제 데이터 사용의 위법성에 대한 쟁점은 여전히 남아 향후 유사 소송에서 다시 다뤄질 전망입니다.

상세 내용

Anthropic은 작가들과의 저작권 침해 소송에서 15억 달러 규모의 합의에 도달했습니다. 이는 미국 저작권 소송 역사상 최대 규모의 배상금입니다.

주요 합의 조건:
* 배상 기금 조성: 최소 15억 달러 규모의 배상 기금을 조성합니다.
* 작품당 지급액: 해당 합의 분류에 포함되는 약 50만 저작물을 기준으로, 한 작품당 3,000달러를 지급할 예정입니다. 작품 수가 50만을 초과할 경우 추가 작품마다 3,000달러가 상승합니다.
* 데이터셋 파기: Anthropic은 법적 보존 요구와 무관하게 LibGen, PiLiMi와 같은 불법 자료 공유 사이트에서 획득한 데이터셋을 모두 파기할 예정입니다.
* 합의 효력 범위: 2025년 8월 25일까지의 공식 "Works List"에 포함된 저작물에 한해서만 과거 침해 책임에서 해방됩니다. 향후 발생할 침해나 생성형 AI 산출물로 인한 침해에 대해서는 이번 합의로 해소되지 않습니다.

법적 선례 및 의미:
이번 합의는 "법적 선례(legal precedent)"를 남기지 않았으며, Anthropic의 위법성을 공식적으로 인정한 것이 아닙니다. 이는 소송에서 불리한 판결을 받기 전에 합의를 통해 리스크를 해소하려는 전략으로 해석됩니다. 즉, AI 모델 트레이닝 자체의 공정 이용(fair use) 여부나 중고책 스캔/학습의 적법성 등 핵심 쟁점은 이번 합의로 확정되지 않았으며, 향후 다른 소송에서 다뤄질 여지가 남아있습니다. Anthropic 측은 "해당 불법 자료를 실제로 사용하지 않았다"고 주장했다고 알려졌습니다.

논쟁의 핵심:
Hacker News 의견에서는 이번 소송의 쟁점이 모델 트레이닝 자체가 아니라, 책을 무단으로 복제(pirating)한 행위였다는 점이 강조되었습니다. 즉, 트레이닝 자체는 공정 이용에 해당할 수 있지만, 학습 데이터를 불법적인 경로(예: LibGen)로 획득한 것이 문제였다는 시각입니다.
반면, 일부에서는 기업들이 정당한 라이선스 계약 대신 불법적인 데이터 수집 후 벌금을 감수하는 방식을 택하고 있다고 비판했습니다. 이는 우버(Uber)가 초기에 택시 면허 없이 사업을 벌인 뒤 투자금으로 벌금과 로비를 감당한 사례와 유사하다는 의견도 제시되었습니다. Anthropic 역시 출판사별로 라이선스를 체결하는 것보다 DRM 없는 PDF/ePUB을 대량으로 수집하는 것이 훨씬 빠르고 효율적이었을 것이라는 분석입니다.

재정적 배경 및 전략:
Anthropic은 최근 130억 달러를 추가 유치하는 등 총 270억 달러 이상의 투자를 받았습니다. 15억 달러의 배상액은 거대하지만, 확보한 투자금에 비하면 상대적으로 소액으로 평가되며, 법적 불확실성을 해소하여 회사의 가치를 높이고 동종 업계 내 투자 메리트를 키우는 전략적 결정으로 분석됩니다. "트레이닝은 괜찮지만 해적판이 문제였다"는 내러티브는 양측이 만족할 수 있는 합의의 결과로 보입니다.

오픈소스 AI 커뮤니티의 우려:
이번 합의는 오픈소스 AI 커뮤니티에는 아쉬움을 남겼습니다. Anthropic과 같은 대기업만이 막대한 자금을 들여 출판사와 라이선스 계약을 맺고 AI를 개발할 수 있게 되어, 수십억 권의 책을 학습에 사용할 수 있는 방도가 사실상 불가능해질 수 있다는 우려입니다.
"공정 이용"의 정의에 대해서도 논의가 있었습니다. 공정 이용은 자료를 "적법하게 접근"한 후 무엇을 하는지에 대한 기준이며, 적법한 접근 없이 불법적으로 획득한 자료에 대해서는 공정 이용 논의 자체가 성립될 수 없다는 지적이 있었습니다.

콘텐츠 보호 방안에 대한 논의:
AI 크롤러의 데이터 수집을 막기 위한 방법으로 로그인 장벽, 계약서 동의 절차, 캡챠 시스템, 유료 API 제공 등이 제안되었습니다. 그러나 저작권에는 다양한 예외 조항이 존재하며, 예를 들어 법원이 LLM 학습을 "변형적 이용(transformative use)"으로 판정할 경우, 특정 금지 조항(예: "LLM 학습만 금지")이 반드시 강제력을 가질 수 없을 것이라는 회의적인 시각도 있었습니다. 저작권의 목적이 '학문과 유익한 예술의 촉진'이며, 학계의 접근성 보장이 저자 개인의 통제보다 중시될 수 있다는 점도 언급되었습니다.

국제적 관점:
서구권 기업들이 데이터 수집과 학습에 제약이 많아지는 반면, 중국 등 일부 국가의 AI 기업들은 훨씬 더 많은 양질의 데이터를 활용할 수 있게 되어 국제적인 경쟁 구도에 영향을 미 미칠 수 있다는 의견도 제시되었습니다.

원본 보기
News
Shared by Anonymous